Ключевые факты
- Категория
- Математика, даты и финансы
- Типы входных данных
- number
- Тип результата
- json
- Покрытие примерами
- 4
- API доступен
- Yes
Обзор
Этот калькулятор позволяет быстро вычислить скорректированный коэффициент детерминации (R-квадрат), учитывая количество независимых переменных и объем выборки. Он помогает оценить реальную объясняющую способность регрессионной модели и избежать переобучения при добавлении новых предикторов.
Когда использовать
- •При сравнении нескольких регрессионных моделей с разным количеством независимых переменных.
- •Для оценки качества модели на небольших выборках, где обычный R-квадрат может быть завышен.
- •При проверке целесообразности добавления нового предиктора в статистическую модель.
Как это работает
- •Введите значение обычного коэффициента детерминации (R-квадрат) из результатов вашего регрессионного анализа.
- •Укажите общий объем выборки (количество наблюдений) и количество независимых переменных (предикторов).
- •Выберите желаемую точность округления результата в настройках десятичных знаков.
- •Получите значение скорректированного R-квадрат, величину штрафа за сложность и процент объясненной дисперсии.
Сценарии использования
Примеры
1. Оценка маркетинговой кампании
Аналитик данных- Контекст
- Аналитик построил модель влияния 5 рекламных каналов на продажи на основе данных за 30 дней.
- Проблема
- Обычный R-квадрат равен 0.85, но есть риск переобучения из-за малого объема данных относительно числа факторов.
- Как использовать
- Введите R-квадрат 0.85, размер выборки 30 и число предикторов 5.
- Пример конфигурации
-
rSquared: 0.85, sampleSize: 30, predictorCount: 5 - Результат
- Скорректированный R-квадрат составил 0.8188, что дает более реалистичную оценку эффективности каналов.
2. Сравнение моделей недвижимости
Риелтор-исследователь- Контекст
- Сравниваются две модели оценки стоимости жилья: одна с 3 параметрами, другая с 10.
- Проблема
- Нужно понять, оправдано ли усложнение модели добавлением новых характеристик дома.
- Как использовать
- Для модели с 10 предикторами при выборке 100 и R-квадрате 0.75 рассчитайте скорректированный показатель.
- Пример конфигурации
-
rSquared: 0.75, sampleSize: 100, predictorCount: 10 - Результат
- Скорректированный R-квадрат 0.7219 показывает реальный вклад дополнительных переменных за вычетом статистического шума.
Проверить на примерах
math-&-numbersСвязанные хабы
FAQ
Чем скорректированный R-квадрат отличается от обычного?
Он накладывает штраф за добавление лишних переменных, которые не улучшают предсказательную силу модели.
Может ли скорректированный R-квадрат быть отрицательным?
Да, если модель объясняет данные хуже, чем простое среднее значение, с учетом штрафа за количество параметров.
Почему скорректированный R-квадрат всегда меньше или равен обычному?
Формула корректировки всегда вычитает значение, зависящее от соотношения количества предикторов к объему данных.
Какое количество предикторов нужно указывать?
Указывайте только количество независимых переменных, исключая константу (свободный член).
Как интерпретировать результат в процентах?
Умножьте полученное значение на 100; это доля вариации зависимой переменной, объясненная моделью с поправкой на сложность.