Ключевые факты
- Категория
- Математика, даты и финансы
- Типы входных данных
- textarea, checkbox, text, number
- Тип результата
- json
- Покрытие примерами
- 4
- API доступен
- Yes
Обзор
Калькулятор логистической регрессии — это аналитический инструмент для построения моделей бинарной классификации с использованием метода градиентного спуска. Он позволяет вычислять вероятность принадлежности объекта к одному из двух классов на основе набора числовых предикторов, обеспечивая точные математические прогнозы без необходимости написания программного кода.
Когда использовать
- •Когда необходимо предсказать вероятность наступления бинарного события (например, да/нет, успех/неудача) на основе числовых данных.
- •Для оценки точности классификации и подбора оптимальных параметров модели, таких как скорость обучения и количество итераций.
- •При работе с наборами данных в формате CSV, где требуется быстро получить коэффициенты регрессии и прогноз для новых значений.
Как это работает
- •Введите данные в формате CSV, где первые столбцы содержат независимые переменные (предикторы), а последний столбец — целевую бинарную переменную (0 или 1).
- •Настройте параметры градиентного спуска: установите скорость обучения (learning rate) для контроля шага оптимизации и количество итераций для достижения сходимости.
- •Укажите порог классификации (threshold), который будет использоваться для разделения вероятностей на классы 0 и 1.
- •Нажмите кнопку расчета, чтобы запустить алгоритм, который вернет точность модели и предсказанный класс для ваших входных значений.
Сценарии использования
Примеры
1. Анализ вероятности покупки
Маркетолог- Контекст
- Имеется список пользователей с данными о времени на сайте и количестве просмотренных страниц, а также отметка о совершении покупки.
- Проблема
- Нужно определить, совершит ли покупку новый пользователь, который провел на сайте 2.5 минуты и открыл 2.5 страницы.
- Как использовать
- Вставьте данные о прошлых сессиях в поле CSV, установите скорость обучения 0.2 и введите '2.5, 2.5' в поле значений прогноза.
- Пример конфигурации
-
learningRate: 0.2, iterations: 3000, threshold: 0.5 - Результат
- Модель рассчитывает точность 100% на обучающей выборке и прогнозирует, что данный пользователь совершит покупку (класс 1).
2. Классификация результатов тестирования
Аналитик данных- Контекст
- Данные содержат результаты двух тестов (x1, x2) и итоговый результат аттестации (y: 0 или 1).
- Проблема
- Необходимо быстро построить модель классификации для оценки влияния баллов на итоговый результат.
- Как использовать
- Загрузите CSV с заголовками, выберите опцию 'Есть строка заголовка' и запустите расчет с 2000 итерациями.
- Пример конфигурации
-
hasHeaderRow: true, iterations: 2000, decimalPlaces: 4 - Результат
- Получен JSON-отчет с коэффициентами модели и показателем точности классификации текущей выборки.
Проверить на примерах
csv, hashСвязанные хабы
FAQ
В каком формате должны быть входные данные?
Данные должны быть представлены в формате CSV, где значения разделены запятыми, а целевой класс (0 или 1) находится в последнем столбце.
Что делает параметр 'Скорость обучения'?
Он определяет размер шага, который делает алгоритм на каждой итерации при поиске минимума функции потерь; слишком большое значение может привести к расходимости.
Как интерпретировать результат точности (accuracy)?
Точность показывает долю правильных предсказаний модели на основе предоставленного набора данных, где 1.0 означает 100% верных попаданий.
Можно ли предсказать класс для новых данных?
Да, введите значения предикторов через запятую в поле 'Значения прогноза', и калькулятор определит наиболее вероятный класс.
Зачем нужен порог (threshold)?
Порог определяет границу вероятности: если вычисленное значение выше порога, модель присваивает класс 1, в противном случае — класс 0.