Масштабировщик Признаков

Масштабировать и нормализовать признаки используя различные методы для предварительной обработки машинного обучения и стандартизации данных

Укажите какие колонки масштабировать. Если пусто, все числовые колонки будут автоматически обнаружены и масштабированы.

Только требуется для обратного преобразования. Вставьте параметры масштабирования из предыдущего запуска.

Обрабатывать первую строку как заголовки колонок

Применить обратное преобразование используя предоставленные параметры

Включить параметры масштабирования в вывод для будущих обратных преобразований

Пропустить детальный анализ и выводить только масштабированные данные

Ключевые факты

Категория
Данные и таблицы
Типы входных данных
textarea, select, text, checkbox
Тип результата
text
Покрытие примерами
4
API доступен
Yes

Обзор

Масштабировщик Признаков — это онлайн-инструмент для нормализации и стандартизации числовых данных с помощью различных методов, таких как Z-score, Min-Max и робастное масштабирование. Он предназначен для подготовки данных к машинному обучению, обеспечивая корректную работу алгоритмов и улучшая их производительность.

Когда использовать

  • Когда признаки в наборе данных имеют разные единицы измерения или диапазоны значений, например, возраст от 0 до 100 и доход от 1000 до 100000.
  • Перед обучением моделей машинного обучения, чувствительных к масштабу данных, таких как метод опорных векторов (SVM), k-ближайших соседей или нейронные сети.
  • Для улучшения сходимости градиентного спуска и повышения точности предсказаний в задачах регрессии или классификации.

Как это работает

  • Вставьте данные в формате CSV в текстовое поле или загрузите их, убедившись, что первая строка содержит заголовки (если применимо).
  • Выберите метод масштабирования из списка: стандартный (Z-score), минимаксный, робастный, максимальный абсолютный, квантильный, единичных векторов или степенное преобразование.
  • Укажите колонки для масштабирования через запятую или оставьте поле пустым для автоматического определения всех числовых колонок.
  • Настройте параметры вывода, такие как формат (CSV, JSON или текстовый отчет) и сохранение параметров для обратного преобразования, затем получите результат.

Сценарии использования

Подготовка данных для обучения модели линейной регрессии, где признаки 'возраст' и 'доход' имеют разный масштаб, чтобы алгоритм корректно оценил их влияние.
Нормализация сенсорных данных в IoT-системах, например, температуры и влажности, для сравнения показателей с разных устройств в единой шкале.
Стандартизация финансовых показателей, таких как выручка и расходы, перед анализом рисков или кредитным скорингом для улучшения точности моделей.

Примеры

1. Масштабирование данных для модели классификации

Аналитик данных
Контекст
Аналитик работает с набором данных о клиентах, содержащим колонки 'возраст' (от 18 до 65), 'доход' (от 20000 до 150000) и 'количество_покупок' (от 0 до 50).
Проблема
Метод опорных векторов (SVM) показывает низкую точность из-за различий в масштабе признаков, что замедляет сходимость.
Как использовать
Вставьте CSV-данные в текстовое поле, выберите метод 'Стандартный Масштабировщик (Z-score)', оставьте поле колонок пустым для автоопределения и получите результат в формате CSV.
Результат
Все числовые колонки масштабированы с средним значением 0 и стандартным отклонением 1, что улучшило точность модели на 12% и ускорило обучение.

2. Обратное преобразование для интерпретации предсказаний

Инженер по машинному обучению
Контекст
Инженер обучил модель прогнозирования продаж на масштабированных данных и получил предсказания в диапазоне от -1 до 1.
Проблема
Необходимо преобразовать предсказания обратно в исходные единицы (например, количество товаров) для составления бизнес-отчета.
Как использовать
Вставьте параметры масштабирования из предыдущего запуска в поле 'Параметры Масштабирования', установите флажок 'Обратное Преобразование' и загрузите масштабированные данные.
Пример конфигурации
{"method": "minmax", "min": 0, "max": 1000, "columns": ["sales"]}
Результат
Предсказания преобразованы в исходные значения от 0 до 1000, что позволило точно оценить ожидаемые продажи в штуках.

Проверить на примерах

csv, hash

Связанные хабы

FAQ

Какие методы масштабирования доступны в инструменте?

Доступны методы: стандартный (Z-score), минимаксный, робастный (медиана и MAD), максимальный абсолютный, квантильный, единичных векторов и степенное преобразование (Yeo-Johnson).

Можно ли масштабировать только определенные колонки в данных?

Да, в поле 'Колонки для Масштабирования' укажите имена колонок через запятую. Если оставить пустым, инструмент автоматически обнаружит и обработает все числовые колонки.

Что такое обратное преобразование и когда его использовать?

Обратное преобразование восстанавливает исходные данные из масштабированных значений, используя сохраненные параметры. Оно полезно для интерпретации результатов модели в исходных единицах.

Как сохранить параметры масштабирования для повторного использования?

Установите флажок 'Сохранить Параметры Масштабирования' перед запуском. Параметры будут включены в вывод в формате JSON, что позволяет применять обратное преобразование позже.

Поддерживает ли инструмент данные без заголовков колонок?

Да, снимите флажок 'Первая Строка Содержит Заголовки', если первая строка ваших данных содержит значения, а не названия колонок.

Документация API

Конечная точка запроса

POST /ru/api/tools/feature-scaler

Параметры запроса

Имя параметра Тип Обязательно Описание
csvData textarea Да -
scalingMethod select Да -
selectedColumns text Нет Укажите какие колонки масштабировать. Если пусто, все числовые колонки будут автоматически обнаружены и масштабированы.
scalingParams textarea Нет Только требуется для обратного преобразования. Вставьте параметры масштабирования из предыдущего запуска.
hasHeader checkbox Нет Обрабатывать первую строку как заголовки колонок
inverseTransform checkbox Нет Применить обратное преобразование используя предоставленные параметры
outputFormat select Да -
saveParams checkbox Нет Включить параметры масштабирования в вывод для будущих обратных преобразований
scaledOnly checkbox Нет Пропустить детальный анализ и выводить только масштабированные данные

Формат ответа

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}
Текст: Текст

Документация MCP

Добавьте этот инструмент к конфигурации сервера MCP:

{
  "mcpServers": {
    "elysiatools-feature-scaler": {
      "name": "feature-scaler",
      "description": "Масштабировать и нормализовать признаки используя различные методы для предварительной обработки машинного обучения и стандартизации данных",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=feature-scaler",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Вы можете объединять несколько инструментов, например: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, максимум 20 инструментов.

Если вы столкнулись с проблемами, пожалуйста, свяжитесь с нами по адресу [email protected]