Масштабировщик Признаков

Масштабировать и нормализовать признаки используя различные методы для предварительной обработки машинного обучения и стандартизации данных

Связанные теги

Обработка данных 125 Масштабирование 14 Z-оценка 10 Machine Learning 9 Предобработка данных 7

Ввод Данных CSV *

Метод Масштабирования *

Колонки для Масштабирования (опционально)

Укажите какие колонки масштабировать. Если пусто, все числовые колонки будут автоматически обнаружены и масштабированы.

Параметры Масштабирования (для обратного преобразования)

Только требуется для обратного преобразования. Вставьте параметры масштабирования из предыдущего запуска.

Первая Строка Содержит Заголовки

Обрабатывать первую строку как заголовки колонок

Обратное Преобразование

Применить обратное преобразование используя предоставленные параметры

Формат Вывода *

Сохранить Параметры Масштабирования

Включить параметры масштабирования в вывод для будущих обратных преобразований

Только Масштабированные Данные

Пропустить детальный анализ и выводить только масштабированные данные

Ключевые факты

Категория: Данные и таблицы
Типы входных данных: textarea, select, text, checkbox
Тип результата: text
Покрытие примерами: 4
API доступен: Yes

Обзор

Масштабировщик Признаков — это онлайн-инструмент для нормализации и стандартизации числовых данных с помощью различных методов, таких как Z-score, Min-Max и робастное масштабирование. Он предназначен для подготовки данных к машинному обучению, обеспечивая корректную работу алгоритмов и улучшая их производительность.

Когда использовать

•Когда признаки в наборе данных имеют разные единицы измерения или диапазоны значений, например, возраст от 0 до 100 и доход от 1000 до 100000.
•Перед обучением моделей машинного обучения, чувствительных к масштабу данных, таких как метод опорных векторов (SVM), k-ближайших соседей или нейронные сети.
•Для улучшения сходимости градиентного спуска и повышения точности предсказаний в задачах регрессии или классификации.

Как это работает

•Вставьте данные в формате CSV в текстовое поле или загрузите их, убедившись, что первая строка содержит заголовки (если применимо).
•Выберите метод масштабирования из списка: стандартный (Z-score), минимаксный, робастный, максимальный абсолютный, квантильный, единичных векторов или степенное преобразование.
•Укажите колонки для масштабирования через запятую или оставьте поле пустым для автоматического определения всех числовых колонок.
•Настройте параметры вывода, такие как формат (CSV, JSON или текстовый отчет) и сохранение параметров для обратного преобразования, затем получите результат.

Сценарии использования

Подготовка данных для обучения модели линейной регрессии, где признаки 'возраст' и 'доход' имеют разный масштаб, чтобы алгоритм корректно оценил их влияние.

Нормализация сенсорных данных в IoT-системах, например, температуры и влажности, для сравнения показателей с разных устройств в единой шкале.

Стандартизация финансовых показателей, таких как выручка и расходы, перед анализом рисков или кредитным скорингом для улучшения точности моделей.

Примеры

1. Масштабирование данных для модели классификации

Аналитик данных

Контекст: Аналитик работает с набором данных о клиентах, содержащим колонки 'возраст' (от 18 до 65), 'доход' (от 20000 до 150000) и 'количество_покупок' (от 0 до 50).
Проблема: Метод опорных векторов (SVM) показывает низкую точность из-за различий в масштабе признаков, что замедляет сходимость.
Как использовать: Вставьте CSV-данные в текстовое поле, выберите метод 'Стандартный Масштабировщик (Z-score)', оставьте поле колонок пустым для автоопределения и получите результат в формате CSV.
Результат: Все числовые колонки масштабированы с средним значением 0 и стандартным отклонением 1, что улучшило точность модели на 12% и ускорило обучение.

2. Обратное преобразование для интерпретации предсказаний

Инженер по машинному обучению

Контекст: Инженер обучил модель прогнозирования продаж на масштабированных данных и получил предсказания в диапазоне от -1 до 1.
Проблема: Необходимо преобразовать предсказания обратно в исходные единицы (например, количество товаров) для составления бизнес-отчета.
Как использовать: Вставьте параметры масштабирования из предыдущего запуска в поле 'Параметры Масштабирования', установите флажок 'Обратное Преобразование' и загрузите масштабированные данные.
Пример конфигурации: {"method": "minmax", "min": 0, "max": 1000, "columns": ["sales"]}
Результат: Предсказания преобразованы в исходные значения от 0 до 1000, что позволило точно оценить ожидаемые продажи в штуках.

Проверить на примерах

csv, hash

CSV Примеры

Примеры CSV-файлов с различными типами данных, размерами и уровнями сложности

preferred input family csv

csv

Примеры Замены Regex

Коллекция общих и полезных шаблонов замены regex для преобразования текста и очистки данных

preferred input family csv

csv

Примеры Дублирующихся Строк

Примеры файлов с различными типами дублирующихся строк для тестирования инструментов удаления дубликатов

preferred input family csv

csv

Примеры Python

Примеры кода Python и демонстрации Hello World

preferred input family csv

csv

Связанные хабы

Инструменты экспорта CSV и конвертации таблиц

Сравните преобразования CSV в Excel, JSON, HTML, Markdown, XML и текст в одном хабе для табличных обменных сценариев.

Инструменты для очистки CSV и перестройки таблиц

Соберите в одном хабе инструменты для очистки CSV, фильтрации, сортировки, группировки, объединения, разделения и перестройки таблиц для табличных и import/export сценариев.

Инструменты качества данных, дедупликации и поиска аномалий

Профилируйте CSV/JSON-наборы данных, сравнивайте версии таблиц и находите дубликаты, выбросы, пропуски, разрывы связей и аномалии временных рядов в одном тематическом hub.

FAQ

Какие методы масштабирования доступны в инструменте?

Доступны методы: стандартный (Z-score), минимаксный, робастный (медиана и MAD), максимальный абсолютный, квантильный, единичных векторов и степенное преобразование (Yeo-Johnson).

Можно ли масштабировать только определенные колонки в данных?

Да, в поле 'Колонки для Масштабирования' укажите имена колонок через запятую. Если оставить пустым, инструмент автоматически обнаружит и обработает все числовые колонки.

Что такое обратное преобразование и когда его использовать?

Обратное преобразование восстанавливает исходные данные из масштабированных значений, используя сохраненные параметры. Оно полезно для интерпретации результатов модели в исходных единицах.

Как сохранить параметры масштабирования для повторного использования?

Установите флажок 'Сохранить Параметры Масштабирования' перед запуском. Параметры будут включены в вывод в формате JSON, что позволяет применять обратное преобразование позже.

Поддерживает ли инструмент данные без заголовков колонок?

Да, снимите флажок 'Первая Строка Содержит Заголовки', если первая строка ваших данных содержит значения, а не названия колонок.

Документация API

Конечная точка запроса

POST /ru/api/tools/feature-scaler

Параметры запроса

Имя параметра	Тип	Обязательно	Описание
csvData	textarea	Да	-
scalingMethod	select	Да	-
selectedColumns	text	Нет	Укажите какие колонки масштабировать. Если пусто, все числовые колонки будут автоматически обнаружены и масштабированы.
scalingParams	textarea	Нет	Только требуется для обратного преобразования. Вставьте параметры масштабирования из предыдущего запуска.
hasHeader	checkbox	Нет	Обрабатывать первую строку как заголовки колонок
inverseTransform	checkbox	Нет	Применить обратное преобразование используя предоставленные параметры
outputFormat	select	Да	-
saveParams	checkbox	Нет	Включить параметры масштабирования в вывод для будущих обратных преобразований
scaledOnly	checkbox	Нет	Пропустить детальный анализ и выводить только масштабированные данные

Формат ответа

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}

Текст: Текст

Документация MCP

Добавьте этот инструмент к конфигурации сервера MCP:

{
  "mcpServers": {
    "elysiatools-feature-scaler": {
      "name": "feature-scaler",
      "description": "Масштабировать и нормализовать признаки используя различные методы для предварительной обработки машинного обучения и стандартизации данных",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=feature-scaler",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Вы можете объединять несколько инструментов, например: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, максимум 20 инструментов.

Если вы столкнулись с проблемами, пожалуйста, свяжитесь с нами по адресу [email protected]

Масштабировщик Признаков

Ключевые факты

Обзор

Когда использовать

Как это работает

Сценарии использования

Примеры

1. Масштабирование данных для модели классификации

2. Обратное преобразование для интерпретации предсказаний

Проверить на примерах

Связанные хабы

Связанные инструменты

FAQ

Документация API

Конечная точка запроса

Параметры запроса

Формат ответа

Документация MCP