特征缩放器

使用各种方法对特征进行缩放和标准化,用于机器学习预处理和数据标准化

指定要缩放的列。如果留空,所有数值列将被自动检测并缩放。

仅逆变换需要。粘贴之前运行的缩放参数。

将第一行作为列标题

使用提供的参数应用逆变换

在输出中包含缩放参数,用于未来的逆变换

跳过详细分析,仅输出缩放后的数据

关键信息

分类
数据与表格
输入类型
textarea, select, text, checkbox
输出类型
text
样本覆盖
4
支持 API
Yes

概览

特征缩放器是一个专为机器学习预处理设计的在线工具。它能将您的CSV格式数据,通过标准化、归一化等多种方法进行缩放,使不同量纲的特征具有可比性,从而提升模型训练效果和收敛速度。

适用场景

  • 在训练机器学习模型(如SVM、KNN、神经网络)前,需要对输入特征进行标准化或归一化处理时。
  • 当数据集中不同特征的数值范围差异巨大(例如,年龄和收入),需要消除量纲影响时。
  • 需要对已缩放的数据进行逆变换,以还原到原始尺度或解释模型结果时。

工作原理

  • 第一步:在输入框中粘贴或上传您的CSV格式数据,并确认首行是否为列标题。
  • 第二步:从下拉菜单中选择一种缩放方法(如Z-score标准化或最小最大值缩放),并可选择指定要处理的列。
  • 第三步:点击处理按钮,工具将计算并应用缩放变换,生成缩放后的数据及可选的参数报告。

使用场景

机器学习模型训练前的数据预处理,确保所有特征处于相近的数值尺度。
数据可视化前的标准化,使不同指标的图表具有可比性。
对模型预测结果进行逆缩放,将其转换回业务可理解的原始单位。

用户案例

1. 标准化传感器读数

数据分析师
背景原因
一个物联网项目收集了温度(范围:-10到40)、湿度(范围:20到100)和气压(范围:980到1050)的传感器数据,准备用于预测模型。
解决问题
三个特征的数值范围和单位完全不同,直接输入模型会导致权重失衡。
如何使用
上传包含这三列数据的CSV文件,选择“标准化缩放(Z-score)”方法,留空“要缩放的列”以自动处理所有数值列。
效果
所有特征被转换为均值为0、标准差为1的分布,消除了量纲差异,适合用于线性回归或神经网络模型。

2. 归一化图像像素值

背景原因
在准备一个图像分类任务的数据集时,需要将像素值从0-255的整数范围,缩放到0-1的浮点数范围。
解决问题
许多深度学习框架要求输入数据在特定范围内(如0-1或-1-1)以获得最佳性能。
如何使用
将像素值数据整理为CSV格式(每行代表一个样本的展平像素向量),选择“最小最大值缩放”方法。
效果
所有像素值被线性缩放到[0, 1]区间,符合大多数深度学习模型的输入要求。

用 Samples 测试

csv, hash

相关专题

常见问题

这个工具支持哪些缩放方法?

支持标准化(Z-score)、最小最大值缩放、鲁棒缩放、最大绝对值缩放、分位数缩放、单位向量缩放和幂变换(Yeo-Johnson)。

如何只缩放数据集中的特定列?

在“要缩放的列”输入框中,输入用逗号分隔的列名。如果留空,工具会自动检测并缩放所有数值列。

什么是逆变换?如何使用?

逆变换是将缩放后的数据还原回原始尺度的过程。您需要勾选“逆变换”选项,并在“缩放参数”框中粘贴之前正向变换时保存的参数。

输出结果有哪些格式?

您可以选择输出为CSV格式(便于下载使用)、JSON格式(便于程序调用)或文本报告(直接在页面上查看分析摘要)。

这个工具能处理多大的数据?

工具适合处理中小型数据集。对于非常大的数据文件,建议在本地使用Python的Scikit-learn等库进行处理。

API 文档

请求端点

POST /zh/api/tools/feature-scaler

请求参数

参数名 类型 必填 描述
csvData textarea -
scalingMethod select -
selectedColumns text 指定要缩放的列。如果留空,所有数值列将被自动检测并缩放。
scalingParams textarea 仅逆变换需要。粘贴之前运行的缩放参数。
hasHeader checkbox 将第一行作为列标题
inverseTransform checkbox 使用提供的参数应用逆变换
outputFormat select -
saveParams checkbox 在输出中包含缩放参数,用于未来的逆变换
scaledOnly checkbox 跳过详细分析,仅输出缩放后的数据

响应格式

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}
文本: 文本

AI MCP 文档

将此工具添加到您的 MCP 服务器配置中:

{
  "mcpServers": {
    "elysiatools-feature-scaler": {
      "name": "feature-scaler",
      "description": "使用各种方法对特征进行缩放和标准化,用于机器学习预处理和数据标准化",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=feature-scaler",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

你可以串联多个工具,比如:`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`,最多20个。

如果遇见问题,请联系我们:[email protected]