特征缩放器

使用各种方法对特征进行缩放和标准化，用于机器学习预处理和数据标准化

相关标签

数据处理 125 比例与缩放 14 Z-Score 10 机器学习 9 数据预处理 7

CSV数据输入 *

缩放方法 *

要缩放的列（可选）

指定要缩放的列。如果留空，所有数值列将被自动检测并缩放。

缩放参数（用于逆变换）

仅逆变换需要。粘贴之前运行的缩放参数。

首行包含标题

将第一行作为列标题

逆变换

使用提供的参数应用逆变换

输出格式 *

保存缩放参数

在输出中包含缩放参数，用于未来的逆变换

仅输出缩放数据

跳过详细分析，仅输出缩放后的数据

关键信息

分类: 数据与表格
输入类型: textarea, select, text, checkbox
输出类型: text
样本覆盖: 4
支持 API: Yes

概览

特征缩放器是一个专为机器学习预处理设计的在线工具。它能将您的CSV格式数据，通过标准化、归一化等多种方法进行缩放，使不同量纲的特征具有可比性，从而提升模型训练效果和收敛速度。

适用场景

•在训练机器学习模型（如SVM、KNN、神经网络）前，需要对输入特征进行标准化或归一化处理时。
•当数据集中不同特征的数值范围差异巨大（例如，年龄和收入），需要消除量纲影响时。
•需要对已缩放的数据进行逆变换，以还原到原始尺度或解释模型结果时。

工作原理

•第一步：在输入框中粘贴或上传您的CSV格式数据，并确认首行是否为列标题。
•第二步：从下拉菜单中选择一种缩放方法（如Z-score标准化或最小最大值缩放），并可选择指定要处理的列。
•第三步：点击处理按钮，工具将计算并应用缩放变换，生成缩放后的数据及可选的参数报告。

使用场景

机器学习模型训练前的数据预处理，确保所有特征处于相近的数值尺度。

数据可视化前的标准化，使不同指标的图表具有可比性。

对模型预测结果进行逆缩放，将其转换回业务可理解的原始单位。

用户案例

1. 标准化传感器读数

数据分析师

背景原因: 一个物联网项目收集了温度（范围：-10到40）、湿度（范围：20到100）和气压（范围：980到1050）的传感器数据，准备用于预测模型。
解决问题: 三个特征的数值范围和单位完全不同，直接输入模型会导致权重失衡。
如何使用: 上传包含这三列数据的CSV文件，选择“标准化缩放（Z-score）”方法，留空“要缩放的列”以自动处理所有数值列。
效果: 所有特征被转换为均值为0、标准差为1的分布，消除了量纲差异，适合用于线性回归或神经网络模型。

2. 归一化图像像素值

背景原因: 在准备一个图像分类任务的数据集时，需要将像素值从0-255的整数范围，缩放到0-1的浮点数范围。
解决问题: 许多深度学习框架要求输入数据在特定范围内（如0-1或-1-1）以获得最佳性能。
如何使用: 将像素值数据整理为CSV格式（每行代表一个样本的展平像素向量），选择“最小最大值缩放”方法。
效果: 所有像素值被线性缩放到[0, 1]区间，符合大多数深度学习模型的输入要求。

用 Samples 测试

csv, hash

各种数据类型、大小和复杂度级别的CSV示例文件

preferred input family csv

正则替换示例

用于文本转换和数据清洗的常用正则替换模式集合

preferred input family csv

重复行示例

用于测试重复行移除工具的各种重复行类型的示例文件

preferred input family csv

Python代码示例和Hello World演示

preferred input family csv

相关专题

CSV 导出与表格转换工具

在一个专题里比较 CSV 与 Excel、JSON、HTML、Markdown、XML 和文本之间的转换工具，适合表格导出与交换工作流。

CSV 清洗与表格重整工具

把 CSV 清洗、筛选、排序、分组、合并、拆分和表格重整工具集中到一个专题中，适合表格整理和导入导出流程。

数据质量、去重与异常检测工具

在一个数据质量工作流专题里检查 CSV/JSON 数据集，比较表格版本，发现重复、离群值、缺失值问题、关联断裂和时序异常。

常见问题

这个工具支持哪些缩放方法？

支持标准化（Z-score）、最小最大值缩放、鲁棒缩放、最大绝对值缩放、分位数缩放、单位向量缩放和幂变换（Yeo-Johnson）。

如何只缩放数据集中的特定列？

在“要缩放的列”输入框中，输入用逗号分隔的列名。如果留空，工具会自动检测并缩放所有数值列。

什么是逆变换？如何使用？

逆变换是将缩放后的数据还原回原始尺度的过程。您需要勾选“逆变换”选项，并在“缩放参数”框中粘贴之前正向变换时保存的参数。

输出结果有哪些格式？

您可以选择输出为CSV格式（便于下载使用）、JSON格式（便于程序调用）或文本报告（直接在页面上查看分析摘要）。

这个工具能处理多大的数据？

工具适合处理中小型数据集。对于非常大的数据文件，建议在本地使用Python的Scikit-learn等库进行处理。

API 文档

请求端点

POST /zh/api/tools/feature-scaler

请求参数

参数名	类型	必填	描述
csvData	textarea	是	-
scalingMethod	select	是	-
selectedColumns	text	否	指定要缩放的列。如果留空，所有数值列将被自动检测并缩放。
scalingParams	textarea	否	仅逆变换需要。粘贴之前运行的缩放参数。
hasHeader	checkbox	否	将第一行作为列标题
inverseTransform	checkbox	否	使用提供的参数应用逆变换
outputFormat	select	是	-
saveParams	checkbox	否	在输出中包含缩放参数，用于未来的逆变换
scaledOnly	checkbox	否	跳过详细分析，仅输出缩放后的数据

响应格式

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}

文本: 文本

AI MCP 文档

将此工具添加到您的 MCP 服务器配置中：

{
  "mcpServers": {
    "elysiatools-feature-scaler": {
      "name": "feature-scaler",
      "description": "使用各种方法对特征进行缩放和标准化，用于机器学习预处理和数据标准化",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=feature-scaler",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

你可以串联多个工具，比如：`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`，最多20个。

如果遇见问题，请联系我们：[email protected]