Datos clave
- Categoría
- Data Processing
- Tipos de entrada
- textarea, text, select, checkbox, number
- Tipo de salida
- text
- Cobertura de muestras
- 4
- API disponible
- Yes
Resumen
El Normalizador Min-Max es una herramienta esencial para transformar datos numéricos a un rango específico, generalmente de 0 a 1, facilitando la comparación y el procesamiento de variables con diferentes escalas.
Cuándo usarlo
- •Preparar conjuntos de datos para algoritmos de machine learning que son sensibles a la escala de las variables.
- •Normalizar métricas heterogéneas para realizar análisis comparativos precisos entre diferentes columnas.
- •Estandarizar entradas de datos antes de alimentar redes neuronales o modelos de regresión.
Cómo funciona
- •Carga tus datos en formato CSV en el área de entrada.
- •Selecciona las columnas que deseas normalizar o deja el campo vacío para detectar automáticamente las numéricas.
- •Configura el rango de salida deseado y elige cómo gestionar los valores faltantes.
- •Ejecuta el proceso para obtener tus datos normalizados junto con un resumen estadístico opcional.
Casos de uso
Ejemplos
1. Normalización de salarios para ML
Científico de datos- Contexto
- Se requiere entrenar un modelo de predicción de ingresos, pero los datos de salarios varían drásticamente en magnitud.
- Problema
- Los valores altos dominan el modelo, sesgando los resultados de aprendizaje.
- Cómo usarlo
- Pegar el CSV con la columna 'salario', seleccionar la columna objetivo y configurar el rango de salida a 0-1.
- Configuración de ejemplo
-
targetColumns: 'salario', outputRange: '0, 1', handleMissing: 'fill_median' - Resultado
- Todos los salarios se transforman a una escala de 0 a 1, permitiendo que el modelo procese la información de manera equilibrada.
2. Estandarización de métricas de rendimiento
Analista de negocios- Contexto
- Se comparan KPIs de diferentes departamentos con unidades distintas (porcentaje, moneda, cantidad).
- Problema
- Es imposible comparar directamente un porcentaje de cumplimiento con un valor monetario total.
- Cómo usarlo
- Subir el reporte CSV, seleccionar todas las columnas numéricas y normalizar al rango 0-1.
- Configuración de ejemplo
-
outputRange: '0, 1', decimalPlaces: 2, includeStatistics: true - Resultado
- Se obtiene una tabla donde todas las métricas son comparables en la misma escala, facilitando la creación de un dashboard unificado.
Probar con muestras
csvHubs relacionados
Preguntas frecuentes
¿Qué es el escalado Min-Max?
Es una técnica que reescala los datos numéricos para que se ajusten a un rango definido, manteniendo las proporciones relativas entre los valores originales.
¿Puedo cambiar el rango de 0 a 1?
Sí, puedes especificar un rango de salida personalizado en la configuración para adaptar los datos a tus necesidades específicas.
¿Cómo maneja la herramienta los valores faltantes?
Ofrece varias opciones, incluyendo omitir filas, rellenar con la media, mediana, cero, o los valores mínimo y máximo del conjunto.
¿Qué sucede con las columnas no numéricas?
La herramienta está diseñada para procesar columnas numéricas; las columnas no numéricas se preservan o ignoran según tu configuración.
¿Es necesario incluir estadísticas?
No es obligatorio, pero activar esta opción te proporciona un resumen útil sobre los valores mínimos y máximos originales utilizados para el cálculo.