Datos clave
- Categoría
- Data Processing
- Tipos de entrada
- textarea, select, checkbox
- Tipo de salida
- text
- Cobertura de muestras
- 4
- API disponible
- Yes
Resumen
El Limitador de Rango de Datos es una herramienta esencial para normalizar conjuntos de información, permitiéndote recortar, filtrar o marcar valores numéricos que exceden límites predefinidos para garantizar la integridad de tus datos.
Cuándo usarlo
- •Cuando necesitas limpiar datos de sensores eliminando lecturas erróneas o fuera de rango.
- •Al preparar datasets para modelos de machine learning que requieren valores dentro de límites específicos.
- •Para aplicar reglas de negocio estrictas sobre reportes financieros o métricas de rendimiento.
Cómo funciona
- •Carga tus datos en formato CSV y define los límites mínimos y máximos para cada columna mediante un objeto JSON.
- •Selecciona la estrategia de manejo: 'Recortar' para ajustar valores, 'Filtrar' para eliminar filas o 'Marcar' para identificar anomalías.
- •Activa la detección automática de rangos si prefieres que el sistema sugiera límites basados en la distribución de tus datos.
- •Obtén un archivo procesado con estadísticas detalladas sobre las modificaciones realizadas.
Casos de uso
Ejemplos
1. Limpieza de lecturas de temperatura
Ingeniero de datos- Contexto
- Un sensor de temperatura registra valores erróneos debido a interferencias eléctricas, generando picos imposibles de 100°C en un entorno de 20°C.
- Problema
- Los valores extremos distorsionan el promedio diario de temperatura.
- Cómo usarlo
- Carga el CSV, configura el rango de temperatura entre 15 y 30 grados y selecciona la estrategia 'Recortar'.
- Configuración de ejemplo
-
{"temperature": {"min": 15, "max": 30}} - Resultado
- Todos los valores superiores a 30°C se ajustan automáticamente a 30°C, permitiendo un cálculo de promedio preciso.
2. Filtrado de registros de edad
Analista de marketing- Contexto
- Una base de datos de clientes contiene errores de entrada donde algunas edades aparecen como 0 o 200 años.
- Problema
- Estos datos inválidos impiden realizar una segmentación demográfica correcta.
- Cómo usarlo
- Configura el rango de edad entre 18 y 99 años y selecciona la estrategia 'Filtrar'.
- Configuración de ejemplo
-
{"age": {"min": 18, "max": 99}} - Resultado
- El dataset resultante elimina automáticamente todas las filas con edades fuera del rango lógico, dejando solo datos válidos para el análisis.
Probar con muestras
json, csv, videoHubs relacionados
Preguntas frecuentes
¿Qué sucede si un valor está fuera del rango definido?
Dependiendo de la estrategia elegida, el valor será ajustado al límite (recortar), la fila completa será eliminada (filtrar) o se añadirá una marca indicando que el valor fue modificado.
¿Puedo procesar solo columnas específicas?
Sí, puedes especificar las columnas objetivo en el campo correspondiente o dejarlo vacío para que la herramienta detecte automáticamente todas las columnas numéricas.
¿Es posible conservar los datos originales?
Sí, al activar la opción 'Preservar Columnas Originales', el sistema mantendrá los valores iniciales añadiendo un sufijo '_original' a las columnas procesadas.
¿Qué formato de entrada acepta la herramienta?
La herramienta acepta datos en formato CSV con encabezados, donde los valores numéricos son procesados según la configuración de rangos proporcionada.
¿Cómo puedo saber cuántos valores fueron modificados?
Al activar la opción 'Incluir Estadísticas', la herramienta generará un informe detallado con el conteo y resumen de los cambios aplicados a tu dataset.