Procesador de Valores Atípicos

Datos clave

Categoría: Datos y tablas
Tipos de entrada: textarea, select, number, checkbox
Tipo de salida: text
Cobertura de muestras: 4
API disponible: Yes

Resumen

El Procesador de Valores Atípicos es una herramienta avanzada diseñada para identificar, limpiar y gestionar anomalías en conjuntos de datos numéricos. Utilizando métodos estadísticos robustos como IQR, Z-Score y algoritmos de aprendizaje automático, permite normalizar tus datos eliminando o reemplazando valores extremos que podrían sesgar tus análisis o modelos predictivos.

Cuándo usarlo

•Antes de realizar análisis estadísticos donde los valores extremos puedan distorsionar los resultados.
•Al preparar datasets para modelos de machine learning que son sensibles a la presencia de ruido.
•Para validar la integridad de datos provenientes de sensores o registros financieros donde ocurren errores de medición.

Cómo funciona

•Carga tus datos en formato CSV y selecciona las columnas que deseas analizar.
•Elige un método de detección, como el Rango Intercuartílico (IQR) o Z-Score, y ajusta el umbral de sensibilidad.
•Define la estrategia de manejo, ya sea eliminando las filas afectadas, reemplazando los valores por la mediana o media, o simplemente marcándolos para su revisión.
•Obtén el archivo procesado junto con un informe estadístico detallado sobre los valores detectados.

Casos de uso

Limpieza de datos financieros para detectar transacciones inusuales o errores de entrada.

Preparación de datasets de entrenamiento para modelos de IA, eliminando ruido que afecta la precisión.

Control de calidad en procesos industriales mediante la validación de lecturas de sensores.

Ejemplos

1. Limpieza de datos de sensores IoT

Ingeniero de Datos

Contexto: Un conjunto de datos de temperatura con lecturas erróneas causadas por fallos intermitentes en los sensores.
Problema: Los valores extremos están arruinando el promedio diario de temperatura.
Cómo usarlo: Cargar el CSV, seleccionar la columna 'temperatura', aplicar el método 'IQR' y elegir la estrategia de 'reemplazo' por la mediana.
Configuración de ejemplo: detectionMethod: iqr, handlingStrategy: replace, replacementMethod: median
Resultado: Los valores atípicos fueron sustituidos por la mediana, permitiendo un cálculo preciso del promedio sin perder las filas de datos.

2. Detección de anomalías en salarios

Analista de RRHH

Contexto: Una base de datos de salarios con errores de digitación que muestran valores irreales.
Problema: Identificar los salarios que se desvían significativamente del estándar sin borrar la información.
Cómo usarlo: Subir el archivo, seleccionar la columna 'salario', usar 'Z-Score' y activar 'Marcar Valores Atípicos'.
Configuración de ejemplo: detectionMethod: zscore, handlingStrategy: mark, markOutliers: true
Resultado: Se generó una nueva columna 'es_atípico' que permite filtrar rápidamente los registros sospechosos para su verificación manual.

Probar con muestras

csv, video, qr

Ejemplos de Reemplazo de Regex

Colección de patrones de reemplazo de regex comunes y útiles para transformación de texto y limpieza de datos

preferred input family csv

csv

Ejemplos de Líneas Duplicadas

Archivos de muestra con varios tipos de líneas duplicadas para probar herramientas de eliminación de duplicados

preferred input family csv

csv

Ejemplos CSV

Archivos CSV de muestra con varios tipos de datos, tamaños y niveles de complejidad

preferred input family csv

csv

Procesamiento de Cadenas Windows - Ejemplos C#

Ejemplos completos de procesamiento de cadenas C# para plataforma Windows incluyendo manipulación, división, unión, expresiones regulares y análisis de texto

preferred input family csv

csv

Hubs relacionados

Herramientas de calidad de datos, deduplicacion y deteccion de anomalías

Perfila datasets CSV/JSON, compara versiones de hojas de calculo y detecta duplicados, valores atipicos, faltantes, rupturas relacionales y anomalias temporales en un solo hub de calidad de datos.

Herramientas de exportacion CSV y conversion de tablas

Compara conversiones entre CSV y Excel, JSON, HTML, Markdown, XML y texto en un solo hub para flujos de intercambio tabular.

Herramientas de video a audio y conversion de animacion

Compara herramientas para convertir video en audio, extraer streams y pasar entre video corto y formatos de imagen animada en un solo hub.

Herramientas de vista previa, extraccion y subtitulos de video

Reune en un solo hub herramientas para generar vistas previas de video, extraer flujos, sacar audio, traducir subtitulos y aplicar giros rapidos en flujos ligeros de preparacion de video.

Preguntas frecuentes

¿Qué métodos de detección están disponibles?

Ofrecemos métodos estadísticos clásicos como IQR, Z-Score, Modified Z-Score, Simple Range y el algoritmo de aprendizaje automático Isolation Forest.

¿Puedo conservar mis datos originales?

Sí, puedes activar la opción 'Preservar Columnas Originales' para comparar los valores procesados con los datos de entrada originales.

¿Qué sucede si elijo la estrategia de reemplazo?

Los valores atípicos se sustituirán por el valor estadístico que elijas, como la media, la mediana, la moda o mediante interpolación lineal.

¿Cómo sé qué umbral de detección es el adecuado?

Puedes usar la función 'Auto-optimize Threshold' para que el sistema determine el umbral óptimo basado en la distribución de tus datos.

¿Es posible marcar los valores sin eliminarlos?

Sí, seleccionando la estrategia 'Mark', el sistema añadirá una columna adicional indicando qué filas contienen valores atípicos sin alterar los datos originales.

Nombre del parámetro	Tipo	Requerido	Descripción
inputData	textarea	Sí	-
targetColumns	textarea	No	-
detectionMethod	select	No	-
threshold	number	No	Sensitivity threshold for outlier detection. Lower values detect more outliers.
handlingStrategy	select	No	-
replacementMethod	select	No	-
preserveOriginal	checkbox	No	-
markOutliers	checkbox	No	Agregar columnas para marcar valores detectados como atípicos
includeStatistics	checkbox	No	-
autoThreshold	checkbox	No	Automatically find optimal threshold based on data distribution
sensitivity	select	No	-

Datos clave

Resumen

Cuándo usarlo

Cómo funciona

Casos de uso

Ejemplos

1. Limpieza de datos de sensores IoT

2. Detección de anomalías en salarios

Probar con muestras

Hubs relacionados

Preguntas frecuentes

Documentación de la API

Punto final de la solicitud

Parámetros de la solicitud

Formato de respuesta

Documentación de MCP

Procesador de Valores Atípicos

Datos clave

Resumen

Cuándo usarlo

Cómo funciona

Casos de uso

Ejemplos

1. Limpieza de datos de sensores IoT

2. Detección de anomalías en salarios

Probar con muestras

Hubs relacionados

Herramientas relacionadas

Preguntas frecuentes

Documentación de la API

Punto final de la solicitud

Parámetros de la solicitud

Formato de respuesta

Documentación de MCP