¿Qué formatos de archivo soporta la herramienta?

Puedes pegar texto directamente en formato CSV o subir archivos con extensión .csv y .json.

¿Cuál es la diferencia entre oversample y undersample?

Oversample duplica las filas de la clase minoritaria para igualar a la mayoritaria, mientras que undersample recorta aleatoriamente las filas de la clase mayoritaria hasta alcanzar el tamaño de la minoritaria.

¿Es seguro usar oversample con datasets muy grandes?

Sí, pero ten en cuenta que aumentará el tamaño total de tu dataset, lo que podría requerir más memoria durante el entrenamiento de tu modelo.

¿Puedo exportar el dataset balanceado completo?

La herramienta genera una vista previa en JSON o CSV según el número de filas configurado, ideal para validar la estrategia antes de procesar todo en tu entorno local.

¿Qué pasa si mi dataset tiene más de dos clases?

La herramienta identificará todas las clases únicas en la columna indicada y ajustará las cantidades basándose en la clase mayoritaria o minoritaria según la estrategia elegida.

Detector de desbalance y remuestreo | Herramienta online gratis

Ejemplos

1. Balanceo de dataset de detección de fraude

Científico de Datos

Contexto

Un modelo de machine learning está clasificando todas las transacciones como 'normales' debido a que el 95% de los datos pertenecen a esa clase.

Problema

Equilibrar las clases 'normal' y 'fraud' para que el modelo aprenda a detectar las anomalías sin sesgos.

Cómo usarlo

Sube el archivo transactions.csv, indica 'label' como columna de etiqueta y selecciona la estrategia 'oversample'.

Columna de etiqueta: label
Estrategia: oversample
Formato: json

Resultado

El reporte muestra la distribución original 95:5 y genera una vista previa donde las transacciones de fraude se duplican hasta igualar a las normales.

2. Reducción de clase mayoritaria en análisis de Churn

Analista de Datos

Contexto

Se tiene un archivo JSON con miles de registros de clientes, pero solo una pequeña fracción ha cancelado su suscripción.

Problema

Reducir el tamaño del dataset para iterar modelos rápidamente sin perder la proporción de la clase minoritaria.

Cómo usarlo

Columna de etiqueta: churn_status
Estrategia: undersample
Formato: csv

Detector de desbalance y remuestreo | Herramienta online gratis | Elysia Tools

Detector de desbalance y remuestreo

Qué te ayuda a hacer esta herramienta

Ejecutar esta herramienta

Ejecuciones de ejemplo preparadas

Entradas

Resultado

Ejecuciones de ejemplo preparadas

Entradas

Resultado

Ejemplos que encajan con esta herramienta

Continuar con herramientas y temas relacionados

Conoce cuándo usar esta herramienta, qué admite y cómo la aplican los usuarios.

Datos clave

Resumen

Cuándo usarlo

Cómo funciona

Casos de uso

Ejemplos

1. Balanceo de dataset de detección de fraude

2. Reducción de clase mayoritaria en análisis de Churn

Preguntas frecuentes

Ejemplos CSV

Ejemplos Python

Muestras de Trazado Distribuido

Muestras JWT

Detector de anomalias en series temporales

Perfilador de calidad de datasets

Detector de conflictos de prefijos y abreviaturas en mock data

Analizador de pronostico y estacionalidad

Herramientas de intercambio JSON y traduccion de formatos

Herramientas de conversión de texto, codificación y normalización

Herramientas de inspeccion, diff y transformacion JSON

Herramientas de exportacion CSV y conversion de tablas