Datos clave
- Categoría
- Text Processing
- Tipos de entrada
- textarea, number, select, checkbox
- Tipo de salida
- text
- Cobertura de muestras
- 4
- API disponible
- Yes
Resumen
Esta herramienta permite introducir errores de forma controlada en cualquier bloque de texto, facilitando la creación de datos sintéticos para pruebas de robustez, algoritmos de corrección ortográfica o simulaciones de errores tipográficos.
Cuándo usarlo
- •Para probar la resiliencia de sistemas de procesamiento de lenguaje natural (NLP) ante errores de escritura.
- •Para generar conjuntos de datos de entrenamiento destinados a modelos de corrección gramatical y ortográfica.
- •Para simular condiciones de entrada de usuario realistas con errores comunes de teclado o de dedo.
Cómo funciona
- •Introduce el texto original en el área de entrada.
- •Define la tasa de error deseada para controlar la frecuencia de las alteraciones.
- •Selecciona los tipos de errores específicos, como sustitución, transposición o eliminación.
- •Aplica los cambios y obtén el texto resultante con los errores integrados.
Casos de uso
Ejemplos
1. Generación de datos para entrenamiento de IA
Ingeniero de Machine Learning- Contexto
- Necesito crear un dataset de entrenamiento para un corrector ortográfico que reconozca errores comunes de escritura.
- Problema
- El modelo actual no detecta suficientes errores de transposición y sustitución de caracteres.
- Cómo usarlo
- Pego un corpus de texto limpio, configuro una tasa de error del 10% y selecciono 'transposition' y 'substitution'.
- Configuración de ejemplo
-
errorRate: 10, errorTypes: ['substitution', 'transposition'], preserveWords: true - Resultado
- Obtengo una versión corrompida del texto que sirve como entrada 'sucia' para entrenar el modelo de corrección.
2. Prueba de robustez de buscador
Desarrollador Web- Contexto
- El buscador de mi sitio web falla cuando los usuarios cometen errores al escribir términos técnicos.
- Problema
- Necesito verificar si el algoritmo de búsqueda difusa (fuzzy search) maneja correctamente las eliminaciones y duplicaciones.
- Cómo usarlo
- Introduzco una lista de términos clave y aplico errores de tipo 'deletion' y 'duplication' con una tasa del 5%.
- Configuración de ejemplo
-
errorRate: 5, errorTypes: ['deletion', 'duplication'], preserveWords: true - Resultado
- El sistema genera variaciones erróneas de los términos, permitiéndome probar si mi buscador devuelve los resultados correctos a pesar de los errores.
Probar con muestras
textHubs relacionados
Preguntas frecuentes
¿Qué tipos de errores puedo introducir?
Puedes aplicar sustituciones, transposiciones, eliminaciones, inserciones, duplicaciones y cambios de mayúsculas/minúsculas.
¿Puedo controlar la cantidad de errores?
Sí, mediante el ajuste de la 'Tasa de Error (%)', que determina qué porcentaje de caracteres se verán afectados.
¿Es posible mantener la estructura de las palabras?
Sí, activando la opción 'Preservar Límites de Palabras', los espacios y la puntuación permanecerán intactos.
¿Los resultados son reproducibles?
Sí, puedes utilizar el campo 'Semilla Aleatoria' para generar siempre el mismo patrón de errores con el mismo texto.
¿Se guardan mis datos en algún servidor?
No, el procesamiento se realiza localmente en tu navegador, garantizando la privacidad de tu información.