Elimina las líneas duplicadas de una lista o bloque de texto e informa cuántas se eliminaron. Útil para limpiar CSVs, logs, listas de URLs, volcados de palabras clave y cualquier sitio donde se cuelan repeticiones.
Modo de conservación:
- Primera aparición — cuando una línea aparece más de una vez, se conserva la primera copia y se eliminan las siguientes. Es la opción habitual: preserva el orden original de arriba a abajo que pegaste.
- Última aparición — se conserva la última copia. Útil cuando la entrada más reciente es la que fías (p. ej. un log donde la última línea sustituye a las anteriores).
Opciones de comparación:
- Distingue mayúsculas (activado por defecto) — trata
Apple y apple como líneas distintas. Desactívalo para considerarlas duplicadas.
- Recortar espacios al comparar — elimina espacios y tabuladores al inicio/final de cada línea antes de decidir si dos líneas son iguales, así
hello y hello cuentan como la misma línea. (El recorte es solo para comparar; los espacios originales de las líneas conservadas se mantienen en la salida.)
- Ignorar líneas vacías — descarta las líneas vacías (sin caracteres o solo con espacios), en lugar de colapsarlas a una.
Bueno saber:
- Comparación solo de línea completa — esta herramienta no desduplica palabras o campos individuales dentro de una línea.
- Los recuentos en los metadatos te dicen el número de líneas original, el conservado y cuántos duplicados se eliminaron exactamente.