
Ordenar y deduplicar líneas de texto online (sin Excel ni scripts)
📷 Pixabay / PexelsOrdenar y deduplicar líneas de texto online (sin Excel ni scripts)
Cómo ordenar, deduplicar, invertir y limpiar rápidamente listas de texto sin necesidad de hojas de cálculo ni terminal. Ejemplos prácticos para desarrolladores y gestores de datos.
Hay un tipo específico de tedio que los desarrolladores y los que trabajan con datos enfrentan constantemente: tienes una lista de cosas — dominios, nombres de usuario, etiquetas, URLs, mensajes de error — y necesitas que estén ordenados, o que los duplicados desaparezcan, o ambas cosas. Parece sencillo. Es sencillo. Pero la fricción de abrir Excel, o escribir un script rápido de Python, o recordar la invocación exacta de sort | uniq en bash es suficiente para ralentizarte.
He perdido más tiempo del que me gustaría admitir en tareas como esta. No horas, sino esas molestas interrupciones de dos minutos que rompen el flujo de trabajo. Ese es el caso de uso para el que se construyó la herramienta Ordenador de líneas — pegar la lista, ordenarla, limpiarla, copiarla, seguir adelante.
Los casos comunes
Déjame repasar las situaciones en las que este tipo de herramienta realmente ahorra tiempo.
Deduplicar una lista de URLs o dominios
Estás compilando una lista de dominios para bloquear, o una lista de reglas de redirección, o una lista de permitidos para una política de seguridad de contenido. Pegas URLs de diferentes fuentes y acabas con duplicados. Podrías:
- Abrir Excel, pegar, usar Eliminar duplicados
- Escribir
sort -u list.txt > sorted.txten un terminal - Usar awk o Python
O podrías pegarlo en un ordenador de líneas, marcar "Eliminar duplicados" y terminar en 10 segundos.
El enfoque de terminal es honestamente más limpio si ya estás en un terminal. Pero cuando estás en medio de otra cosa — escribiendo documentación, rellenando un formulario, trabajando en un navegador — cambiar de contexto a un terminal para ejecutar un comando de una línea tiene más sobrecarga de la que parece.
Alfabetizar listas de etiquetas o palabras clave
Palabras clave SEO. Nombres de columnas de base de datos. Nombres de variables de entorno. Claves de configuración. Estas son listas que se leen mejor alfabetizadas, y raramente están alfabetizadas cuando las escribes por primera vez.
Alfabetizar manualmente funciona para cinco elementos. Con quince elementos tus ojos empiezan a saltarse cosas. Con cincuenta elementos necesitas una herramienta.
Aleatorizar el orden (barajar)
A veces quieres lo contrario de ordenado — necesitas aleatorizar una lista. Datos de prueba en orden aleatorio, preguntas de encuesta mezcladas, una lista de reproducción aleatoria exportada como texto. La opción de barajar lo maneja.
Invertir sin ordenar
Si tienes un registro de cambios donde la entrada más antigua está primero, puede que quieras la más reciente primero para visualización. El orden inverso (no el orden alfabético inverso — solo voltear la secuencia) es diferente de ordenar en orden inverso. Ambas operaciones están disponibles.
Las opciones que realmente importan
El Ordenador de líneas tiene algunas opciones que vale la pena entender:
Distinguir mayúsculas: Con distinción de mayúsculas desactivada (predeterminado), "Manzana" y "manzana" se ordenan juntas y cuentan como duplicados. Con ella activada, se tratan como valores diferentes. Para casos de uso de programación — nombres de variables de entorno, nombres de comandos — distinguir mayúsculas suele ser lo que quieres. Para texto humano como listas de nombres o lugares, no distinguir mayúsculas suele ser mejor.
Eliminar duplicados: Funciona en combinación con otras operaciones. Si ordenas y eliminas duplicados simultáneamente, obtienes una lista limpia, deduplicada y alfabetizada.
Eliminar líneas vacías: Pegar algo de un documento a menudo trae líneas en blanco dispersas. Esto las elimina.
Recortar espacios: Espacios iniciales y finales en cada línea. El tipo que aparece invisiblemente cuando copias de una hoja de cálculo o un PDF. "manzana " y "manzana" no son la misma cadena — pero con recortar activado se vuelven iguales, así que los duplicados se detectan correctamente.
Un flujo de trabajo real: limpiar una lista de verificación de migración de base de datos
Aquí hay un flujo de trabajo específico que realmente he usado. Teníamos una lista de verificación de migración de base de datos que había sido mantenida por varias personas a lo largo del tiempo. Los elementos habían sido añadidos y vueltos a añadir, algunos con espacios ligeramente diferentes o diferencias de mayúsculas. La lista había crecido a más de 200 elementos.
Para limpiarla:
- Copiar toda la lista al portapapeles
- Pegar en el Ordenador de líneas
- Activar: Recortar espacios, Eliminar líneas vacías, Eliminar duplicados
- Ordenar A → Z (facilita detectar cuasi-duplicados a simple vista)
- Copiar el resultado
La salida ordenada y deduplicada se redujo a 140 elementos. Los cuasi-duplicados — "Migrar tabla de usuarios" vs "migrar tabla de usuarios" — todavía necesitaban un ojo humano, pero los duplicados exactos obvios habían desaparecido.
Después de la deduplicación, pasé la lista ordenada por la herramienta Diferencia de texto para compararla con la versión anterior y asegurarme de que nada legítimo había sido eliminado. Ese flujo de trabajo de dos herramientas tomó quizás cinco minutos en total.
Cuándo usar un terminal en su lugar
Seré honesto: si te sientes cómodo en un terminal, sort -u filename.txt es más rápido para archivos. Y si estás procesando algo programáticamente como parte de un script, definitivamente hazlo en código.
La herramienta online es mejor cuando:
- Ya estás en un contexto de navegador
- Estás trabajando con texto que está en el portapapeles, no en un archivo
- Quieres aplicar múltiples opciones (ordenar + deduplicar + recortar) a la vez sin encadenar comandos
- La persona que hace esto no es un desarrollador
Ese último punto importa. No todo el mundo que necesita deduplicar una lista sabe cómo abrir un terminal. Un gestor de contenido, una persona de marketing, un jefe de proyecto — tienen la misma necesidad y merecen una herramienta que no requiera saber qué hace awk '{!seen[$0]++} !seen[$0]'.
Ordenación multilingüe
Algo fácil de pasar por alto: ordenar texto no inglés no es lo mismo que ordenar texto ASCII.
sort en bash hace un trabajo razonable con UTF-8, pero necesitas configurar correctamente tu locale (LC_ALL=es_ES.UTF-8 sort o similar). Las letras con acentos (é, ü, ñ) se ordenan de manera diferente según el locale. El coreano, el japonés y el chino tienen reglas de clasificación completamente diferentes.
El Ordenador de líneas usa el método localeCompare() de JavaScript para ordenar, que respeta la configuración de locale del navegador. Esto significa que las listas en español ordenan correctamente: ñ ordena después de n, é cerca de e, y así sucesivamente.
No es perfecto — la ordenación sensible al locale es un problema profundo — pero es significativamente mejor que el ordenamiento naïf de códigos de caracteres para contenido multilingüe real.
Lo que no hace
Para fijar expectativas:
No hará coincidencias difusas de duplicados. Si tienes "Buenos Aires" y "buenos aires" con distinción de mayúsculas desactivada, esas coinciden. Pero "Buenos Aires" y "La ciudad de Buenos Aires" son cadenas diferentes y no serán detectadas como duplicados. Para deduplicación difusa necesitarías algo más sofisticado.
No ordenará columnas. Esta es una herramienta a nivel de líneas. Si tienes valores separados por comas y quieres ordenar por la segunda columna, necesitas una herramienta CSV o una hoja de cálculo.
No contará ocurrencias ni agrupará por valor. Para análisis de texto más rico, consulta el Contador de palabras.
Privacidad
Todo se ejecuta en tu navegador. Tu texto nunca se envía a un servidor. Esto importa cuando la lista que estás deduplicando contiene emails, nombres de dominio internos, datos de clientes o cualquier otro contenido sensible.
Integrando en tu flujo de trabajo
Algunas notas prácticas:
Uso con teclado: Si eres de los que prefiere el teclado, el flujo es: Ctrl+A para seleccionar todo en la entrada, Ctrl+V para pegar, ajustar opciones con Tab y Espacio, luego hacer clic en Procesar. La salida tiene un botón de copiar.
Entradas grandes: La herramienta maneja bien entradas grandes para tamaños típicos — cientos o miles de líneas. Para entradas verdaderamente masivas (millones de líneas), una herramienta de línea de comandos será más rápida.
Ida y vuelta: Está bien usar la salida de una operación como entrada para otra. Ordenar, copiar, pegar de vuelta, aplicar diferentes opciones, repetir. La herramienta no tiene memoria entre operaciones.
Conclusión
Un ordenador de líneas suena casi demasiado simple para necesitar su propia herramienta. Pero "demasiado simple para necesitar una herramienta" es a menudo la categoría donde la fricción se acumula de forma más invisible. Las tareas de cinco segundos que haces veinte veces al día.
Ordena, deduplica y limpia tus listas de texto aquí. Sin configuración, sin registro, sin preocupaciones por pegar en servidores aleatorios.
Si estás trabajando con algo más estructurado, la herramienta Diferencia de texto es buena para comparar versiones de una lista antes y después de la modificación. Y el Contador de palabras te da estadísticas sobre tu texto si necesitas más que solo salida ordenada.