![]() |
|
|
google unix.com
|
|||||||
| Foros | Registro | Reglas de los Foros | Enlaces | Álbumes | Preguntas más frecuentes | Lista de miembros | Calendario | Búsqueda | Puestos de hoy | Marcar Foros Como Leídos |
| Programación de scripts de shell y Plantear preguntas sobre KSH, CSH, SH, BASH, PERL, PHP, SED, AWK y otros scripts de shell y lenguajes de script de shell aquí. |
Más UNIX y Linux Foro Temas usted puede encontrar útiles
|
||||
| Hilo | Hilo para principiantes | Foro | Respuestas | Último mensaje |
| Eliminar duplicados de archivos de la ubicación específica | gopikgunda | Programación de scripts de shell y | 1 | 04-09-2008 03:16 AM |
| Es la manera más rápida para la búsqueda en el archivo | vaibhavbhat | UNIX para usuarios avanzados y expertos | 3 | 03-10-2008 10:57 AM |
| Cómo eliminar duplicados sin orden | orahi001 | UNIX for Dummies Preguntas y Respuestas | 4 | 01-17-2008 07:19 PM |
| cómo eliminar / eliminar el directorio en forma más rápida | getdpg | Programación de scripts de shell y | 6 | 03-07-2006 10:42 AM |
| más rápido copiar | vascobrito | UNIX for Dummies Preguntas y Respuestas | 0 | 07-20-2004 07:02 AM |
![]() |
|
|
Linkback vínculo | Herramientas de hilo | Buscar en este Hilo | Tasa de Hilo | Modos de visualización |
|
|
|
||||
|
manera más rápida de eliminar duplicados.
He buscado las Preguntas más frecuentes - con suerte, duplicados, etc ... pero no he tenido ningún artículo o los resultados en ella.
Actualmente, estoy usando: sort-u archivo1> archivo2 para eliminar duplicados. Para un tamaño de archivo de byte 1giga aprox. tiempo necesario para eliminar duplicados es 1 hora 21 minutos. ¿Hay alguna otra manera más rápida de eliminar duplicados? Nuestros tamaños de archivo puede llegar a 10 a 12 giga octetos tamaño. Aprpeciate cualquier punteros. Gracias, Radhika. |
|
||||
|
Eso es aproximadamente 200 KB / s. Bastante basura.
Supongo que estás paliza de intercambio? Una cosa que hacer es comprobar si no necesita multibyte clasificación, entonces anteponer el tipo de mando con LANG \u003d C Suena como que necesita una base de datos (índices) para ser honesto. Si la salida es un pequeño% de la entrada y, a continuación, particionado explícitamente la entrada sería beneficioso. IE: mientras sort-u fragmento | sort-u |
|
||||
|
Pruebe esta ...
sed '$! N; / ^ \ (.* \) \ n \ 1 $ /! P, D' # La primera línea de los dos ejemplares y sólo se conserva resto se eliminan. He probado este archivo con cerca de 1GB. tomó cerca de 13 minutos para ordenar el archivo. Mucho mucho más rápido que el tipo de comando. ![]() Última edición por amit_sapre; al 06-24-2005 10:53 AM.. |
|
||||
|
Hola Vino,
Este comando se mantendrá la primera entrada, tal y como es y borrar las otras entradas, independientemente de si el archivo está ordenada o no. Mientras que los supuestos antes no ejecutar este comando. |
|
||||
|
Hola Amit,
>> sed '$! N; / ^ \ (.* \) \ n \ 1 $ /! P, D' ¿Podría explicar el comando - poco a poco si no le importa. Gracias! |
![]() |
| Marcadores |
| Herramientas de hilo | Buscar en este Hilo |
| Modos de visualización | Vota a este hilo |
|
|