The UNIX and Linux Forums  

Go Back   El UNIX y Linux Foros > Arriba Foros > Programación de scripts de shell y
.
google unix.com



Programación de scripts de shell y Plantear preguntas sobre KSH, CSH, SH, BASH, PERL, PHP, SED, AWK y otros scripts de shell y lenguajes de script de shell aquí.

Más UNIX y Linux Foro Temas usted puede encontrar útiles
Hilo Hilo para principiantes Foro Respuestas Último mensaje
Eliminar duplicados de archivos de la ubicación específica gopikgunda Programación de scripts de shell y 1 04-09-2008 03:16 AM
Es la manera más rápida para la búsqueda en el archivo vaibhavbhat UNIX para usuarios avanzados y expertos 3 03-10-2008 10:57 AM
Cómo eliminar duplicados sin orden orahi001 UNIX for Dummies Preguntas y Respuestas 4 01-17-2008 07:19 PM
cómo eliminar / eliminar el directorio en forma más rápida getdpg Programación de scripts de shell y 6 03-07-2006 10:42 AM
más rápido copiar vascobrito UNIX for Dummies Preguntas y Respuestas 0 07-20-2004 07:02 AM

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
Linkback vínculo Herramientas de hilo Buscar en este Hilo Tasa de Hilo Modos de visualización
  #1 (Enlace permanente)  
Old 06-23-2005
Radhika radhika is offline
Usuario Registrado
  
 

Fecha: abril 2005
Puestos: 51
manera más rápida de eliminar duplicados.

He buscado las Preguntas más frecuentes - con suerte, duplicados, etc ... pero no he tenido ningún artículo o los resultados en ella.

Actualmente, estoy usando:
sort-u archivo1> archivo2 para eliminar duplicados. Para un tamaño de archivo de byte 1giga aprox. tiempo necesario para eliminar duplicados es 1 hora 21 minutos.

¿Hay alguna otra manera más rápida de eliminar duplicados? Nuestros tamaños de archivo puede llegar a 10 a 12 giga octetos tamaño.

Aprpeciate cualquier punteros.
Gracias,
Radhika.
  #2 (Enlace permanente)  
Old 06-24-2005
vino's Avatar
vino vino is offline Forum Staff  
Defensor (in vino veritas)
  
 

Fecha: febrero 2005
Lugar: Bangalore, India
Mensajes: 2.798
Sólo un pensamiento.

¿Por qué no utilizar el enfoque de divide y vencerás?

Vino

Última edición por vino; al 06-24-2005 04:46 AM..
  #3 (Enlace permanente)  
Old 06-24-2005
pixelbeat pixelbeat is offline
Usuario Registrado
  
 

Fecha: junio 2005
Ubicación: Irlanda
Puestos: 61
Eso es aproximadamente 200 KB / s. Bastante basura.
Supongo que estás paliza de intercambio?

Una cosa que hacer es comprobar si no necesita multibyte clasificación,
entonces anteponer el tipo de mando con LANG \u003d C

Suena como que necesita una base de datos (índices) para ser honesto.

Si la salida es un pequeño% de la entrada y, a continuación,
particionado explícitamente la entrada sería beneficioso.
IE: mientras sort-u fragmento | sort-u
  #4 (Enlace permanente)  
Old 06-24-2005
amit_sapre amit_sapre is offline
Usuario Registrado
  
 

Fecha: junio 2005
Lugar: Bangalore, India
Publicaciones: 28
Cool

Pruebe esta ...

sed '$! N; / ^ \ (.* \) \ n \ 1 $ /! P, D'

# La primera línea de los dos ejemplares y sólo se conserva resto se eliminan.

He probado este archivo con cerca de 1GB.

tomó cerca de 13 minutos para ordenar el archivo. Mucho mucho más rápido que el tipo de comando.


Última edición por amit_sapre; al 06-24-2005 10:53 AM..
  #5 (Enlace permanente)  
Old 06-24-2005
vino's Avatar
vino vino is offline Forum Staff  
Defensor (in vino veritas)
  
 

Fecha: febrero 2005
Lugar: Bangalore, India
Mensajes: 2.798
Cita:
Publicado originalmente por amit_sapre
Pruebe esta ...

sed '$! N; / ^ \ (.* \) \ n \ 1 $ /! P, D'

# La primera línea de los dos ejemplares y sólo se conserva resto se eliminan.

Esperamos que este trabajo más rápido que el tipo de comando.

No he tratado de archivos grandes.
HAVN'T intentado su sed. Pero doesnt asume que todas las entradas ya están clasificados y, a continuación, elimina los duplicados.

y / o

Si el archivo está sin clasificar y, a continuación, sobre la base de entradas duplicadas de primera línea son eliminadas. desde que sed hace tan sólo un paso a través del archivo.

¿O lo entiendo mal?

vino
  #6 (Enlace permanente)  
Old 06-24-2005
amit_sapre amit_sapre is offline
Usuario Registrado
  
 

Fecha: junio 2005
Lugar: Bangalore, India
Publicaciones: 28
Hola Vino,

Este comando se mantendrá la primera entrada, tal y como es y borrar las otras entradas,

independientemente de si el archivo está ordenada o no.

Mientras que los supuestos antes no ejecutar este comando.
  #7 (Enlace permanente)  
Old 06-24-2005
Radhika radhika is offline
Usuario Registrado
  
 

Fecha: abril 2005
Puestos: 51
Hola Amit,


>>
sed '$! N; / ^ \ (.* \) \ n \ 1 $ /! P, D'

¿Podría explicar el comando - poco a poco si no le importa.

Gracias!
Closed Thread

Marcadores

Herramientas de hilo Buscar en este Hilo
Buscar en este Hilo:

Búsqueda avanzada
Modos de visualización Vota a este hilo
Vota a este hilo:

Normas de envío
puede que no nuevo puesto de hilos
puede que no enviar respuestas
puede que no enviar archivos adjuntos
puede que no editar sus puestos

Código BB es Encendido
Emoticones son Encendido
[IMG] código Encendido
Código HTML es Apagado
Trackbacks son Encendido
Pingbacks son Encendido
Refbacks son Encendido




Todas las horas son GMT -4. La hora es 07:36 PM.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Traducciones de idiomas Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Estudios
El UNIX y Linux Foros Contenido Copyright © 1993-2009. Todos los derechos Reserved.Ad Gestión por RedTyger

Las direcciones URL de contenido vBSEO 3.2.0