The UNIX and Linux Forums  
Ciao e benvenuto da parte degli Stati Uniti al UNIX e Linux Forum! Grazie per la visita ed unirsi alla nostra Comunità Globale.

Go Back   UNIX e Linux Forum > Inizio Forum > Shell scripting e di programmazione
.
google unix.com



Shell scripting e di programmazione Pubblica domande su KSH, CSH, SH, Bash, Perl, PHP, sed, awk e da altri script di shell e linguaggi di scripting shell qui.

Più di UNIX e Linux Forum Argomenti potreste trovare utili
Filo Thread Starter Forum Risposte Ultimo Post
Rimuovere dal file duplicati da posizione specifica gopikgunda Shell scripting e di programmazione 1 04-09-2008 02:16 AM
Modo più veloce per la ricerca del file vaibhavbhat UNIX e avanzata per utenti esperti 3 03-10-2008 10:57 AM
Come rimuovere i duplicati senza sistemazione orahi001 UNIX for Dummies Domande & Risposte 4 01-17-2008 07:19 PM
come eliminare / rimuovere directory in modo più veloce getdpg Shell scripting e di programmazione 6 03-07-2006 10:42 AM
più veloce copia comando vascobrito UNIX for Dummies Domande & Risposte 0 07-20-2004 06:02 AM

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
LinkBack Thread Tools Cerca in questo Thread Rate Thread Modalità di visualizzazione
  #1 (permalink)  
Old 06-23-2005
Radhika radhika is offline
Utente Registrato
  
 

Iscriviti Data: aprile 2005
Interventi: 51
modo più veloce per eliminare i duplicati.

Ho cercato le FAQ - utilizzando sorta, duplicati, ecc ... ma non ho alcun articolo o risultati su di esso.

Attualmente sto utilizzando:
sort-u file1> file2 di eliminare i duplicati. Per un file di dimensioni di circa 1giga byte. tempo necessario per rimuovere i duplicati è 1 ora e 21 min.

C'è un altro modo più veloce per eliminare i duplicati? Le nostre dimensioni di file potrebbero arrivare a 10 a 12 Giga byte dimensioni.

Aprpeciate qualsiasi puntatori.
Grazie,
Radhika.
  #2 (permalink)  
Old 06-24-2005
vino's Avatar
vino vino is offline Forum Staff  
Supporter (in vino veritas)
  
 

Iscriviti Data: febbraio 2005
Località: Bangalore, India
Messaggi: 2.798
Solo un pensiero.

Perché non utilizzare il divide et impera approccio?

Vino

Ultimo a cura di vino; al 06/24/2005 03:46 AM..
  #3 (permalink)  
Old 06-24-2005
pixelbeat pixelbeat is offline
Utente Registrato
  
 

Iscriviti Data: giugno 2005
Luogo: Irlanda
Interventi: 61
Questo è circa 200 Kb / s. Pretty crap.
Presumo che stai thrashing swap?

Una cosa da verificare è se non hai bisogno di multibyte cernita,
anteponi quindi il tipo di comando con LANG \u003d C

Suona come avete bisogno di un database (indici), a essere onesti.

Se l'output è una piccola% di input, quindi
partizionamento esplicitamente l'ingresso sarebbe vantaggioso.
IE: mentre sort-u pezzo | sort-u
  #4 (permalink)  
Old 06-24-2005
amit_sapre amit_sapre is offline
Utente Registrato
  
 

Iscriviti Data: giugno 2005
Località: Bangalore, India
Interventi: 28
Cool

Prova questo uno ...

sed '$! N / ^ \ (.* \) \ n \ 1 $ /! P; D'

# La prima linea è quella di duplicare solo conservato e di riposo sono soppressi.

Ho testato con circa 1 GB di file.

ci sono voluti circa 13 minuti per ordinare i file. Molto molto più veloce di tipo comando.


Ultimo a cura di amit_sapre; al 06/24/2005 09:53 AM..
  #5 (permalink)  
Old 06-24-2005
vino's Avatar
vino vino is offline Forum Staff  
Supporter (in vino veritas)
  
 

Iscriviti Data: febbraio 2005
Località: Bangalore, India
Messaggi: 2.798
Citazione:
Originalmente inviato da amit_sapre
Prova questo uno ...

sed '$! N / ^ \ (.* \) \ n \ 1 $ /! P; D'

# La prima linea è quella di duplicare solo conservato e di riposo sono soppressi.

Auguriamo che questo tipo di lavoro più veloce di comando.

Non ho provato il file di grandi dimensioni.
Havn't cercato il tuo sed. Ma doesnt si suppone che tutte le voci sono già ordinati e poi elimina i duplicati.

e / o

Se il file è senza cernita, quindi sulla base di voci duplicate prima linea sono stati rimossi. da sed fa solo un passaggio attraverso il file.

Oppure non ho capito male?

vino
  #6 (permalink)  
Old 06-24-2005
amit_sapre amit_sapre is offline
Utente Registrato
  
 

Iscriviti Data: giugno 2005
Località: Bangalore, India
Interventi: 28
Hi Vino,

Questo comando non mancherà di tenere il primo ingresso in quanto è e cancellare le altre voci,

indipendentemente dal fatto che il file è ordinato o meno.

N. prima ipotesi, mentre l'esecuzione di questo comando.
  #7 (permalink)  
Old 06-24-2005
Radhika radhika is offline
Utente Registrato
  
 

Iscriviti Data: aprile 2005
Interventi: 51
Hi Amit,


>>
sed '$! N / ^ \ (.* \) \ n \ 1 $ /! P; D'

Potrebbe spiegare il comando - poco a poco se non si mente.

Grazie!
Closed Thread

Segnalibri

Thread Tools Cerca in questo Thread
Cerca in questo Thread:

Ricerca Avanzata
Modalità di visualizzazione Vota questo thread
Vota questo thread:

Distacco regolamento
Tu non può post nuovo thread
Tu non può inviare una risposta
Tu non può postare allegati
Tu non può modificare i tuoi post

BB codice è Su
Smilies sono Su
[IMG] codice Su
Codice HTML è Chiuso
Trackbacks sono Su
Pingbacks sono Su
Refbacks sono Su




Tutti gli orari sono GMT -4. La data di oggi è 11:15 AM.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Traduzioni Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Studios
UNIX e Linux Forum Content Copyright © 1993-2009. Tutti i diritti Reserved.Ad di gestione da RedTyger

Contenuti pertinenti URL da vBSEO 3.2.0