![]() |
Ciao e benvenuto da parte degli Stati Uniti al UNIX e Linux Forum! Grazie per la visita ed unirsi alla nostra Comunità Globale.
|
|
google unix.com
|
|||||||
| Forum | Registrati | Regole Forum | Collegamenti | Album | FAQ | Members List | Calendario | Ricerca | Today's Posts | Mark Forums Read |
| Shell scripting e di programmazione Pubblica domande su KSH, CSH, SH, Bash, Perl, PHP, sed, awk e da altri script di shell e linguaggi di scripting shell qui. |
Più di UNIX e Linux Forum Argomenti potreste trovare utili
|
||||
| Filo | Thread Starter | Forum | Risposte | Ultimo Post |
| Rimuovere dal file duplicati da posizione specifica | gopikgunda | Shell scripting e di programmazione | 1 | 04-09-2008 02:16 AM |
| Modo più veloce per la ricerca del file | vaibhavbhat | UNIX e avanzata per utenti esperti | 3 | 03-10-2008 10:57 AM |
| Come rimuovere i duplicati senza sistemazione | orahi001 | UNIX for Dummies Domande & Risposte | 4 | 01-17-2008 07:19 PM |
| come eliminare / rimuovere directory in modo più veloce | getdpg | Shell scripting e di programmazione | 6 | 03-07-2006 10:42 AM |
| più veloce copia comando | vascobrito | UNIX for Dummies Domande & Risposte | 0 | 07-20-2004 06:02 AM |
![]() |
|
|
LinkBack | Thread Tools | Cerca in questo Thread | Rate Thread | Modalità di visualizzazione |
|
|
|
||||
|
modo più veloce per eliminare i duplicati.
Ho cercato le FAQ - utilizzando sorta, duplicati, ecc ... ma non ho alcun articolo o risultati su di esso.
Attualmente sto utilizzando: sort-u file1> file2 di eliminare i duplicati. Per un file di dimensioni di circa 1giga byte. tempo necessario per rimuovere i duplicati è 1 ora e 21 min. C'è un altro modo più veloce per eliminare i duplicati? Le nostre dimensioni di file potrebbero arrivare a 10 a 12 Giga byte dimensioni. Aprpeciate qualsiasi puntatori. Grazie, Radhika. |
|
||||
|
Questo è circa 200 Kb / s. Pretty crap.
Presumo che stai thrashing swap? Una cosa da verificare è se non hai bisogno di multibyte cernita, anteponi quindi il tipo di comando con LANG \u003d C Suona come avete bisogno di un database (indici), a essere onesti. Se l'output è una piccola% di input, quindi partizionamento esplicitamente l'ingresso sarebbe vantaggioso. IE: mentre sort-u pezzo | sort-u |
|
||||
|
Prova questo uno ...
sed '$! N / ^ \ (.* \) \ n \ 1 $ /! P; D' # La prima linea è quella di duplicare solo conservato e di riposo sono soppressi. Ho testato con circa 1 GB di file. ci sono voluti circa 13 minuti per ordinare i file. Molto molto più veloce di tipo comando. ![]() Ultimo a cura di amit_sapre; al 06/24/2005 09:53 AM.. |
|
||||
|
Hi Vino,
Questo comando non mancherà di tenere il primo ingresso in quanto è e cancellare le altre voci, indipendentemente dal fatto che il file è ordinato o meno. N. prima ipotesi, mentre l'esecuzione di questo comando. |
![]() |
| Segnalibri |
| Thread Tools | Cerca in questo Thread |
| Modalità di visualizzazione | Vota questo thread |
|
|