![]() |
|
|
Google unix.com
|
|||||||
| Foren | Registrieren | Forum-Regeln | Links | Alben | FAQ | Benutzerliste | Kalender | Suche | Die heutige Beiträge | Alle Foren als gelesen markieren |
| Shell Programmierung und Scripting Post Fragen zu ksh, csh, sh, bash, Perl, PHP, sed, awk und anderen Shell-Skripte und Shell-Scripting-Sprachen hier. |
Mehr UNIX-und Linux-Forum Themen Vielleicht finden Sie hilfreiche
|
||||
| Faden | Thread Starter | Forum | Antworten | Last Post |
| Entfernt Dubletten aus Datei von bestimmten Standort | gopikgunda | Shell Programmierung und Scripting | 1 | 04-09-2008 03:16 AM |
| Schnellste Weg für die Suche nach der Datei | vaibhavbhat | UNIX für Fortgeschrittene und Experten | 3 | 03-10-2008 10:57 AM |
| So entfernen Sie Duplikate nicht sortieren | orahi001 | UNIX for Dummies Questions & Answers | 4 | 01-17-2008 07:19 PM |
| So löschen / entfernen, Verzeichnis, in schnellste Weg | getdpg | Shell Programmierung und Scripting | 6 | 03-07-2006 10:42 AM |
| schnellste Befehl "Kopieren" | vascobrito | UNIX for Dummies Questions & Answers | 0 | 07-20-2004 07:02 AM |
![]() |
|
|
LinkBack | Thread Tools | Suche diesen Thread | Rate Thread | Anzeige-Modi |
|
|
|
||||
|
schnellste Weg, um Duplikate zu entfernen.
Ich habe die Fragen und Antworten - mit sortieren, Duplikate, etc. ... aber ich habe nicht alle Artikel oder Ergebnisse auf.
Derzeit bin ich mit: sort-u datei1> datei2 Duplikate zu entfernen. Bei einer Dateigröße von ca. 1giga Byte. Zeit, die zur Beseitigung von Dubletten ist 1 Stunde 21 Min.. Gibt es eine andere Art und Weise schneller zu entfernen Duplikate? Unsere Dateigrößen könnte auf 10 bis 12 Giga Byte Größe. Aprpeciate Any pointers. Danke, Radhika. |
|
||||
|
Das ist ca. 200 KByte / s. Pretty crap.
Ich vermute, Sie verprügeln Swap? Eine Sache ist zu prüfen, wenn Sie sie nicht benötigen Multibyte Sortieren, dann stelle die Art Befehl mit LANG \u003d C Klingt wie Sie eine Datenbank (Index) um ehrlich zu sein. Wenn die Ausgabe ist ein kleiner% der Eingabe, dann ausdrücklich Partitionierung der Eingabe von Vorteil wäre. IE: Während sort-u chunk | sort-u |
|
||||
|
Probieren Sie diese ...
sed '$! N; / ^ \ (.* \) \ n \ 1 $ /! P, D' # Die erste Zeile der doppelten sind nur gehalten und Ruhezeiten sind, werden gestrichen. Ich habe das mit rund 1 GB-Datei. Es dauerte etwa 13 min zu sortieren, dass die Datei. Viel viel schneller als Art Befehl. ![]() Zuletzt bearbeitet von amit_sapre; am 06-24-2005 10:53 AM.. |
|
||||
|
Hallo Vino,
Mit diesem Befehl wird der erste Eintrag, wie sie ist und löschen Sie die anderen Einträge, unabhängig davon, ob die Datei sortiert ist oder nicht. Eine vorherige Annahmen während der Ausführung dieses Befehls. |
![]() |
| Lesezeichen |
| Thread Tools | Suche diesen Thread |
| Anzeige-Modi | Rate this thread |
|
|