![]() |
|
|
google unix.com
|
|||||||
| Forums | Registrer | Forum Rules | Lenker | Album | FAQ | Medlemsliste | Kalender | Søke | Dagens innlegg | Marker forumene som lest |
| Shell programmering og Skripting Post spørsmål om ksh, csh, SH, Bash, Perl, PHP, SED, awk og ANDRE shell scripts og Shell skriptespråk her. |
Mer UNIX og Linux Forum Emner Du kan finne nyttig
|
||||
| Tråd | Tråd startet | Forum | Svar | Siste innlegg |
| Fjern duplikater fra fil fra en bestemt plassering | gopikgunda | Shell programmering og Skripting | 1 | 04-09-2008 03:16 |
| Raskeste måten for søking filen | vaibhavbhat | UNIX for Advanced & ekspertbrukere | 3 | 03-10-2008 10:57 |
| Hvordan fjerne duplikater uten sortering | orahi001 | UNIX for Dummies Spørsmål og svar | 4 | 01-17-2008 07:19 |
| hvordan du sletter / fjerne katalogen raskest | getdpg | Shell programmering og Skripting | 6 | 03-07-2006 10:42 |
| raskeste kopieringskommando | vascobrito | UNIX for Dummies Spørsmål og svar | 0 | 07-20-2004 07:02 |
![]() |
|
|
LinkBack | Thread Tools | Søk i denne tråden | Rate Thread | Visningsmoduser |
|
|
|
||||
|
raskeste måten å fjerne duplikater.
Jeg har søkt FAQ - ved hjelp av sort, duplikater, etc. ... men jeg fikk ikke noen av artiklene eller resultater på det.
For tiden bruker jeg: sort-u fil1> fil2 å fjerne duplikater. For en filstørrelse på 1giga byte ca. Tiden det tar å fjerne duplikater er 1t 21 min. Er det noen andre raskere måte å fjerne duplikater? Våre filstørrelser kan få 10 til 12 giga bytes størrelse. Aprpeciate noen pekere. Takk, Radhika. |
|
||||
|
Det er omtrent 200KB / s. Pretty crap.
Jeg antar du juling bytte? En ting å sjekke er om du ikke trenger multibyte sortering, Deretter setter den type kommandoen med LANG \u003d C Høres ut som du trenger en database (indekser) for å være ærlig. Hvis utdataene er en liten% av input, så eksplisitt partisjonering inngangen ville være gunstig. IE: mens sort-u blings | sort-u |
|
||||
|
Prøv denne ...
sed "$! N; / ^ \ (.* \) \ n \ 1 $ /! P; D ' # Den første linjen i duplikat de er bare oppbevares og resten slettes. Jeg har testet dette med rundt 1GB-fil. det tok ca 13 min å sortere denne filen. Mye mye raskere enn sort kommandoen. ![]() Sist endret av amit_sapre; 06-24-2005 kl 10:53.. |
|
||||
|
Hi Vino,
Denne kommandoen vil holde den første oppføringen som det er og slette de andre oppføringer, uavhengig av om filen er sortert eller ikke. Ingen tidligere antakelser mens kjøre denne kommandoen. |
![]() |
| Hugseliste |
| Thread Tools | Søk i denne tråden |
| Visningsmoduser | Ranger denne tråden |
|
|