The UNIX and Linux Forums  


Go Back   UNIX og Linux Forums > Top Forums > Shell programmering og Skripting
.
google unix.com



Shell programmering og Skripting Post spørsmål om ksh, csh, SH, Bash, Perl, PHP, SED, awk og ANDRE shell scripts og Shell skriptespråk her.

Mer UNIX og Linux Forum Emner Du kan finne nyttig
Tråd Tråd startet Forum Svar Siste innlegg
Fjern duplikater fra fil fra en bestemt plassering gopikgunda Shell programmering og Skripting 1 04-09-2008 03:16
Raskeste måten for søking filen vaibhavbhat UNIX for Advanced & ekspertbrukere 3 03-10-2008 10:57
Hvordan fjerne duplikater uten sortering orahi001 UNIX for Dummies Spørsmål og svar 4 01-17-2008 07:19
hvordan du sletter / fjerne katalogen raskest getdpg Shell programmering og Skripting 6 03-07-2006 10:42
raskeste kopieringskommando vascobrito UNIX for Dummies Spørsmål og svar 0 07-20-2004 07:02

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
LinkBack Thread Tools Søk i denne tråden Rate Thread Visningsmoduser
  #1 (permalink)  
Old 06-23-2005
radhika radhika is offline
Registrert bruker
  
 

Bli Dato: april 2005
Innlegg: 51
raskeste måten å fjerne duplikater.

Jeg har søkt FAQ - ved hjelp av sort, duplikater, etc. ... men jeg fikk ikke noen av artiklene eller resultater på det.

For tiden bruker jeg:
sort-u fil1> fil2 å fjerne duplikater. For en filstørrelse på 1giga byte ca. Tiden det tar å fjerne duplikater er 1t 21 min.

Er det noen andre raskere måte å fjerne duplikater? Våre filstørrelser kan få 10 til 12 giga bytes størrelse.

Aprpeciate noen pekere.
Takk,
Radhika.
  #2 (permalink)  
Old 06-24-2005
vino's Avatar
Vino vino is offline Forum Staff  
Tilhenger (i Vino Veritas)
  
 

Bli Date: Feb 2005
Beliggenhet: Bangalore, India
Innlegg: 2798
Bare en tanke.

Hvorfor ikke bruke splitt og hersk tilnærming?

Vino

Sist endret av Vino; 06-24-2005 på 04:46..
  #3 (permalink)  
Old 06-24-2005
pixelbeat pixelbeat is offline
Registrert bruker
  
 

Bli Dato: juni 2005
Sted: Irland
Innlegg: 61
Det er omtrent 200KB / s. Pretty crap.
Jeg antar du juling bytte?

En ting å sjekke er om du ikke trenger multibyte sortering,
Deretter setter den type kommandoen med LANG \u003d C

Høres ut som du trenger en database (indekser) for å være ærlig.

Hvis utdataene er en liten% av input, så
eksplisitt partisjonering inngangen ville være gunstig.
IE: mens sort-u blings | sort-u
  #4 (permalink)  
Old 06-24-2005
amit_sapre amit_sapre is offline
Registrert bruker
  
 

Bli Dato: juni 2005
Beliggenhet: Bangalore, India
Innlegg: 28
Cool

Prøv denne ...

sed "$! N; / ^ \ (.* \) \ n \ 1 $ /! P; D '

# Den første linjen i duplikat de er bare oppbevares og resten slettes.

Jeg har testet dette med rundt 1GB-fil.

det tok ca 13 min å sortere denne filen. Mye mye raskere enn sort kommandoen.


Sist endret av amit_sapre; 06-24-2005 kl 10:53..
  #5 (permalink)  
Old 06-24-2005
vino's Avatar
Vino vino is offline Forum Staff  
Tilhenger (i Vino Veritas)
  
 

Bli Date: Feb 2005
Beliggenhet: Bangalore, India
Innlegg: 2798
Sitat:
Originally Posted by amit_sapre
Prøv denne ...

sed "$! N; / ^ \ (.* \) \ n \ 1 $ /! P; D '

# Den første linjen i duplikat de er bare oppbevares og resten slettes.

Håper dette vil arbeide raskere enn sort kommandoen.

Jeg har ikke prøvd på store filer.
Havn't forsøkt din sed. Men doesnt it anta at alle oppføringene allerede er sortert og så fjerner duplikater.

og / eller

Hvis filen er usortert, da doble oppføringer basert på første linje er fjernet. siden sed gjør bare ett pass gjennom filen.

Eller har jeg misforstått noe?

Vino
  #6 (permalink)  
Old 06-24-2005
amit_sapre amit_sapre is offline
Registrert bruker
  
 

Bli Dato: juni 2005
Beliggenhet: Bangalore, India
Innlegg: 28
Hi Vino,

Denne kommandoen vil holde den første oppføringen som det er og slette de andre oppføringer,

uavhengig av om filen er sortert eller ikke.

Ingen tidligere antakelser mens kjøre denne kommandoen.
  #7 (permalink)  
Old 06-24-2005
radhika radhika is offline
Registrert bruker
  
 

Bli Dato: april 2005
Innlegg: 51
Hi Amit,


>>
sed "$! N; / ^ \ (.* \) \ n \ 1 $ /! P; D '

Kan du forklare kommandoen - litt etter litt hvis du ikke tankene.

Takk!
Closed Thread

Hugseliste

Thread Tools Søk i denne tråden
Søk i denne tråden:

Avansert søk
Visningsmoduser Ranger denne tråden
Ranger denne tråden:

Innleggsaktivitet Regler
Du kanskje ikke poste nye tråder
Du kanskje ikke poste svar
Du kanskje ikke post vedlegg
Du kanskje ikke redigere innleggene dine

BB-kode er
Smilefjes er
[IMG] koden
HTML-koden Av
Pingbacks er
Refbacks er




Alle klokkeslett er GMT -4. Nå er klokken 07:14.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Language Translations Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Studios
UNIX og Linux Forums Content Copyright © 1993-2009. All Rights Reserved.Ad Management by RedTyger

Content Relevant nettadresser av vBSEO 3.2.0