The UNIX and Linux Forums  


Go Back   UNIX og Linux Forums > Top Forums > Shell Programmering og Scripting
.
google unix.com



Shell Programmering og Scripting Post spørgsmål om ksh, CSH, SH, Bash, Perl, PHP, SED, AWK og ANDRE shell scripts og Shell scriptsprog her.

Mere UNIX og Linux Forum Emner du måske kan finde Helpful
Tråd Thread Starter Forum Svar Last Post
Fjern dubletter fra fil fra en bestemt placering gopikgunda Shell Programmering og Scripting 1 04-09-2008 03:16 AM
Hurtigste måde til at søge efter filen vaibhavbhat UNIX for Advanced & Ekspertsøgning Brugere 3 03-10-2008 10:57 AM
Sådan fjernes dubletter uden sortering orahi001 UNIX for dummyer Spørgsmål & svar 4 01-17-2008 07:19 PM
hvordan man kan slette / fjerne mappe i hurtigste måde getdpg Shell Programmering og Scripting 6 03-07-2006 10:42 AM
hurtigste kopi kommando vascobrito UNIX for dummyer Spørgsmål & svar 0 07-20-2004 07:02 AM

Closed Thread
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
LinkBack Thread Tools Søg denne tråd Rate Thread Display Modes
  #1 (permalink)  
Old 06-23-2005
Radhika radhika is offline
Registreret Bruger
  
 

Join Date: Apr 2005
Stillinger: 51
hurtigste måde at fjerne dubletter.

Jeg har søgt FAQ - ved hjælp af sort, dubletter, etc. ... men jeg fik ikke nogen artikler eller resultater på det.

I øjeblikket bruger jeg:
sort-u fil1> fil2 at fjerne dubletter. For en filstørrelse på 1giga byte ca. tid, det tager at fjerne dubletter er 1 time og 21 min.

Er der nogen andre hurtigere måde at fjerne dubletter? Vores filstørrelser kunne komme til fra 10 til 12 giga byte størrelse.

Aprpeciate nogen pointers.
Tak,
Radhika.
  #2 (permalink)  
Old 06-24-2005
vino's Avatar
vino vino is offline Forum Staff  
Supporter (in vino veritas)
  
 

Join Date: Feb 2005
Beliggenhed: Bangalore, Indien
Indlæg: 2.798
Bare en tanke.

Hvorfor ikke bruge den del og hersk strategi?

Vino

Sidst redigeret af vino; 06-24-2005 på 04:46 AM..
  #3 (permalink)  
Old 06-24-2005
pixelbeat pixelbeat is offline
Registreret Bruger
  
 

Join Date: Jun 2005
Beliggenhed: Irland
Stillinger: 61
Det er ca 200KB / s. Pretty crap.
Jeg formoder, du gennemdrøfte swap?

En ting er at kontrollere, er, hvis du ikke behøver multibyte sortering,
Derefter prepend den slags kommando med LANG \u003d C

Lyder som om du har brug for en database (indeks) for at være ærlig.

Hvis output er en lille% af de input, så
eksplicit opdeling af input ville være gavnligt.
IE: mens sort-u luns | sort-u
  #4 (permalink)  
Old 06-24-2005
amit_sapre amit_sapre is offline
Registreret Bruger
  
 

Join Date: Jun 2005
Beliggenhed: Bangalore, INDIEN
Stillinger: 28
Cool

Prøv denne her ...

sed '$! N; / ^ \ (.* \) \ n \ 1 $ /! P D'

# Den første linje i to eksemplarer dem er kun holdes, og resten er slettet.

Jeg har testet dette med omkring 1GB fil.

det tog ca 13 min for at sortere denne fil. Meget meget hurtigere end slags kommando.


Senest redigeret af amit_sapre; 06-24-2005 kl 10:53 AM..
  #5 (permalink)  
Old 06-24-2005
vino's Avatar
vino vino is offline Forum Staff  
Supporter (in vino veritas)
  
 

Join Date: Feb 2005
Beliggenhed: Bangalore, Indien
Indlæg: 2.798
Citat:
Oprindeligt Indsendt af amit_sapre
Prøv denne her ...

sed '$! N; / ^ \ (.* \) \ n \ 1 $ /! P D'

# Den første linje i to eksemplarer dem er kun holdes, og resten er slettet.

Håber, at dette vil arbejde hurtigere end slags kommando.

Jeg har ikke prøvet den store filer.
Havn't forsøgt jeres sed. Men det gør ikke antage, at alle indgange er allerede sorteret og så det fjerner dubletter.

og / eller

Hvis filen er usorteret, så dobbelte poster baseret på første linje er fjernet. siden sed gør bare et enkelt gennemløb gennem filen.

Eller gjorde jeg det forkert?

vino
  #6 (permalink)  
Old 06-24-2005
amit_sapre amit_sapre is offline
Registreret Bruger
  
 

Join Date: Jun 2005
Beliggenhed: Bangalore, INDIEN
Stillinger: 28
Hi Vino,

Denne kommando vil beholde den første indrejse, som den er, og slette de andre poster,

uanset om filen er sorteret eller ej.

Ingen forudgående forudsætninger, mens det udfører denne kommando.
  #7 (permalink)  
Old 06-24-2005
Radhika radhika is offline
Registreret Bruger
  
 

Join Date: Apr 2005
Stillinger: 51
Hi Amit,


>>
sed '$! N; / ^ \ (.* \) \ n \ 1 $ /! P D'

Kan du forklare kommando - lidt efter lidt, hvis du ikke har noget imod.

Tak!
Closed Thread

Bogmærker

Thread Tools Søg denne tråd
Søg denne tråd:

Avanceret søgning
Display Modes Bedøm denne tråd
Bedøm denne tråd:

Udstationering Regler
Du kan ikke post nye tråde
Du kan ikke post svar
Du kan ikke post vedhæftede filer
Du kan ikke redigere dine indlæg

BB-kode er
Smilies er
[IMG] koden er
HTML-koden er Slukket
Trackbacks er
Pingbacks er
Refbacks er




Alle tidspunkter er GMT -4. Den tid er nu 12:35 PM.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Oversættelser Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Studios
UNIX og Linux Forums Content Copyright © 1993-2009. Alle rettigheder Reserved.Ad Management ved RedTyger

Content Relevant webadresser ved vBSEO 3.2.0