The UNIX and Linux Forums  
Hei og Velkommen fra USA til UNIX og Linux Forums! Takk for besøket og Delta i vårt globale samfunn.

Go Back   UNIX og Linux Forums > Top Forums > High Level Programmering
.
google unix.com



High Level Programmering Post spørsmål om C, C + +, Java, SQL og andre programmeringsspråk her.

Mer UNIX og Linux Forum Emner Du kan finne nyttig
Tråd Tråd startet Forum Svar Siste innlegg
Hvordan legge til metadata til digitale bilder fra kommandolinjen iBot UNIX og Linux RSS Nyheter 0 09-19-2008 03:30
Hachoir metadata 1,2 (standardgrenen) iBot Software Releases - RSS Nyheter 0 09-03-2008 08:30
Nok et metadataregisteret Injector for FLV 1,4 (standardgrenen) iBot Software Releases - RSS Nyheter 0 05-25-2008 10:10
Nok et metadataregisteret Injector for FLV 1,3 (standardgrenen) iBot Software Releases - RSS Nyheter 0 04-27-2008 05:30
Hjelp, hva er forskjellen mellom core dump og panikk dump? Aileen UNIX for Dummies Spørsmål og svar 1 06-11-2001 09:08

 
English Japanese Spanish French German Portuguese Italian Dutch Swedish Russian Norwegian Hungarian Hebrew Danish Bulgarian Greek Powered by Powered by Google
 
LinkBack Thread Tools Søk i denne tråden Rate Thread Visningsmoduser
  #1 (permalink)  
Old 06-29-2009
emitrax emitrax is offline
Registrert bruker
  
 

Bli Dato: april 2009
Innlegg: 38
Beste måten å dumpe metadata til fil: når og av hvem?

Hei,

min søknad (faktisk bibliotek) indekserer en fil av mange GB produsere tabeller (arrays av offset og lengden av dataene indeksert) for senere gjenbruk. Tabellene produseres er ganske stor også, så store at jeg gikk tom for minne i min prosess (3 GB-grensen), når vi indekserer mer enn 8 GB på fil eller så. Selv om jeg kunne gaffel en annen prosess for å omgå minnet begrense størrelsen, dette vil ikke løse problemet, så jeg vil dumpe tabeller til en fil for å frigjøre minne, og unngå å re-indeksen den samme filen mer enn én gang.

Husk at det foreløpig tabellene produseres lagres i minnet i en enkelt-linket liste, som deles med en annen tråd som brukes til å produsere en ny liste over filtrerte data. Jeg vil derfor heller ikke endre dette skjemaet. Den andre tråden bare tilgang til listen når hele filen er indeksert.

Nå er det spørsmål jeg spør meg selv er:

- Når og hvor det er enklest å dumpe tabeller til en fil?

Dumping et bord som det blir full ikke høres veldig effektivt for meg. Ville jeg ha noe i minnet? Det knyttet listen vil alltid være tom? Hvis jeg velger å beholde N tabeller i minnet, og dumpe alle N, hvordan kan jeg unngå å foreta en sjekk på hvor mange tabellene jeg har
i minnet til hver syklus?

- Hvem bør dumpe metadata produsert til fil? Annen tråd? Samme tråd som indekserer data? Jeg ville ikke like å produsere metadata filer når filen behandles er mindre enn en GIGA (liten fil tilfellet), men samtidig ville jeg ikke vil kompleks kode indeksereren, som akkurat nå er ganske enkelt: parse finne dataene, oppretter du en oppføring bordet, legge den til. Hvis bordet er fullt, opprette en ny og legge den til den koblede listen.

- La oss si jeg funnet ut (takk til deg) den beste måten (i mitt tilfelle) til å dumpe metadata. Hvilke retningslinjer bør jeg bruke for å laste inn data for å la den andre tråden
filtreringsteknikker indeksen uten en radikal endring i måten den fungerer nå (f.eks gjennom knyttet liste)?

En løsning som kommer til meg, ville unngå en drastical endre i mitt skjema er å lage en "liste", som ville gi et grensesnitt for å legge til og hente element fra listen. Denne enhet (enten en tråd eller en prosess) ville ta seg av å holde noen data i minne (lenket liste) og noen andre i filen.

Vær dele med meg dine ferdigheter og erfaringer! :-)

Takk på forhånd.

Hilsen,
S.
 

Hugseliste

Thread Tools Søk i denne tråden
Søk i denne tråden:

Avansert søk
Visningsmoduser Ranger denne tråden
Ranger denne tråden:

Innleggsaktivitet Regler
Du kanskje ikke poste nye tråder
Du kanskje ikke poste svar
Du kanskje ikke post vedlegg
Du kanskje ikke redigere innleggene dine

BB-kode er
Smilefjes er
[IMG] koden
HTML-koden Av
Pingbacks er
Refbacks er




Alle klokkeslett er GMT -4. Nå er klokken 12:43.


Powered by: vBulletin, Copyright © 2000 - 2006, Jelsoft Enterprises Limited. Language Translations Powered by .
vBCredits v1.4 Copyright © 2007 - 2008, PixelFX Studios
UNIX og Linux Forums Content Copyright © 1993-2009. All Rights Reserved.Ad Management by RedTyger

Content Relevant nettadresser av vBSEO 3.2.0