![]() |
|
|
google unix.com
|
|||||||
| Forums | Registreer | Forum Regels | Links | Albums | Veelgestelde vragen | Ledenlijst | Kalender | Zoeken | Today's Posts | Markeer forums als gelezen |
| Hoog Niveau Programmering Post vragen over C, C + +, Java, SQL, en andere programmeertalen hier. |
Meer UNIX en Linux Forum Onderwerpen Misschien vindt u Helpful
|
||||
| Draad | Thread Starter | Forum | Antwoorden | Last Post |
| Het toevoegen van metadata aan digitale foto's vanaf de opdrachtregel | iBot | UNIX en Linux RSS Nieuws | 0 | 09-19-2008 03:30 PM |
| Hachoir metadata 1.2 (Default branch) | iBot | Software releases - RSS Nieuws | 0 | 09-03-2008 08:30 PM |
| Alweer een Metadata Verstuiver voor FLV 1.4 (Default branch) | iBot | Software releases - RSS Nieuws | 0 | 05-25-2008 10:10 |
| Alweer een Metadata Verstuiver voor FLV 1.3 (Default branch) | iBot | Software releases - RSS Nieuws | 0 | 04-27-2008 05:30 PM |
| help, wat is het verschil tussen core dump en paniek dumpen? | Aileen | UNIX voor Dummies Questions & Answers | 1 | 06-11-2001 09:08 PM |
![]() |
|
|
LinkBack | Thread Tools | Zoeken in deze Thread | Rate Thread | Display Modes |
|
|
|
||||
|
Beste manier te dumpen metadata naar bestand: wanneer en door wie?
Hoi,
mijn aanvraag (eigenlijk bibliotheek) indexen een bestand van vele GB produceren tabellen (arrays van offset en lengte van de gegevens geïndexeerd) voor later hergebruik. De tabellen zijn ook behoorlijk groot, zo groot dat ik liep uit het geheugen in mijn proces (3GB limiet), bij het indexeren van meer dan 8GB dossier of zo. Hoewel ik kon vork een ander proces om te werken rond het geheugen limiet grootte, zou dit niet het probleem op te lossen, dus ik wil graag dump de tabellen naar een bestand om gratis het geheugen, en vermijd om opnieuw indexeren hetzelfde bestand meer dan een keer. Houd er rekening mee dat moment, de tabellen zijn bewaard in het geheugen in een gekoppelde lijst, gedeeld met een andere thread die gebruiken voor de productie van een andere lijst van gefilterde gegevens. Dus ik liever niet veranderen dit schema. De andere draad alleen toegang tot de lijst een keer het hele bestand is geïndexeerd. Nu, de vragen die ik mezelf de vraag zijn: - Wanneer en hoe is het beste tijd te dumpen de tabellen naar een bestand? Dumpingcode een tabel als deze krijgt volledige klinkt niet erg efficiënt voor mij. Zou ik blijf er niets in het geheugen? De gelinkte lijst zou altijd leeg? Als ik besluit om N tabellen in het geheugen, en dump elke N, hoe kan ik voorkomen dat het maken van een check voor hoeveel tafels heb ik in het geheugen bij elke cyclus? - Wie moet dumpen de metadata geproduceerd tot het dossier? Verschillende draad? Dezelfde thread die index de gegevens? Ik ben het ook niet zou willen produceren metadata bestanden wanneer het bestand verwerkt is minder dan een giga (klein bestand geval is), maar tegelijkertijd zou ik niet willen complexer de code van de indexeerfunctie, dat nu is vrij eenvoudig: parse, vindt de gegevens, maakt u een item tabel toevoegen. Als de tabel vol is, maak een andere en voeg deze toe aan de gelinkte lijst. - Laten we zeggen dat ik dacht dat (met dank aan u) de beste manier (in mijn geval) te dumpen de metadata. Wat moet ik gebruiken voor het laden van de gegevens in om te laten de andere draad filteren van de index van gegevens zonder radicaal veranderen van de manier waarop het werkt nu (bijvoorbeeld door middel van de gelinkte lijst)? Een oplossing die in mijn ogen, die zou voorkomen dat een drastical verandering in mijn schema is het creëren van een "list manager" dat zou een interface toe te voegen en op te halen element uit de lijst. Deze entiteit (een draad of een proces) zou zorgen dat bepaalde gegevens in het geheugen (gekoppeld lijst) en enkele andere in het bestand. Gelieve met mij deelt uw vaardigheden en ervaring! :-) Thanks in advance. Groeten, S. |
|
||||
|
Citaat:
Citaat:
Citaat:
De andere draad (B), gebaseerd op een vlag, of lees de tabellen uit het bestand of de lijst in het geheugen. Bedankt voor uw hulp, S. |
|
||||
|
Je bedoelt dat ik moet gebruik maken van een database voor het houden van de tabellen, net als sqlite?
|
|
|||||
|
Welke database voornamelijk afhankelijk van hoe u veel indexeerbare en unieke kolommen je hebt, op de verhouding tussen de lezers voor schrijvers. sqlite? LOL. Ik dacht meer langs de lijnen van MySQL of BerkelyDB / SleepyCat DB.
|
|
||||
|
Citaat:
Ik heb alleen een schrijver en een lezer. De gegevens zijn geschreven achtereenvolgens, en nooit gewijzigd. Write Once, Read Many. Een ad-hoc oplossing dacht ik zou mijn beste manier om te gaan. Ik waardeer uw gedachten over dit. Bedankt, S. |
![]() |
| Bladwijzers |
| Thread Tools | Zoeken in deze Thread |
| Display Modes | Beoordeel deze draad |
|
|