![]() |
|
|
google unix.com
|
|||||||
| Forum | Registrati | Regole Forum | Collegamenti | Album | FAQ | Members List | Calendario | Ricerca | Today's Posts | Mark Forums Read |
| Di programmazione ad alto livello Pubblica domande su C, C + +, Java, SQL, e di altri linguaggi di programmazione qui. |
Più di UNIX e Linux Forum Argomenti potreste trovare utili
|
||||
| Filo | Thread Starter | Forum | Risposte | Ultimo Post |
| Sparse Indicizzazione: larga scala, in linea di campionamento e di deduplicazione Uso Località | iBot | UNIX e Linux RSS News | 0 | 06-09-2009 12:30 AM |
| Campionamento e Binning-Ingegneria problema | Needhelp2 | Shell scripting e di programmazione | 7 | 09-05-2008 04:11 AM |
![]() |
|
|
LinkBack | Thread Tools | Cerca in questo Thread | Rate Thread | Modalità di visualizzazione |
|
|
|
||||
|
Uniformi di campionamento
Salve Il mio obiettivo è quello di costruire una C che svolgono una funzione di campionamento uniforme. Voglio dire che ho un grosso file con una grande quantità di dati e vorrei fare solo alcuni dati campioni accordly la distribuzione uniforme. Es. file1: abcdefghilmnopq Un esempio potrebbe essere quello di capovolgere una moneta per ogni lettera e selezionare tutte le lettere per i quali la moneta ha mostrato la testa. Ho utilizzato il srand () chiamata di sistema, ma non è uniforme. Chiunque può proporre un modo per iniziare? Grazie D Posta ---------- aggiornato a 08:00 PM ---------- precedente aggiornamento è stato a 06:30 PM ---------- Ciao Sto cercando in questo modo: Codice:
...... #define RAND_MAX 2 srand(time(NULL)); ....... in the loop p=rand()%RAND_MAX e se l'indice è superiore a 0 afferrare la lettera altrimenti lasciarlo. Se avete un altro suggerimento fatemelo sapere grazie D. |
|
|||||
|
A seconda di che cosa avete bisogno, la srand () / rand () PRNG combinazione funziona bene. Ma per un numero maggiore di campioni, inizia essere prevedibile e cluster. Più avanzati sono i generatori Blum-Blum-Shub generatore o Fortuna. Se avete bisogno di veri numeri casuali, si potrebbe provare un servizio come random.org o costruire il proprio vero generatore di numeri casuali.
|
|
||||
|
FWIW --
in termini di pratiche di campionamento statistico, se avete bisogno di un media e deviazione standard quello che stai facendo è veramente Overkill, e si traduce in una dimensione del campione del 50% dei dati. Si potrebbe dire altrettanto bene / deviazione std / ANOVA o qualunque sia l'intero file. Ad esempio, uno statico signficant (95% di confidenza) dimensione del campione per la popolazione degli Stati Uniti utilizzati in seggi: ~ 1526 persone fuori di 300 milioni di utilizzare sistematicamente i metodi di campionamento. Cosa si sta facendo è sorta di campionamento sistematico, sì, ma l'intento di campionamento è di non guardare quasi tutto. |
![]() |
| Segnalibri |
| Tag |
| campionamento, uniforme |
| Thread Tools | Cerca in questo Thread |
| Modalità di visualizzazione | Vota questo thread |
|
|