![]() |
Bonjour et bienvenu par les États-Unis à la UNIX et Linux Forums! Merci de votre visite et vous joindre à notre communauté mondiale.
|
|
google unix.com
|
|||||||
| Forums | S'inscrire | Forum Rules | Liens | Albums | FAQ | Liste des membres | Calendrier | Recherche | Aujourd'hui, les postes | Marquer les forums comme lus |
| High Level Programming Posez vos questions à propos de C, C + +, Java, SQL, et d'autres langages de programmation ici. |
Plus d'UNIX et Linux Forum Sujets Vous trouverez peut-être utile
|
||||
| Fil | Thread Starter | Forum | Réponses | Last Post |
| Sparse Indexation: Large Scale, ligne d'échantillonnage et d'utilisation de déduplication Localité | iBot | UNIX et Linux News RSS | 0 | 06-09-2009 12:30 AM |
| Échantillonnage et Binning-Engineering problème | Needhelp2 | De programmation et de script Shell | 7 | 09-05-2008 04:11 AM |
![]() |
|
|
LinkBack | Thread Tools | Recherche sur ce Thread | Rate Thread | Modes d'affichage |
|
|
|
||||
|
Échantillonnage uniforme
Salut
Mon objectif est de bâtir une fonction C qui effectuent un prélèvement uniforme. Je veux dire que j'ai un gros fichier avec beaucoup de données et je voudrais juste prendre quelques échantillons accordly l'homogénéité de la distribution. Es. fichier1: abcdefghilmnopq Un exemple serait de retourner une pièce de monnaie pour chaque lettre et de sélectionner toutes les lettres pour laquelle la pièce a montré la tête. J'ai utilisé le srand () appel système, mais il n'est pas uniforme. Quelqu'un peut-il suggérer une façon de commencer? Merci D ---------- Message mis à jour à 08:00 PM ---------- Mise à jour précédente a été, à 06:30 PM ---------- Salut je tente de cette façon: Code:
...... #define RAND_MAX 2 srand(time(NULL)); ....... in the loop p=rand()%RAND_MAX Si vous avez une autre suggestion de me le faire savoir merci D. |
|
|||||
|
Selon ce que vous avez besoin, le srand () / rand () PRNG combinaison fonctionne bien. Mais pour un plus grand nombre d'échantillons, il commence à être prévisible et clusters. Plus avancés sont les générateurs Blum-Blum-Shub générateur ou Fortuna. Si vous avez besoin réel de nombres aléatoires, vous pouvez essayer un service comme random.org ou construire votre propre véritable générateur de nombres aléatoires.
|
|
||||
|
FWIW --
en termes de pratiques de l'échantillonnage statistique, si vous avez besoin d'une moyenne et écart-type de ce que vous faites est vraiment excessif, et les résultats dans un échantillon de 50% des données. Vous pourriez tout aussi bien signifier / std déviation / ANOVA ou quoi que ce soit l'ensemble du dossier. Par exemple, un statiquement significatif (95% de confiance) la taille de l'échantillon de la population des États-Unis utilisées dans les bureaux de vote: ~ 1526 personnes prises sur un total de 300 millions en utilisant des méthodes d'échantillonnage systématique. Qu'est-ce que vous faites une sorte d'échantillonnage systématique, oui, mais l'intention de l'échantillonnage est de ne pas chercher à tout faire ou presque. |
![]() |
| Bookmarks |
| Tags |
| d'échantillonnage, uniforme |
| Thread Tools | Recherche sur ce Thread |
| Modes d'affichage | Rate this thread |
|
|