Fluctuation de l'échantillonnage et loi des grands nombres
- Fiche de cours
- Quiz et exercices
- Vidéos et podcasts
- Simuler une expérience aléatoire sur tableur.
- Connaitre la notion de fluctuation de l’échantillonnage.
- Observer expérimentalement la loi des grands nombres à l’aide d’une simulation sur tableur.
- On répète n fois de manière indépendante une expérience aléatoire à deux issues. On appelle l’une de ces issues « succès », l’autre « échec ». La série statistique dont les valeurs sont les résultats obtenus lors de cette répétition d’expériences s’appelle un échantillon aléatoire de taille n.
- Simuler une expérience aléatoire, c’est remplacer cette expérience par une autre plus simple à organiser et qui permet d’obtenir des résultats semblables. L’outil informatique peut aider dans cette démarche (programme en langage Python ou logiciel de type tableur).
- Des échantillons de la même expérience aléatoire peuvent donner des résultats très différents. C’est ce que l’on appelle la fluctuation de l’échantillonnage.
- À l’aide d’une simulation sur tableur, on peut observer la loi des grands nombres : lorsque la taille n de l’échantillon est grande, sauf exception, la fréquence observée d’un succès a tendance à se stabiliser autour d’un nombre qui est proche de la probabilité de ce succès.
- Dans un échantillon aléatoire de
taille n,
on a au moins 95 % de chance de trouver la
fréquence f d'un caractère dans un
intervalle , où p est la proportion du
caractère dans la population.
Cet intervalle s’appelle l’intervalle de fluctuation au seuil de 95 %.
- Calcul de probabilité simple
- Utilisation du tableur
La série statistique dont les valeurs sont les résultats obtenus lors de cette répétition d’expériences s’appelle un échantillon aléatoire de taille n.
Répéter n fois une expérience « de manière indépendante » signifie que le résultat d’une répétition n’influence pas le résultat des répétitions suivantes.
Un sac contient 10 boules blanches et 20 boules noires.
Une expérience aléatoire consiste à prendre au hasard une boule dans le sac, à noter « succès » si c’est une boule noire, « échec » sinon, puis à remettre la boule dans le sac.
On répète 8 fois cette expérience. La répétition se fait bien de manière indépendante, car la boule tirée est toujours remise dans le sac, donc le résultat d’un tirage n’influence pas les tirages suivants.
On obtient un échantillon de taille 8 : {succès, échec, échec, succès, succès, échec, succès, succès}.
Reprenons le sac de boules de l’exemple précédent. Si maintenant, à chaque fois que l’on a tiré une boule, on l’enlève du sac, la répétition de cette expérience ne se fera plus de manière indépendante. En effet, si on a enlevé une boule blanche au premier tirage, alors au deuxième tirage on n’aura plus que 9 boules blanches dans le sac (au lieu des 10 qu’il y avait au départ). Le résultat de la deuxième expérience dépend donc de celui de la première expérience. Dans ce cas, on ne peut pas parler d’échantillon.
Organiser une expérience aléatoire ou une répétition d’expériences aléatoires n’est pas toujours facile.
- Jouer à la roulette nécessite de se déplacer dans un casino ou d’acheter un matériel coûteux.
- Lancer 100 fois une pièce équilibrée et noter la face obtenue après chaque lancer prend un certain temps.
On considère l’expérience aléatoire qui consiste à lancer une pièce équilibrée et à noter la face obtenue (0 pour « face » et 1 pour « pile »). Comme la pièce est équilibrée, p(« obtenir face ») = p(« obtenir pile ») = 0,5. On veut répéter 30 fois de manière indépendante cette expérience.
Avec un tableur, on simule 30 fois le lancer de la pièce. Dans B2, on saisit la formule =ENT(ALEA()+0,5) et on recopie cette formule jusqu’en B31. La formule =ENT(ALEA()+0,5) permet d’obtenir 1 avec une probabilité égale à 0,5 et d’obtenir 0 avec une probabilité égale à 0,5. On obtient ainsi un échantillon de taille 30 de l’expérience :
- La fonction ALEA() permet de générer un nombre compris entre 0 et 1 (1 non compris). La formule ALEA()+0,5 permet donc de générer un nombre compris entre 0,5 et 1,5 (1,5 non compris).
- La fonction ENT() arrondit à l’entier immédiatement inférieur.
Pour obtenir la fréquence d’apparition de la valeur 1, autrement dit la fréquence d’apparition de « pile », on peut entrer comme ci-dessus la formule =SOMME(B2:B31)/30 dans la cellule B33.
- =SOMME(B2:B31) effectue la somme de toutes les valeurs comprises dans la plage s’étendant de B2 à B31, et donc indique le nombre de fois où la valeur 1 est sortie dans cette plage.
- La division par 30 donne la fréquence d’apparition de la valeur 1.
Dans cette simulation, « pile » a été obtenu 12 fois sur les 30 tirages. Sa fréquence est donc égale à 0,4.
On simule à nouveau 30 fois sur tableur le lancer de la pièce équilibrée pour obtenir un deuxième échantillon de 30 résultats.
Le tableau ci-dessous présente la distribution des fréquences des deux échantillons de taille 30.
Échantillon 1
Résultat | Pile | Face |
Nombre d'apparitions | 17 | 13 |
Fréquence | 0,57 | 0,43 |
Échantillon 2
Résultat | Pile | Face |
Nombre d'apparitions | 21 | 9 |
Fréquence | 0,7 | 0,3 |
Sous forme graphique :
On constate des différences de résultats entre ces deux simulations : on dit qu’il y a fluctuation de l'échantillonnage.
Par contre, si l’on refait la même simulation avec des échantillons de taille 1000, on obtient le résultat suivant :
On observe que l’ampleur des fluctuations des fréquences diminue et que la fréquence d’apparition de chacune des faces de la pièce se rapproche de 0,5. Or, cette valeur correspond à la probabilité d’apparition de chacune des faces de la pièce.
On a p(« obtenir pile ») = p(« obtenir face ») = 0,5.
On observe ainsi la propriété dite « loi des grands nombres ».
Lorsque la taille n de l’échantillon est grande, sauf exception, la fréquence observée d’un succès a tendance à se stabiliser autour d’un nombre qui est proche de la probabilité de ce succès.
On prélève un échantillon dans une population. On cherche à connaitre la proportion f d’un caractère dans cet échantillon, sachant que l’on connait la proportion p de ce même caractère dans la population.
Dans ce cas, la proportion f du caractère étudié dans l’échantillon n’est pas nécessairement celle de la population. Néanmoins, cette proportion f a un comportement donné par la propriété suivante :
Dans un échantillon aléatoire de taille n, on a au moins 95 % de chance de trouver la fréquence f d'un caractère dans un intervalle , où p est la proportion du caractère dans la population.
Cet intervalle s’appelle l’intervalle de fluctuation au seuil de 95 %.
Ceci n'est vrai que pour des échantillons de taille n supérieure à 25 et pour une proportion p comprise entre 0,2 et 0,8.
Un joueur tire une carte d’un jeu de cartes, puis la remet dans le paquet. Il gagne s'il tire un cœur. Il renouvelle cette expérience n fois.
La proportion des cœurs est : .
- Si n = 100, dans au moins 95 % des cas, la fréquence d’apparition d’un cœur fluctue dans l’intervalle [0,15 ; 0,35],
- Si n = 10 000, dans au moins 95 % des cas, la fréquence d’apparition d’un cœur fluctue dans l’intervalle [0,24 ; 0,26].
Des quiz et exercices pour mieux assimiler sa leçon
La plateforme de soutien scolaire en ligne myMaxicours propose des quiz et exercices en accompagnement de chaque fiche de cours. Les exercices permettent de vérifier si la leçon est bien comprise ou s’il reste encore des notions à revoir.
Des exercices variés pour ne pas s’ennuyer
Les exercices se déclinent sous toutes leurs formes sur myMaxicours ! Selon la matière et la classe étudiées, retrouvez des dictées, des mots à relier ou encore des phrases à compléter, mais aussi des textes à trous et bien d’autres formats !
Dans les classes de primaire, l’accent est mis sur des exercices illustrés très ludiques pour motiver les plus jeunes.
Des quiz pour une évaluation en direct
Les quiz et exercices permettent d’avoir un retour immédiat sur la bonne compréhension du cours. Une fois toutes les réponses communiquées, le résultat s’affiche à l’écran et permet à l’élève de se situer immédiatement.
myMaxicours offre des solutions efficaces de révision grâce aux fiches de cours et aux exercices associés. L’élève se rassure pour le prochain examen en testant ses connaissances au préalable.
Des vidéos et des podcasts pour apprendre différemment
Certains élèves ont une mémoire visuelle quand d’autres ont plutôt une mémoire auditive. myMaxicours s’adapte à tous les enfants et adolescents pour leur proposer un apprentissage serein et efficace.
Découvrez de nombreuses vidéos et podcasts en complément des fiches de cours et des exercices pour une année scolaire au top !
Des podcasts pour les révisions
La plateforme de soutien scolaire en ligne myMaxicours propose des podcasts de révision pour toutes les classes à examen : troisième, première et terminale.
Les ados peuvent écouter les différents cours afin de mieux les mémoriser en préparation de leurs examens. Des fiches de cours de différentes matières sont disponibles en podcasts ainsi qu’une préparation au grand oral avec de nombreux conseils pratiques.
Des vidéos de cours pour comprendre en image
Des vidéos de cours illustrent les notions principales à retenir et complètent les fiches de cours. De quoi réviser sa prochaine évaluation ou son prochain examen en toute confiance !