École Polyvalente Charles-Gravel

Mathématiques 416 - 436

 

Retour à la page principale

 Pour imprimer ce document, choisissez l'option "Imprimer" dans le menu "Fichier"

Objectif: Connaître les notions statistiques de base.

Vocabulaire

Statistique: Étude d'une population

Population: Ensemble de personnes, animaux, objet, etc.

Échantillon: Petite partie de la population que l'on étudie si on ne peut le faire sur toute la population.

Caractères: Ce sur quoi porte précisément l'étude statistique.

Distribution: Ensemble de données ordonnées en ordre croissant.

Type d'études statistiques

Recensement: Étude sur tous les individus d'une population.

Sondage: Étude sur un échantillon, dans le but de comprendre le comportement de toute une population.

Enquête: Étude sur un échantillon, devant être fait par des spécialistes dans un domaine précis, pour comprendre le comportement de toute une population.

Procédés de collecte de donnée

Questionnaire écrit : Rempli par une personne et retourné au sondeur / enquêteur.

Entrevue téléphonique : On pose les questions au téléphone.

Entrevue en personne : On pose les questions en personne, souvent dans un lieu public.

Observation directe : On note les événements ou comportements à l'aide de critères d'observation précis.

Observation documentaire : Les informations sont prises dans des banques de données (informatiques, bibliothécaires, etc.).

Instruments mécaniques ou électroniques : Tourniquet, lecteur optique, ordinateurs, etc.

Méthode d'échantillonnage

Un bon échantillon doit être représentatif de la population (avoir les mêmes caractères), si non on le dit BIAISÉ. Il y a quatre façons de former un bon échantillon :

ALÉATOIRE: Choisi au hasard ; chacun a autant de chances que les autres d'être choisi.

STRATIFIÉ: On partage la population en catégories, puis on pige au hasard dans chacune de ces catégories. Le nombre pigé pour chaque catégorie doit être proportionnel à celui dans la population (voir p. 13, #4).

SYSTÉMATIQUE: Pas de hasard ; on choisit selon un ordre. 1 à tous les X

EN GRAPPE : On choisit un (ou plusieurs) groupe(s) au hasard, puis on étudie tous les individus du groupe (ou des groupes).

Taille de l'échantillon : Nombre d'individus ou d'éléments par échantillon selon la taille de la population la marge d'erreur maximale de ± 5%, ± 2,5% ou ± 1%, 19 fois sur 20

(Source : Angers, Claude. Les statistiques, oui mais…, Montréal Éditions Agence D'Arc, 1991, p. 110.)

Taille de la population

Marge d'erreur maximale

Erreur: ± 5%

Erreur: ± 2,5%

Erreur: ± 1%

25 000 000

384

1536

9600

1 000 000

384

1535

9513

100 000

383

1514

8763

10 000

370

1332

4899

1 000

278

606

906

100

80

94

99

Les Sources de Biais

Différentes causes qui empêchent les résultats d'être conformes à la réalité.

Échantillonnage biaisé :

Mauvaise méthode,

L'implication et l'intérêt des personnes interrogées,

Tailles trop petite.

Questions biaisées :

Mauvaises formulation des questions,

Condition de recueille des données,

Attitude de l'enquêteur / sondeur.

Réponses biaisées :

Erreurs de mesure,

Instruments imprécis,

Influences extérieures,

Taux de réponse trop faible.

Interprétation biaisées :

Présentation,

Élimination de certains résultats,

Exagérations.

Encore bien d'autres sources de biais pourraient advenir.

Mesures de tendance centrale (Où se situe la majorité)

Moyenne: Somme de toutes les données d'une distribution, divisée par le nombre de données.

Médiane: Donnée au centre d'une distribution de données en ordre croissant.

Mode: Donnée qui est répétée le plus souvent dans une distribution.

Mesures de dispersion (Éparpillement)

Étendue: Différence entre la plus grande et la plus petite donnée.

Étendue interquartile : Différence entre le troisième et le premier quartile (Q3 - Q1)

Étendue des quarts : Étendue à l'intérieur de chacun des 4 groupes

Mesures de position (Où se situe une donnée par rapport aux autres)

Quartiles: Les 3 frontières qui partagent une distribution en 4 groupes égaux (Q1, Q2, Q3).

Ex. Distribution de 18 données : 2, 2, 3, 4, 6, 6, 7, 7, 8, 9, 9, 10, 12, 13, 13, 15, 16, 16

Q1: Le deuxième 6 donc Q1 = 6

Q2: Entre 8 et 9, donc Q2 = 8,5

Q3: Le premier 13, donc Q3 = 13

Truc: Si le nombre de données est pair, la frontière arrive entre deux données. On fait une moyenne pour établir la valeur du quartile.

Si le nombre de données est impair, la frontière arrive sur l'une des données de la distribution. Cette donnée devient la valeur du quartile.

Quintiles: Les 4 frontières qui partagent une distribution en 5 groupes égaux.

Même principe que les Quartiles, mais il n'y a pas de nom ou symbole pour les indiquer.

Déciles: Les 9 frontières qui partagent une distribution en 10 groupes égaux.

Même principe que les Quartiles, mais il y a 10 groupes au lieu de 4. On les dénote comme suit : D1, D2, D3, D4, D5, D6, D7, D8, D9.

Centiles: Les 99 frontières qui partagent une distribution en 100 groupes égaux.

Même principe que les Quartiles, mais il y a 100 groupes au lieu de 4. On les dénote comme suit : C1, C2, C3, C4, C5, . . ., C96, C97, C98, C99.

Rang cinquième : Position par rapport à 5 groupes approximativement égaux ; deux groupes ne peuvent contenir une donnée de même valeur.

Ex. : 1 2 2 3 | 3 5 6 6 | 7 8 9 9 | 10 11 11 14 | 14 14 14 16

Il y a 5 groupes de quatre données, mais les nombres 3 et 14 ne peuvent être en même temps dans 2 rangs cinquième.

On réorganise les groupes comme suit :

1 2 2 3 3 | 5 6 6 | 7 8 9 9 | 10 11 11 | 14 14 14 14 16

Les données du premier rang cinquième sont toujours les plus élevées.

Formule pour déterminer le rang cinquième :

Rang centile : Position par rapport à 100 groupes approximativement égaux ; deux groupes ne peuvent contenir une donnée de même valeur.

Même principe que le rang cinquième, mais il y a cent groupes.

Les données du premier rang centième sont toujours les moins élevées.

Formule pour déterminer le rang centile :

Pour trouver quelle donnée occupe un rang centile:

La donnée cherché occupe le rang trouver à l'aide le la dernière formule.

Graphiques

Diagramme à bandes horizontales ou verticales et diagramme Circulaire :

Pour mettre en évidence les différences entre les données.

Diagramme à ligne brisée : Pour représenter et comparer des données continues.

L'histogramme : Pour mettre en évidence les différences entre des données regroupées en classe (de x à y).

Diagramme de quartiles : Pour mettre en évidence l'étendu d'une distribution et la répartition des données.

Diagramme à tige et feuilles : Pour grouper des données de façon ordonnée.

Tableaux de distribution

Valeur - quantité.

Valeur - effectif à données condensées.

Valeur - effectif à données regroupées en classes (par intervalles).