1
|
- Détermination des paramètres
|
2
|
|
3
|
|
4
|
- Moyenne :
- Données groupées :
|
5
|
- Données quantitatives continues.
- Distribution normale
- Absence de valeurs aberrantes
- Echantillonnage indépendant
|
6
|
- La somme algébrique des écarts entre observés la moyenne arithmétique
est nulle.
- Elle minimise la somme des carrés des écarts à elle-même.
- La moyenne est considérée comme le centre de gravité d’une distribution.
- Estimateur (µ) de la moyenne de la population.
- On peut modifier le poids des données par l’utilisation de moyennes
pondérées
|
7
|
- =MOYENNE(plage des données).
|
8
|
- Universellement répandue et acceptée
- Se prête aux calculs algébriques
et est programmée sur toutes les calculettes et tableurs.
- Répond au principe des moindres carrés et confère ainsi à la moyenne la
plus petite erreur.
- Meilleur estimateur de la moyenne de la population :m est le meilleur
estimateur de µ.
|
9
|
- Fortement influencée et donc peu robuste en présence de données
extrêmes.
- Peu représentative d’une population hétérogène (distribution
polymodale).
|
10
|
- Positifs :
- utilisés pour un effet à long terme
- pour une population uniforme, relativement peu dispersée
- requiert moins d ’échantillons
- Négatifs :
- non représentatifs de la tendance centrale en cas d ’asymétrie
- non représentatif de la tendance centrale en présence de nombreuses
données en-dessous du seuil de détection.
|
11
|
|
12
|
- Formule :
- Utilisation : les observations n’ont pas une importance identique
|
13
|
- Formule :
- S’applique pour des moyennes de ratios
- Diminue l’effet des valeurs élevées
- S’applique aux nombres positifs
- Excel : =MOYENNE.GEOMETRIQUE(plage des données)
|
14
|
|
15
|
- Mesure de la tendance centrale définie comme la valeur qui partage la
distribution d’une série d’observations triées en ordre croissant ou
décroissant en deux parties égales
- S’applique aux données quantitatives continues ou ordinales
|
16
|
- Tri des données puis:
- Nombre impair : la médiane est la (n+1)/2 donnée
- Nombre pair : moyenne entre n/2 et la suivante
- Excel : =MEDIANE(plage des données)
|
17
|
- Avantages
- Plus robuste : moins influencée par les données extrêmes
- Inconvénients
- Se prête mal aux calculs
- N’est pas présente sue les calculettes
- Suppose l’équi-partition des données
|
18
|
|
19
|
- Valeur la plus fréquemment rencontrée
- Se calcule par la fonction EXCEL : =MODE (plage des données)
|
20
|
- N’est pas affecté par les données extrêmes
- Peut être calculé sur des valeurs nominales.
- Bon indicateur de populations hétérogènes (multinodales).
- Le mode est un score réellement observé alors que la médiane ou la
moyenne peuvent correspondre à des valeurs non observées.
|
21
|
- Se prête mal aux calcul statistiques et algébriques.
- N’est pas programmé sur calculettes.
- Ne tient compte que des éléments qui se rapprochent de la ou des classes
modales.
- Pour les données continues, son calcul varie selon le choix de
l’intervalle de classe.
- N’est un bon indicateur de la tendance centrale que s’il y a une valeur
dominante.
|
22
|
|
23
|
- Extension du concept de médiane
- Le quartile divise l’ensemble des données en 4 parties
- Le décile divise l’ensemble des données en 10 parties
- Le centile divise l’ensemble des données en 100 parties
|
24
|
- EXCEL :
- =QUARTILE(plage des données;valeur du quartile)
- =DECILE(plage des données;valeur du décile)
|
25
|
- Variable quantitative continue
- Application pour tout type de distribution
- Les déciles et centiles requièrent un grand nombre d’observations
|
26
|
|
27
|
- Différence entre la valeur la plus élevée et la plus faible.
- Dépend des données extrêmes.
- EXCEL : =MAX(plage des données) – MIN (plage des données)
|
28
|
|
29
|
- Intervalle comprenant 50% des observations les plus au centre de la
distribution.
- Evite la dépendance aux données extrêmes.
- Joue un rôle central dans la construction du Box-plot.
- Tronque une top grande partie des données.
- EXCEL : =quartile (plage des données;3) - quartile (plage des
données;1).
|
30
|
|
31
|
- Variance population :
- EXCEL : =VAR.P(plage des
données)
- Variance échantillon
EXCEL : =VAR(plage des données)
|
32
|
- Données quantitatives continues
|
33
|
- 3. L’écart type
(standard deviation)
|
34
|
- Ecart-type de la population
- EXCEL : =ECARTYPEP(plage des données)
- Ecart-type de l’échantillon
- EXCEL : =ECARTYPE(plage des données)
|
35
|
- Variable aléatoire
- Variable quantitative continue
- Distribution normale
|
36
|
- 4. Autres mesures de dispersion.
|
37
|
- Expression mathématique :
- Avantage :
- Indépendant du choix des unités
- Permet de comparer des distributions exprimées en unités différentes.
- Désavantage : est inefficace quant la moyenne tend vers 0.
|
38
|
- Expression mathématique :
- EXCEL : =ECARTMOYEN(plage des données)
|
39
|
- 1. Le coefficient d’asymétrie
(Skewness)
|
40
|
- 3e moment :
- EXCEL : =COEFFICIENT.ASYMETRIE(plage des données)
|
41
|
- Si le coefficient est nul, la distribution est symétrique.
- Si le coefficient est négatif, la distribution est asymétrique à droite
- Si le coefficient est positif, la distribution est asymétrique à gauche
|
42
|
- 2. Le coefficient d’aplatissement
(Kurtosis)
|
43
|
|
44
|
- 4e moment :
- EXCEL: =KURTOSIS(plage des données)
|
45
|
- Indicateur de la concentration des données autour du mode
|
46
|
|
47
|
|
48
|
|
49
|
|
50
|
|
51
|
|