Commentaires
Diaporama
Plan
1
Statistique descriptive
  • Détermination des paramètres
2
 
3
Paramètres de position
Statistique univariée
  • 1. La moyenne
4
Mathématique
  • Moyenne :




  • Données groupées :
5
Domaine d’application
  • Données quantitatives continues.
  • Distribution normale
  • Absence de valeurs aberrantes
  • Echantillonnage indépendant
6
Propriétés
  • La somme algébrique des écarts entre observés la moyenne arithmétique est nulle.
  • Elle minimise la somme des carrés des écarts à elle-même.
  • La moyenne est considérée comme le centre de gravité d’une distribution.
  • Estimateur (µ) de la moyenne de la population.
  • On peut modifier le poids des données par l’utilisation de moyennes pondérées


7
Calcul en Excel
  • =MOYENNE(plage des données).
8
Avantages
  • Universellement répandue et acceptée
  • Se prête  aux calculs algébriques et est programmée sur toutes les calculettes et tableurs.
  • Répond au principe des moindres carrés et confère ainsi à la moyenne la plus petite erreur.
  • Meilleur estimateur de la moyenne de la population :m est le meilleur estimateur de  µ.


9
Inconvénients
  • Fortement influencée et donc peu robuste en présence de données extrêmes.
  • Peu représentative d’une population hétérogène (distribution polymodale).
10
Attributs
  • Positifs :
    • utilisés pour un effet à long terme
    • pour une population uniforme, relativement peu dispersée
    • requiert moins d ’échantillons
  • Négatifs :
    • non représentatifs de la tendance centrale en cas d ’asymétrie
    • non représentatif de la tendance centrale en présence de nombreuses données en-dessous du seuil de détection.




11
Autres moyennes
12
Moyenne pondérée
  • Formule :



  • Utilisation : les observations n’ont pas une importance identique


13
Moyenne géométrique
  • Formule :


  • S’applique pour des moyennes de ratios
  • Diminue l’effet des valeurs élevées
  • S’applique aux nombres positifs
  • Excel : =MOYENNE.GEOMETRIQUE(plage des données)
14
Paramètres de position
  • 2. La médiane
15
Définition
  • Mesure de la tendance centrale définie comme la valeur qui partage la distribution d’une série d’observations triées en ordre croissant ou décroissant en deux parties égales
  • S’applique aux données quantitatives continues ou ordinales
16
Calcul
  • Tri des données puis:
    • Nombre impair : la médiane est la (n+1)/2 donnée
    • Nombre pair : moyenne entre n/2 et la suivante
  • Excel : =MEDIANE(plage des données)
17
Caractéristiques
  • Avantages
    • Plus robuste : moins influencée par les données extrêmes
  • Inconvénients
    • Se prête mal aux calculs
    • N’est pas présente sue les calculettes
    • Suppose l’équi-partition des données
18
Paramètres de position
  • 3. Le Mode
19
Définition
  • Valeur la plus fréquemment rencontrée
  • Se calcule par la fonction EXCEL : =MODE (plage des données)
20
Avantages
  • N’est pas affecté par les données extrêmes
  • Peut être calculé sur des valeurs nominales.
  • Bon indicateur de populations hétérogènes (multinodales).
  • Le mode est un score réellement observé alors que la médiane ou la moyenne peuvent correspondre à des valeurs non observées.


21
Inconvénients
  • Se prête mal aux calcul statistiques et algébriques.
  • N’est pas programmé sur calculettes.
  • Ne tient compte que des éléments qui se rapprochent de la ou des classes modales.
  • Pour les données continues, son calcul varie selon le choix de l’intervalle de classe.
  • N’est un bon indicateur de la tendance centrale que s’il y a une valeur dominante.


22
Paramètres de position
  • 4. Les quartiles
23
Définition
  • Extension du concept de médiane
  • Le quartile divise l’ensemble des données en 4 parties
  • Le décile divise l’ensemble des données en 10 parties
  • Le centile divise l’ensemble des données en 100 parties
24
Calcul
  • EXCEL :
    • =QUARTILE(plage des données;valeur du quartile)
    • =DECILE(plage des données;valeur du décile)


25
Domaine d’application
  • Variable quantitative continue
  • Application pour tout type de distribution
  • Les déciles et centiles requièrent un grand nombre d’observations
26
Paramètres de dispersion
  • 1. L’étendue
27
Caractéristiques
  • Différence entre la valeur la plus élevée et la plus faible.
  • Dépend des données extrêmes.
  • EXCEL : =MAX(plage des données) – MIN (plage des données)
28
Paramètres de dispersion
  • 2. L’interquartile
29
Caractéristiques
  • Intervalle comprenant 50% des observations les plus au centre de la distribution.
  • Evite la dépendance aux données extrêmes.
  • Joue un rôle central dans la construction du Box-plot.
  • Tronque une top grande partie des données.
  • EXCEL : =quartile (plage des données;3) - quartile (plage des données;1).


30
Paramètres de dispersion
  • 3. La variance
31
Définition
  • Variance population :


  •    EXCEL : =VAR.P(plage des données)


  • Variance échantillon

  • EXCEL : =VAR(plage des données)
32
Domaine d’application
  • Données quantitatives continues
33
Paramètres de dispersion
  • 3. L’écart type
    (standard deviation)
34
Définition
  • Ecart-type de la population


  • EXCEL : =ECARTYPEP(plage des données)


  • Ecart-type de l’échantillon


  • EXCEL : =ECARTYPE(plage des données)
35
Domaine d’application
  • Variable aléatoire
  • Variable quantitative continue
  • Distribution normale
36
Paramètres de dispersion
  • 4. Autres mesures de dispersion.
37
Coefficient de variation
  • Expression mathématique :


  • Avantage :
    • Indépendant du choix des unités
    • Permet de comparer des distributions exprimées en unités différentes.
  • Désavantage : est inefficace quant la moyenne tend vers 0.
38
Ecart-moyen
  • Expression mathématique :


  • EXCEL : =ECARTMOYEN(plage des données)


39
Paramètres de la forme de la distribution
  • 1. Le coefficient d’asymétrie
    (Skewness)
40
Expression mathématique
  • 3e moment :



  • EXCEL : =COEFFICIENT.ASYMETRIE(plage des données)
41
Propriétés
  • Si le coefficient est nul, la distribution est symétrique.
  • Si le coefficient est négatif, la distribution est asymétrique à droite
  • Si le coefficient est positif, la distribution est asymétrique à gauche


42
Paramètres de la forme de la distribution
  • 2. Le coefficient d’aplatissement
    (Kurtosis)
43
 
44
Expression mathématique
  • 4e moment :


  • EXCEL: =KURTOSIS(plage des données)


45
Propriétés
  • Indicateur de la concentration des données autour du mode
46
Rapport statistique
  • 1.EXCEL
47
 
48
 
49
Rapport statistique
  • 2. XLSTAT
50
 
51