Moyenne VS Médiane : La guerre des indicateurs est lancée…!

—————————————————————————————————————————————–

vignette

Découvrez avec Bernard les rudiments des outils statistiques du Lean Six Sigma dans le roman d’initiation « A la découverte du Lean Six Sigma » de Florent FOUQUE disponible sur :

http://www.a-la-decouverte-du-lean-six-sigma.fr
—————————————————————————————————————————————–

L’idée de ce post m’est venue suite à une réponse apportée sur un commentaire. Le commentaire, déposé par Bernard Sady (dont je vous recommande vivement la consultation de son blog pour son intérêt et sa constance dans les mises à jour) posait la question de la nécessité de l’utilisation d’indicateurs complexes comme la médiane et les quartiles…

Nous avons tous, en tête, des « idées reçues »… Ce sont ces « idées reçues », (déjà transmises à notre cerveau plusieurs fois, soit par l’écoute soit par la pratique) qui nous permettent de réfléchir plus rapidement et d’avancer dans nos raisonnements. Il n’est donc pas question de critiquer l’idée reçue en tant que telle mais de veiller à ce qu’elles ne nous fasse pas trop défaut… Car au milieu de ces milliers d’idées reçues se cachent des idées fausses…

Ainsi lorsque la question, de la complexité de l’indicateur « médiane et quartiles », m’a été posé : je fût moi-même tombé dans le piège et me suis dit…c’est vrai que la médiane est plus complexe que la moyenne mais elle est plus « robuste »… Hors tout cela est faux ! La médiane est tout aussi accessible que la moyenne…je dirai même plus accessible ! ;-P

Alors faisons-en la démonstration…

L’exemple du panier moyen.
Dans la grande distribution, le panier moyen permet de savoir, en moyenne, combien les clients achètent de marchandises lorsqu’ils passent en caisse. En résumé : c’est le chiffre d’affaires moyen par passage en caisse. J’ai souvenir, lors d’une visite de magasin d’une grande enseigne, d’avoir écouté le directeur se plaindre d’une action commerciale mise en place par la franchise. Pour 20 euros d’achat, le magasin devait offrir un cadeau. Le courroux du directeur venait du fait que les 20 euros correspondaient au panier moyen (voir même légèrement en dessous) et que de ce fait, cette action commerciale n’incitait pas les clients à acheter plus que ce qu’ils avaient l’habitude de prendre. Le raisonnement tient la route n’est-ce pas…!?
Mais après une étude très succincte d’un échantillon de tickets de caisse nous pouvons nous rendre compte que notre directeur était dans le faux…
Voici une « boîte à moustache » résultante du traitement de cet échantillon :


Une « boîte à moustache » est une représentation graphique d’un ensemble de données. Elle fait apparaître la moyenne (Mean in english)+/- l’écart type (qui correspond à la variation moyenne) ainsi que les quartiles (à savoir le découpage de la distribution en 4). Nous pouvons donc observer que la panier moyen est de 23,64 euros avec une variation moyenne de 29,60. La médiane est à 15,66 Euros ce qui signifie que la moitié des clients achètent moins de 15,66 de marchandise et qu’une autre moitié en achète pour plus de 15,66 euros. Avec le 1er et le 3ème quartile on s’aperçoit que la moitié des clients achètent entre 7,87 et 29,42 euros de marchandises. Enfin le quart des meilleurs clients achètent entre 29,42 et 1379 euros de marchandise.
Alors maintenant revenons-en à notre problématique d’action commerciale… Selon ce que l’on vient de voir 50% des clients achètent au maximum pour 15,66 euros de marchandises… donc si nous offrons un cadeau à partir de 20 euros d’achat nous incitons plus de la moitié des clients à acheter plus qu’à l’accoutumée. En conclusion cette action commerciale n’est pas si dénuée de sens que cela…! ;-)

Pour revenir sur l’idée reçue… La moyenne est très utilisée et maîtrisée de chacun. Et comme la nature humaine a horreur du changement : alors les gens préfèrent utiliser un outils qu’ils maitrisent au dépend de la justesse de leur jugement. Mais à bien y réfléchir est-ce que la médiane est plus difficile d’accès que la moyenne ? La médiane est une valeur qui fait partie de la réalité des données traitées. La médiane est la valeur qui coupe en deux données, cette valeur est donc existante, elle n’émane pas réellement d’un calcul. Alors que la moyenne n’a pas de réalité. Je crois qu’en France les femmes ont 1,8 enfants en moyenne…Ce 1,8 n’est pas « rattachable » à la réalité, alors que la médiane, elle, le serait !

Voilà, la première bataille (celle qui opposait la moyenne à la médiane) est terminée… mais la guerre continue ! Bientôt sur le champ de bataille s’opposeront le min et le max contre les écarts type… ;-)

—————————————————————————————————————————————–

vignette

Découvrez avec Bernard les rudiments des outils statistiques du Lean Six Sigma dans le roman d’initiation « A la découverte du Lean Six Sigma » de Florent FOUQUE disponible sur :

http://www.a-la-decouverte-du-lean-six-sigma.fr
—————————————————————————————————————————————–

Did you enjoy this post? Why not leave a comment below and continue the conversation, or subscribe to my feed and get articles like this delivered automatically to your feed reader.

Comments
  • Bonjour Florent,
    C’est une très bonne révision des stats. Et ici, l’exemple permet de bien comprendre l’utilisation et l’intérêt de la médiane.
    J’attends avec impatience la bataille entre min/max et écarts types…
    Et merci pour la pub…
    Cordialement.
    Bernard Sady

  • Bonjour Bernard,
    C’est très précisément le but de ce blog : démystifier les statistiques et le LSS…
    Contrairement à ce que de nombreuses personnes pensent ou écrivent : le LSS n’est pas une affaire d’expert… c’est surtout une affaire de bon sens !
    Et je vous retourne le remerciement pour la « pub » ;-)

  • Bonjour,
    vous faites fausse route lorsque vous dites que la moyenne ne se rattache pas à la réalité mais que la médiane, elle, s’y rattache.

    Dans le calcul d’une médiane, on peut très bien obtenir des valeurs fractionnaires, comme pour la moyenne. Par exemple, supposons que 4 femmes ont respectivement 0, 1, 2 et 4 enfants. La moyenne serait de 1,75 enfant et la médiane serait de 1,5 enfant. Quelle mesure se rattache le mieux à la réalité ?

    Si on veut généraliser les résultats à l’ensemble d’une population, il est préférable d’utiliser la moyenne si celle-ci est représentative des données (pas de valeurs aberrantes, distribution symétrique). Ainsi, si la population est de 1000000, la moyenne nous permettrait d’affirmer qu’il y a 1750000 enfants tandis qu’avec la médiane, il y en aurait 1500000. Une petite erreur de 250000 enfants si on utilise la médiane.

  • Désolé, les commentaires sont fermés pour le moment.