Comprenez-vous la variabilité dans vos données ?

Ce n’est pas un sujet habituel, et pourtant il donne vraiment à réfléchir et il permet de positiver bien plus qu’on ne l’imagine !

Il est assez facile pour les managers de voir que les choses varient dans le monde des affaires. Certaines campagnes de marketing donnent d’excellents résultats, d’autres non. Il y a des moments où la chaîne d’approvisionnement fonctionne sans effort, et d’autres où chaque étape est bousculée. Certains jours, les chiffres sont bons et d’autres jours, ils ne concordent tout simplement pas. La variation est l’ennemi naturel d’un manager, ce qui rend plus difficile de comprendre ce qui se passe vraiment, de faire des prédictions valables et d’avoir le contrôle.

Ce n’est pas obligé d’être comme ça. Le tri des variations fournit le contexte nécessaire, indique les possibilités et aide les managers à garder leur sang-froid lorsque quelque chose ne va pas. Les managers devraient apprendre à mesurer la variation, à comprendre ce qu’elle leur dit sur leur entreprise, à la décomposer et, au besoin, à la réduire.

La meilleure chose à faire est de trier les variations et ce qui en est la cause. Cela leur fournit le contexte nécessaire, leur indique les possibilités et les aide à garder leur sang-froid lorsque quelque chose ne va pas. La figure ci-dessous illustre les taux d’erreur pour les trois premières semaines d’un processus de facturation :

Après la deuxième semaine, la manager responsable était gênée – son équipe pourrait-elle vraiment avoir un si mauvais rendement ? Après la troisième, elle poussa un soupir de soulagement. Le taux d’erreur est peut-être élevé, mais au moins la tendance était dans la bonne direction ! Elle avait exhorté son équipe à « travailler plus dur pour faire baisser le taux d’erreur ». Enfin, ils écoutaient !

Malheureusement, son interprétation n’a pas tenu la route. Voici les mesures des sept semaines suivantes :

L’illusion de ce manager a été brisée dès la semaine suivante, alors que le taux d’erreur était encore plus élevé ! Son erreur est survenue parce qu’elle ne comprenait pas que tous les processus varient, souvent considérablement !

Cette vignette souligne le premier point, qui consiste simplement à reconnaître l’importance de la variation et à en tenir compte. Plus précisément, vous devriez toujours vous demander : « Quel est le  » plus  » ou le  » moins  » de ce chiffre et en comprendre les implications. Après la troisième semaine dans cet exemple, le plus/moins est de 50% ± 8% (42 % à 58 %). Le « 8% » est deux écarts-types, une mesure de variabilité expliquée plus loin. Si elle en avait tenu compte, cette gestionnaire n’aurait pas été si prompte à créditer ses exhortations aux troupes d’une amélioration qui n’était pas là. De façon plus générale, vous devriez supposer que les différences à l’intérieur du plus ou moins sont dues au hasard et résister à la tentation de s’attribuer le mérite ou le blâme.

Au fur et à mesure que vous plongez dans les chiffres, il est important de comprendre les sources de variation. Par exemple, tout le monde sait que certains adultes adultes sont plus grands que d’autres, et il est assez facile d’observer que les hommes, en moyenne, sont plus grands que les femmes. Ainsi, dans ce cas, l’une des composantes de la variation est le sexe. De même, les Néerlandais sont généralement plus grands et les Philippins sont généralement plus petits. La nationalité est donc une autre source de variation. Il est important de comprendre ces sources de variabilité si vous êtes dans l’industrie du vêtement, de peur d’envoyer trop de pantalons courts dans les magasins de vêtements aux Pays-Bas.

Ces sources deviennent de plus en plus importantes à mesure que l’on se familiarise avec les mesures de variation. Après tout, on ne peut pas gérer ce qu’on ne mesure pas ! Les deux mesures les plus importantes de la variabilité sont appelées « écart-type » (σ) et « R-carré (R2) ». Ne vous laissez pas abattre par les noms non intuitifs. Mettez plutôt l’accent sur l’interprétation.

Pensez que la fourchette allant d’un écart-type (1σ) inférieur à la moyenne à un écart-type supérieur à la moyenne englobe environ les 2/3 d’une population totale. Ainsi, comme le montre la figure ci-dessous, environ 2/3 des femmes américaines adultes mesurent entre 5’1″ (1m55) et 5’7″ (1m70). Pensez à l’écart type moyen plus/moins deux (2σ) comme englobant 95 % d’une population, comme l’illustre également le graphique. Pour les femmes américaines, cela signifie que seulement 5 % d’entre elles mesurent moins de 4’10 » (1m45 ) ou plus de 5’9 » (1m75 ). De même, la manager responsable du processus de facturation devrait s’attendre à ce que 95 % de toutes les mesures se situent entre 42 % et 58 % et souligne sa mauvaise interprétation de 46 % à la troisième semaine.

Enfin, considérez la moyenne plus/moins de trois écarts-types (3σ) comme englobant la quasi-totalité, sauf une fraction d’1%, d’une population.

Interpréter R2 comme la « fraction de variation due à une source particulière ». L’intrigue suivante présente les hauteurs des hommes et des femmes. Il est à noter que les hommes mesurent en moyenne 5 pouces de plus (12 cm) et que leur taille varie un peu plus. En ce qui concerne la taille, il est clair que les hommes et les femmes sont différents. De plus, la population combinée d’hommes et de femmes varie encore plus. Mais dans quelle mesure les différences entre les sexes expliquent-elles cette population combinée ? La réponse est d’environ un tiers. Ainsi, le genre est un facteur important, mais il y a beaucoup plus à faire. (Note : Excel, les feuilles de calcul Google et les bons logiciels statistiques et analytiques fournissent les calculs nécessaires.)

Les managers devraient s’efforcer d’identifier autant de sources importantes de variabilité que possible. On a déjà vu que le sexe et la nationalité sont deux sources. L’âge peut bien être un tiers, et on peut en identifier beaucoup d’autres aussi. Chacun a son propre R2 et, plus le R2 est grand, plus la source est importante. Une fois que vous avez trouvé une source importante de variation, portez votre attention sur la création d’un avantage commercial.

Il est important de noter que R2 s’applique également aux modèles entiers. Ainsi, il y a un R2 pour même le modèle le plus compliqué en hauteur. Encore une fois, plus le R2 est grand, meilleur est le modèle.

Regardons maintenant l’exemple avec le taux d’erreur de l’équipe. Les calculs plus/moins sont habituellement basés sur deux écarts-types. Le « 8% » dans le « 50% ± 8% » ci-dessus est 2σ. Le gestionnaire responsable de cet exemple devrait s’attendre à ce que 95 % de toutes les mesures se situent entre 42 % et 58 %, et souligne sa mauvaise interprétation de 46 % à la troisième semaine.

Comprendre σ et R2 permet aux gestionnaires de faire des prédictions plus puissantes, d’établir un contrôle et d’améliorer la performance. Les prédictions les plus simples utilisent les limites de 3σ pour les plus/moins. Dans le graphique suivant, ont été ajoutées ces limites (appelées limites de contrôle supérieures et inférieures, et étiquetées « ucl » et « lcl » dans le graphique) cinq semaines dans le futur. Le gestionnaire peut maintenant prédire avec certitude qu’à moins qu’il ne prenne des mesures actives pour le modifier, le processus fonctionnera dans ces limites dans un avenir prévisible.

Pour être clair, aucun manager ne devrait être satisfait de ce niveau de rendement ou de la variation connexe, et cette manager ne l’a pas été. Elle et son équipe ont creusé plus profondément, trouvant – puis éliminant – deux sources de variation. Ce travail a duré plusieurs semaines, ce qui a conduit au tableau ci-dessous.

Il est important de noter que le travail de cette manager a été beaucoup plus facile à partir de la semaine 24. Son processus a donné de meilleurs résultats et les trois quarts de la variation ont été éliminés, ce qui permet de prédire plus facilement un avenir meilleur.

Comprendre la variation met un outil puissant dans votre carquois de la science des données. Cherchez donc d’abord à apprécier, quantifier et identifier les sources importantes de variation. Ensuite, réduisez celles que vous pouvez et tenez compte des autres pour obtenir un avantage commercial. Bien qu’elles ne soient peut-être pas explicites à ce sujet, toutes les techniques les meilleures et les plus populaires en data science visent à vous aider à le faire. La variation n’a pas besoin d’être votre ennemi. Les occasions abondent.

Via HarwardBusinessReview

 

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.