mardi 11 juin 2019

Note de lecture 1

Goupy J., La méthode des plans d'expériences, Optimisation du choix des essais & de l'interprétation des résultats, Dunod, Ed. Paris, 1988, 304 pages.


Jacques Goupy (1934-2015) a été un auteur très productif en matière d'ouvrages en langue française relatifs aux plans d'expérience (voir ici). Dans cet article, je vais commenter la première édition d'un livre que l'on peut considérer comme pionnier parmi les ouvrages de grande diffusion en France à propos de plans d'expérience. Ce livre publié en 1988 a été longtemps un de mes livres de chevet pour deux raisons simples. 

Tout d'abord, cette première édition est contemporaine de ma découverte et de mon apprentissage des plans d'expérience en milieu industriel en 1989. Rares étaient les ouvrages en langue française à cette époque, excepté ceux qui abordaient les techniques d'expérimentation en agronomie. Ensuite, l'auteur détaillait les calculs pour tous les exemples que comporte le livre, ce qui offrait un terrain d'exercice intéressant complété en dernière partie par une mise en oeuvre des traitements numériques à l'aide d'un tableur, en l’occurrence le tableur LOTUS 123. Il faut garder à l'esprit qu'à l'aube des années quatre-vingt-dix, on utilisait surtout les machines à calculer et que l'édition de graphiques nécessitait le recours à des traceurs informatiques onéreux auxquels on préférait de loin le papier millimétré ...

Ce que j'ai bien aimé ...
  • Les différents chapitres du livre font appel à des exemples concrets, certains provenant même d'une mise en oeuvre industrielle de plans d'expérience, pour illustrer les propos de l'auteur. On trouve au fil du livre une petite dizaine d'exemples qui peuvent représenter, encore aujourd'hui, une excellente base d'exercices pour qui veut se former à l'analyse des résultats d'un plan d'expérience. On peut regretter la présence d'une seule réponse observée pour chacun des exemples, à l'exception de celui traitant de la photolithographie bicouche, mais ce reproche pourrait être adressé à de nombreux auteurs.
  • On trouve une illustration du surprenant exemple des pesées présenté par H. Hotelling en 1944. L'accès aux ressources étant aujourd'hui facilité, j'invite les plus curieux d'entre-vous à vous intéresser à des problèmes mettant en jeu plus de quatre objets à peser, à la fois avec une balance à deux plateaux de type Roberval, mais aussi à l'aide d'une balance à un plateau plus communément rencontrée aujourd'hui. Cet exemple sert d'introduction à la notion de plan optimal, notion qui renvoie à la définition et à l'interprétation d'invariants matriciels tels que la trace et le déterminant. La généralisation de cet exemple sera probablement reprise sous forme d'une étude de cas académique dans ce blog.
  • L'introduction à la construction des plans factoriels fractionnaires à deux niveaux me semble accessible pour un large lectorat, comparée à la présentation proposée par d'autres auteurs durant la même décennie.  Outre la méthode de construction de ce type de plan d'expérience, Jacques Goupy présente quelques possibilités d'exploitation des générateurs d'aliases. Par exemple, ces générateurs permettent d'adopter une démarche séquentielle afin de compléter intelligemment un premier plan d'expérience. Il est également possible de proposer un ordre particulier de mise en oeuvre des traitements expérimentaux afin de ne pas impacter les effets principaux des facteurs par une éventuelle dérive supposée linéaire. On appréciera l'illustration d'une méthode de création de blocs également basée sur l'utilisation des générateurs d'aliases. Le lecteur particulièrement intéressé par ce point particulier trouvera de plus amples informations dans les ouvrages présentant l'utilisation des plans d'expérience dans un contexte agronomique. Tout cela rejoint les principes d'expérimentation énoncés par Ronald Fisher (1890-1962), en particulier concernant la mise en oeuvre des traitements expérimentaux dans un ordre aléatoire sous forme de blocs homogènes.
  • Même s'il s'agit de généralités relevant le plus souvent du grand bon sens, la lecture du dernier chapitre distillant quelques conseils peut s'avérer souvent bien utile à un détail près ; il s'agit des répétitions au point central qui feront l'objet d'une remarque à la fin du paragraphe suivant.
Ce que j'ai moins aimé ...
  • Même après de nombreuses et studieuses relectures, je trouve que l'auteur inscrit toujours trop son discours dans un espace mathématique. Faire appel trop souvent à des matrices me semble inutile en raison de la limitation des ambitions du livre aux seuls plans factoriels complets ou fractionnaires avec deux niveaux par facteur. C'est un reproche général que l'on peut faire à propos des formations universitaires ou industrielles aux travers desquelles les stagiaires ont eu tendance à associer les plans d'expérience à des problèmes de calcul matriciel. Je ne suis pas certain que les rappels sur les matrices et le calcul matriciel en annexe soient bien utiles, surtout quand ils sont éloignés de l'usage que l'on peut en faire de manière sous-jacente en utilisant des plans d'expérience. Certes l'utilisateur des plans d'expérience précités a pu bénéficier des propriétés des matrices d'Hadamard à une époque où les calculs devaient être effectués manuellement. J'aurai préféré de loin des informations plus utiles à propos des propriétés d'orthogonalité, naturellement respectées par les deux familles de plans évoquées par l'auteur. L'utilisation d'arrangements orthogonaux permet d'une part de restituer l'information à partir de calculs de simples moyennes arithmétiques et, d'autre part, d'estimer de manière indépendante les effets des facteurs ce qui est un point recherché par les expérimentateurs. A vouloir présenter l'utilisation des matrices, pourquoi ne pas avoir utilisé la matrice des aliases lors de la présentation des plans factoriels fractionnaires à deux niveaux ?
  • Ce livre souffre de l'absence de graphiques, particulièrement ceux illustrant les notions d'effet principal et d'interaction. L'auteur restitue les informations uniquement sous forme de tableaux faisant appel aux notations proposées par G.E.P. Box, notations mathématiques qui font oublier le nom et les niveaux des facteurs dans une étude. Quand on souhaite comparer les effets de plusieurs facteurs, il faut les représenter côte à côte et à la même échelle, possibilité offerte par le tracé des effets principaux et le tracé des interactions. Paradoxalement l'auteur représente des surfaces de réponse et des courbes d'isoréponses, représentations limitées à des domaines définis à partir des variations de deux facteurs. L'intérêt de ces graphiques relève bien plus des problèmes d'optimisation non présentés dans cet ouvrage. Il faut attendre l'édition de 2006 pour bénéficier de graphiques plus pédagogiques et plus explicites en milieu industriel. Le manque de graphiques était-il lié à un problème technico-économique d'édition en 1988 ?
  • Alors qu'ils sont cités en bibliographie, les plans d’expérience à deux niveaux proposés par R.L. Plackett et J.P. Burman en 1946, appelés parfois plans multifactoriels, sont absents dans cette première édition, alors qu'ils apparaissent la même année dans l'ouvrage de M.G. Vigier en reprenant un arrangement orthogonal proposé par Genichi Taguchi (1924-2012). C'est un oubli dommageable car les plans de Plackett et Burman sont très utilisés en tant que plans de criblage dans l'industrie. Il faut également attendre l'édition de 2006 pour découvrir un exemple utilisant douze traitements expérimentaux distincts pour l'étude des effets principaux de neufs facteurs à deux niveaux. 
  • A la place de rappels sur la loi normale et le théorème des variances, j'aurai préféré trouver en annexe un glossaire offrant au lecteur des définitions pour un vocabulaire parfois très spécifique ; c'est le cas des mots aliase, contraste ou encore résolution dans le chapitre relatif aux plans factoriels fractionnaires. On a la chance de disposer aujourd'hui de définitions normalisées à ce sujet qui n'existaient pas à la date de parution de cet ouvrage ; beaucoup d'auteurs devraient s'en inspirer. Ce qui est le plus gênant à mon sens est la définition "variable" du mot effet. On veut désigner par ce terme l'influence des facteurs, l'estimation et la comparaison des effets étant la raison d'être de nombreux plans d'expérience. L'effet moyen ne peut hélas être défini comme la moitié de l'effet que dans le cas particulier de l'étude des facteurs à deux niveaux. L'approche de Jacques Goupy dans ce livre n'est pas généralisable à des facteurs présentant un nombre plus important de niveaux. Il faudrait donc proscrire cette définition au profit de celle caractérisant l'effet principal, locution utilisé par l'auteur sans jamais la définir. Quelques conflits avec la terminologie recommandée par le Vocabulaire International de Métrologie aujourd'hui peuvent être relevés : il conviendrait d'utiliser le mot incertitude à la place de précision ou encore erreur, même si la locution erreur-type reste très attachée en statistique au doute qui affecte l'estimation d'un paramètre.
  • L'origine de la désignation des deux niveaux des facteurs à partir des notations -1 et +1 proposée par l'auteur n'est également pas généralisable à l'étude des effets principaux des facteurs présentant plus de deux niveaux. Elle laisse de plus supposer qu'il faut ordonner de manière croissante les valeurs des niveaux des facteurs, ce qui est absolument inutile lors de la décomposition des valeurs observées pour une réponse par une méthode d'analyse de variance.
  • Le chapitre consacré au modèle mathématique associé aux plans factoriels complets à deux niveaux introduit de façon erronée la notion de modèle linéaire ; il faut comprendre que le modèle est linéaire par rapport aux coefficients. L'étude de tels modèles peut renvoyer, si nécessaire, à l'utilisation des méthodes et des outils offerts par l'algèbre linéaire comme, par exemple, le calcul matriciel. L'analyse de variance présentée également dans ce chapitre mériterait un rappel en annexe sur l'analyse de variance à un facteur avant d'être généralisée aux plans factoriels complets. Un chapitre spécifique devrait être consacré à cette méthode statistique pour présenter distinctement le cas des plans d'expérience avec des répliques et/ou des blocs. Expliciter l'équation d'un modèle mathématique permet d'asseoir la démarche des plans d'expérience dans une approche scientifique ... Est-ce systématiquement utile ?
  • Si l'on s'intéresse uniquement à l'influence des facteurs à deux niveaux à partir des seuls effets principaux complétés le cas échéant par des interactions d'ordre un, la définition d'un point central n'a aucun sens car il créerait un troisième niveau ! Par ailleurs, en présence de facteurs qualitatifs tels que le type de bitume ou de catalyseur, il est impossible de créer un point central. Par contre, le point central associé à d'éventuelles répliques prend tout son sens quand on veut compléter un plan factoriel complet ou fractionnaire à deux niveaux pour construire un plan composite centré. La traduction de la variation des valeurs observées pour une réponse fait alors intervenir la notion de courbure. On parle dans ce cas de plans à surface de réponse, non décrits dans ce livre, plans pour lesquels les facteurs doivent être quantitatifs à variation continue afin de permettre d'éventuelles interpolations entre les niveaux au sein du domaine expérimental. Les répliques permettent alors d'améliorer des propriétés telles que l'isovariance par rotation et la précision uniforme dans une vaste zone du domaine expérimental.
En conclusion ...
  • Si vous trouvez ce livre sur le marché de l'occasion, n'hésitez pas à l'acquérir car, pour un prix souvent très abordable, vous disposerez d'un "collector" et de plusieurs exemples bien utiles à la compréhension de plans d'expérience simples et efficaces, comme les plans factoriels complets et les plans factoriels fractionnaires à deux niveaux. Même si vous n'êtes pas chimiste ou rattaché professionnellement au monde de la chimie, vous trouverez de nombreuses idées d'application dans ce livre
  • N'hésitez pas à reproduire la construction des plans d'expérience proposés par l'auteur ainsi que l'analyse des résultats à l'aide d'un logiciel pour en apprécier l'ergonomie et, si vous êtes un peu téméraire et attentif aux articles de ce blog, vous découvrirez que les fonctionnalités d'un tableur peuvent offrir bien des services pour une première analyse.