Affichage des articles dont le libellé est Box et Hunter. Afficher tous les articles
Affichage des articles dont le libellé est Box et Hunter. Afficher tous les articles

mardi 11 juin 2019

Note de lecture 1

Goupy J., La méthode des plans d'expériences, Optimisation du choix des essais & de l'interprétation des résultats, Dunod, Ed. Paris, 1988, 304 pages.


Jacques Goupy (1934-2015) a été un auteur très productif en matière d'ouvrages en langue française relatifs aux plans d'expérience (voir ici). Dans cet article, je vais commenter la première édition d'un livre que l'on peut considérer comme pionnier parmi les ouvrages de grande diffusion en France à propos de plans d'expérience. Ce livre publié en 1988 a été longtemps un de mes livres de chevet pour deux raisons simples. 

Tout d'abord, cette première édition est contemporaine de ma découverte et de mon apprentissage des plans d'expérience en milieu industriel en 1989. Rares étaient les ouvrages en langue française à cette époque, excepté ceux qui abordaient les techniques d'expérimentation en agronomie. Ensuite, l'auteur détaillait les calculs pour tous les exemples que comporte le livre, ce qui offrait un terrain d'exercice intéressant complété en dernière partie par une mise en oeuvre des traitements numériques à l'aide d'un tableur, en l’occurrence le tableur LOTUS 123. Il faut garder à l'esprit qu'à l'aube des années quatre-vingt-dix, on utilisait surtout les machines à calculer et que l'édition de graphiques nécessitait le recours à des traceurs informatiques onéreux auxquels on préférait de loin le papier millimétré ...

Ce que j'ai bien aimé ...
  • Les différents chapitres du livre font appel à des exemples concrets, certains provenant même d'une mise en oeuvre industrielle de plans d'expérience, pour illustrer les propos de l'auteur. On trouve au fil du livre une petite dizaine d'exemples qui peuvent représenter, encore aujourd'hui, une excellente base d'exercices pour qui veut se former à l'analyse des résultats d'un plan d'expérience. On peut regretter la présence d'une seule réponse observée pour chacun des exemples, à l'exception de celui traitant de la photolithographie bicouche, mais ce reproche pourrait être adressé à de nombreux auteurs.
  • On trouve une illustration du surprenant exemple des pesées présenté par H. Hotelling en 1944. L'accès aux ressources étant aujourd'hui facilité, j'invite les plus curieux d'entre-vous à vous intéresser à des problèmes mettant en jeu plus de quatre objets à peser, à la fois avec une balance à deux plateaux de type Roberval, mais aussi à l'aide d'une balance à un plateau plus communément rencontrée aujourd'hui. Cet exemple sert d'introduction à la notion de plan optimal, notion qui renvoie à la définition et à l'interprétation d'invariants matriciels tels que la trace et le déterminant. La généralisation de cet exemple sera probablement reprise sous forme d'une étude de cas académique dans ce blog.
  • L'introduction à la construction des plans factoriels fractionnaires à deux niveaux me semble accessible pour un large lectorat, comparée à la présentation proposée par d'autres auteurs durant la même décennie.  Outre la méthode de construction de ce type de plan d'expérience, Jacques Goupy présente quelques possibilités d'exploitation des générateurs d'aliases. Par exemple, ces générateurs permettent d'adopter une démarche séquentielle afin de compléter intelligemment un premier plan d'expérience. Il est également possible de proposer un ordre particulier de mise en oeuvre des traitements expérimentaux afin de ne pas impacter les effets principaux des facteurs par une éventuelle dérive supposée linéaire. On appréciera l'illustration d'une méthode de création de blocs également basée sur l'utilisation des générateurs d'aliases. Le lecteur particulièrement intéressé par ce point particulier trouvera de plus amples informations dans les ouvrages présentant l'utilisation des plans d'expérience dans un contexte agronomique. Tout cela rejoint les principes d'expérimentation énoncés par Ronald Fisher (1890-1962), en particulier concernant la mise en oeuvre des traitements expérimentaux dans un ordre aléatoire sous forme de blocs homogènes.
  • Même s'il s'agit de généralités relevant le plus souvent du grand bon sens, la lecture du dernier chapitre distillant quelques conseils peut s'avérer souvent bien utile à un détail près ; il s'agit des répétitions au point central qui feront l'objet d'une remarque à la fin du paragraphe suivant.
Ce que j'ai moins aimé ...
  • Même après de nombreuses et studieuses relectures, je trouve que l'auteur inscrit toujours trop son discours dans un espace mathématique. Faire appel trop souvent à des matrices me semble inutile en raison de la limitation des ambitions du livre aux seuls plans factoriels complets ou fractionnaires avec deux niveaux par facteur. C'est un reproche général que l'on peut faire à propos des formations universitaires ou industrielles aux travers desquelles les stagiaires ont eu tendance à associer les plans d'expérience à des problèmes de calcul matriciel. Je ne suis pas certain que les rappels sur les matrices et le calcul matriciel en annexe soient bien utiles, surtout quand ils sont éloignés de l'usage que l'on peut en faire de manière sous-jacente en utilisant des plans d'expérience. Certes l'utilisateur des plans d'expérience précités a pu bénéficier des propriétés des matrices d'Hadamard à une époque où les calculs devaient être effectués manuellement. J'aurai préféré de loin des informations plus utiles à propos des propriétés d'orthogonalité, naturellement respectées par les deux familles de plans évoquées par l'auteur. L'utilisation d'arrangements orthogonaux permet d'une part de restituer l'information à partir de calculs de simples moyennes arithmétiques et, d'autre part, d'estimer de manière indépendante les effets des facteurs ce qui est un point recherché par les expérimentateurs. A vouloir présenter l'utilisation des matrices, pourquoi ne pas avoir utilisé la matrice des aliases lors de la présentation des plans factoriels fractionnaires à deux niveaux ?
  • Ce livre souffre de l'absence de graphiques, particulièrement ceux illustrant les notions d'effet principal et d'interaction. L'auteur restitue les informations uniquement sous forme de tableaux faisant appel aux notations proposées par G.E.P. Box, notations mathématiques qui font oublier le nom et les niveaux des facteurs dans une étude. Quand on souhaite comparer les effets de plusieurs facteurs, il faut les représenter côte à côte et à la même échelle, possibilité offerte par le tracé des effets principaux et le tracé des interactions. Paradoxalement l'auteur représente des surfaces de réponse et des courbes d'isoréponses, représentations limitées à des domaines définis à partir des variations de deux facteurs. L'intérêt de ces graphiques relève bien plus des problèmes d'optimisation non présentés dans cet ouvrage. Il faut attendre l'édition de 2006 pour bénéficier de graphiques plus pédagogiques et plus explicites en milieu industriel. Le manque de graphiques était-il lié à un problème technico-économique d'édition en 1988 ?
  • Alors qu'ils sont cités en bibliographie, les plans d’expérience à deux niveaux proposés par R.L. Plackett et J.P. Burman en 1946, appelés parfois plans multifactoriels, sont absents dans cette première édition, alors qu'ils apparaissent la même année dans l'ouvrage de M.G. Vigier en reprenant un arrangement orthogonal proposé par Genichi Taguchi (1924-2012). C'est un oubli dommageable car les plans de Plackett et Burman sont très utilisés en tant que plans de criblage dans l'industrie. Il faut également attendre l'édition de 2006 pour découvrir un exemple utilisant douze traitements expérimentaux distincts pour l'étude des effets principaux de neufs facteurs à deux niveaux. 
  • A la place de rappels sur la loi normale et le théorème des variances, j'aurai préféré trouver en annexe un glossaire offrant au lecteur des définitions pour un vocabulaire parfois très spécifique ; c'est le cas des mots aliase, contraste ou encore résolution dans le chapitre relatif aux plans factoriels fractionnaires. On a la chance de disposer aujourd'hui de définitions normalisées à ce sujet qui n'existaient pas à la date de parution de cet ouvrage ; beaucoup d'auteurs devraient s'en inspirer. Ce qui est le plus gênant à mon sens est la définition "variable" du mot effet. On veut désigner par ce terme l'influence des facteurs, l'estimation et la comparaison des effets étant la raison d'être de nombreux plans d'expérience. L'effet moyen ne peut hélas être défini comme la moitié de l'effet que dans le cas particulier de l'étude des facteurs à deux niveaux. L'approche de Jacques Goupy dans ce livre n'est pas généralisable à des facteurs présentant un nombre plus important de niveaux. Il faudrait donc proscrire cette définition au profit de celle caractérisant l'effet principal, locution utilisé par l'auteur sans jamais la définir. Quelques conflits avec la terminologie recommandée par le Vocabulaire International de Métrologie aujourd'hui peuvent être relevés : il conviendrait d'utiliser le mot incertitude à la place de précision ou encore erreur, même si la locution erreur-type reste très attachée en statistique au doute qui affecte l'estimation d'un paramètre.
  • L'origine de la désignation des deux niveaux des facteurs à partir des notations -1 et +1 proposée par l'auteur n'est également pas généralisable à l'étude des effets principaux des facteurs présentant plus de deux niveaux. Elle laisse de plus supposer qu'il faut ordonner de manière croissante les valeurs des niveaux des facteurs, ce qui est absolument inutile lors de la décomposition des valeurs observées pour une réponse par une méthode d'analyse de variance.
  • Le chapitre consacré au modèle mathématique associé aux plans factoriels complets à deux niveaux introduit de façon erronée la notion de modèle linéaire ; il faut comprendre que le modèle est linéaire par rapport aux coefficients. L'étude de tels modèles peut renvoyer, si nécessaire, à l'utilisation des méthodes et des outils offerts par l'algèbre linéaire comme, par exemple, le calcul matriciel. L'analyse de variance présentée également dans ce chapitre mériterait un rappel en annexe sur l'analyse de variance à un facteur avant d'être généralisée aux plans factoriels complets. Un chapitre spécifique devrait être consacré à cette méthode statistique pour présenter distinctement le cas des plans d'expérience avec des répliques et/ou des blocs. Expliciter l'équation d'un modèle mathématique permet d'asseoir la démarche des plans d'expérience dans une approche scientifique ... Est-ce systématiquement utile ?
  • Si l'on s'intéresse uniquement à l'influence des facteurs à deux niveaux à partir des seuls effets principaux complétés le cas échéant par des interactions d'ordre un, la définition d'un point central n'a aucun sens car il créerait un troisième niveau ! Par ailleurs, en présence de facteurs qualitatifs tels que le type de bitume ou de catalyseur, il est impossible de créer un point central. Par contre, le point central associé à d'éventuelles répliques prend tout son sens quand on veut compléter un plan factoriel complet ou fractionnaire à deux niveaux pour construire un plan composite centré. La traduction de la variation des valeurs observées pour une réponse fait alors intervenir la notion de courbure. On parle dans ce cas de plans à surface de réponse, non décrits dans ce livre, plans pour lesquels les facteurs doivent être quantitatifs à variation continue afin de permettre d'éventuelles interpolations entre les niveaux au sein du domaine expérimental. Les répliques permettent alors d'améliorer des propriétés telles que l'isovariance par rotation et la précision uniforme dans une vaste zone du domaine expérimental.
En conclusion ...
  • Si vous trouvez ce livre sur le marché de l'occasion, n'hésitez pas à l'acquérir car, pour un prix souvent très abordable, vous disposerez d'un "collector" et de plusieurs exemples bien utiles à la compréhension de plans d'expérience simples et efficaces, comme les plans factoriels complets et les plans factoriels fractionnaires à deux niveaux. Même si vous n'êtes pas chimiste ou rattaché professionnellement au monde de la chimie, vous trouverez de nombreuses idées d'application dans ce livre
  • N'hésitez pas à reproduire la construction des plans d'expérience proposés par l'auteur ainsi que l'analyse des résultats à l'aide d'un logiciel pour en apprécier l'ergonomie et, si vous êtes un peu téméraire et attentif aux articles de ce blog, vous découvrirez que les fonctionnalités d'un tableur peuvent offrir bien des services pour une première analyse.





mardi 4 juin 2019

Episode 2 - Il y a trente ans déjà …

Après avoir obtenu en 1988 un diplôme d'ingénieur délivré par l’Institut National des Sciences Appliquées de Toulouse, dans le domaine du génie civil, j’ai passé avec succès l’année suivante une agrégation dans le même domaine. Mon rang de sortie m’a permis d'échapper à la formation initiatique des jeunes enseignants et d’obtenir un détachement dans une entreprise. Certes j'avais déjà fait des stages industriels, mais cette fois c'était un contrat d'ingénieur en recherche et développement qui m'attendait pour une durée de 18 mois.  L’entreprise rebaptisée aujourd’hui Ciments Calcia était l’un des deux plus gros fleurons de l’industrie cimentière française et les découvertes qui ont marqué mon affectation au sein du laboratoire Béton Développement sont à l’origine d'orientations thématiques et pédagogiques opérées plus tard en tant qu’enseignant dans des écoles d’ingénieurs à Orléans puis à Limoges. Je dois une grande reconnaissance à celles et ceux qui ont contribué à cette initiation aux méthodes statistiques dans le monde industriel et qui ont surtout permis d'éveiller ma curiosité. La célèbre question "Comment çà marche ?" du chroniqueur scientifique Michel Chevalet allait devenir rapidement une interrogation à laquelle j'allais devoir répondre à propos des plans d'expérience. C’était le 15 juin 1989, année du bicentenaire de la Révolution française.

J’avais échappé durant mon parcours initial à l'enseignement des statistiques et des probabilités en raison de l'ablation d'un kyste sur une corde vocale qui contraignit l'enseignant au mutisme le plus complet durant le trimestre où cet enseignement devait avoir lieu : cela ne s'invente pas ! Comme bien souvent dans l'enseignement supérieur, il n'y a pas de remplaçant ... À chacun sa spécialité ... Je ne savais donc rien à propos de l'espérance mathématique et de la variance d'une loi de probabilité. L'écart-type et les intervalles de confiance devaient être timidement évoqués sous forme d'une note manuscrite de bas de page dans un cahier de travaux pratiques rattachés à l'enseignement du ciment et du béton. Un peu d'analyse combinatoire était associée aux différents cas de charge, sous forme de neige et de vent ou sous forme de charges fixes et variables, dans les cours de béton armé ou de construction métallique. Le futur ingénieur en génie civil devait par contre se délecter de calculs matriciels et d'équations différentielles qui allaient nous permettre de dimensionner et construire les édifices les plus audacieux, le tout accompagné par un important volume d'heures en analyse numérique mise en application à l'aide de langages de programmation compilés. La table à dessins existait encore dans les salles de projet et l'usage de papier millimétré aussi bien que logarithmique accompagnait les rédactions manuscrites de nos comptes rendus de travaux pratiques. À la fin de mes études, j’avais la certitude de posséder de solides connaissances pour affronter une période économique de plein emploi pour les ingénieurs : c’était il y a maintenant trente ans.

Le détachement en entreprise m’imposa très vite un virage radical en me faisant côtoyer le caractère aléatoire de variables que je considérais jusqu'alors comme parfaitement déterministes. L’écart-type me rattrapa dès le premier mois, un vendredi après-midi, quand en pleine réunion de laboratoire un de mes responsables me pria de compléter un rapport d’essai en rajoutant la valeur de cette statistique, a priori mal-aimée par certains et inconnue par d'autres, à côté de la valeur de la moyenne arithmétique, rassurante et maîtrisée, traduisant la résistance mécanique à la compression d’un béton. L’achat du premier livre d’une longue série relative aux statistiques me rassura en m’offrant la formule qui manquait à ma culture. Je ne suis pas certain d'en avoir bien compris le sens à l'époque mais elle fut immédiatement mise en œuvre à la machine à calculer en prenant soin de fournir dans le rapport un nombre de décimales tel qu’on ne puisse pas douter de ma compétence à fournir un résultat de mesure. Je compris ce jour-là que j’allais devoir apprivoiser cette statistique et bien d’autres, un peu comme le Petit Prince de Saint-Exupéry face au renard dans le désert. Il faut du temps, de la patience et un peu d’obstination pour cela. Mais la persévérance porte ses fruits petit à petit, au fil des pages de lecture, au gré de nouvelles études expérimentales ou en découvrant de nouvelles méthodes statistiques. Il ne faut surtout pas se montrer trop pressé. Découvrir l'usage des statistiques en milieu industriel leur donne tout de suite un aspect plus concret que lors d'un cours magistral à la craie et au tableau dans un grand amphithéâtre.

Le projet B312 ...

Les plans d’expérience sont apparus au même moment dans ma vie professionnelle quand on me demanda de participer à un groupe de travail à propos de la formulation d’un nouvel adjuvant pour béton, dans le cadre d’un projet appelé B312. Curieux nom de code me rappelant, toujours dans la même œuvre de Saint-Exupéry, l’astéroïde B612 possédant des volcans et surtout une rose. Moins prosaïquement, ce nom de code signifiait que l’on cherchait à formuler un béton dont la rhéologie resterait stable et fluide durant 3 heures tout en permettant d’obtenir des résistances contractuelles 12 heures après sa fabrication : un vrai défi ... Point de salut sans la chimie organique, aide discrète et efficace quand on a atteint les limites de la chimie minérale. Dans le groupe de travail, il y avait un chimiste qui connaissait mieux que personne les vertus des polynaphtalènes sulfonates et celles des nonylphénols suivant leur nombre d’oxyde d’éthylène. Quinquagénaire averti et passionné, il reproduisait même des essais et créait de nouvelles formules en amateur dans le garage de son pavillon de banlieue parisienne, un peu comme cet oncle fameux bricoleur, héros d’une chanson de Boris Vian. Le chimiste allait réaliser les savants mélanges et s’assurer de leur stabilité avant de me les transmettre pour étudier leur efficacité sur le béton. Dans le groupe de travail, il y avait un spécialiste des plans d’expérience. Il ne portait pas de blouse blanche comme le chimiste mais plutôt un blazer. Il se retranchait dans son petit bureau derrière l’écran monochrome d’un ordinateur sur lequel il mettait en œuvre un logiciel dont le nom représentait à mes yeux un acronyme à la fois génial mais quelque peu obscur : LUMIERE. Logiciel à Usage de Modélisation Industrielle Et de Recherche Expérimentale. Génial car il fallait y penser ; obscur parce que le spécialiste des plans d’expérience, fort sympathique et serviable au demeurant, ne communiquait qu’à l’aide de statistiques de Fisher et de Student que lui renvoyait le logiciel à l’aide d’une imprimante à aiguilles. Le premier nom me faisait penser à une marque de bière dans un contenant en verre ambré et le second à un statut que je venais de quitter. Dans le groupe de travail, il y avait enfin un technicien et moi-même sur qui on fondait beaucoup d’espoir au travers de nos essais rhéologiques. Nous étions supervisés à la fois par un directeur scientifique pour ce qui relevait de la chimie des adjuvants et par un directeur technique qui n'était autre qu'un de mes deux supérieurs hiérarchiques pour ce qui relevait des propriétés du béton. C’est dans ce contexte que je fus amené à mettre en œuvre mon premier plan d’expérience.

Il s'agissait d’un plan factoriel fractionnaire de type 2k-p présentant une résolution IV. Le but de ce blog sera de démystifier plus tard ce type de notation, mais les spécialistes savent déjà qu’il s’agit de dispositifs expérimentaux proposés par Box et Hunter en 1961 permettant d’estimer et de comparer les effets principaux des facteurs indépendamment des effets des interactions d’ordre un que l’on confond entre elles. Pour moi, j’associais le terme résolution à celui de problème ou d’équation et celui d’interaction au monde de la chimie dont je n’étais pas très passionné, avouons-le. J’allais devoir enrichir mon vocabulaire par de nouveaux termes et chercher rapidement à en comprendre le sens et les subtilités car, contre toute attente, la mise en œuvre de deux ou trois plans d’expérience successifs conduisirent à la formule recherchée. On peut en effet associer une approche séquentielle à la mise en oeuvre de ce type de dispositif expérimental. Il en découla même un brevet. 

... la suite au prochain épisode ...