Affichage des articles dont le libellé est Matrice d'Hadamard. Afficher tous les articles
Affichage des articles dont le libellé est Matrice d'Hadamard. Afficher tous les articles

mardi 2 juillet 2019

Episode 4 - La naissance fortuite de l'association Expérimentique ...

La vie est faite de rencontres, souvent surprenantes et inattendues ... Je retiendrai trois faits marquants en rapport avec les plans d'expérience durant mes premières années d'exercice.

Quelqu'un avait vendu la mèche ...

Je venais de rejoindre l'Ecole Supérieure de l'Energie et des Matériaux à Orléans. Alors que j'enseignais des éléments de mécanique des milieux continus, de mécanique des sols ou encore les base de la formulation des bétons hydrauliques auprès des étudiants de l'option Ressources et Travaux d'Aménagement, un vénérable collègue responsable de l'option relative au Génie des Matériaux m’interpella au détour d'un couloir. Il me proposa d'enseigner les plans d'expérience auprès de ses élèves car, lors des stages en entreprise, l'utilisation de cette démarche méthodologique revenait de façon assez récurrente. Je ne m'étais pas vanté d'avoir des notions dans ce domaine préférant mettre en avant ma formation initiale en génie civil. Comment pouvait-il donc savoir ? La réponse à cette interrogation tomba dans l'instant. Nous avions accueilli en entreprise un stagiaire dont la copine était étudiante dans l'école que je venais de rejoindre. Un oreiller avait servi à la transmission d'un modeste savoir et à dénoncer mes quelques connaissances. Je ne pouvais pas reculer devant l'évidence et il ne me restait plus qu'à accepter la proposition de ce cher collègue sous forme d'une vingtaine d'heures de travaux dirigés.

Quelques étudiants ont mis en pratique lors de leur stage les éléments de ce premier enseignement et les soutenances de stage, précédées par la lecture des rapports, m'ont permis d'échanger avec le monde industriel. Les informations disponibles étaient rares et peu accessibles spontanément ; elle provenaient essentiellement des publicités faites par les diffuseurs de logiciels dans des revues spécialisées et des livres qui commençaient à apparaître, les libraires ayant du mal à positionner les nouveaux opus dans un domaine bien particulier. Certains classaient les livres de plans d'expérience avec les ouvrages consacrés aux méthodes statistiques, d'autres les positionnaient dans les rayonnages consacrés à la qualité. Il n'y avait pas encore Internet sous la forme que l'on connaît aujourd'hui et la recherche d'articles renvoyait à des examens minutieux et fréquents de catalogues offrant des résumés. Certains prestataires de service proposaient bien des recherches par mots clés mais les tarifs étaient exorbitants. C'est au hasard des discussions avec un encadrant que j'appris l’existence d'un générateur de plans d'expérience, NEMROD (New Efficiency Method for Research using Optimal Design), développé par un universitaire marseillais connu pour sa séduisante faconde. Un peu comme dans une loge maçonnique, on ne pénétrait dans le domaine des plans d'expérience que lentement et par cooptation.

Les plans d'expérience, çà ne s'applique pas chez nous ...

De nombreux étudiants de l'option Ressources et Travaux d'Aménagement se destinaient au génie civil routier. Le laboratoire de recherche d'une entreprise de travaux routiers accueillait chaque année des stagiaires, en particulier pour le développement de nouveaux liants bitumineux. Seules des approches expérimentales permettaient de développer de nouvelles émulsions associant des bitumes et des polymères pour fabriquer des revêtements dans lesquels on introduisait des fibres de différentes natures et de différentes longueurs. Des approches systématiques mettant en oeuvre un très grand nombre de traitements expérimentaux m'incitèrent à poser la question lors d'une soutenance de stage : pourquoi n'utilisez-vous pas les plans d'expérience ? La réponse fut immédiate : çà ne s'applique pas chez nous. J'étais très perplexe car d'autres étudiants en stage dans une autre entreprise de la même zone industrielle de la proche banlieue parisienne appliquaient, avec succès, la méthode des plans d'expérience sur des sujets assez voisins. Était-ce une question de rue ou de code postal ?

Après avoir obtenu la même réponse alors que je posais la même question lors d'une autre soutenance de stage, j'ai proposé au directeur technique de l'entreprise de travaux routiers une analyse différente des résultats du stagiaire en extrayant de la base de données les quelques lignes qui permettaient d'estimer les effets des facteurs. Le tracé des effets principaux faisait apparaître plusieurs niveaux pour les facteurs traduisant le type de fibres et la longueur des fibres, ce qui surprit le directeur technique. Pour lui, et preuve à l'appui, les plans d'expérience ne permettaient de prendre en compte que des facteurs à deux niveaux. La preuve provenait d'un support de formation où la présentation des plans d'expérience était manuscrite et matricielle. Elle se limitait à l'étude de facteurs possédant deux niveaux ; les propriétés des matrices d'Hadamard y étaient largement exploitées. J'avais quelque part eu la chance de lire avec attention le livre de Michel Vigier (voir ici) paru en 1988 qui présentait le catalogue des arrangements orthogonaux associés à la méthode Taguchi et qui m'ouvrait ainsi de nouvelles perspectives d'application. L'année suivante, les stagiaires ont naturellement utilisé les plans d'expérience dans cette entreprise !

N'auriez-vous pas une idée pour organiser une journée technique ?

La technopole d'Orléans venait d'ériger sa nouvelle structure au milieu du campus universitaire arboré d'Orléans-la-Source et les enseignants furent rapidement mis à contribution pour proposer des idées de journées techniques afin d'attirer des industriels sur le campus. Une première journée portant sur les problèmes de compatibilité électromagnétique avait remporté un grand succès. J'ai répondu favorablement et doublement à la sollicitation de la technopole ; le premier thème portait sur une typologie des ponts sur la Loire et le second proposait une rencontre autour des plans d'expérience. Le directeur me reçut fort aimablement et m'orienta vers le muséum d'histoire naturelle d'Orléans et l'association Centre Sciences à propos du premier thème. De cette collaboration, naquit une exposition itinérante : le génie des ponts. Le second thème embarrassait mon interlocuteur qui avait besoin de plus d'explications et n'osait pas me répondre par la négative. Après avoir interrogé des partenaires industriels qui approuvèrent l'idée, on se lança dans l'organisation d'une journée technique à la fin du printemps 1996 : plus d'une centaine de participants assistèrent à cette journée. Ce fut un succès : l'association Expérimentique était née.

... la suite au prochain épisode ...

mardi 11 juin 2019

Note de lecture 1

Goupy J., La méthode des plans d'expériences, Optimisation du choix des essais & de l'interprétation des résultats, Dunod, Ed. Paris, 1988, 304 pages.


Jacques Goupy (1934-2015) a été un auteur très productif en matière d'ouvrages en langue française relatifs aux plans d'expérience (voir ici). Dans cet article, je vais commenter la première édition d'un livre que l'on peut considérer comme pionnier parmi les ouvrages de grande diffusion en France à propos de plans d'expérience. Ce livre publié en 1988 a été longtemps un de mes livres de chevet pour deux raisons simples. 

Tout d'abord, cette première édition est contemporaine de ma découverte et de mon apprentissage des plans d'expérience en milieu industriel en 1989. Rares étaient les ouvrages en langue française à cette époque, excepté ceux qui abordaient les techniques d'expérimentation en agronomie. Ensuite, l'auteur détaillait les calculs pour tous les exemples que comporte le livre, ce qui offrait un terrain d'exercice intéressant complété en dernière partie par une mise en oeuvre des traitements numériques à l'aide d'un tableur, en l’occurrence le tableur LOTUS 123. Il faut garder à l'esprit qu'à l'aube des années quatre-vingt-dix, on utilisait surtout les machines à calculer et que l'édition de graphiques nécessitait le recours à des traceurs informatiques onéreux auxquels on préférait de loin le papier millimétré ...

Ce que j'ai bien aimé ...
  • Les différents chapitres du livre font appel à des exemples concrets, certains provenant même d'une mise en oeuvre industrielle de plans d'expérience, pour illustrer les propos de l'auteur. On trouve au fil du livre une petite dizaine d'exemples qui peuvent représenter, encore aujourd'hui, une excellente base d'exercices pour qui veut se former à l'analyse des résultats d'un plan d'expérience. On peut regretter la présence d'une seule réponse observée pour chacun des exemples, à l'exception de celui traitant de la photolithographie bicouche, mais ce reproche pourrait être adressé à de nombreux auteurs.
  • On trouve une illustration du surprenant exemple des pesées présenté par H. Hotelling en 1944. L'accès aux ressources étant aujourd'hui facilité, j'invite les plus curieux d'entre-vous à vous intéresser à des problèmes mettant en jeu plus de quatre objets à peser, à la fois avec une balance à deux plateaux de type Roberval, mais aussi à l'aide d'une balance à un plateau plus communément rencontrée aujourd'hui. Cet exemple sert d'introduction à la notion de plan optimal, notion qui renvoie à la définition et à l'interprétation d'invariants matriciels tels que la trace et le déterminant. La généralisation de cet exemple sera probablement reprise sous forme d'une étude de cas académique dans ce blog.
  • L'introduction à la construction des plans factoriels fractionnaires à deux niveaux me semble accessible pour un large lectorat, comparée à la présentation proposée par d'autres auteurs durant la même décennie.  Outre la méthode de construction de ce type de plan d'expérience, Jacques Goupy présente quelques possibilités d'exploitation des générateurs d'aliases. Par exemple, ces générateurs permettent d'adopter une démarche séquentielle afin de compléter intelligemment un premier plan d'expérience. Il est également possible de proposer un ordre particulier de mise en oeuvre des traitements expérimentaux afin de ne pas impacter les effets principaux des facteurs par une éventuelle dérive supposée linéaire. On appréciera l'illustration d'une méthode de création de blocs également basée sur l'utilisation des générateurs d'aliases. Le lecteur particulièrement intéressé par ce point particulier trouvera de plus amples informations dans les ouvrages présentant l'utilisation des plans d'expérience dans un contexte agronomique. Tout cela rejoint les principes d'expérimentation énoncés par Ronald Fisher (1890-1962), en particulier concernant la mise en oeuvre des traitements expérimentaux dans un ordre aléatoire sous forme de blocs homogènes.
  • Même s'il s'agit de généralités relevant le plus souvent du grand bon sens, la lecture du dernier chapitre distillant quelques conseils peut s'avérer souvent bien utile à un détail près ; il s'agit des répétitions au point central qui feront l'objet d'une remarque à la fin du paragraphe suivant.
Ce que j'ai moins aimé ...
  • Même après de nombreuses et studieuses relectures, je trouve que l'auteur inscrit toujours trop son discours dans un espace mathématique. Faire appel trop souvent à des matrices me semble inutile en raison de la limitation des ambitions du livre aux seuls plans factoriels complets ou fractionnaires avec deux niveaux par facteur. C'est un reproche général que l'on peut faire à propos des formations universitaires ou industrielles aux travers desquelles les stagiaires ont eu tendance à associer les plans d'expérience à des problèmes de calcul matriciel. Je ne suis pas certain que les rappels sur les matrices et le calcul matriciel en annexe soient bien utiles, surtout quand ils sont éloignés de l'usage que l'on peut en faire de manière sous-jacente en utilisant des plans d'expérience. Certes l'utilisateur des plans d'expérience précités a pu bénéficier des propriétés des matrices d'Hadamard à une époque où les calculs devaient être effectués manuellement. J'aurai préféré de loin des informations plus utiles à propos des propriétés d'orthogonalité, naturellement respectées par les deux familles de plans évoquées par l'auteur. L'utilisation d'arrangements orthogonaux permet d'une part de restituer l'information à partir de calculs de simples moyennes arithmétiques et, d'autre part, d'estimer de manière indépendante les effets des facteurs ce qui est un point recherché par les expérimentateurs. A vouloir présenter l'utilisation des matrices, pourquoi ne pas avoir utilisé la matrice des aliases lors de la présentation des plans factoriels fractionnaires à deux niveaux ?
  • Ce livre souffre de l'absence de graphiques, particulièrement ceux illustrant les notions d'effet principal et d'interaction. L'auteur restitue les informations uniquement sous forme de tableaux faisant appel aux notations proposées par G.E.P. Box, notations mathématiques qui font oublier le nom et les niveaux des facteurs dans une étude. Quand on souhaite comparer les effets de plusieurs facteurs, il faut les représenter côte à côte et à la même échelle, possibilité offerte par le tracé des effets principaux et le tracé des interactions. Paradoxalement l'auteur représente des surfaces de réponse et des courbes d'isoréponses, représentations limitées à des domaines définis à partir des variations de deux facteurs. L'intérêt de ces graphiques relève bien plus des problèmes d'optimisation non présentés dans cet ouvrage. Il faut attendre l'édition de 2006 pour bénéficier de graphiques plus pédagogiques et plus explicites en milieu industriel. Le manque de graphiques était-il lié à un problème technico-économique d'édition en 1988 ?
  • Alors qu'ils sont cités en bibliographie, les plans d’expérience à deux niveaux proposés par R.L. Plackett et J.P. Burman en 1946, appelés parfois plans multifactoriels, sont absents dans cette première édition, alors qu'ils apparaissent la même année dans l'ouvrage de M.G. Vigier en reprenant un arrangement orthogonal proposé par Genichi Taguchi (1924-2012). C'est un oubli dommageable car les plans de Plackett et Burman sont très utilisés en tant que plans de criblage dans l'industrie. Il faut également attendre l'édition de 2006 pour découvrir un exemple utilisant douze traitements expérimentaux distincts pour l'étude des effets principaux de neufs facteurs à deux niveaux. 
  • A la place de rappels sur la loi normale et le théorème des variances, j'aurai préféré trouver en annexe un glossaire offrant au lecteur des définitions pour un vocabulaire parfois très spécifique ; c'est le cas des mots aliase, contraste ou encore résolution dans le chapitre relatif aux plans factoriels fractionnaires. On a la chance de disposer aujourd'hui de définitions normalisées à ce sujet qui n'existaient pas à la date de parution de cet ouvrage ; beaucoup d'auteurs devraient s'en inspirer. Ce qui est le plus gênant à mon sens est la définition "variable" du mot effet. On veut désigner par ce terme l'influence des facteurs, l'estimation et la comparaison des effets étant la raison d'être de nombreux plans d'expérience. L'effet moyen ne peut hélas être défini comme la moitié de l'effet que dans le cas particulier de l'étude des facteurs à deux niveaux. L'approche de Jacques Goupy dans ce livre n'est pas généralisable à des facteurs présentant un nombre plus important de niveaux. Il faudrait donc proscrire cette définition au profit de celle caractérisant l'effet principal, locution utilisé par l'auteur sans jamais la définir. Quelques conflits avec la terminologie recommandée par le Vocabulaire International de Métrologie aujourd'hui peuvent être relevés : il conviendrait d'utiliser le mot incertitude à la place de précision ou encore erreur, même si la locution erreur-type reste très attachée en statistique au doute qui affecte l'estimation d'un paramètre.
  • L'origine de la désignation des deux niveaux des facteurs à partir des notations -1 et +1 proposée par l'auteur n'est également pas généralisable à l'étude des effets principaux des facteurs présentant plus de deux niveaux. Elle laisse de plus supposer qu'il faut ordonner de manière croissante les valeurs des niveaux des facteurs, ce qui est absolument inutile lors de la décomposition des valeurs observées pour une réponse par une méthode d'analyse de variance.
  • Le chapitre consacré au modèle mathématique associé aux plans factoriels complets à deux niveaux introduit de façon erronée la notion de modèle linéaire ; il faut comprendre que le modèle est linéaire par rapport aux coefficients. L'étude de tels modèles peut renvoyer, si nécessaire, à l'utilisation des méthodes et des outils offerts par l'algèbre linéaire comme, par exemple, le calcul matriciel. L'analyse de variance présentée également dans ce chapitre mériterait un rappel en annexe sur l'analyse de variance à un facteur avant d'être généralisée aux plans factoriels complets. Un chapitre spécifique devrait être consacré à cette méthode statistique pour présenter distinctement le cas des plans d'expérience avec des répliques et/ou des blocs. Expliciter l'équation d'un modèle mathématique permet d'asseoir la démarche des plans d'expérience dans une approche scientifique ... Est-ce systématiquement utile ?
  • Si l'on s'intéresse uniquement à l'influence des facteurs à deux niveaux à partir des seuls effets principaux complétés le cas échéant par des interactions d'ordre un, la définition d'un point central n'a aucun sens car il créerait un troisième niveau ! Par ailleurs, en présence de facteurs qualitatifs tels que le type de bitume ou de catalyseur, il est impossible de créer un point central. Par contre, le point central associé à d'éventuelles répliques prend tout son sens quand on veut compléter un plan factoriel complet ou fractionnaire à deux niveaux pour construire un plan composite centré. La traduction de la variation des valeurs observées pour une réponse fait alors intervenir la notion de courbure. On parle dans ce cas de plans à surface de réponse, non décrits dans ce livre, plans pour lesquels les facteurs doivent être quantitatifs à variation continue afin de permettre d'éventuelles interpolations entre les niveaux au sein du domaine expérimental. Les répliques permettent alors d'améliorer des propriétés telles que l'isovariance par rotation et la précision uniforme dans une vaste zone du domaine expérimental.
En conclusion ...
  • Si vous trouvez ce livre sur le marché de l'occasion, n'hésitez pas à l'acquérir car, pour un prix souvent très abordable, vous disposerez d'un "collector" et de plusieurs exemples bien utiles à la compréhension de plans d'expérience simples et efficaces, comme les plans factoriels complets et les plans factoriels fractionnaires à deux niveaux. Même si vous n'êtes pas chimiste ou rattaché professionnellement au monde de la chimie, vous trouverez de nombreuses idées d'application dans ce livre
  • N'hésitez pas à reproduire la construction des plans d'expérience proposés par l'auteur ainsi que l'analyse des résultats à l'aide d'un logiciel pour en apprécier l'ergonomie et, si vous êtes un peu téméraire et attentif aux articles de ce blog, vous découvrirez que les fonctionnalités d'un tableur peuvent offrir bien des services pour une première analyse.