Résumé

Dans la pratique, lorsqu'on dispose de plusieurs échantillons de données de même nature, il est usuel de vouloir tester l'homogénéité des dispersions. Un tel test est conseillé avant de procéder à une analyse de variance, où il est exigé que tous les groupes de données aient des variances semblables. Ce type de test est également très utilisé dans certains domaines industriels, notamment en contrôle de qualité. Plus généralement, un test ne rejetant pas l'hypothèse d'homogénéité des dispersions est intéressant car il justifie une ``fusion'' de tous les échantillons et conduit par conséquent à une connaissance plus fine de la variation des données. Le test le plus répandu dans ce contexte est celui de Bartlett (1937). Ce test est une amélioration du test obtenu par Neyman et Pearson (1931) en appliquant le rapport des vraisemblances. Il est démontré que le test de Bartlett est très puissant dans le cas où les données sont gaussiennes. Malheureusement, ce test est extrêmement sensible à la nature des données: si celles-ci proviennent d'une loi autre que la normale, il se peut que le test soit fortement perturbé. Box (1953) a très bien expliqué ce phénomène en montrant que le comportement aléatoire de la statistique de Bartlett est étroitement lié au coefficient d'applatissement de la distribution sous-jacente. En tenant compte de ce défaut majeur, plusieurs tests alternatifs ont été proposés. Le but visé: être aussi robuste que possible par rapport à la non normalité, tout en étant très sensible à la non homogénéité des dispersions. Après une présentation brèves de quelques tests et de leur comportement dans diverses situations, nous introduisons deux tests d'homogénéité des dispersions qui se basent sur la notion de densité structurelle conditionnelle. Les performances de ces deux tests sont étudiées pour des échantillons gaussiens (situation idéale pour le test Bartlett), puis pour des échantillons provenant de distributions à queues lourdes (situations défavorables pour le test de Bartlett).

Détails