Discuter:Test d'hypothèse

Un article de Wikipédia, l'encyclopédie libre.

Le début de l'article définit les mots "hypothèse nulle".

Je crois que, dans les parties de phrase :

  la possibilité de rejeter à tort une hypothèse lorsqu'elle est vraie

et

  la possibilité d'accepter à tort une hypothèse lorsqu'elle est fausse

il est absolument nécessaire de préciser qu'on parle exclusivement de cette hypothèse nulle H0 ; sinon, le risque α et le risque β restent non définis.


Comme c'est le cas pour l'article "test statistique", il semble y avoir "une erreur de sens" dans la deuxième des phrases ci-dessous :

"On impose que le risque de deuxième espèce β tende vers 0 quand le nombre d'observations tend vers 
l'infini et l'on fixe le risque de première espèce à un niveau α.
Cela revient à considérer que le risque d'accepter une hypothèse alors que cette hypothèse est 
fausse est infiniment plus couteux que celui de refuser une hypothèse alors qu'elle est vraie."

En effet, le fait que le risque β tende vers 0 quand le nombre d'observations tend vers l'infini n'indique pas la vitesse de cette convergence. (Exemple : \frac{1}{\ln(n)} et \frac{1}{n^n} tendent vers zéro quand n tend vers plus l'infini.) Au contraire, on fixe le risque de première espèce à un niveau α qu'on choisit à volonté, éventuellement \frac{1}{1000}, par exemple, même si on prend souvent 5 %. L'Afnor fournit des courbes donnant les valeurs possibles du risque β pour un test classique et les données employées pour ce test : β peut souvent être fort grand. C'est donc le risque correspondant à β que les inventeurs des tests d'hypothèses à deux risques ont considéré comme le moins coûteux des deux : le risque d'accepter à tort l'hypothèse H0 est le moins coûteux des deux, le risque de rejeter à tort l'hypothèse H0 est le plus coûteux des deux.

Il serait bien de dire selon quel principe l'hypothèse nulle H0 se distingue de l'hypothèse alternative H1 ; de mon point de vue, H0 est celle dans le cadre logique de laquelle les calculs de probabilité peuvent être faits efficacement : exemple : "μ = μ0" contre "μ \neq μ0" où μ est l'espérance d'une variable aléatoire réelle et où μ0 est un réel. Avec la première hypothèse, on peut travailler ; avec la deuxième, non !

Au sujet de H1, il serait bien de distinguer

  test bilatéral
  test unilatéral à gauche
  test unilatéral à droite.

La phrase

  "3. Calcul de la probabilité d'obtenir une valeur de la variable de décision aussi extrême 
 ou plus extrême que la valeur obtenue, en supposant que H0 soit vraie. Cette probabilité, 
 généralement appelée risque de première espèce et notée α0, correspond au risque de rejeter
 à tort H0 si H0 est en fait vraie."

est en contradiction avec la définition du risque de première espèce α, défini plus haut comme étant fixé (arbitrairement donc) ; l'auteur, sensible à cette contradiction, a pris la notation, non pas α, mais α0. Il faut quand même utiliser un autre vocable que "risque de première espèce" : cette probabilité est la p-value.

Il serait bien d'expliquer comment la p-value se calcule dans le cas d'un test bilatéral, même si les mots "valeur de la variable de décision aussi extrême ou plus extrême" peuvent être compris immédiatement lorsqu'on a tout compris par ailleurs.

Si on définit les risques α et β, ou même si on définit seulement le risque α (ce qui n'empêche pas le risque β d'exister), il est dommage de ne pas définir la zone de rejet, éventuellement deux demi-zones de rejet, ce qui donne du corps (de la matérialisation) au risque α. (Des figures s'imposent alors.)

Comme on le voit en utilisant des logiciels de statistique d'origine anglophone, cette notion de zone de rejet, et donc la notion des deux risques, disparaît au bénéfice de la p-value. Cette valeur permet en effet d'obtenir la conclusion du test. (Les articles de en.wikipedia.org sont vraiment très bons, mais sont dans le style de ces logiciels. C'est pourquoi je pense qu'ici, une connaissance des articles anglais est nécessaire mais n'est pas suffisante.)

Cependant, dans un article qui évoque les risques, on doit expliquer comment la connaissance du seul risque α permet d'obtenir la conclusion du test.

A ce moment, on pourrait parler des nouvelles calculatrices "statistique avancée", à savoir CASIO, à partir de GRAPH 35+, TI 83, TI 83+, TI 82STATS, TI 89 TITANIUM (ou ancienne avec la flash-application tistatle) qui procurent les fonctions de répartition des lois de probabilités

  • normales
  • de Student
  • de Fisher-Snedecor
  • du χ2 de Pearson

permettant ainsi le calcul des p-value des tests d'hypothèse correspondants

mais, à l'exception de la TI 89, ne procurent les bijections réciproques de ces fonctions de répartition que pour les lois normales, ce qui rend impossible l'abandon de nos vieilles tables numériques de Student, de Fisher-Snedecor, du χ2 de Pearson qui restent indispensables pour déterminer les zonzs de rejet et matérialiser le risque α.

JSFT (d) 24 janvier 2008 à 19:22 (CET)

Je suis d'accord sur la plupart des points et j'ai fait quelques modifications en conséquences. (par contre j'ai oublié si les tests type rejeter si alpha>p-value étaient des tests unilatéraux gauche ou droite donc j'ai juste mis unilatéraux. dsl j'ai vraiment la flème de chercher dans les bouquins Sourire) Pour les histoires de présenter les variable de décision comme des distances entre deux échantillons ou entre un échantillon et une loi je ne sais pas si c'est nécessairement vrai en fait je doute fortement qu'on puisse exprimer tout les tests comme la distance entre deux choses mais après tout peut être. (j'ai passé en petit en attendant) Je crois surtout qu'il faudrai peut être réécrire entièrement la partie déroulement d'un test en se basant peut être sur un exemple ce qui serai plus clair.
Par contre je ne suis pas d'accord sur le fait de distinguer de la sorte l'hypothèse H1 et H0 vu que à priori ce n'est pas nécessairement vrai. On peut très bien imaginer un test du type tester mu>0 en H0 avec l'hypothèse alternative mu<=0. Même si c'est vrai qu'en regle général on choisit une hypothèse nulle qui permet de travailler de façon efficace ce n'est pas forcément le critère de choix ou ce qui définit l'hypothèse nulle.
Pour l'interprétation de beta: "C'est donc le risque correspondant à β que les inventeurs des tests d'hypothèses à deux risques ont considéré comme le moins coûteux des deux : le risque d'accepter à tort l'hypothèse H0 est le moins coûteux des deux, le risque de rejeter à tort l'hypothèse H0 est le plus coûteux des deux." euh en fait non c'est bien dans le sens écrit dans l'article on cherche à minimiser beta et à réduire au maximum ce risque (test universellement plus puissants ou au moins convergents) donc quand on a de nombreuses observations on aura toujours une probabilité alpha de refuser à tord H0 alors que la probabilité d'accepter à tord H0 sera presque nulle (nulle pour une infinité d'observations et pour les tests convergents). On cherche au maximum à réduire le risque de deuxième espèce et à le faire tendre vers 0 ce qui va dans le sens de l'interprétation donnée. (Après c'est vrai que pour un nombre fini d'observations si ce nombre d'observations est insuffisant on aura tendance à avoir beta grand)godix (d) 25 janvier 2008 à 23:03 (CET)