Discuter:Régression linéaire

Un article de Wikipédia, l'encyclopédie libre.

la variance des y ne serait elle pas V(y) ?

Sommaire

[modifier] Variance des y en regression linéaire (du bistro)

En regardant l'article sur la Régression linéaire je me demandais si le libellé de la variance des y était correcte :

variance des yi = V(x) = ....

J'aurais intuitivement écrit : variance des yi = V(y) = ...

Mais comme j'en suis pas sur, je veux pas corriger en rajoutant une connerie :-)

Axel584 30 nov 2004 à 11:51 (CET)

Il s'agit effectivement d'une coquille puisque des références à V(y) sont faites dans la suite : par exemple, dans le chapitre Régression_linéaire#Coefficient de corrélation linéaire, la symétrie des expressions des pentes a et a' , permet de confirmer qu'on a bien variance des yi = V(y). Bcoconni 30 nov 2004 à 14:17 (CET)
S'il y a des coquilles, c'est à cause des fûts !
Le contrepéteur fou --Jean-Jacques MILAN 30 nov 2004 à 21:10 (CET)

[modifier] equation de la droite de régression

Pour resulta de la regression y a ecrie y=cov(x,y)/v(X) *(x - /x) + /y . j'aurai mit perso /y=a/x+b avec a=cov(x,y)/v(X)

je saisie mal pkoi y à (x - /x) au lieu de x et pkoi /y au lieu de b

Attention la forme donnée dans l'article n'est pas la forme réduite
y = \frac{cov(X,Y)}{V(X)} (x - \overline{X}) + \overline{Y}
s'écrit aussi en posant a = \frac{cov(X,Y)}{V(X)}
y = a(x - \overline{X}) + \overline{Y}
ce qui donne en développant
y = ax - a\overline{X} + \overline{Y}
et donc un b= - a\overline{X} + \overline{Y}

[modifier] Vision pratique sur le sujet

Je viens de rédiger une étude sur la régression linéaire : http://yves.demur.free.fr/reglin/reglin1105.pdf

Je ne suis pas un spécialiste de ce domaine mais je pense que ce document apporte un éclairage pratique. Je ne vois pas bien comment apporter cette "matière" à Wikipédia : peut être qu'un statisticien pourrait l'utiliser pour enrichir l'article actuel de Wikipédia, ou alors mon document pourrait-il avoir une place quelque part ?

Je fais un appel à suggestions. CordWikipédialement. Si vous répondez, signalez le moi par mail à yves.demur@m4am.net

Pour information, il n'est pas dans notre habitude de répondre par email. Donc si quelqu'un vous réponds, vous trouverez sa réponse ici. Pyb 6 novembre 2005 à 00:48 (CET)

[modifier] Coefficient de corrélation

Il y a une erreur dans la formulation de la validité de la corrélation, en effet \sqrt{3}/2 >1 ce qui est impossible. Je pense qu'il faut inversé les 2 terme soit \sqrt{2}/3 ≈0,82 valeur dépendante de l'intervale de confiance et du nombre de degrés de liberté.

pardon d'avoir annulé votre intervention mais j'ai cru à du vandalisme en effet \sqrt{2}/3  \approx 1,41/3 \approx 0,47 (priorité opératoire) alors que \sqrt{3}/2  \approx 1,73/2 \approx 0,86. Il est vrai que \sqrt{2/3} ≈0,82. Entre 0,86 et 0,82, je ne peux affimer lequel est choisi en première approximation (je pense avoir vu \sqrt 3/2, mais je ne peux retrouver mes sources). Il est certain qu'un calcul plus sérieux, dépendant du nombre de mesures et de l'intervalle de confiance permet de moduler ce fameux seuil de validité. Si vous avez compétence à compléter l'article ce ne serait pas mal. HB 25 octobre 2006 à 22:47 (CEST)