Regresja liniowa 1 rzecz to łaczny rozkład częstośći!!!!
X=ax|y+bx|y*y
Musimy mięć
E(X) – liczoną z łącznego rozkładu częstości
(*)
x/y
1
2
3
4
2/18
3/18
0
2/318
1/3
5/18
4/18
E(X)= 1*1/3+2*1/3+3*1/3=2
D2(X)=12*1/3+22*1/3+32*1/3-E(X)2=0,667
E(Y)=1*5/18+2*4/18+3*4/18+4*5/18=2,5
D2(Y)= 12*5/18+22*4/18+32*4/18+42*5/18- E(Y)2=1,36
E(XY)
xy
2/18 | 2/18
3/18 | 6/18
0 | 0
2/18 | 4/18
2/18 | 12/18
2/18 | 6/18
2/18 | 18/18
3/18 | 24/18
2/18 | 24/18
5/18| 8/18
4/18 | 16/18
4/18 | 24/18
5/18 | 48/18
E(XY)=8/18+16/18+24/18+48/18=96/18=5,33
C(XY)=E(XY)-E(X)*E(Y)=5,33-2*2,5=0,33
bx|y=C(XY)D2(Y)=0,331,36=0,24
ax|y=E(X)- bx|y*E(Y)=2-0,24*2,=1,4
X= ax|y+ bx|y*y = > x=1,4+0,24y
Regresja średnich
Zwrócić uwagę czy jest rozkład warunkowy X|Y czy Y|X Można liczyć również z łącznego rozkładu liczebności
Przykład dla rozkładu X|Y z rozkładu częstości powyżej* tworzymy rozkład warunkowy X|Y
0,4
0,6
0,5
0,4= 2/18:5/18=2/18*18/5
E(X|Y=1)=1*0,4+2*0,6+3*0=1,6
Xy E(X|Y=2)=1*0,5+2*0+3*0,5=2
E(X|Y=3)= 1*0,5+2*0+3*0,5=2
E(X|Y=4)=1*0+2*0,6+3*0,4=2,4
Miernik siły zależności przy regresji liniowej
= 0,330,0667*1,36=0,12
W 12% zmienna Y wykorzystywana jest do przewidywania zmiennej X w regresji liniowej, redukuje średni kwadrat błędu przewidywania zmiennej X
Miernik siły zależności przy regresji średnich
η2=D2[E(X|Y)D2(X) D2[E(X|Y)]=∑[E(X|Y=yi]2-E(X)]*P(y=yi)
D2[E(X|Y)]=(1,6-2)2*5/18+(2-2)2*4/18+(2-2)2*4/18+(2,4-2)2*5/18=0,089
η2=0,0890,667=0,133 W 13,3% zmienna Y wykorzystana jest do przewidywania zmiennej X w regresji średnich, redukuje średni kwadrat błędu przewidywania.
Interpretacja Parametrów
X=1,4+0,24y
0,24 - jeżeli czas poświęcony na naukę wzrośnie o 1 tydzień to przewidywana liczba zdanych egzaminów wzrośnie o 0,24
1,4 – jeżeli nie będziemy się uczyć o sesji to przewidywana liczba zdanych egzaminów wyniesie 1,4
Przedział ufności dla średniej
Standaryzujemu
Poziom ufności = 1-α zazwyczaj podany w zadaniu α=1-ten poziom
F(Uα)=1-∝2 później odczytać z tablic ...
ccsocjologia