WYKŁAD VIII (18.04.07)
Pierwszy test statystyczny rok 1710 – dlaczego przez kolejne 82 lata rodziło się w Londynie więcej mężczyzn niż kobiet? Pierwszy współczesny test statystyczny – Karl Pearson (1900).
Najczęściej w psychologii badamy próbki wygodne. Możemy wnioskować tylko wtedy, gdy mamy do czynienia z próbą.
Test statystyczny to nic innego jak jakiś wzór w wyniku którego coś obliczamy.
W praktyce hipoteza zerowa może brzmieć różnie.
Hipoteza alternatywna oznaczana jest H1 – w Londynie rodzi się więcej mężczyzn niż kobiet.
Ponieważ znam dane populacji, mogę sprawdzić jaka jest szansa wylosowania z niej próby o takiej samej liczebności i takiej samej średniej jak grupa mieszkańców województwa warszawskiego.
Dwa rodzaje hipotez alternatywnych:
Hipotezy kierunkowe, np. mieszkańcy Warszawy zarabiają więcej niż średnia w całej Polsce lub mieszkańcy Warszawy zarabiają mniej niż średnia w całej Polsce. Zawsze wprost trzeba napisać jaka jest moja hipoteza. Określa spodziewany kierunek zależności.
Hipoteza bezkierunkowa – stwierdza istnienie zależności, ale nie określa jej kierunku, np. średnie zarobki mieszkańców Warszawy różnią się od średnich zarobków w całej Polsce.
Hipoteza kierunkowa i bezkierunkowa to hipotezy alternatywne. Zawsze można postawić tylko jedną hipotezę alternatywną. Rodzaj postawionej hipotezy wpływa na obszar odrzucania hipotezy zerowej (wykresy Statistica).
To jaką postawimy hipotezę, zależy od naszej wiedzy.
Hipotezy kierunkowe mogą być lewostronne lub prawostronne. Lewostronna jest wtedy, gdy można ją zapisać przy pomocy równania, wynik w tej grupie jest niższy niż w całej populacji.
Testowanie hipotez dotyczących średnich:
Sytuacja 1: Czy próba pochodzi z populacji o znanych parametrach? – czyli, wiem coś o populacji, wiem jaka jest średnia arytmetyczna danej cechy populacji (w praktyce tylko tyle wystarczy, aby stosować test t dla jednej średniej), np. iloraz inteligencji mierzony testem Weschlera.
Sytuacja 2. Czy dwie próby pochodzą z tej samej populacji Sytuacja 2 to typowy eksperyment, np. jak zachowują się ludzie pod wpływem alkoholu, mamy dwie grupy osób badanych, jedni piją, drudzy nie, badamy zakres ich pamięci. Czym te grupy różnią się między sobą? To są dwie grupki wylosowane z tej samej populacji. Mogę uznać, ze ten alkohol nie ma znaczenia, jeżeli średnie w obu próbach nie różnią się istotnie. To jest tak, jakby ciągle pochodziły z tej samej populacji. Jeżeli natomiast średnie różnią się istotnie, to lepiej jest uznać, że obie grupy pochodzą z dwóch różnych populacji (tych co pili i tych co nie pili).
Sytuacja 3. Czy można uznać, że różnica miedzy średnimi w dwóch sytuacjach w tej samej grupie osób badanych jest różna od 0,
William Gosset – (13.07.1876 – 16.10.1937) – jeżeli próbki są małe nie należy przyjmować założenia, że rozkład byłby rozkładem normalnym. Napisał, ze rozkład byłby podobny do rozkładu normalnego, który nazwał rozkładem t (uwaga zawsze t małą literą). Opisał artykuł o rozkładzie t, wysłał do czasopisma Biometrica, podpisał się pseudonimem STUDENT. Stąd nazwa rozkładu t. Podpisał się tym pseudonimem, bo nie chciał by został zidentyfikowany jako pracownik browaru Guinessa w Dublinie, gdzie zajmował się kontrolą jakości piwa.
Jeżeli próba jest dostatecznie mała, to rozkład średnich tej próby nie jest rozkładem normalnym, ale jest podobny do normalnego.
Rozkładem t Studenta jest uogólnienie rozkładu normalnego standaryzowanego o średniej 0 i odchyleniu standardowym 1.
Ile wynosi odchylenie standardowe w rozkładzie t? – elearning.
Rozkład t jest definiowany przez 1 parametr - liczbę stopni swobody.
Liczba stopni swobody to liczba wyników, które mogą się swobodnie zmieniać. Jeżeli losujesz 30elementową próbę, możesz mieć w niej 30 różnych wyników. Jeżeli wylosowałem próbę, która ma średnią arytmetyczną i chcę wylosować inną próbę, która będzie miała taką samą średnią to ile wyników może się swobodnie zmieniać? 29
Losuję 5 liczb: 7,8,3,1 – piąta liczba nie może być dowolna. Po dodaniu ich wszystkich mamy wynik 19. żeby średnia wynosiła 5, brakuje nam -4, więc piątą cyfrą będzie –4, bo średnia ma wynosić 3, czyli wynik musi wynosić 15.
JEŻELI LICZBA STOPNI SWOBODY W ROZKŁADZIE T STUDENTA JEST NIESKOŃCZENIE DUŻA, TO ROZKŁAD T STUDENTA STAJE SIĘ TAKI SAM JAK NORMALNY.
W praktyce różnica między tymi rozkładami znika, gdy liczba swobody równa się około 30 (w książkach podaje się 30).
Wzór na wartość testu 7 Studenta (najłatwiejszy jaki może być!!!) – elearning.
Jeżeli z nieobciążonego estymatora wariancji wyciągnę pierwiastek, to mam nieobciążone odchylenie standardowe w próbie.
Od czego zależy znak w teście T, czy będzie – czy + ? Od tego, która średnia jest wyższa i od tego, w jakiej kolejności są zapisane.
Żeby odrzucić hipotezę zerową, prawdopodobieństwo uzyskania takiego wyniku jaki mam, musi być mniejsze niż 0,05 (twierdzenie Fischera). W praktyce przyjmuje się jeszcze dwie wartości 0,01 oraz 0,001
W pewnym teście badacz przeprowadził eksperyment, w którym sprawdza, czy tramwaje na ulicy Grochowskiej jeżdżą szybciej niż w Środmieściu. Czy wartość testu będzie dodatnia, ujemna, czy nie mam zielonego pojęcia? – tego typu pytania będą na egzaminie.
Ile wynosi mediana z liczb 1-8 – jeżeli ktoś tego nie wie, to ma niezłe tyły :)
SPSS zawsze podaje istotność dwustronną, to znaczy, ze podaje sumę dwóch pól powierzchni położonych powyżej ujemnego t i dodatniego t. Należy patrzeć w kolumnę oznaczoną jako p, czyli istotność testu
Test t podaje zawsze istotności dwustronne. Jeżeli stawiamy hipotezy kierunkowe, należy wartość istotności testu tz SPSS podzielić przez 2. SPSS zawsze podaje istotność dwustronną, czyli dwa przedziały łącznie. Czy łatwiej jest stwierdzić istotność, kiedy hipoteza jest jednostronna czy dwustronna? Jeżeli hipoteza alternatywna jest bezkierunkowa, zawsze bierzemy pod uwagę istotność dwustronną i wtedy nie dzielimy prawdopodobieństwa przez 2.
Zawsze łatwiej jest odrzucić hipotezę zerową, kiedy hipoteza alternatywna jest jednostronna niż gdy jest dwustronna. Dlatego że w przypadku jednostronnej interesuje nas tylko jeden z obszarów.
Jeżeli w dwóch obszarach jest mniej niż 0,05 w sumie, czyli mam hipotezę dwustronną, odrzucam zerową. Średnia jest na pewno różna od średniej w populacji, jednoznacznie wynika, ze jest większa.
Rozkład średnich z próbek jest normalny zgodnie z centralnym twierdzeniem granicznym.
Stopnie swobody – liczba wartości, które swobodnie mogą się zmieniać.
W Łodzi zarobki są niższe niż w Warszawie – hipoteza kierunkowa jednostronna.
4
psych_spoleczna