stat.doc

(117 KB) Pobierz
Are You suprised ?

 

 

1. ZMIENNA właściwość, pod względem której elementy grupy lub zbioru różnią się między sobą. Elementami grupy mogą być jednostki ludzkie, które mogą różnić się miedzy sobą płcią, wiekiem, kolorem oczu, inteligencją, ostrością słuchu itp.

ZMIENNĄ nazywa się w badaniach socjologicznych dowolną cechę, która może przyjąć

co najmniej dwie wartości.

PODZIAŁ ZMIENNYCH:

1)     z. zależna – jej wartość wynika bezpośrednio z kształtu zmian wartości innej zmiennej

(niezależnej). Zmienną Y, czyli zmienną, której wartość przewidujemy, przyjęło się określać mianem zmiennej zależnej, ponieważ jej przewidywanie zależy od wartości X

i od znanej nam wartości funkcyjnej.

z. niezależna – jej określona wartość  bezpośrednio wpływa na wartość innych zmiennych (zależnych). Zmienną X określa się mianem zmiennej niezależnej.

2) z. ilościowa  - wyraża określoną właściwość lub cechę danego obiektu, której poziom   

     lub natężenie można wyrazić liczbowo(wzrost, wiek, zarobki)

      z. jakościowa–( zaliczamy do nich z. dychotomiczne) Wyraża określoną właściwość 

      lub cechę danego obiektu nie przy  pomocy wartości liczbowych, ale przez

      Skategoryzowanie tych cech czy właściwości

(np. kobieta – mężczyzna)

3)  z. dwuwartościowa – (zerojedynkowa) – powstaje przez określenie czy dany obiekt,

posiada cechę czy jej nie posiada, przy czym abstrahuje się  faktu, że obiekty mogą

posiadać cechę o różnym stopniu natężenia.(przykładem jest zdanie – niezdanie egzaminu na studiach)

z. wielowartościowa –(przykładem są wyniki testu zdolności akademickich)

4) z.. dyskretna – może przyjmować tylko niektóre wartości

z. ciągła –Wtedy, gdy jej zbiór tworzy kontinuum i jeżeli pomiędzy dwiema sąsiednimi wartościami zmiennej możliwe jest znalezienie trzeciej wartości.

Może przyjmować dowolną wartość z określonego zbioru wartości. Możliwe wartości  zmiennej należą do pewnego ciągu. Między dowolnymi dwiema wartościami

zmiennej znajduję się nieskończenie wielka liczba wartości pośrednich. Przykładami

zmiennych ciągłych mogą być wzrost, ciężar i czas.

5) z. dychotomiczna –  Która w naturalny sposób przyjmuję tylko wartości ze zbioru 

      dwuelementowego

     zmienna dwukategorialna (płeć,  odp: tak, nie)

    z. zdychotomizowana – Faktycznie wielowartościowe, ale badacz dla jakiś celów 

     sprowadził do postaci dwuwartościowej (np. wzrost niski – równy i poniżej 170

     wysoki –powyżej 170)

 

 

 

 

2. POMIAR – Jeżeli dane o jakimś zjawisku społecznym stanowią wynik pojęciowo ustrukturowanych, systematycznych i kontrolowanych obserwacji cech jednostek badawczych, to ów proces obserwacji jest równoznaczny z najogólniej pojętym  dokonywaniem pomiarów, czyli uzyskiwaniem danych. Dane o obiektach badanych, uzyskane w wyniku pomiaru, mogą dostarczać informacji o tym:

1)     jaka jest wartość jakiejś cechy jakiegoś obiektu badanego w danym momencie

2)     jakiej zmianie uległa wartość danej cechy w nie zmienionych warunkach

3)     jakiej zmianie uległa wartość danej cechy w warunkach, które zmieniły się w sposób

znany

Każda z tych możliwości wymaga spełnienie następujących warunków wstępnych, bez których pomiar nie odpowiadałby koniecznym wymogom strukturalizacji pojęciowej

i kontrolowalności.

1.      Zbiór obiektów badawczych musi być określony tak jednoznacznie, aby w każdym przypadku można było rozstrzygnąć, czy określony obiekt należy do niego czy nie.

2.      Warunki sytuacyjne towarzyszące pomiarom, jeśli badacz nie może nimi odpowiednio manipulować, muszą być znane na tyle, aby można było kontrolować ich ewentualny wpływ na przebieg pomiarów.

3.      Należy dokładnie ustalić metody pomiaru i zbierania danych.

4.      Cechę, której dotyczyć mają dane, należy zdefiniować, tak aby można było dokładnie

podać, jakiego rodzaju obserwacje mają być przeprowadzone za pomocą danego narzędzia.

POMIAR w węższym znaczeniu  oznacza podlegający określonym regułom proces przyporządkowania symboli zaobserwowanym wartościom badanych cech.. Stosowanie do owych reguł można wyróżnić cztery poziomy pomiaru i odpowiadające im cztery skale:

1.      skala nominalna

2.      skala porządkowa

3.      skala interwałowa

4.      skala ilorazowa

SKALA NOMINALNA – pozwala tylko na pogrupowanie obiektów (osób)

pomiar na poziomie nominalnym jest najprostszą formą pomiaru. Opiera się on na regułach dwuwartościowej logiki predykatorów i polega na klasyfikowaniu obiektów ze względu na posiadanie lub brak określonej cechy (jakościowej). Zgodnie z tym, ludzi można podzielić na mężczyzn i kobiety, na osoby wyznania protestanckiego, katolickiego i mojżeszowego.

Przy pomiarze nominalnym muszą być spełnione następujące warunki:

1.      W odniesieniu do dwóch obiektów badanych musi być rozstrzygalne, czy ze względu na badaną cechę są one takie same czy nie. Możliwa jest tylko jedna z dwu sytuacji:

     A=B lub A≠B

2.      Identyczność dwu obiektów badanych musi być relacją symetryczną, jeżeli obiekt A ma tę samą cechę badaną co obiekt B, to obiekt B ma tę samą cechę badaną co obiekt A: jeżeli A=B, to B=A

3.      Jeżeli obiekt badany A ma tę samą wartość cechy co obiekt badany B, obiekt zaś B tę samą wartość cechy co obiekt C, to obiekt A ma tę samą wartość cechy co obiekt C:

Jeżeli A=B i B=C, to A=C

Cechy mierzone za pomocą skali nominalnej charakteryzują się tym, że ogół możliwych wartości tych cech stanowi zbiór nieuporządkowany. Między poszczególnymi kategoriami tych wartości nie da się ustalić żadnych stosunków metrycznych.

ZMIENNA NOMINALNA – to cechy, których wartości mogą być uporządkowane

w dowolnej kolejności. Nie ma znaczenia, czy w zmiennej „płeć” wyróżni się wartości

w kolejności: 1/mężczyzna, 2/kobieta czy też odwrotnie

SKALA PORZĄDKOWA – możemy nie tylko stwierdzać o równości lub różności, ale także wskazać któremu  z obiektów zmienna przysługuje w wyższym stopniu

reprezentuje ona wyższy od nominalnej poziom pomiaru. Pozwala na porządkowanie obiektów badanych odpowiednio do wartości  danej cechy, ponieważ cecha ta ma charakter ilościowy. Ten poziom pomiaru uwzględnia natężenie, siłę i wielkość określonej cechy u poszczególnych obiektów badanych.

Aby jakąś cechę można było uznać za mierzalną na poziomie porządkowym, dane muszą spełniać następujące warunki:

1.      Jeżeli obiekt A pod względem danej cechy jest większy od obiektu B, to obiekt B pod względem tej samej cechy nie jest większy od obiektu  A: jeżeli A>B, to B>A

     to także A>C

Liczby określające rangę są wartościami rangowymi lub liczbami porządkowymi.

ZMIENNA PORZĄDKOWA – takie cechy, których wartości są lub mogą być uporządkowane w oparciu o wyraźne kryterium tego uporządkowania. Zmienną porządkową jest z pewnością wykształcenie.

SKALA INTERWAŁOWA – pozwala na stwierdzenie o ile natężenie zmiennej X dla obiektu A jest większe (mniejsze) od natężenia tej zmiennej dla obiektu B

informuje, jak wielkie są odstępy między poszczególnymi punktami. Warunkiem podstawowym jest tu istnienie powtarzalnej jednostki miary, którą można uznać za standard.

ZMIENNA INTERWAŁOWA – cechy o wartościach między którymi można określić odległość. Odległość ta nie musi być jednakowa. Ważne jest natomiast, aby można ją było w sposób uzasadniony wyznaczyć , zmierzyć. Zmienną interwałową jest zmienna wykształcenia, mierzonego ilością ukończonych lat nauki w szkole.

SKALA ILORAZOWA – pozwala na stwierdzenie, że natężenie zmiennej X dla obiektu A jest k razy większe niż natężenie tej zmiennej dla obiektu B

  gdy skala ma ponadto naturalny punkt zerowy, mamy do czynienia ze skalą ilorazową.

ZMIENNA ILORAZOWA – to takie cechy, których wartości pozostają do  siebie

w stosunkach liczbowych. Przykładowo, w zmiennej wieku można ustalić relacje liczbowe i proporcje między poszczególnymi wartościami. Sensowne jest więc powiedzenie, że osoba 60-letnia jest dwukrotnie starsza od osoby 30-letniej.

 

 

 

2.     SZEREG LICZEBNOŚCI (CZĘSTOŚCI). GRUPOWANIE, KUMULOWANIE I RANGOWANIE DANYCH

GRUPOWANIE –(ustalanie wielkości przedziału klasowego – zasady)

-          nie powinno być mniej niż 10 ani więcej niż 20 przedziałów klasowych

-          pewne rozpiętości wyników są przedkładane na inne, są to 1,2,3,5,10 i 20.

RANGOWANIE DANYCH –przypisanie zjawiskom liczby w taki sposób, że zjawiska te zostają umiejscowione wg kolejności. Pomiary wyrażone rangami dają nam po prostu uporządkowanie szeregowe rzeczy.

4.     GRAFICZNA PREZENTACJA DANYCH

(histogram, wielobok liczebności i  krzywa   kumulatywna)

HISTOGRAM – rodzaj wykresu, często wykorzystywany w badaniach opinii społecznej

do prezentacji danych statystycznych, w którym różnym wartościom danej zmiennej odpowiadają różne wysokości pionowych prostokątów. W histogramie zakładamy, że wszystkie przypadki w obrębie przedziału klasowego rozkładają się równomiernie.

WIELOBOK LICZEBNOŚCI – przyjmujemy, że wszystkie przypadki w każdym przedziale  skupiają się  w jego środku.

KRZYWA KUMULATYWNA –

5.     MIARY TENDENCJI CENTRALNEJ

( średnia arytmetyczna, mediana, wartość modalna)

ŚREDNIA ARYTMETYCZNA – to suma zbiorów pomiarów podzielona przez liczbę pomiarów

w zbiorze.

CECHY:

1.      Suma odchyleń wszystkich pomiarów w zbiorze od ich średniej arytmetycznej równa 

jest  0.

3.      Suma kwadratów odchyleń od średniej arytmetycznej jest mniejsza niż suma kwadratów odchyleń od dowolnej innej wartości.

4.      Każda średnia obliczona z próby o liczebności N stanowi estymator średniej

     w populacji.

5.      W przypadku większości rozkładów średnia jest dokładniejsza bądź skuteczniejsza jako estymator średniej w populacji aniżeli takie miary tendencji centralnej, jak mediana i wartość modalna jako estymatory odpowiadających im wartości w populacji.

MEDIANA –  jest wartością dzielącą wszystkie pomiary na pół, czyli tak, że połowa pomiarów mieści się poniżej niej, a połowa powyżej.

WARTOŚĆ MODALNA – w sytuacjach, w których różne wartości zmiennej X   występują więcej niż raz, wartość modalna jest wartością występującą najczęściej

6.     MIARY DESPERSJI

   ( odchylenie standardowe, odchylenie ćwiartkowe)

ODCHYLENIE STANDARDOWE – (s) jest miarą stopnia zmienności najpowszechniej stosowaną i najbardziej rzetelną. To znaczy zmienia się ono najmniej między próbami pobranymi losowo z tej samej populacji. Jest rodzajem przeciętnej wszystkich odchyleń od średniej w próbie.

ODCHYLENIE ĆWIARTKOWE –     

WSPÓŁCZYNNIK ZMIENNOŚCI – nie powinien być stosowany, jeśli nie jesteśmy dość pewni, że nasza skala pomiarowa posiada równe jednostki, a przede wszystkim, jeśli nie występuje punkt zera bezwzględnego.

7.     MIARY POLOŻENIA (kwartyle) I MIARY ASYMETRII (skośność)

MIARA SKOŚNOŚCI – wykorzystuje trzeci moment. Uzasadnienie tej statystyki opiera się na zaobserwowanym fakcie, że gdy rozkład jest symetryczny, to suma odchyleń powyżej średniej podniesiona do trzeciej potęgi jest równoważna sumie odchyleń poniżej średniej podniesionych do trzeciej potęgi. Zatem dla rozkładu symetrycznego

m3 =0 i g1=0. Jeżeli rozkład jest asymetryczny, to sumy odchyleń powyżej i poniżej średniej podniesionych do trzeciej potęgi nie są sobie równoważne.

8.     ROZKŁADY PRAWDOPODOBIEŃSTWA (zero-jedynkowe, skokowe, ciągle)

ROZKŁAD NORMALNY PRAWO TRZECH SIGM. STANDARYZACJA ROZKŁADU

Terminu prawdopodobieństwo można używać subiektywnie, określając nim pewną postawę albo wątpliwość dotyczącą jakiegoś zdarzenia przyszłego.

ROZKŁAD NORMALNY –(właściwości)

1)     Krzywa jest symetryczna. Średnia, mediana i wartość modalna zbiegają się

     w jednym punkcie.

2)     Najwyższa rzędna krzywej występuje w punkcie średniej, czyli gdy

     z=0 i w jednostkowej krzywej normalnej równa jest 0,3989

3)     Krzywa jest asymptotyczna.  Zbliża się ona do osi poziomej, lecz nigdy do niej nie dochodzi i rozciąga się od minus nieskończoności do plus nieskończoności.

4)     Punkty zagięcia krzywej znajdują się w miejscach plus lub minus  jedną jednostkę  odchylenia standardowego powyżej lub poniżej średniej. W tych miejscach krzywa zmienia się względem osi poziomej z wypukłej we wklęsłą.

5)     Mniej więcej 68% powierzchni pod krzywą mieści się w granicach plus lub minus jednej jednostki odchylenia standardowego od średniej

6)     W jednostkowej krzywej normalnej granice z= +1,96 obejmują 95%, a granice

z=+2,58 obejmują 99% całkowitej powierzchni pod krzywą, przy czym odpowiednio 5% i 1% powierzchni mieści się poza tymi granicami.

STANDARYZACJA – O teście psychologicznym mówimy, że jest standaryzowany, gdy dysponujemy wynikami przekształconymi, opartymi na odpowiednio dużej grupie odniesienia. Same wyniki przekształcone nazywamy normami.

PRAWO TRZECH SIGM – 3 odchylenia w prawo od średniej , 3 odchylenia w lewo od średniej

 

 

 

 

 

 

9.     WSPÓŁCZYNNIK KORELACJI (r-Pearsona, rs-Spearmanna,

Fi-Yulla, V-Cramera)

R-Pearson

Najpowszechniej stosowaną miarą korelacji jest współczynnik Pearsona według momentu iloczynowego (mieszanego). Jest to statystyka typu przedziałowo-stosunkowego

WSPÓŁCZYNNIK KORELACJI – jest statystyką określającą siłę związku między dwiema zmiennymi. Na oznaczenie wartości współczynnika korelacji z próby stosuje się powszechnie symbol, r. Natomiast parametr populacji, czyli korelację w populacji, z której została pobrana próba, oznacza się symbolem p.

rs –Spearmann Miara inwersji ∑d2, występuje w definicji współczynnika korelacji rangowej. Współczynnik korelacji rangowej jest statystyką zdefiniowaną w taki sposób, że przyjmuje wartość +1, gdy pary rang są uszeregowane w tym samym porządku, wartość –1, gdy są uszeregowane w porządku odwrotnym względem siebie, oraz wartość oczekiwaną 0, gdy rangi są uszeregowane względem siebie losowo.

fi-Yulla –   j

Obie zmienne zdychotomizowane, najlepiej w punkcie mediany (lub dychotomiczne)

j+1 tylko wtedy, gdy rozkłady brzegowe obu zmiennych są zmienne, oraz gdy liczebność pól leżących na tej samej przekątnej jest zerowa

V-Cramera ...

Zgłoś jeśli naruszono regulamin