rozwiÄ…zania.pdf
(
100 KB
)
Pobierz
Zadanie 1
Dokładność oszacowania średniej nazywamy błędem standardowym (SE od
standard error)
i
wyliczamy ze wzoru:
SE
=
σ
√
n
gdzie:
•
n oznacza liczbę elementów próbki,
•
σ oznacza odchylenie standardowe obliczone z próbki.
Musimy więc znaleźć takie n, aby SE było równe 1% średniej. Musimy więc obliczyć średnią i σ.
Aby obliczyć średnią i odchylenie standardowe tworzymy następującą tabelkę:
x
i
x
i
-x
(x
i
-x)²
10,1
-0,15
0,02
9
-1,25
1,56
11,3
1,05
1,1
10,7
0,45
0,2
11,4
1,15
1,32
8,7
-1,55
2,4
11
0,75
0,56
9,8
-0,45
0,2
82
7,36
- W pierwszej kolumnie wpisujemy nasze dane, sumujemy tę kolumnę (dostajemy sumę 82) i
dzielimy przez liczbę naszych danych 82:8=10,25 i to jest nasza średnia:
̄
x
=
10,25.
- W drugiej kolumnie od każdej liczby z pierwszej kolumny odejmujemy wyliczoną przed chwilą
średnią. Np. w pierwszym wierszu mamy 10,1-10,25=-0,15, a w drugim 9-10,25=-1,25.
- W ostatniej kolumnie podnosimy do kwadratu kolumnę drugą. Np. w pierwszym wierszu
mamy -0,15 do kwadratu, czyli 0,02, a w drugim -1,25 do kwadratu, czyli 1,56. Tą kolumnę
sumujemy (dostajemy sumę 7,36) i dzielimy przez liczbę o jeden mniejszą niż liczba naszych
danych: 7,36:7=1,05 a na koniec wyciągamy pierwiastek i to jest nasze odchylenie
standardowe:
σ=
√
1,05
=
1,02.
Chcemy więc, żeby SE było równe 1% średniej, czyli 1%·10,25=0,1025. Wstawiamy więc
wszystko do wzoru:
0,1025
=
1,
0
2
√
n
√
n
=
1,02
0,1025
√
n
=
9,95
n
=(
9,95
)
2
n
=
99
A więc potrzeba 99 próbek. Czyli trzeba do 8 próbek, które już mamy dobrać 91. Skoro są one
klasy 70-80 mm, to można przyjąć, że są one kulami o średnicy 70-80 mm (czyli promieniu
35-40 mm). Korzystając ze wzoru na objętość kuli:
V
=
4
3
π
r
3
i biorąc maksymalny promień 40 mm. Dostajemy, że każda próbka ma objętość
V
=
4
3
π(
40
)
3
=
4
3
⋅
3,14
⋅
64000
=
268000mm
3
=
268cm
3
91 próbek będzie miało więc objętość 91·268=24388 cm³=0,024388 m³. Skoro gęstość to
1450g/m³, to masa tych 91 próbek to 1450·0,024388 =35,36 g.
Zadanie 2
Test serii zaczynamy od uszeregowania wyników z obu zakładów od najmniejszego do
największego. Ważne jest żeby wiedzieć, który wynik jest z którego zakładu, dlatego użyję
kolorów. Czerwone liczby to zakład I, a zielone to zakład II.
10,8 11,9 11,9
12,1
12,8
12,9 13,1 13,3 13,8
14,5
14,7
15,1
15,3
16,0
16,2
17,0
Serią nazywamy ciąg wyników tego samego typu (tutaj: z tego samego zakładu). Czyli
pierwszą serię tworzą liczby 10,8, 11,9 i 11,9. Druga seria to tylko liczba 12,1, trzecia to 12,8
itd.
W teście serii zliczamy liczbę serii i porównujemy ją z wartością krytyczną. Jeśli liczba serii jest
mniejsza od wartości krytycznej, to odrzucamy hipotezę, że oba zakłady produkują takie same
koncentraty. A jeśli liczba serii jest wyższa od wartości krytycznej, to nie ma podstaw by taką
hipotezę odrzucić.
U nas liczba serii to 10. Wartość krytyczną odczytujemy z tabeli wartości krytycznych
(zamieszczam ją w oddzielnym pliku). Wybieramy tam tabelę dla
a
=0,05, bo w zadaniu mamy
poziom istotności 0,05. n
1
i n
2
oznaczają zaś liczności naszych próbek. U nas n
1
=7 (bo tyle
mamy wyników z zakładu I), a n
2
=9 (tyle jest wyników z zakładu II). Z tabeli odczytujemy
więc wartość krytyczną równą 5. Czyli u nas liczba serii jest wyższa od wartości krytycznej, a
więc nie ma podstaw by odrzucić hipotezę, że oba zakłady produkują takie same koncentraty.
Zadanie 3
Jeśli podana jest dystrybuanta, to wartości wychodu dla przedziału (a,b) obliczamy ze wzoru
F
(b)-
F
(a).
Należy przy tym pamiętać o czterech zasadach:
– F
(0)=0,
– F
(∞)=100,
–
jeśli z tabeli można dla jakiejś liczby odczytać dwie wartości, to zawsze bierzemy
mniejszą, np.
F
(0,5)=15, a nie 25,
–
jeśli w tabeli nie ma jakiejś liczby, to znajdujemy w tabeli dwie najbliższe jej liczby:
jedną mniejszą (oznaczamy ją x) i jedną większą od szukanej (oznaczamy ją y) i
stosujemy przybliżenie:
Φ(
a
)=Φ(
x
)+(Φ(
y
)−Φ(
x
))⋅
a
−
x
y
−
x
a)
Wychód dla klasy (0; 0,5) to więc
F
(0,5)-
F
(0)=15-0=15%
b)
Wychód dla klasy (0,8; 1,5) to więc
F
(1,5)-
F
(0,8)
Nie mamy jednak w tabeli
F
(1,5). Ale mamy
F
(1) i
F
(2), stosujemy więc ostatni wzór z a=1,5,
x=1 i y=2:
Φ(
1,5
)=Φ(
1
)+(Φ(
2
)−Φ(
1
))⋅
1,5
−
1
2
−
1
=
25
+(
36
−
25
)⋅
0,5
=
25
+
11
⋅
0,5
=
25
+
5,5
=
30,5
I analogicznie dla
F
(0,8) bierzemy a=0,8, x=0,5, y=1:
Φ(
0,8
)=Φ(
0,5
)+(Φ(
1
)−Φ(
0,5
))⋅
0,8
−
0,5
1
−
0,5
=
15
+(
25
−
15
)⋅
0,3
0,5
=
15
+
10
⋅
0,6
=
15
+
6
=
21
I ostatecznie wychód to
F
(1,5)-
F
(0,8)=30,5-21=9,5%
c)
Wychód dla klasy powyżej 2, to to samo co wychód dla klasy (2; ∞), a więc
F
(∞)-
F
(2)=100-
36=64%
d)
Krzywa o przewadze ziaren drobnych to taka, która na samym początku gwałtownie rośnie, by
potem już się prawie nie zmieniać:
Krzywa o przewadze ziaren grubych to taka, która na samym początku jest bliska zeru, a
dopiero pod koniec gwałtownie rośnie:
O braku wybranek klasy świadczy płaski fragment krzywej. Np. krzywa bez klasy (1,2) może
wyglądać tak:
Zadanie 4
Do sprawdzenia, czy równanie regresji jest istotne używamy statystyki testowej F oraz
wartości krytycznej F
KRYT
. Jeśli otrzymamy F większe od F
KRYT
, to równanie jest istotne, a jeśli
otrzymamy F mniejsze od F
KRYT
, to równanie jest nieistotne.
Statystyka F ma wzór:
F
=
R
2
(
1
−
R
2
)
⋅(
n
−
2
)
gdzie:
–
R² oznacza współczynnik determinacji,
–
n oznacza liczbę danych, którymi dysponujemy.
Z kolei F
KRYT
odczytujemy z tabeli wartości krytycznych rozkładu F (załączam ją w oddzielnym
pliku) w następujący sposób: patrząc na
a
wybieramy jedną z dostępnych tabel. Z niej
odczytujemy liczbę z przecięcia kolumny z numerem 1 i wiersza z numerem n-2.
Z treści zadania wiemy, że n=27, ale nie znamy R². Ale wiemy, że wzór na parametr a w
równaniu regresji to
a
=
r
s
Y
s
X
gdzie:
-
s
X
oznacza odchylenie standardowe zmiennej X,
-
s
Y
oznacza odchylenie standardowe zmiennej Y,
-
r oznacza współczynnik korelacji zmiennych X i Y.
Możemy więc z tego wyznaczyć r, a potem
skorzysta
ć ze wzoru
R
2
=
r
2
Mamy więc ze wzoru na a:
1,75
=
r
⋅
5,5
3,35
1,75
=
r
⋅
1,64
r
=
1,75
1,64
r
=
1,067
W tym miejscu widać, że coś jest nie tak danymi w zadaniu, bo r musi być zawsze liczbą od -1
do 1. Zmieńmy sobie dane, tak żeby było OK. Załóżmy np. że s
Y
=6,5:
Mamy więc ze wzoru na a:
1,75
=
r
⋅
6,5
3,35
1,75
=
r
⋅
1,94
r
=
1,75
1,94
r
=
0,9
A więc R²=(0,9)²=0,81. I liczymy statystykę F:
F
=
0,81
1
−
0,81
⋅(
27
−
2
)=
0,81
0,19
⋅
25
=
4,26
⋅
25
=
106,5.
Skoro nie ma podane, na jakim poziomie istotności oceniać istotność regresji, to przyjmujemy
a
=0,05 i w tabeli wartości krytycznych rozkładu F dla
a
=0,05 bierzemy liczbę z pierwszej
kolumny i 25 wiersza: F
KRYT
=4,242. Widzimy, że F>F
KRYT
, więc równanie jest istotne.
Teraz przyjmując b=3 otrzymujemy równanie y=1,75x+3. I wstawiając x=3 wyliczamy
y=1,75·3+3=5,25+3=8,25.
Zadanie 5
Test mediany polega na wyliczeniu statystyki
c
² i porównaniu jej z wartością krytyczną k:
•
Jeśli
c
²>k, to odrzucamy hipotezę o identyczności rozkładów.
Plik z chomika:
licha2
Inne pliki z tego folderu:
Janusz_Buga,Helena_Kassyk-Rokicka_-_Podstawy_statystyki_opisowej_-_ksiÄ…ĹĽka.rar
(4639 KB)
rozwiÄ…zania.pdf
(100 KB)
statystyka Liszka 2003.doc
(134 KB)
statystyka Liszka.docx
(32 KB)
Statystyka.rar
(657 KB)
Inne foldery tego chomika:
infa
notatek
radek
Zgłoś jeśli
naruszono regulamin