rozwiÄ…zania.pdf

Zadanie 1

Dokładność oszacowania średniej nazywamy błędem standardowym (SE od standard error) i

wyliczamy ze wzoru:

SE = σ

√ n

gdzie:

• n oznacza liczbę elementów próbki,

• σ oznacza odchylenie standardowe obliczone z próbki.

Musimy więc znaleźć takie n, aby SE było równe 1% średniej. Musimy więc obliczyć średnią i σ.

Aby obliczyć średnią i odchylenie standardowe tworzymy następującą tabelkę:

x i

x i -x

(x i -x)²

10,1

-0,15

0,02

-1,25

1,56

11,3

1,05

1,1

10,7

0,45

0,2

11,4

1,15

1,32

8,7

-1,55

2,4

0,75

0,56

9,8

-0,45

0,2

7,36

- W pierwszej kolumnie wpisujemy nasze dane, sumujemy tę kolumnę (dostajemy sumę 82) i

dzielimy przez liczbę naszych danych 82:8=10,25 i to jest nasza średnia:

̄ x = 10,25.

- W drugiej kolumnie od każdej liczby z pierwszej kolumny odejmujemy wyliczoną przed chwilą

średnią. Np. w pierwszym wierszu mamy 10,1-10,25=-0,15, a w drugim 9-10,25=-1,25.

- W ostatniej kolumnie podnosimy do kwadratu kolumnę drugą. Np. w pierwszym wierszu

mamy -0,15 do kwadratu, czyli 0,02, a w drugim -1,25 do kwadratu, czyli 1,56. Tą kolumnę

sumujemy (dostajemy sumę 7,36) i dzielimy przez liczbę o jeden mniejszą niż liczba naszych

danych: 7,36:7=1,05 a na koniec wyciągamy pierwiastek i to jest nasze odchylenie

standardowe:

σ= √ 1,05 = 1,02.

Chcemy więc, żeby SE było równe 1% średniej, czyli 1%·10,25=0,1025. Wstawiamy więc

wszystko do wzoru:

0,1025 = 1, 0 2

√ n

√ n = 1,02

0,1025

√ n = 9,95

n =( 9,95 ) 2

n = 99

A więc potrzeba 99 próbek. Czyli trzeba do 8 próbek, które już mamy dobrać 91. Skoro są one

klasy 70-80 mm, to można przyjąć, że są one kulami o średnicy 70-80 mm (czyli promieniu

35-40 mm). Korzystając ze wzoru na objętość kuli:

V = 4

3 π r 3

i biorąc maksymalny promień 40 mm. Dostajemy, że każda próbka ma objętość

V = 4

3 π( 40 ) 3 = 4

3 ⋅ 3,14 ⋅ 64000 = 268000mm 3 = 268cm 3

91 próbek będzie miało więc objętość 91·268=24388 cm³=0,024388 m³. Skoro gęstość to

1450g/m³, to masa tych 91 próbek to 1450·0,024388 =35,36 g.

Zadanie 2

Test serii zaczynamy od uszeregowania wyników z obu zakładów od najmniejszego do

największego. Ważne jest żeby wiedzieć, który wynik jest z którego zakładu, dlatego użyję

kolorów. Czerwone liczby to zakład I, a zielone to zakład II.

10,8 11,9 11,9 12,1 12,8 12,9 13,1 13,3 13,8 14,5 14,7 15,1 15,3 16,0 16,2 17,0

Serią nazywamy ciąg wyników tego samego typu (tutaj: z tego samego zakładu). Czyli

pierwszą serię tworzą liczby 10,8, 11,9 i 11,9. Druga seria to tylko liczba 12,1, trzecia to 12,8

itd.

W teście serii zliczamy liczbę serii i porównujemy ją z wartością krytyczną. Jeśli liczba serii jest

mniejsza od wartości krytycznej, to odrzucamy hipotezę, że oba zakłady produkują takie same

koncentraty. A jeśli liczba serii jest wyższa od wartości krytycznej, to nie ma podstaw by taką

hipotezę odrzucić.

U nas liczba serii to 10. Wartość krytyczną odczytujemy z tabeli wartości krytycznych

(zamieszczam ją w oddzielnym pliku). Wybieramy tam tabelę dla a =0,05, bo w zadaniu mamy

poziom istotności 0,05. n 1 i n 2 oznaczają zaś liczności naszych próbek. U nas n 1 =7 (bo tyle

mamy wyników z zakładu I), a n 2 =9 (tyle jest wyników z zakładu II). Z tabeli odczytujemy

więc wartość krytyczną równą 5. Czyli u nas liczba serii jest wyższa od wartości krytycznej, a

więc nie ma podstaw by odrzucić hipotezę, że oba zakłady produkują takie same koncentraty.

Zadanie 3

Jeśli podana jest dystrybuanta, to wartości wychodu dla przedziału (a,b) obliczamy ze wzoru

F (b)- F (a).

Należy przy tym pamiętać o czterech zasadach:

– F (0)=0,

– F (∞)=100,

– jeśli z tabeli można dla jakiejś liczby odczytać dwie wartości, to zawsze bierzemy

mniejszą, np. F (0,5)=15, a nie 25,

– jeśli w tabeli nie ma jakiejś liczby, to znajdujemy w tabeli dwie najbliższe jej liczby:

jedną mniejszą (oznaczamy ją x) i jedną większą od szukanej (oznaczamy ją y) i

stosujemy przybliżenie:

Φ( a )=Φ( x )+(Φ( y )−Φ( x ))⋅ a − x

y − x

Wychód dla klasy (0; 0,5) to więc F (0,5)- F (0)=15-0=15%

Wychód dla klasy (0,8; 1,5) to więc F (1,5)- F (0,8)

Nie mamy jednak w tabeli F (1,5). Ale mamy F (1) i F (2), stosujemy więc ostatni wzór z a=1,5,

x=1 i y=2:

Φ( 1,5 )=Φ( 1 )+(Φ( 2 )−Φ( 1 ))⋅ 1,5 − 1

2 − 1 = 25 +( 36 − 25 )⋅ 0,5 = 25 + 11 ⋅ 0,5 = 25 + 5,5 = 30,5

I analogicznie dla F (0,8) bierzemy a=0,8, x=0,5, y=1:

Φ( 0,8 )=Φ( 0,5 )+(Φ( 1 )−Φ( 0,5 ))⋅ 0,8 − 0,5

1 − 0,5 = 15 +( 25 − 15 )⋅ 0,3

0,5 = 15 + 10 ⋅ 0,6 = 15 + 6 = 21

I ostatecznie wychód to F (1,5)- F (0,8)=30,5-21=9,5%

Wychód dla klasy powyżej 2, to to samo co wychód dla klasy (2; ∞), a więc F (∞)- F (2)=100-

36=64%

Krzywa o przewadze ziaren drobnych to taka, która na samym początku gwałtownie rośnie, by

potem już się prawie nie zmieniać:

Krzywa o przewadze ziaren grubych to taka, która na samym początku jest bliska zeru, a

dopiero pod koniec gwałtownie rośnie:

O braku wybranek klasy świadczy płaski fragment krzywej. Np. krzywa bez klasy (1,2) może

wyglądać tak:

Zadanie 4

Do sprawdzenia, czy równanie regresji jest istotne używamy statystyki testowej F oraz

wartości krytycznej F KRYT . Jeśli otrzymamy F większe od F KRYT , to równanie jest istotne, a jeśli

otrzymamy F mniejsze od F KRYT , to równanie jest nieistotne.

Statystyka F ma wzór:

F = R 2

( 1 − R 2 ) ⋅( n − 2 )

gdzie:

– R² oznacza współczynnik determinacji,

– n oznacza liczbę danych, którymi dysponujemy.

Z kolei F KRYT odczytujemy z tabeli wartości krytycznych rozkładu F (załączam ją w oddzielnym

pliku) w następujący sposób: patrząc na a wybieramy jedną z dostępnych tabel. Z niej

odczytujemy liczbę z przecięcia kolumny z numerem 1 i wiersza z numerem n-2.

Z treści zadania wiemy, że n=27, ale nie znamy R². Ale wiemy, że wzór na parametr a w

równaniu regresji to

a = r s Y

s X

gdzie:

- s X oznacza odchylenie standardowe zmiennej X,

- s Y oznacza odchylenie standardowe zmiennej Y,

- r oznacza współczynnik korelacji zmiennych X i Y.

Możemy więc z tego wyznaczyć r, a potem skorzysta ć ze wzoru

R 2 = r 2

Mamy więc ze wzoru na a:

1,75 = r ⋅ 5,5

3,35

1,75 = r ⋅ 1,64

r = 1,75

1,64

r = 1,067

W tym miejscu widać, że coś jest nie tak danymi w zadaniu, bo r musi być zawsze liczbą od -1

do 1. Zmieńmy sobie dane, tak żeby było OK. Załóżmy np. że s Y =6,5:

Mamy więc ze wzoru na a:

1,75 = r ⋅ 6,5

3,35

1,75 = r ⋅ 1,94

r = 1,75

1,94

r = 0,9

A więc R²=(0,9)²=0,81. I liczymy statystykę F:

F = 0,81

1 − 0,81 ⋅( 27 − 2 )= 0,81

0,19 ⋅ 25 = 4,26 ⋅ 25 = 106,5.

Skoro nie ma podane, na jakim poziomie istotności oceniać istotność regresji, to przyjmujemy

a =0,05 i w tabeli wartości krytycznych rozkładu F dla a =0,05 bierzemy liczbę z pierwszej

kolumny i 25 wiersza: F KRYT =4,242. Widzimy, że F>F KRYT , więc równanie jest istotne.

Teraz przyjmując b=3 otrzymujemy równanie y=1,75x+3. I wstawiając x=3 wyliczamy

y=1,75·3+3=5,25+3=8,25.

Zadanie 5

Test mediany polega na wyliczeniu statystyki c ² i porównaniu jej z wartością krytyczną k:

• Jeśli c ²>k, to odrzucamy hipotezę o identyczności rozkładów.

Plik z chomika:

Inne pliki z tego folderu:

Inne foldery tego chomika: