Estymacja2.doc

(317 KB) Pobierz

ESTYMACJA

Def. Estymacją nazywamy szacowanie wartości parametrów, ewentualnie postaci rozkładu w populacji generalnej, na podstawie obserwacji uzyskanych w próbie losowej.

Typy estymacji:

- estymacja parameryczna

estymacja nieparametryczna

- estymacja punktowa

estymacja przedziałowa

ESTYMATORY

Założenia - rozkład zmiennej losowej X w populacji generalnej jest opisany za pomocą dystrybuanty , gdzie jest parametrem rozkładu, od którego zależy ta dystrybuanta,

- nieznaną wartość parametru szacujemy na podstawie n-elementowej próby losowej

Def. Estymatorem parametru rozkładu populacji generalnej nazywamy statystykę z próby , która służy do oszacowania wartości tego parametru.

Def. Oceną parametru nazywamy konkretną wartość liczbową jaką przyjmuje estymator parametru dla realizacji próby .

Def. Błędem szacunku (estymacji) parametru nazywamy różnicę pomiędzy estymatorem a wartością parametru, oznaczoną przez:

a za miarę tego błędu przyjmujemy wyrażenie:

Def. Średnim (standardowym) błędem szacunku paramertu jest wyrażenie

Def. Względnym błędem szacunku parametru jest wyrażenie

Poprawka dla błędów standardowych szacunku w przypadku losowania ze skończonej populacji:

WŁASNOŚCI ESTYMATORÓW

Def. Mówimy, że estymator parametru jest nieobciążony, jeśli spełniona jest relacja:

W przeciwnym przypadku estymator nazywamy obciążonym, a wyrażenie:

nazywamy obciążeniem estymatora.

Przykład

- badamy populację generalną o dowolnym rozkładzie z wartością oczekiwaną

- średnia arytmetyczna z n-elementowej próby losowej jest nieobciążonym estymatorem wartości oczekiwanej w rozkładzie populacji generalnej gdyż:

Def. Mówimy, że estymator parametru jest asymptotycznie nieobciążony, jeśli:

Def. Mówimy, że estymator parametru jest zgodny, jeśli spełnia relację:

dla dowolnego 0

Przykład

Twierdzenie (prawo wielkich liczb Czebyszewa)

Jeśli dla ciągu zmiennych losowych , z których każda ma skończoną wartość oczekiwaną oraz wariancję , jest spełniony warunek:

to znaczy ciąg jest stochastycznie zbieżny do wartości oczekiwanej

Wniosek

Ciąg zmiennych losowych jest stochastycznie zbieżny do wspólnej dla wszystkich zmiennych wartości oczekiwanej , tzn.:

Średnia arytmetyczna z próby jest zgodnym estymatorem wartości w populacji generalnej, tzn.:

; >0

ZWIĄZKI POMIĘDZY WŁASNOŚCIAMI NIEOBCIĄŻONOŚCI

ORAZ ZGODNOŚCI ESTYMATORA

1. Jeśli estymator parametru jest zgodny, to jest asymptotycznie nieobciążony. Twierdzenie odwrotne nie jest prawdziwe.

2. Jeśli estymator parametru jest nieobciążony (lub asymptotycznie nieobciążony) oraz jeśli jego wariancja spełnia relację , to jest estymatorem zgodnym.

Def. Jeśli dany jest zbiór wszystkich nieobciążonych estymatorów parametru , to estymator , który ma w tym zbiorze najmniejszą wariancję, tzn. , i=1,...,r, nazywamy najefektywniejszym estymatorem parametru

Wyrażenie:

nazywamy efektywnością estymatora parametru .

Przykład

Bierzemy pod uwagę dwa estymatory nieobciążone wartości oczekiwanej w populacji generalnej o dowolnym rozkładzie:

- średnia arytmetyczna ,

- - zmienna charakteryzująca próbę.

Wiemy, że wariancje tych estymatorów odpowiednio wynoszą:

Ponieważ średnia arytmetyczna jest efektywniejszym estymatorem wartości oczekiwanej niż i-ta zmienna z próby.

WYZNACZANIE WARIANCJI ESTYMATORA

NAJEFEKTYWNIEJSZEGO

Twierdzenie (nierówność Rao-Cramera)

Przy pewnych ogólnych warunkach wariancja dowolnego nieobciążonego estymatora parametru spełnia relację:

gdzie: oznacza funkcję gęstości lub funkcję prawdopodobieństwa rozkładu populacji generalnej.

Def. Mówimy, że estymator parametru jest asymptotycznie najefektywniejszy, jeśli:

PRZEDZIAŁ UFNOŚCI

Założenia

- cecha X ma w populacji generalnej rozkład z nieznanym parametrem ,

- na podstawie próby losowej pochodzącej z populacji wyznaczamy takie dwie funkcje i , że dla każdej realizacji próby jest i dla, z góry przyjętego, prawdopodobieństwa 1- zachodzi:

Def. Przedziałem ufności parametru nazywamy losowy przedział . Współczynnikiem ufności 1- nazywamy z góry ustalone prawdopodobieństwo, z jakim ten przedział pokrywa nieznaną wartość parametru .