IS3 wyklad5


STATYSTYKA
Statystyka bada prawidłowości w zjawiskach masowych (tzn. takich, które mogą występowad
nieograniczoną ilośd razy). Przedmiotem badao statyki są zbiory (populacje), których elementami
sÄ… wszelkiego rodzaju obiekty materialne i zjawiska.
Populacja generalna  zbór dowolnych elementów, nieidentycznych z punktu widzenia badanej
cechy X
Elementy populacji generalnej nazywamy jednostkami statystycznymi.
Właściwości jednostek statystycznych, które podlegają badaniu statystycznemu, nazywamy
cechami statystycznymi
Próbą losową nazywamy częśd populacji, dostępną bezpośredniej obserwacji ze względu na
cechÄ™ X
i-ta jednostka statystyczna ma cechÄ™ 5ØKÜ5ØVÜ, czyli próbÄ™ n elementowÄ… traktujemy jako ciÄ…g
zmiennych losowych (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü)
PróbÄ… prostÄ… nazywamy próbÄ™ losowÄ…, w której cechy jednostek statystycznych 5ØKÜ5ØVÜ sÄ… niezależne
i mają ten sam rozkład, co cecha X w populacji generalnej
Statystyką nazywamy zmienną losową będącą dowolną funkcją wyników próby losowej
Z = f(5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü)
Wartości cechy X u poszczególnych jednostek statystycznych, zarejestrowane w trakcie badania
statystycznego, nazywają się obserwacjami statystycznymi, a zbiór uzyskanych w trakcie
badania obserwacji statystycznych nazywamy materiałem statystycznym
Zbiór obserwacji statystycznych uporządkowany według wartości rosnących cechy X nazywamy
statystycznym szeregiem uporzÄ…dkowanym
Jeżeli obserwacje statystyczne pogrupujemy zliczając je do utworzonych wcześniej przedziałów,
tzw. klas szeregu rozdzielczego, to otrzymamy szereg rozdzielczy (rozkład empiryczny).
Liczbę obserwacji wchodzących do danej klasy nazywamy liczebnością klasy, a kooce przedziału
wyznaczającego daną klasę, granicami przedziału klasowego; wariantem klasowym
nazywamy środek przedziału klasowego, ozn. X
Dzieląc liczebnośd danej klasy przez sumę liczebności wszystkich klas w szeregu otrzymamy
częstośd (względną) g(x) tej klasy, dodając do częstości danej klasy sumę częstości klas
poprzednich otrzymamy częstośd skumulowaną G(x).
Nr Wiek uczniów szkół X Liczebnośd (w tys.) częstośd częstośd skumulowana
podstawowych n g(x) G(x)
1 6,5 i mniej 6 20 0,006 0,006
2 6,5  7,5 7 573 0,179 0,184
3 7,5  8,5 8 529 0,165 0,35
4 8,5  9,5 9 386 0,121 0,471
5 9,5  10,5 10 387 0,121 0,592
6 10,5  11,5 11 375 0,117 0,709
7 11,5  12,5 12 373 0,11 0,819
8 12,5  13,5 13 351 0,109 0,928
9 13,5  14,5 14 150 0,053 0,981
10 14,5  15,5 15 49 0,016 0,997
11 15,5 i więcej 16 10 0,003 1,0
3203
Wniosek: związki pomiędzy rachunkiem prawdopodobieostwa i statystyką
odpowiednikiem zmiennej losowej jest cecha statystyczna
rozkładu teoretycznego jest rozkład empiryczny
dystrybuanty jest częstośd skumulowana
Estymatorem nazywamy dowolną statystykę Z służącą do oszacowania nieznanej wartości
parametru qð populacji generalnej lub nieznanego rozkÅ‚adu populacji
Hipotezą statystyczną nazywamy dowolne przypuszczenie dotyczące rozkładu populacji
generalnej lub parametrów tego rozkładu
Testem statystycznym nazywamy regułę postępowania, która na podstawie wyników próby ma
doprowadzid do decyzji przyjęcia lub odrzucenia postawionej hipotezy statystycznej
W przeciwieostwie do momentów zwykÅ‚ych 5ØZÜ5ØXÜ i centralnych 5ØPÜ5ØXÜ zmiennej losowej, które
nazywamy momentami teoretycznymi, momenty empiryczne oznaczamy 5Ø@Ü5ØXÜ i 5Ø6Ü5ØXÜ.
Momenty empiryczne sÄ… statystykami.
Def. Niech (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü) bÄ™dzie próbÄ… prostÄ….
5Ø[Ü
1
k-tym empirycznym momentem zwykÅ‚ym nazywamy 5Ø@Ü5ØXÜ = 5ØKÜ5ØVÜ5ØXÜ
5ØVÜ=1
5Ø[Ü
5Ø[Ü
1
k-tym empirycznym momentem centralnym nazywamy 5Ø6Ü5ØXÜ = 5ØKÜ5ØVÜ - 5Ø@Ü1 5ØXÜ
5ØVÜ=1
5Ø[Ü
1
5Ø[Ü
Å›redniÄ… empirycznÄ… nazywamy 5ØKÜ = 5Ø@Ü1 = 5ØKÜ5ØVÜ ( statystyka  X z kreskÄ… )
5ØVÜ=1
5Ø[Ü
5Ø[Ü
1
2
wariancjÄ… empirycznÄ… nazywamy 5ØFÜ2 = 5Ø6Ü2 = 5ØKÜ5ØVÜ - 5ØKÜ ( statystyka  S kwadrat )
5ØVÜ=1
5Ø[Ü
5Ø[Ü
1
2
wariancjÄ… empirycznÄ… poprawionÄ… nazywamy 5ØFÜ2 = 5ØKÜ5ØVÜ - 5ØKÜ ( statystyka
5ØVÜ=1
5Ø[Ü-1
 S kwadrat z daszkiem )
Wniosek: Jeżeli X jest cechÄ… w populacji generalnej, gdzie (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü) jest próbÄ… prostÄ… z tej
populacji i istnieje wartośd oczekiwana, to
5Ø[Ü-1
5Ø8ÜX = 5Ø8ÜX , 5Ø8Ü5ØFÜ2 = 5Ø7Ü25ØKÜ , 5Ø8Ü5ØFÜ2 = 5Ø7Ü25ØKÜ
5Ø[Ü
Niech (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü) bÄ™dzie próbÄ… prostÄ… z populacji generalnej, a (5ØKÜ12 , 5ØKÜ22 , & , 5ØKÜ5Ø[Ü2 ) tÄ… samÄ…
próbą z rosnąco posortowanymi wartościami
Def. Kwantylem empirycznym rzędu p nazywamy statystykę
2
5ØKÜ5Ø[Ü5Ø]Ü, dla 5Ø[Ü5Ø]Ü " $!
5Ø ß5Ø]Ü = , *x+ oznacza cechÄ™ z x.
5ØKÜ2 , dla 5Ø[Ü5Ø]Ü " $!
5Ø[Ü5Ø]Ü +1
MedianÄ… empirycznÄ… nazywamy statystykÄ™
5ØKÜ2 , dla n nieparzystego
5Ø[Ü+1
5Ø@Ü5ØRÜ = 1 2 2 .
2
5ØKÜ5Ø[Ü + 5ØKÜ1+5Ø[Ü , dla n parzystego
2
2 2
Kwantyle empiryczne rzÄ™du 1, 1 i 3 nazywamy kwartylami empirycznymi i oznaczamy 5ØDÜ1, 5ØDÜ2
4 2 4
i 5ØDÜ3 (5ØDÜ2 = 5Ø@Ü5ØRÜ )
Np. Oblicz kwartyle empiryczne dla próby (1,05; 1,13; 0,41; 0,12; 0,12; 0,19; 3,02; 0,08; 3,87;
0,54; 2,63; 0,4; 1,15; 0,24; 0,46; 1,07; 0,58; 0,29; 0,56; 2,11; 0,4; 0,04; 0,74; 1,41; 0,18; 3,14;
0,4; 0,64; 0,29; 2,47)
Dane posortowane: (0,04; 0,08; 0,12; 0,12; 0,18; 0,19; 0,24; 0,29; 0,29; 0,4; 0,4; 0,4; 0,41; 0,46;
0,54; 0,56; 0,58; 0,64; 0,74; 1,05; 1,07; 1,13; 1,15; 1,41; 2,11; 2,47; 2,63; 3,02; 3,14; 3,87)
1 3
n=30, [30" - = 7, [30" - =22, 5ØDÜ1 = 0,29; 5ØDÜ2 = 5Ø@Ü5ØRÜ = 0,55; 5ØDÜ3 = 1,15
4 4
Niech qð bÄ™dzie pewnym parametrem rozkÅ‚adu cechy X w populacji generalnej.
Oznaczmy przez 5ØMÜ5Ø[Ü = 5Øß estymator tego parametru (statystyczne oszacowanie qð).
Def. Mówimy, że statystyka 5ØMÜ5Ø[Ü jest estymatorem nieobciążonym parametru qð •ð E5ØMÜ5Ø[Ü = 5Øß
Mówimy, że estymator 5ØMÜ5Ø[Ü jest zgodny •ð "5Øß > 0: lim 5ØCÜ 5ØMÜ5Ø[Ü - 5Øß < 5Øß = 1
5Ø[Ü"
Mówimy, że estymator 5ØMÜ5Ø[Ü jest asymptotycznie nieobciążony •ð lim 5Ø8Ü5ØMÜ5Ø[Ü = 5Øß
5Ø[Ü"
Wniosek:
1. Nieobciążony estymator parametru qð o wariancji dążącej do zera, jest zgodnym estymatorem
parametru qð, gdy wielkoÅ›d próby dąży do nieskooczonoÅ›ci (n®ðÄ„ð) *sÅ‚abe prawo wielkich liczb+
1
2. X jest estymatorem nieobciążonym wartoÅ›ci oczekiwanej, a ponieważ 5Ø7Ü2X = 5Ø7Ü25ØKÜ, jest też
5Ø[Ü
estymatorem zgodnym
Tw. SÅ‚uckiego
Jeżeli 5Øß5Ø[Ü jest estymatorem zgodnym parametru qð i 5Øß = 5ØTÜ(5Øß), gdzie g(x) jest funkcjÄ… wymiernÄ…, to
5ØTÜ(5Øß5Ø[Ü) jest estymatorem zgodnym parametru hð.
"
Def. Estymatorem najefektywniejszym parametru qð nazywamy estymator nieobciążony 5ØMÜ5Ø[Ü, który
ma najmniejszÄ… wariancjÄ™
Jeżeli 5ØMÜ5Ø[Ü jest nieobciążonym estymatorem parametru qð, to efektywnoÅ›ciÄ… estymatora 5ØMÜ5Ø[Ü
"
5Ø7Ü2(5ØMÜ5Ø[Ü)
nazywamy 5ØRÜ 5ØMÜ5Ø[Ü = d" 1 .
5Ø7Ü2(5ØMÜ5Ø[Ü)
Gdy nie ma estymatorów najefektywniejszych, szukamy estymatorów asymptotycznie
najefektywniejszych tzn. takich, dla których lim 5ØRÜ(5ØMÜ5Ø[Ü) = 1
5Ø[Ü"
Tw. nierównośd Rao-Cramera
Jeżeli 5ØSÜ(5ØeÜ, 5Øß) jest funkcjÄ… gÄ™stoÅ›ci rozkÅ‚adu populacji generalnej, 5ØMÜ5Ø[Ü estymatorem parametru qð, to
1
"
5Ø7Ü2 5ØMÜ5Ø[Ü e" = 5Ø7Ü2(5ØMÜ5Ø[Ü)
2
5Øß ln 5ØSÜ 5ØeÜ, 5Øß
5Ø[Ü5Ø8Ü
5Øß5Øß
Np. Niech (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü) bÄ™dzie próbÄ… prostÄ… z populacji generalnej
1. Zbadaj efektywnośd estymatora X wartości oczekiwanej cechy X w populacji generalnej o
rozkÅ‚adzie normalnym N(m,sð).
(5ØeÜ-5ØZÜ)2
1 (5ØeÜ-5ØZÜ)2 5ØeÜ-5ØZÜ
25Øß2
5ØSÜ 5ØeÜ = 5ØRÜ- Þð 5ØYÜ5Ø[Ü5ØSÜ 5ØeÜ = -5ØYÜ5Ø[Ü5Øß 25Ø ß - Þð 5Øß5ØYÜ5Ø[Ü5ØSÜ(5ØeÜ) =
5Øß 25Ø ß 25Øß2 5Øß5ØZÜ 5Øß2
1 1 1 5Øß2
= = = = 5Ø7Ü2X
2
2
5Øß2
5Ø[Ü
5ØeÜ - 5ØZÜ
5Øß ln 5ØSÜ 5ØeÜ
5Ø[Ü
5Ø[Ü5Ø8Ü
5Ø[Ü5Ø8Ü
5Øß4
5Øß2
5Øß5ØZÜ
czyli X jest estymatorem najefektywniejszym i 5ØRÜ X = 1.
2. Znajdz wariancjÄ™ najefektywniejszego estymatora parametru 5Øß2 cechy X w populacji generalnej
o rozkÅ‚adzie normalnym N(m,sð).
(5ØeÜ-5ØZÜ)2
1 (5ØeÜ-5ØZÜ)2 1 (5ØeÜ-5ØZÜ)2
25Øß2
5ØSÜ 5ØeÜ = 5ØRÜ- Þð 5ØYÜ5Ø[Ü5ØSÜ 5ØeÜ = -5ØYÜ5Ø[Ü 25Ø ß - 5ØYÜ5Ø[Ü 5Øß2 - Þð 5Øß5ØYÜ5Ø[Ü5ØSÜ(5ØeÜ) = - +
5Øß 25Ø ß 25Øß2 5Øß5Øß2 25Øß2 25Øß4
1 1
"
5Ø7Ü2 5ØMÜ5Ø[Ü = = =
2
1 (5ØKÜ - 5ØZÜ)2
5Øß ln 5ØSÜ 5ØeÜ
5Ø[Ü5Ø8Ü(-
5Ø[Ü5Ø8Ü
25Øß2 + 25Øß4 )2
5Øß5Øß2
45Øß8 45Øß8 25Øß4
= = =
4 2
5Ø[Ü,5Ø8Ü 5ØKÜ - 5ØZÜ - 25Øß25Ø8Ü 5ØKÜ - 5ØZÜ + 5Øß4- 5Ø[Ü,35Øß4 - 25Øß4 + 5Øß4- 5Ø[Ü
3. Cecha X populacji generalnej ma rozkład jednostajny na przedziale *a,a+1+. Sprawdz, czy
5Ø[Ü
estymator 5ØGÜ5Ø[Ü = max 5ØKÜ5ØVÜ - parametru a jest nieobciążony i zgodny.
5Ø[Ü+1
0d"5ØVÜd"5Ø[Ü
0, 5ØeÜ d" 5ØNÜ
1, 5ØeÜ " ,5ØNÜ, 5ØNÜ + 1-
funkcja gÄ™stoÅ›ci f(x) = i dystrybuanta F(x) = 5ØeÜ - 5ØNÜ, 5ØNÜ < 5ØeÜ d" 5ØNÜ + 1
0, 5ØeÜ " ,5ØNÜ, 5ØNÜ + 1
1, 5ØeÜ > 5ØNÜ + 1
5Ø9Ümax (5ØKÜ1,5ØKÜ2,& ,5ØKÜ5Ø[Ü) 5ØeÜ = 5ØCÜ 5ØKÜ1 < 5ØeÜ )" 5ØKÜ2 < 5ØeÜ )" ï" )" 5ØKÜ5Ø[Ü < 5ØeÜ = (5Ø9Ü 5ØeÜ )5Ø[Ü
5Ø[Ü-1
5Ø[Ü(5ØeÜ - 5ØNÜ)5Ø[Ü-1, 5ØeÜ " ,5ØNÜ, 5ØNÜ + 1-
5ØSÜ5ØZÜ5ØNÜ5ØeÜ(5ØKÜ1,5ØKÜ2,& ,5ØKÜ5Ø[Ü) 5ØeÜ = 5Ø[Ü 5Ø9Ü 5ØeÜ 5ØSÜ 5ØeÜ =
0, 5ØeÜ " ,5ØNÜ, 5ØNÜ + 1-
5ØNÜ+1 5Ø[Ü
E(max (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü)) = 5Ø[Ü5ØeÜ(5ØeÜ - 5ØNÜ)5Ø[Ü-15ØQÜ5ØeÜ = + 5ØNÜ Þð E5ØGÜ5Ø[Ü = 5ØNÜ
+"5ØNÜ
5Ø[Ü+1
czyli estymator 5ØGÜ5Ø[Ü jest nieobciążony
5ØNÜ+1 5Ø[Ü 5Ø[Ü
E([max (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü)-2) = 5Ø[Ü5ØeÜ2(5ØeÜ - 5ØNÜ)5Ø[Ü-15ØQÜ5ØeÜ = + 25ØNÜ + 5ØNÜ2
+"5ØNÜ
5Ø[Ü+2 5Ø[Ü+1
5Ø[Ü 5Ø[Ü 5Ø[Ü 5Ø[Ü 5Ø[Ü2
5Ø7Ü25ØGÜ5Ø[Ü = 5Ø7Ü2max (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü) = 5Ø[Ü+2 + 25ØNÜ + 5ØNÜ2 - (5Ø[Ü+1 + 5ØNÜ)2 = - 0
5Ø[Ü+1 5Ø[Ü+2 (5Ø[Ü+1)2
5Ø[Ü"
czyli estymator 5ØGÜ5Ø[Ü jest zgodny
Def. Niech (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü) bÄ™dzie próbÄ… prostÄ… z populacji generalnej
DystrybuantÄ… empirycznÄ… cechy X populacji generalnej nazywamy funkcjÄ™
1
5Ø9Ü5Ø[Ü 5ØeÜ = *5ØVÜ: 5ØKÜ5ØVÜ < 5ØeÜ+
5Ø[Ü
Uwaga:
1
1. Dla ustalonego wð Îð Wð funkcja 5Ø9Ü5Ø[Ü jest przedziaÅ‚ami staÅ‚a i ma skoki o wartoÅ›ci 5Ø[Ü w punktach
5ØeÜ5ØVÜ = 5ØKÜ5ØVÜ(5Øß)
2. Dla ustalonego x, 5Ø9Ü5Ø[Ü(5ØeÜ) jest zmiennÄ… losowÄ…
Dla rozkładów typu ciągłego statystycznym przybliżeniem gęstości rozkładu jest histogram.
Niech (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü) bÄ™dzie próbÄ… prostÄ… z populacji generalnej, a ciÄ…g (5ØeÜ1, 5ØeÜ2, & , 5ØeÜ5Ø[Ü) ciÄ…giem
obserwacji w tej próbie.
Oznaczamy x = min(5ØeÜ1, 5ØeÜ2, & , 5ØeÜ5Ø[Ü), x  = max (5ØeÜ1, 5ØeÜ2, & , 5ØeÜ5Ø[Ü)
Dzielimy przedziaÅ‚ *x ,x  + na klasy punktami x = 5ØNÜ0 < 5ØNÜ1 < ï" < 5ØNÜ5ØXÜ = x 
5Ø[Ü5ØVÜ = *5ØWÜ: 5ØeÜ5ØWÜ " 5ØNÜ5ØVÜ-1, 5ØNÜ5ØVÜ +, i = 1, & , k
Def. Histogramem dla próby prostej (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü) z populacji generalnej nazywamy funkcjÄ™
0, 5ØeÜ " (-", 5ØeÜ2 ) *" (5ØeÜ2 2 , ")
5Ø[Ü5ØVÜ
5ØUÜ 5ØeÜ =
, 5ØeÜ " 5ØNÜ5ØVÜ-1, 5ØNÜ5ØVÜ
5Ø[Ü(5ØNÜ5ØVÜ - 5ØNÜ5ØVÜ-1)
Uwaga:
Wykres histogramu jest wykresem słupkowym, w którym słupki mają pole proporcjonalne do
częstości względnej poszczególnych klas.
Histogram spełnia wszystkie własności gęstości rozkładu typu ciągłego.
Wniosek: Jeżeli klasy, na które obserwacje są podzielone mają małą szerokośd, a obserwacje
mają rozkład jednostajny w każdym przedziale klasowym, to przybliżeniami wartości statystyk
X, 5ØFÜ2 5ØVÜ 5ØFÜ2 sÄ… statystyki
1 1 1 5ØNÜ5ØVÜ-1+5ØNÜ5ØVÜ
5ØXÜ 5ØXÜ 5ØXÜ
x = 5ØeÜ5ØVÜ5Ø[Ü5ØVÜ , 5Ø`Ü2 = (5ØeÜ5ØVÜ - x)2 5Ø[Ü5ØVÜ , 5Ø`Ü2 = (5ØeÜ5ØVÜ - x)2 5Ø[Ü5ØVÜ, gdzie 5ØeÜ5ØVÜ =
5ØVÜ=1 5ØVÜ=1 5ØVÜ=1
5Ø[Ü 5Ø[Ü 5Ø[Ü-1 2
Ustalenie liczby klas tak, aby powyższe statystyki były dobrymi przybliżeniami prawdziwych
wartoÅ›ci odpowiednich statystyk zależy od liczby obserwacji. Przyjmuje siÄ™, że 5ØXÜ H" 5Ø[Ü lub
5ØXÜ H" 1 + 3,3225ØYÜ5Ø\Ü5ØTÜ5Ø[Ü
Np. Dla podanych materiałów statystycznych oblicz X, 5ØFÜ2 5ØVÜ 5ØFÜ2, narysuj histogram i oblicz
x, 5Ø`Ü2 5ØVÜ 5Ø`Ü2 porównujÄ…c je z prawdziwymi wartoÅ›ciami odpowiednich statystyk
1. (0.5, 0.93, 0.75, 0.89, 0.15, 0.94, 0.16, 0, 0.63, 0.57, 0.33, 0.1, 0.14, 0.21, 0.05, 0.15, 0.37,
0.51, 0.09, 0.25)
X = 0.386 , 5ØFÜ2 = 0.090914 5ØVÜ 5ØFÜ2 = 0.0956989
5ØXÜ H" 20 = 4.47214
5ØXÜ H" 1 + 3,3225ØYÜ5Ø\Ü5ØTÜ20 = 5.32202
nr ,5ØNÜ5ØVÜ-1, 5ØNÜ5ØVÜ) 5Ø[Ü5ØVÜ 5ØeÜ5ØVÜ (5ØeÜ5ØVÜ - x)2
1 [0,0.188) 8 0.094 0.053038
2 [0.188,0.376) 4 0.282 0.000179
k=5
3 [0.376,0.564) 2 0.47 0.002123
4 [0.564,0.752) 3 0.658 0.11135
5 [0.752,0.94] 2 0.846 0.27217
x = 0.3243, 5Ø`Ü2 = 0.0653828 , 5Ø`Ü2 = 0.068824
2. (0.798955,0.81413,0.7904,0.307137,0.342783,-1.0968,-0.378992,-0.452682,-0.921005,
-1.0124,-0.903119,-0.659144,-1.04451,-1.92985,0.7313,0.778717,-0.246786,-0.412439,
0.311415,-1.0318,-0.802116,-0.992476,-0.670884,-1.21274,-0.389695,-0.471496,-1.40024,
0.419988,0.407631,-0.282595,-0.120198,0.402077,-1.20905,0.460571,0.151101,0.225885,
-0.556859,0.442095,0.654481,-1.64419,1.49428,0.352118,0.665502,-0.123524,0.668605,
0.244939,0.52167,-0.85173,1.75322,0.53866)
X = -0.130793, 5ØFÜ2 = 0.65715 5ØVÜ 5ØFÜ2 = 0.670561
5ØXÜ H" 50 = 7.07107
5ØXÜ H" 1 + 3,3225ØYÜ5Ø\Ü5ØTÜ50 = 6.64398
nr ,5ØNÜ5ØVÜ-1, 5ØNÜ5ØVÜ) 5Ø[Ü5ØVÜ 5ØeÜ5ØVÜ (5ØeÜ5ØVÜ - x)2
1 [-1.92985, -1.4037) 2 -1.6668 2.26978
2 [-1.4037, -0.877548) 10 -1.1406 0.96114
3 [-0.877548, 10 -0.6145 0.20636
-0.351395)
4 [-0.351395, 5 -0.0883 0.005173
0.174759)
5 [0.174759, 0.700912] 16 0.4378 0.357633
x = -0.160224,
6 [0.700912, 1.22707) 5 0.964 1.26388
5Ø`Ü2 = 0. 62011,
5Ø`Ü2 = 0.63276
7 [1.22707,1.75322] 1 1.4901 2.72357
Metody modyfikacji histogramu w celu wygładzenia jego wykresu:
1. Zmiana szerokości klas h:
2.64"(5ØDÜ3-5ØDÜ1)
a) wybieramy poczÄ…tkowÄ… szerokoÅ›d klasy 5ØUÜ0 =
3
5Ø[Ü
taka zmiana wystarczy, gdy populacja ma rozkład zbliżony do normalnego
b) zwiÄ™kszamy h biorÄ…c kolejne szerokoÅ›ci: 5ØNÜ5ØUÜ0, 5ØNÜ25ØUÜ0, 5ØNÜ35ØUÜ0, &
1 1 1
lub zmniejszamy h biorÄ…c kolejne szerokoÅ›ci: 5ØNÜ 5ØUÜ0, 5ØUÜ0, 5ØUÜ0, &
5ØNÜ2 5ØNÜ3
dla a=1.2 lub a=1.5
2. Wybór początku histogramu
środkiem pierwszego przedziału klasowego powinna byd najmniejsza obserwacja
Np. Poprawiony histogram dla przykładu poprzedniego ma kształt
Rozkłady pewnych statystyk:
Tw.
Jeżeli (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü) jest próbÄ… prostÄ… z populacji generalnej o rozkÅ‚adzie normalnym N(m,sð), to
statystyka X-5ØZÜ 5Ø[Ü ma rozkÅ‚ad normalny standaryzowany N(0,1)
5Øß
Tw.
Jeżeli (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü) jest próbÄ… prostÄ… z populacji generalnej o rozkÅ‚adzie normalnym N(m,sð), to
2
(5Ø[Ü-1)5ØFÜ2
statystyka 5Ø[Ü5ØFÜ = ma rozkÅ‚ad chi-kwadrat o (n-1) stopniach swobody
5Øß2 5Øß2
Tw.
Jeżeli cecha X w populacji generalnej ma rozkÅ‚ad normalny, to statystyki X i 5ØFÜ2 sÄ… niezależnymi
zmiennymi losowymi
Tw.
Jeżeli (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü) jest próbÄ… prostÄ… z populacji generalnej o rozkÅ‚adzie normalnym N(m,sð), to
statystyka X-5ØZÜ 5Ø[Ü - 1 ma rozkÅ‚ad t-Studenta o (n-1) stopniach swobody
5ØFÜ
Tw.
Jeżeli (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü) jest próbÄ… prostÄ… z populacji generalnej o wartoÅ›ci oczekiwanej m i
skooczonej wariancji 5Øß2 , to statystyki X-5ØZÜ 5Ø[Ü i X-5ØZÜ 5Ø[Ü majÄ… rozkÅ‚ad asymptotycznie
5Øß 5ØFÜ
normalny standaryzowany N(0,1)
Tw.
Jeżeli (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü1) i (5ØLÜ1, 5ØLÜ2, & , 5ØLÜ5Ø[Ü2) sÄ… próbami prostymi z dwóch niezależnych populacji
generalnych o rozkÅ‚adach normalnych N(5ØZÜ1,5Øß1) i N(5ØZÜ2,5Øß2), to statystyka X-Y-(5ØZÜ1-5ØZÜ2) ma
(5Øß1)2 2
+(5Øß2)
5Ø[Ü1 5Ø[Ü2
rozkład normalny standaryzowany N(0,1)
Tw.
Jeżeli (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü1) i (5ØLÜ1, 5ØLÜ2, & , 5ØLÜ5Ø[Ü2) sÄ… próbami prostymi z dwóch niezależnych populacji
X-Y-(5ØZÜ1-5ØZÜ2)
generalnych o rozkÅ‚adach normalnych N(5ØZÜ1,5Øß1) i N(5ØZÜ2,5Øß2), to statystyka
5Ø[Ü1 5ØFÜ1 2+5Ø[Ü2 5ØFÜ2 2 1 1
(5Ø[Ü + )
5Ø[Ü1+5Ø[Ü2-2 5Ø[Ü2
1
ma rozkÅ‚ad t-Studenta o (5Ø[Ü1 + 5Ø[Ü2 - 2) stopniach swobody
Tw.
Jeżeli (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü1) i (5ØLÜ1, 5ØLÜ2, & , 5ØLÜ5Ø[Ü2) sÄ… próbami prostymi z dwóch niezależnych populacji
generalnych o wartoÅ›ciach oczekiwanych 5ØZÜ1 i 5ØZÜ2 oraz skooczonych wariacjach (5Øß1)2 i (5Øß2)2,
to statystyki X-Y-(5ØZÜ1-5ØZÜ2) i X-Y-(5ØZÜ1-5ØZÜ2) majÄ… rozkÅ‚ad asymptotycznie normalny N(0,1)
(5Øß1)2 2 (5ØFÜ1)2 2
+(5Øß2) +(5ØFÜ2)
5Ø[Ü1 5Ø[Ü2 5Ø[Ü1 5Ø[Ü2
Tw.
Jeżeli (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü1) i (5ØLÜ1, 5ØLÜ2, & , 5ØLÜ5Ø[Ü2) sÄ… próbami prostymi z dwóch niezależnych populacji
(5ØFÜ1)2
5Øß1
generalnych o rozkÅ‚adach normalnych N(5ØZÜ1,5Øß1) i N(5ØZÜ2,5Øß2), to statystyka ma rozkÅ‚ad
(5ØFÜ2)2
5Øß2
Snedecora o (5Ø[Ü1 - 1, 5Ø[Ü2 - 1) stopniach swobody
Estymacja punktowa:
I. Metoda momentów
Niech parametr qð bÄ™dzie jednoznacznie okreÅ›lony przy pomocy wartoÅ›ci pierwszych k
momentów teoretycznych tzn. 5Øß = 5ØSÜ(5ØZÜ1, 5ØZÜ2, & , 5ØZÜ5ØXÜ)
Def. Estymator 5Øß otrzymany metodÄ… momentów ma postad
5Øß = 5ØSÜ 5Ø@Ü1, 5Ø@Ü2, & , 5Ø@Ü5ØXÜ ,
gdzie 5Ø@Ü1, 5Ø@Ü2, & , 5Ø@Ü5ØXÜ sÄ… momentami empirycznymi
Uwaga: Estymatory otrzymane metoda momentów rzadko mają dużą efektywnośd, ale stosuje
się je jako pierwsze przybliżenia badanej cechy, ze względu na prostotę ich znalezienia.
Np.
1. Niech X ma rozkÅ‚ad wykÅ‚adniczy z nieznanym parametrem lð. Znajdz estymator tego
parametru.
1 1
EX = 1 Þð lð = 5Ø8Ü5ØKÜ z metody momentów 5Øß =
5Øß X
2. Niech X ma rozkład jednostajny na nieznanym przedziale *a,b+. Znajdz estymatory obydwu
parametrów.
5ØNÜ+5ØOÜ
5Ø8Ü5ØKÜ =
5ØOÜ = 25Ø8Ü5ØKÜ - 5ØNÜ
2
Þð Þð 5ØNÜ = X - 35ØFÜ
(5ØOÜ-5ØNÜ)2
5ØNÜ = 5Ø8Ü5ØKÜ - 35Ø7Ü25ØKÜ
5ØOÜ = X + 35ØFÜ
5Ø7Ü25ØKÜ =
12
II. Metoda największej wiarygodności:
Niech rozkÅ‚ad zmiennej losowej X zależy od parametrów (5Øß1, 5Øß2, & , 5Øß5ØZÜ) oraz (5ØeÜ1, 5ØeÜ2, & , 5ØeÜ5Ø[Ü)
obserwacjami w próbie prostej (5ØKÜ1, 5ØKÜ2, & , 5ØKÜ5Ø[Ü) z populacji generalnej majÄ…cej cechÄ™ X.
Def. FunkcjÄ… wiarygodnoÅ›ci dla parametrów (5Øß1, 5Øß2, & , 5Øß5ØZÜ) nazywamy
5Ø?Ü 5Øß1, 5Øß2, & , 5Øß5ØZÜ = 5Ø]Ü 5ØeÜ1 5Ø]Ü 5ØeÜ2 & 5Ø]Ü 5ØeÜ5Ø[Ü ,
gdzie 5Ø]Ü 5ØeÜ5ØVÜ = 5ØCÜ(5ØKÜ = 5ØeÜ5ØVÜ) dla zmiennej X typu skokowego oraz
5Ø?Ü 5Øß1, 5Øß2, & , 5Øß5ØZÜ = 5ØSÜ 5ØeÜ1 5ØSÜ 5ØeÜ2 & 5ØSÜ 5ØeÜ5Ø[Ü ,
gdzie f(x) jest gęstością zmiennej X typu ciągłego
Def. Estymator 5Øß otrzymany metodÄ… najwiÄ™kszej wiarygodnoÅ›ci jest tÄ… wartoÅ›ciÄ… parametru
qð = (5Øß1, 5Øß2, & , 5Øß5ØZÜ), dla której funkcja wiarygodnoÅ›ci osiÄ…ga wartoÅ›d najwiÄ™kszÄ….
Uwaga: Jeżeli funkcja wiarygodności jest różniczkowalna, to wygodniej jest badad pochodną
5ØYÜ5Ø[Ü5Ø?Ü(5Øß) zamiast pochodnej 5Ø?Ü(5Øß).
Np.
1. X ma rozkÅ‚ad Poissona z parametrem lð. Znajdz estymator tego parametru
dla obserwacji (5ØXÜ1, 5ØXÜ2, & , 5ØXÜ5Ø[Ü) funkcja wiarygodnoÅ›ci 5Ø?Ü 5Øß = 5ØRÜ-5Ø[Ü5Øß 5Øß5ØXÜ1+5ØXÜ2+ï"+5ØXÜ5Ø[Ü
5ØXÜ1 ! 5ØXÜ2 !& 5ØXÜ5Ø[Ü !
5ØYÜ5Ø[Ü5Ø?Ü 5Øß = -5Ø[Ü5Øß + 5ØXÜ1 + 5ØXÜ2 + ï" + 5ØXÜ5Ø[Ü 5ØYÜ5Ø[Ü5Øß - 5ØYÜ5Ø[Ü 5ØXÜ1 ! 5ØXÜ2 & 5ØXÜ5Ø[Ü !
2
5ØXÜ1+5ØXÜ2+ï"+5ØXÜ5Ø[Ü 5ØXÜ1+5ØXÜ2+ï"+5ØXÜ5Ø[Ü
5ØYÜ5Ø[Ü5Ø?Ü 5Øß = -5Ø[Ü + = 0 •ð 5Øß =
5Øß 5Ø[Ü
2 2
5ØXÜ1+5ØXÜ2+ï"+5ØXÜ5Ø[Ü
5ØYÜ5Ø[Ü5Ø?Ü 5Øß = - < 0 Þð 5Ø?Ü ma maksimum
5Øß2
czyli 5Øß = X
2. Niech X ma rozkład jednostajny na przedziale *0,b+. Znajdz estymator parametru b.
0, min 5ØeÜ5ØVÜ < 0
1
dla obserwacji (5ØeÜ1, 5ØeÜ2, & , 5ØeÜ5Ø[Ü) funkcja wiarygodnoÅ›ci 5Ø?Ü 5ØOÜ = 5ØOÜ5Ø[Ü , min 5ØeÜ5ØVÜ e" 0 '" max*5ØeÜ5ØVÜ+ d" 5ØOÜ
0, max 5ØeÜ5ØVÜ > 5ØOÜ
jest nieciÄ…gÅ‚a w b = max,5ØeÜ5ØVÜ+ i b=min{5ØeÜ5ØVÜ+
0, min 5ØeÜ5ØVÜ < 0
-5Ø[Ü
, min 5ØeÜ5ØVÜ e" 0 '" max 5ØeÜ5ØVÜ < 5ØOÜ
5Ø?Ü2 5ØOÜ = 5ØOÜ5Ø[Ü+1 Þð z analizy znaków pochodnej w b = min{5ØeÜ5ØVÜ}
0, max 5ØeÜ5ØVÜ > 5ØOÜ
funkcja L ma wartośd największą
czyli 5ØOÜ = m5ØVÜ5Ø[Ü*5ØKÜ5ØVÜ+
Niech A Îð M(n).
Def. Minorem wiodÄ…cym stopnia k macierzy A nazywamy wyznacznik 5Ø4Ü5ØVÜ macierzy, która powstaje
z macierzy A przez skreślenie kolumn i wierszy o indeksach k+1,k+2,& ,n.
Niech funkcja f 5Øß1, 5Øß2, & , 5Øß5ØZÜ bÄ™dzie dwukrotnie różniczkowalna oraz 5ØQÜ25ØSÜ bÄ™dzie ciÄ…gÅ‚a.
5Øß25ØSÜ 5Øß25ØSÜ
5Øß25ØSÜ
(5Øß) (5Øß) &
(5Øß)
2
5Øß5Øß1 5Øß5Øß15Øß5Øß2
5Øß5Øß15Øß5Øß5ØZÜ
5Øß25ØSÜ 5Øß25ØSÜ 5Øß25ØSÜ
(5Øß) (5Øß) & (5Øß)
2
A(qð) = 5Øß5Øß15Øß5Øß2 5Øß5Øß2 5Øß5Øß25Øß5Øß5ØZÜ
î"
î" î"
Å„"
5Øß25ØSÜ
5Øß25ØSÜ 5Øß25ØSÜ
(5Øß)
(5Øß) (5Øß)
&
2
5Øß5Øß5ØZÜ
5Øß5Øß15Øß5Øß5ØZÜ 5Øß5Øß25Øß5Øß5ØZÜ
Tw. WK istnienia ekstremum funkcji f 5Øß1, 5Øß2, & , 5Øß5ØZÜ
Jeżeli różniczkowalna funkcja f 5Øß1, 5Øß2, & , 5Øß5ØZÜ ma ekstremum w 5Øß = 5Øß1, 5Øß2, & , 5Øß5ØZÜ to
5Øß5ØSÜ
"5ØVÜ = 1, & , 5ØZÜ: 5Øß = 0
5Øß5Øß5ØVÜ
Tw. WW istnienie ekstremum funkcji f 5Øß1, 5Øß2, & , 5Øß5ØZÜ
5Øß5ØSÜ
Jeżeli dla funkcji dwukrotnie różniczkowalnej f 5Øß1, 5Øß2, & , 5Øß5ØZÜ zachodzi "5ØVÜ = 1, & , 5ØZÜ: 5Øß5Øß 5Øß = 0
5ØVÜ
oraz "5ØVÜ = 1, & , 5ØZÜ: 5Ø4Ü5ØVÜ(5Øß) > 0 , to 5ØSÜ ma w punkcie 5Øß minimum,
5ØVÜ
a jeżeli "5ØVÜ = 1, & , 5ØZÜ: -1 5Ø4Ü5ØVÜ(5Øß) > 0, to 5ØSÜ ma w punkcie 5Øß minimum.
Np. Niech X ma rozkÅ‚ad normalny N(m,sð). Znajdz estymatory parametrów m i 5Øß2.
dla obserwacji (5ØeÜ1, 5ØeÜ2, & , 5ØeÜ5Ø[Ü) funkcja wiarygodnoÅ›ci
(5ØeÜ1-5ØZÜ)2+(5ØeÜ2-5ØZÜ)2+ & +(5ØeÜ5Ø[Ü-5ØZÜ)2
1
25Øß2
5Ø?Ü 5ØZÜ, 5Øß2 = 5ØRÜ-
5Øß5Ø[Ü (25Ø ß)5Ø[Ü
5Ø[Ü (5ØeÜ1 - 5ØZÜ)2+(5ØeÜ2 - 5ØZÜ)2+ & + (5ØeÜ5Ø[Ü - 5ØZÜ)2
5ØYÜ5Ø[Ü5Ø?Ü 5ØZÜ, 5Øß2 = - ln 25Ø ß5Øß2 -
2 25Øß2
2
5Øß5ØYÜ5Ø[Ü5Ø?Ü 5ØeÜ1-5ØZÜ + 5ØeÜ2-5ØZÜ +ï"+(5ØeÜ5Ø[Ü-5ØZÜ) 5Ø[Ü
5ØZÜ, 5Øß2 = , 5Øß5ØYÜ5Ø[Ü5Ø?Ü 5ØZÜ, 5Øß2 = - + (5ØeÜ1-5ØZÜ) +(5ØeÜ2-5ØZÜ)2+ & +(5ØeÜ5Ø[Ü-5ØZÜ)2
5Øß5ØZÜ 5Øß2 5Øß5Øß2 25Øß2 25Øß4
5ØeÜ1+5ØeÜ2+ï"+5ØeÜ5Ø[Ü-5Ø[Ü5ØZÜ 5ØeÜ1+5ØeÜ2+ï"+5ØeÜ2
= 0 5ØZÜ =
5Øß2 5Ø[Ü
5ØZÜ = 5ØKÜ
Þð Þð
2 2 2 2 2 2
5Ø[Ü5Øß2 5ØeÜ1-5ØZÜ + 5ØeÜ2-5ØZÜ +& + 5ØeÜ5Ø[Ü-5ØZÜ 5ØeÜ1-5ØZÜ + 5ØeÜ2-5ØZÜ +& + 5ØeÜ5Ø[Ü-5ØZÜ
5Øß2 = 5ØFÜ2
- + = 0 5Øß2 =
25Øß4 25Øß4 5Ø[Ü
2 2 2
5Øß25ØYÜ5Ø[Ü5Ø?Ü 5Ø[Ü 5Øß25ØYÜ5Ø[Ü5Ø?Ü 5Ø[Ü 5ØeÜ1-5ØZÜ + 5ØeÜ2-5ØZÜ +& + 5ØeÜ5Ø[Ü-5ØZÜ 5Øß25ØYÜ5Ø[Ü5Ø?Ü 5ØeÜ1+5ØeÜ2+ï"+5ØeÜ5Ø[Ü-5Ø[Ü5ØZÜ
= - , = - , = -
5Øß5ØZÜ2 5Øß2 5Øß 5Øß2 2 25Øß4 5Øß6 5Øß5ØZÜ5Øß5Øß2 5Øß4
5Ø[Ü
- 0
5Ø[Ü 5Ø[Ü2
5ØFÜ2
A(5ØZÜ, 5Øß2) = , 5Ø4Ü1(5ØZÜ, 5Øß2) = - < 0, 5Ø4Ü2(5ØZÜ, 5Øß2) = 25ØFÜ6 > 0
5Ø[Ü
5ØFÜ2
0 -
25ØFÜ4
L ma maksimum
Najczęściej szacowanym niemierzalnym (jakościowym) parametrem rozkładu jest wskaznik
struktury qð, czyli frakcja (lub procent) elementów wyróżnionych (majÄ…cych cechÄ™ X) w populacji
5ØXÜ
Najlepszym estymatorem wskaznika struktury jest 5Øß = , gdzie k oznacza liczbÄ™ elementów
5Ø[Ü
wyróżnionych znalezionych w losowej próbie o liczebności n
Podsumowanie:
Parametr Estymator Własności Rozkłady
n
Wartośd oczekiwana zgodny, nieobciążony dowolny
1
X =ð Xi
åð
EX = m dla N(m,sð) efektywny
n
i=ð1
zgodny, asymptoty- dowolny
5Ø@Ü5ØRÜ
2
cznie nieobciążony
dla N(m,sð) e(5Ø@Ü5ØRÜ) =5Ø ß
n
Wariancja 5Ø7Ü25ØKÜ = 5Øß2 1
S12 =ð
åð(X -ð m)2 zgodny, nieobciążony dowolny
i
gdy m znane dla N(m,sð) efektywny
n
i=ð1
n
Wariancja 5Ø7Ü25ØKÜ = 5Øß2 zgodny, asymptoty- dowolny
1
S2 =ð
åð(X -ð X )2 cznie nieobciążony
i
gdy m nieznane
n
i=ð1
n
zgodny, nieobciążony dowolny
1
\2 =ð
åð(X -ð X )2
i
dla N(m,sð) e(5ØFÜ2)=5Ø[Ü-1
n -ð1
i=ð1
5Ø[Ü
Parametr Estymator Własności Rozkłady
Odchylenie zgodny, obciążony dowolny
5ØFÜ1, 5ØFÜ, 5ØFÜ
standardowe sð
zgodny, nieobciążony, normalny
“(5Ø[Ü - 1) 5Ø[Ü
2
asymptotycznie
5ØFÜ,
“(5Ø[Ü) 2
efektywny ( tzn.
lim 5ØRÜ(5Øß) = 1 )
“(5Ø[Ü - 1) 5Ø[Ü - 1
2 5Ø[Ü"
5ØFÜ
“(5Ø[Ü) 2
5ØXÜ
Wskaznik struktury qð zgodny, nieobciążony, Bernoulliego
5Øß =
efektywny
5Ø[Ü


Wyszukiwarka