STAT 2010 W8

Testy parametryczne
Najczęściej występującym w zagadnieniach badawczych problemem
jest obiektywne rozstrzygnięcie stwierdzenie różnic między
średnimi zaobserwowanymi w próbach statystycznych. Jeśli
cecha statystyczna jest wielkością mierzalną, i w dwóch próbach
statystycznych średnie istotnie się różnią, to oznacza to, że występuje
powiązanie (związek) między tą zmienną (mierzalną) a zmienną
jakościową ( na podstawie której nastąpił podział na dwie próby
losowe).
losowe).
Medycyna: podaje się dwa leki A i B obniżające ciśnienie u pacjentów (próbki
niezależne). Po zaaplikowaniu rejestrujemy ciśnienie krwi, i chcemy rozstrzygnąć,
czy występują istotne różnice pomiędzy ciśnieniem w grupie A i B (przez
porównanie średnich ciśnień w grupach).
Technika: dwa urządzenia A i B produkują pewien produkt, którego jakość
charakteryzuje cecha mierzalna X. Po wylosowaniu prób z serii produktów obu
maszyn wyznaczono średnie �A i �B, które się różnią. Trzeba rozstrzygnąć, czy
różnice są dziełem przypadku, czy zjawiskiem obiektywnym (jedna maszyn jest
lepsza od drugiej).
Test istotności dla wartości średniej populacji generalnej
Stosujemy, gdy należy sprawdzić, czy różnica zaobserwowanej (w
próbie losowej) średniej istotnie odbiega od znanej wartości
średniej w populacji generalnej.
Założenie: populację charakteryzuje rozkład normalny o nieznanej wartości
średniej m oraz znanym odchyleniu standardowym �
�.
�
�
H0 � H1 �
H0: � = m0 wobec H1: � `" m0
� �
� �
gdzie m0 pewna wartość założona ( średnia w populacji generalnej).
Pobieramy n elementową próbę z populacji, i wyznaczamy średnią z próby �
�.
�
�
Jeśli prawdziwa jest H0, to średnia z próby jest zmienną
statystyczną o rozkładzie normalnym N(m0, �/n1/2), co oznacza, że
�
�
�
statystyka
U �- �
U= n1/2[(� m0)/ �]
� �
� �
ma rozkład normalny N(0,1) czyli do weryfikacji hipotezy
stosujemy obszar krytyczny: P{ |U|e"uą} = ą . Jeśli U należy do
P{ |U|e"uą} = ą
e" ą
e" ą
e" ą
e" ą
e" ą
e" ą
ą
ą
ą
ą
ą
ą
obszaru krytycznego H0 odrzucamy na korzyść H1.
Przykład. Zastosowanie testu istotności średniej w populacji generalnej
Według normy technologicznej wykonanie obróbki mechanicznej produktu
powinno zajmować 22 minuty. Wylosowano 16 stanowisk obróbki
mechanicznej, dla których średni czas obróbki wyniósł 24 minuty.
Wcześniejsze badania (na szeroką skalę) pokazały, że odchylenie standardowe
czasu obróbki wynosi 4 minuty, a sam rozkład czasu ma charakter normalny.
Zweryfikować na poziomie istotności 5% hipotezę, że zaobserwowana średnia
nie różni się od normy.
Rozwiązanie: Obliczamy statystykę testową
U �- �
U=[(� �] n1/2=[(24-22)/4]*161/2=(2/4)*4=2
U �- m0)/ �
U=[(� m0)/ �] n1/2=[(24-22)/4]*161/2=(2/4)*4=2
� �
� �
� �
� �
i konfrontujemy ją z wartością krytyczną rozkładu normalnego dla ą=0.05,
która wynosi ukryt=1.96 (przypominam, że jest to test dwustronny, zatem
odczytujemy z tablic dystrybuanty rozkładu normalnego dla ą/2=0.025 patrz
wcześniejszy materiał).
Ponieważ: |U|=2 > ukryt=1.96 hipotezę o równości rzeczywistego
średniego czasu obróbki na 16 stanowiskach z czasem podanym normą należy
odrzucić, z 5% ryzykiem popełnienia błędu. Przyjmujemy zatem hipotezę
alternatywną: wyznaczona średnia różni się od normy ( trzeba przeprowadzić
szkolenie lub lepiej kontrolować załogę).
Dobór testu dla prób niezależnych
Dwie niezależne próby losowe wybór testu równości średnich
Duże próby losowe (n1>50,n2>50)
Nieduże próby losowe
Rozkład odbiega Rozkład normalny
od normalnego w obu próbach
Znane wariancje Nieznane
�12 i �12 wariancje
Równe wariancje Nierówne wariancje
Test
Testy
Test z
Test U
Test t Cochran-Cox
nieparametryczne
UWAGA: Przed przystąpieniem do testu należy sprawdzić (jeśli nie wiadomo z góry)
czy rozkłady empiryczne mają charakter normalny test Kołmogorowa-Smirnowa.
Dla sprawdzenia równości wariancji w próbkach można zastosować test F.
Test U - próby niezależne
Test istotności dla 2 średnich
Zakładamy, że badane są dwie populacje, z których każda ma rozkład normalny o
nieznanych średnich m1 i m2, ale znanych odchyleniach standardowych �1 i �2.
� �
� �
� �
H0 H1
H0: m1 = m2 wobec H1: m1 `" m2
- Losujemy próby z obu populacji o liczebnościach n1 i n2.
- Obliczamy średnie z prób �1 oraz �2 .
Jeśli prawdziwa jest H0, to różnica średnich � - � jako zmienna
Jeśli prawdziwa jest H , to różnica średnich �1 - �2 jako zmienna
statystyczna ma rozkład normalny o średniej 0 i wariancji
�12/n1 + �22/n2
� �
� �
� �
a wtedy statystyka testowa
�1 - �2
U =
2
�1 / n1 + �2 / n2
2
ma rozkład normalny N(0,1). Odrzucamy H0 gdy statystyka testowa
|U|e"Ukryt(ą)
Przykład. W pewnym sektorze gospodarki narodowej średni staż pracy mężczyzn
uważa się za większy od stażu kobiet. Szerokie badania statystyczne dały
podstawę do założenia o rozkładzie normalnym dla stażu kobiet i mężczyzn, gdzie
wariancje określono : dla mężczyzn �12= 1.89 a kobiet �12= 1.44. W pewnym
zakładzie tej branży wylosowano n1=35 mężczyzn i n2=30 kobiet i oszacowano
średnie staże w obu grupach: �1= 3.5, �2= 2.8 lat. Sprawdz, czy faktycznie w
zakładzie staż mężczyzn jest większy niż kobiet, na poziomie istotności 5%.
Rozwiązanie: Znane są wariancje rozkładów stażu (obszerne badania je
dostarczyły w formie estymat ale bliskich rzeczywistym wariancjom). Nadto,
rozkłady są normalne, przeto na podstawie schematu wyboru testu wybieram
test U. Statystyka testowa U wynosi:
test U. Statystyka testowa U wynosi:
�1 - �2
3.5-2.8
U = = = 2.19
2
�1 / n1 + �2 / n2 1.89/ 35+1.44/ 30
2
Statystykę konfrontujemy z jednostronnym obszarem krytycznym rozkładu
normalnego , gdzie wartość krytyczna Ukryt=1.65 dla ą=0.05.
Wniosek: Ponieważ U=2.19 > 1.65=Ukryt hipotezę zerową o równości średnich
(H0:�1= �2) odrzucamy na korzyść hipotezy alternatywnej H1 ( średnia stażu
mężczyzn istotnie większa od średniej stażu kobiet �1> �2).
Test t próby niezależne
Test istotności dla 2 średnich
Zastosowanie: jeśli ani średnie ani wariancje populacji generalnych
nie są znane, zaś test równości wariancji w próbach nie wskazuje na
istotne różnice.
Hipoteza zerowa: H0: m1 = m2 (wobec H1: m1 `" m2)
H0 H1
Jeśli H0 jest prawdziwa to statystyka t
Jeśli H0 jest prawdziwa to statystyka t
H0
H0
�1 - �2
t =
2
sn 1/ n1 +1/ n2
( )
ma rozkład t-Studenta o (n1+n2-2) stopniach swobody, gdzie sn2 jest
estymatą wariancji z połączonych prób n1 i n2 :
2 2
s1 (n1 -1) + s2 (n2 -1)
2
sn =
n1 + n2 - 2
gdzie �1 i �2 estymaty średnich w badanych próbach losowych.
Test z próby niezależne
Test istotności dla 2 średnich duże próby
Ze względu na dużą liczebność prób możemy założyć, że rozkład
jest zbliżony do normalnego.
Hipoteza zerowa: H0: m1 = m2 (wobec H1: m1 `" m2)
H0 H1
Jeśli H0 jest prawdziwa to statystyka z
H0
�1 - �2
�1 - �2
z =
z =
2 2
s1 / n1 + s2 / n2
( )
ma rozkład normalny N(0,1), gdzie �1 i �2 estymaty średnich w
badanych próbach losowych, zaś zaś s12 i s22 to estymatory
wariancji .
Odrzucamy H0 gdy statystyka testowa z należy do obszaru
H
krytycznego na poziomie istotności ą.
Przykład. W pewnym kraju wykonano badania statystyczne spożycia alkoholu na
dużej liczbie jego mieszkańców (5000), i określono średnie spożycie w wysokości 7
litrów/rok przy odchyleniu standardowym 1 litr/rok. Podobne badanie wykonano dla
300 mieszkańców jednego z regionów (A), gdzie średnia wyniosła 10 l/rok z
odchyleniem standardowym 2 l/rok.
Zbadać czy średnie spożycie alkoholu w regionie A jest równe spożyciu alkoholu w
całym kraju, wobec hipotezy alternatywnej, iż spożycie w regionie A jest istotnie
większe niż w kraju. Poziom istotności ą=0.01.
Rozwiązanie. Przypadek dużych prób statystycznych, stosujemy test z jednostronny:
�1 - �2 10 - 7
�1 - �2 10 - 7
z = = = 25.79
z = = = 25.79
2 2
s1 / n1 + s2 / n2 22 / 300 +12 / 5000
( ) ( )
Hipoteza: H0 : m1=m2 wobec H1 : m1>m2
Dystrybuanta standardowego rozkładu normalnego Ś(u)= P{ U d" u } , dla u<0 obliczaj używając Ś Ś
Ś d" Ś Ś
Ś d" Ś(u) =1 - Ś(-u) fragment
Ś d" Ś Ś
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158 1-ą
Wobec tego, jednostronny (ą=0.01) obszar krytyczny rozkładu normalnego ze"2.33,
skąd wnioskujemy, że średnie się różnią istotnie, i przyjmujemy hipotezę
alternatywną, że w regionie A spożycie alkoholu jest istotnie większe, bowiem
zachodzi relacja z=25.79 > zkryt =2.33
Testy dla prób zależnych (średnie)
Przypominamy, że ten przypadek (prób zależnych), dotyczy sytuacji gdy wyniki
obserwacji zmiennej statystycznej pochodzą z 2 populacji i są w jakikolwiek
sposób zestawione w pary. Najczęściej jest to przypadek prób powiązanych, gdy
eksperyment dotyczył tych samych elementów (obiektów) a zmienna statystyczna
dla każdego z obiektów reprezentuje dwie serie wyników eksperymentów. Takie
zestawienie w pary daje więcej informacji o różnicy wyników badań, niż
informacja jaką otrzymalibyśmy przy wykorzystaniu odrębnych grup obiektów
poddanych eksperymentom (a wtedy stosowalibyśmy test t Studenta dla
zmiennych niepowiązanych prób niezależnych).
Wybór tej metody, gdy eksperymenty stosujemy dla tej samej grupy obiektów,
eliminuje przypadkową zmienność wyników eksperymentów wskutek wpływu
innych czynników różnicujących własności obiektów ( a które mogłyby mieć
wpływ na rozkład zmiennej statystycznej).
Dowodzi się, że dla 2 prób zależnych (Xi, Yi) zmienna losowa zdefiniowana jako:
�ł �ł
D
sr
t = n gdzie Dsr = średnia różnic(Xi-Yi), sD - odchylenie stand. różnic
�ł �ł
sD
�ł łł
ma rozkład t Studenta o n-1 stopniach swobody, gdy hipoteza zerowa (H0: równość
średnich w obu grupach, H1: brak równości średnich) jest prawdziwa ( n jest
liczebnością prób).
Test istotności dla wariancji
Zakładamy, że badana jest populacja, która charakteryzuje się rozkładem
normalnym o nieznanych parametrach N(m,�). Chcemy zweryfikować hipotezę, że
wariancja �2 w tej populacji ma ustaloną wartość �02 (znaną/postulowaną). W tym
celu losuje się n - elementową próbę w badanej populacji i na jej podstawie
wyznacza estymator wariancji s2
n
�ł
s2 =
"(X - X )2 �ł /(n -1)
i
�ł �ł
�ł i=1 łł
Wiadomo, iż statystyka (n-1)*s2/�2 ma rozkład �2 o (n-1) stopniach swobody
(bowiem Xi ma rozkład normalny). Tedy, jeśli prawdziwa jest hipoteza zerowa
(bowiem Xi ma rozkład normalny). Tedy, jeśli prawdziwa jest hipoteza zerowa
2
(n -1)s2
-1
(sformułowana tutaj tak) H0: �2 = �02 , to statystyka postaci
�2 =
2
�0
ma rozkład �2 o n-1 stopniach swobody. Jeśli rzeczywista wariancja w populacji
wynosi �02 , to estymata wariancji z próby s2 powinna być jej bliska, a wtedy
statystyka testowa �2 nie powinna być zbyt duża co do wartości. Nie powinna ona
przekraczać wartości krytycznej �2 wyznaczanej z rozkładu �2 , tak by
ą,n-1
spełniona była relacja P(�2 e" �2 ) = ą. Zatem, odrzucamy hipotezę zerową H0
ą,n-1
wtedy, gdy zachodzi �2 e" �2 . Jeśli ten warunek nie jest spełniony, nie ma
ą,n-1
podstaw do odrzucenia hipotezy zerowej. Ponieważ rozkład �2 jest szybko
zbieżny do rozkładu normalnego ze wzrostem liczby stopni swobody, to dla
n-1>30 możemy obszar krytyczny wyznaczać na podstawie rozkładu normalnego.
Przykład. Na pewnym odcinku trasy dokonano 20 pomiarów szybkości
samochodów. Wariancja szybkości wyniosła s2=81 (km/h)2. Według zasad ruchu
drogowego wariancja szybkości powinna wynosić �02=77 (km/h)2. Zakładając, że
rozkład prędkości samochodów jest normalny, zweryfikować hipotezę, że wariancja
na tym odcinku trasy jest równa wariancji hipotetycznej, wobec hipotezy
alternatywnej, iż jest większa od hipotetycznej, na poziomie istotności 5%.
Rozwiązanie.
Hipoteza H0 : �2= �02 wobec H1: �2>�02 ( test jednostronny)
20 -1 81
20 -1 81
Statystyka testowa:
Statystyka testowa:
(n -1)s ( )
(n -1)s2 ( )
�2 = = = 19.99
�2 = = = 19.99
2
�0 77
Wartość krytyczna z tablic dla ą=0.05 i licz.st.swob.=20-1=19 wynosi �2 =30.14
�
�
�
kryt
Wnioskowanie: obliczona statystyka testowa �2=19.99 jest poza obszarem
krytycznym (mniejsza od �2 ). Wykonane badania nie dają podstawy do
kryt
odrzucenia hipotezy H0 o równości wariancji empirycznej i teoretycznej, przy 5%
marginesie błędu. Obserwowana różnica jest przypadkowa.
Testy istotności dwóch wariancji
Załóżmy, że badane są dwie populacje, o rozkładach normalnych, ale o nieznanych
parametrach (tzn. zm. stat. X ma rozkład N(m1,�1) a zm. Y ma rozkład N(m2,�2) ).
Chcemy zbadać przypuszczenie, że wariancje w obu populacjach są identyczne, czyli
hipoteza zerowa ma postać H0: �12= �22 ( inaczej zapisując mamy �12/�22 =1 ).
� � � �
� � � �
� � � �
Dla zweryfikowania hipotezy pobieramy niezależne próby z obu populacji, i na ich
podstawie wyznaczamy estymatory wariancji s12 (próba o liczebności n1) oraz s22
(liczebność próby n2). Z rozważań teoretycznych wynika, że statystyka
2 2
s1 s2
F = /
2
�2 �2
�1 �2
2
ma rozkład F Snedecora z n1-1 oraz n2-1 stopniami swobody. Stąd wniosek, że jeżeli
rzeczywiście zachodzi warunek �12= �22 (hipoteza zerowa), to zmienna postaci
� �
� �
� �
F= s12/ s22 ma również rozkład F Snedecora, co wykorzystujemy do zdefiniowania
obszaru krytycznego testu. UWAGA do wykorzystania tablic rozkładu F: należy
rozróżnić sposoby określania obszaru krytycznego dla testów 1-stronnych lub 2-
stronnych:
H0: �12= �22 wobec H1: �12`" �22 (dwustronny) F= s12/ s22 (ale zawsze s12>s22 )
� � � `" �
� � � `" �
� � � `" �
obszar krytyczny F>Fkryt(ą
ą/2,n1-1,n2-1)
ą
ą
H0: �12=�22 wobec H1: �12>�22 (jednostronny) F= s12/ s22 , wtedy obszar krytyczny
� � � �
� � � �
� � � �
jest określony jako F>Fkryt(ą
ą,n1-1,n2-1)
ą
ą
Testy istotności dla frakcji
Jeśli zmienna statystyczna w danej populacji przyjmuje tylko 2 dopuszczalne wartości
(mówimy wtedy o zmiennej dychotomicznej). W takiej sytuacji, frakcja elementów
populacji przyjmujących jedną z dopuszczalnych wartości zmiennej statystycznej
v
p = nx / n
nazywana jest wskaznikiem struktury w populacji. Liczbowo, frakcja taka
określa prawdopodobieństwo, że przy jednokrotnym losowaniu elementu populacji,
będzie się on charakteryzował tą właśnie wartością zmiennej dychotomicznej
(odpowiadająca wyróżnionej frakcji).
Zagadnienia testowania struktury populacji można sprowadzić do 2 przypadków:
1) weryfikujemy hipotezę że wskaznik struktury p w populacji ma określoną
(znaną) wartość p0,
(znaną) wartość p0,
2) weryfikujemy hipotezę o równości wskaznika struktury w dwóch badanych
populacjach.
Ad. 1) H0: p=p0 wobec H1: p`" (lub H1: pp0 )
`"p0
`"
`"
v
p = nx / n
statystyka testowa ma asymptotyczny rozkład
N p, p(1 - p) / n
normalny , co przy wystarczająco dużej próbie
( )
pozwala na testowanie hipotezy zerowej względem rozkładu normalnego N(0,1), dla
statystyki testowej z próby obliczonej ze wzoru
v
u = p - p0 / p0(1 - p0) / n
( )
Jeśli wartość statystyki u z próby jest taka, że |u| e" ukryt(ą) odrzucamy H0.
Ad. 2) Przyjmijmy, że p1 oznacza frakcję elementów wyróżnionych z pierwszej
populacji, p2 z drugiej.
H0: p1=p2 wobec H1: p1`"p2 (lub H1: p1 < p2 lub H1: p1 > p2 )
`"
`"
`"
v v
Statystyki z próby: p1 = nx,1 / n1 , p2 = nx,2 / n2
Jeśli H0 jest prawdziwa, to statystyka dana wzorem:
v v v v
u = p1 - p2 / p(1 - p)(1/ n1 + 1/ n2)
( )
ma asymptotyczny rozkład normalny N(0,1), gdzie:
v
p = nx,1 + nx,2 / n1 + n2
( )
( )
Dla testu dwustronnego obszar krytyczny zdefiniowany jest relacją
Dla testu dwustronnego obszar krytyczny zdefiniowany jest relacją
P | u |e" ukryt (ą) = ą
( )
Przykład. Sprawdz, czy wśród pracowników zakładu przynależność do organizacji
społecznej A jest taka sama w grupie robotników (1) i nadzoru (2). Dla weryfikacji
hipotezy zerowej dokonano badań ankietowych: nx,2=180, n2=300, nx,1=400, n1=500
v
p = 580 / 800 = 0.725 u=((180/300)-(400/500))/ 0.725(1-0.725)(1/300+1/500) = -6.13
Dla rozkładu N(0,1) wart. krytyczna na poziomie istotności ą=0.05 wynosi ukr=1.96,
zatem |-6.13|>1.96 statystyka testowa jest w obszarze krytycznym, odrzucamy H0.
Różnica w przynależności do organizacji społecznej A w populacjach jest istotna.

Wyszukiwarka

Podobne podstrony:
STAT 10 W11
STAT 12 W8 Test Niezal
STAT 10 W3
STAT 10 W12
STAT 10 W5
STAT 10 W2
stat zadania1 10
BD W8
WSM 10 52 pl(1)
VA US Top 40 Singles Chart 2015 10 10 Debuts Top 100
10 35

więcej podobnych podstron