STAT 2010 W5


Rozkład Normalny
Zmienna losowa X ma rozkÅ‚ad normalny N(m,Ã) o parametrach m
0.4
oraz à jeÅ›li funkcja gÄ™stoÅ›ci przyjmuje postać:
0.3
ëÅ‚ öÅ‚ 0.2
1 (x - m)2
f (x) = expìÅ‚ - ; à > 0
÷Å‚
2
0.1
2Ã
à 2Ą
íÅ‚ Å‚Å‚
0
-4 -2 2 4
u
Standardowy rozkÅ‚ad normalny charakteryzujÄ… parametry m=0, Ã=1
Wartość oczekiwana
Wartość oczekiwana x
Wariancja:
Wariancja:
ëÅ‚ öÅ‚
ëÅ‚ öÅ‚
1 (t - m)
1 (t - m)2
F(x) = expìÅ‚ -
= -
÷Å‚dt
+"
+" 2
E(X) = m
D2(X) = Ã2
2Ã
à 2Ą
íÅ‚ Å‚Å‚
-"
Jeśli na zjawisko działa duża liczba niezależnych czynników (których
wpływ  każdego z osobna  jest nieznaczny) prowadzi to zawsze do
rozkładu normalnego zmiennej opisującej przebieg takiego
zjawiska.Tzw. Centralne twierdzenie graniczne dowodzi, że przy
dużej liczbie zmiennych losowych ( w granicy ") suma
"
"
"
zmiennych losowych jako nowa zmienna ma w przybliżeniu
rozkład normalny!!!
0.4
Wpływ parametrów
N(m=2,Ã=1)
rozkładu na funkcję
0.3
N(m=2,Ã=2)
gęstości rozkładu
0.2
normalnego
N(m=5,Ã=3)
0.1
0
-5 5 10 15
x
Przykład.
Przykład.
Niech stężenie miedzi pozostającej w żużlu po procesie redukcji w piecu
Niech stężenie miedzi pozostającej w żużlu po procesie redukcji w piecu
elektrycznym ma rozkÅ‚ad normalny N(m=0.5,Ã
Ã=0.25). Oblicz prawdopodobieÅ„stwo,
Ã
Ã
że stężenie miedzi będzie w przedziale ( 0.75 ; 1.0 ] ?
1.6
1.4
Prawdopodobieństwo, to pole żółte
1.2
1
P(0.750.8
0.6 Lub z dystrybuanty
0.4
P(0.750.2
0
-0.5 0.5 1 1.5
x
F(1.0)-F(0.75)
Standardowy-normalny
UWAGA: obliczanie prawdopodobieństwa na podstawie funkcji
gęstości rozkładu normalnego o dowolnej średniej i wariancji może
sprawić dużo kłopotu, bowiem całka nie wyraża się jako skończona
kombinacja funkcji elementarnych. Dla ułatwienia obliczeń
prawdopodobieństwa, w pierwszej kolejności stosuje się
standaryzację (unormowanie) badanego rozkładu.
RozkÅ‚ad normalny ze Å›redniÄ… m = 0 i bÅ‚Ä™dem standardowym Ã=1 jest
tzw. standardowym rozkładem normalnym N(0,1). Zmienna
standardowym rozkładem normalnym
losowa U ma rozkład standardowy gdy dokona się transformacji
dowolnej zmiennej losowej X o rozkÅ‚adzie N(m,Ã):
U = (X m)/ Ã
U = (X m)/ Ã
Ã
Ã
Ã
Ã
Ã
Ã
Funkcje gÄ™stoÅ›ci standardowego rozkÅ‚adu oznaczamy Õ(u), zaÅ›
dystrybuantę tego rozkładu jako Ś(u).
Dawniej, wykorzystywano tablicowane wartoÅ›ci Õ(u) oraz Åš(u) ,
obecnie w obliczeniach komputerowych stosuje siÄ™ odpowiednie
procedury. Przy wyznaczaniu wartoÅ›ci Õ(u) oraz Åš(u) korzysta siÄ™ z
ich wÅ‚asnoÅ›ci: parzystoÅ›ci Õ(u)= Õ( u) oraz Åš(u) = 1 Åš( u) .
Õ(u)= Õ( u) Åš(u) = 1 Åš( u)
Õ Õ Åš Åš
Õ Õ Åš Åš
Õ Õ Åš Åš
Õ Õ Åš Åš
Õ Õ Åš Åš
Õ Õ Åš Åš
Korzystanie z tablic:
P{ }=P{ } =
P{a= Åš( )  Åš((a  m)/Ã)
= Åš((b  m)/Ã)  Åš( )
Åš Åš
Åš Åš
Åš Åš
Åš Åš
Åš Åš
Åš Åš
gdzie wartości Ś((b ) , Ś( )
gdzie wartoÅ›ci Åš(  m)/Ã) , Åš((a  m)/Ã) dostÄ™pne sÄ… w tablicach.
Åš Åš
Åš( ) , Åš((a  m)/Ã) dostÄ™pne sÄ… w tablicach.
Åš((b  m)/Ã) , Åš( )
Åš Åš
Åš Åš
Åš Åš
Åš Åš
Åš Åš
Åš Åš
Åš Åš
Åš Åš
Åš Åš
Åš Åš
Åš Åš
Przykład.
Przykład.
Niech stężenie miedzi pozostającej w żużlu po procesie redukcji w piecu
elektrycznym ma rozkÅ‚ad normalny N(m=0.5,Ã
Ã=0.25). Oblicz prawdopodobieÅ„stwo,
Ã
Ã
że stężenie miedzi będzie w przedziale ( 0.75 ; 1.0 ] ?
ua=(0.75-0.5)/0.25=1 , ub=(1-0.5)/0.25=2
Åš(ua=1)=0.84134 Åš(ub=2)=0.97725
Åš( )=0.84134 Åš( )=0.97725
Åš Åš
Åš Åš
Åš Åš
Åš Åš
Åš Åš
Åš Åš
P{ }= P{ua }= Åš( ) Åš(ua)= =0.136
P{0.75Åš Åš
Åš Åš
Åš Åš
Åš Åš
Åš Åš
Åš Åš
Dystrybuanta standardowego rozkładu normalnego Ś(u)= P{ U d" u } , dla u<0 obliczaj używając Ś Ś
Åš d" Åš Åš
Åš d" Åš(u) =1 - Åš(-u)
Åš d" Åš Åš
u=1
u=1.9+0.06
u=2
P=0.975
Przykład.
Przykład.
Niech stężenie miedzi pozostającej w żużlu po procesie redukcji w piecu
elektrycznym ma rozkład normalny N(m=0.5,à Oblicz
Ã=0.25).
Ã
Ã
prawdopodobieństwo, że
1) stężenie miedzi będzie większe od 1.0 (%)
2) stężenie miedzi będzie mniejsze od 0.1 (%)
3) Stężenie miedzi będzie się różnić od średniej m=0.5 nie więcej niż dwa
odchylenia standardowe
ODP.
1) u =(1-0.5)/0.25=2
1) ua=(1-0.5)/0.25=2
P{ X>1 } = P{ U > 2 } = 1 Åš(2) = 1 0.97725=0.02275 (2.3%)
(2.3%)
2) ub=(0.1-0.5)/0.25= -0.4/0.25=  1.6
P{ Xd" 0.1} = P{ U d" 1.6} = Åš( 1.6)
W tablicach jest Åš(1.6) = 0.9452, stÄ…d Åš( 1.6) = 1 Åš(1.6)=1  0.9452 = 0.0548
P{ Xd" 0.1} = 0.0548 (5.5%)
(5.5%)
3) Interesuje nas prawdopodobieÅ„stwo, że |X m| d" 2à . Nierówność ta jest
Ã
Ã
Ã
równoważna 2 nierównoÅ›ciom:  2à < X m d" 2à . Doprowadzamy do
à Ã
à Ã
à Ã
normalizacji zmiennej, drogą wydzielenia przez à :  2 < (X m) / à d" 2
à Ã
à Ã
à Ã
P{|X 0.5| d" 2*0.25 } = P{ -2 < U d" 2 }= Åš(2)  Åš( 2)=0.97725 (1 0.97725)=0.9545
Wyniki ostatniego przykładu można uogólnić dla rozkładu
normalnego o średniej m i odchyleniu standardowym à :
P{|X-m|d" à }=P{ 1P{|X-m|d" 2Ã}=P{ 2P{|X-m|d" 3Ã}=P{ 3Teoremat Czebyszewa dla dowolnego rozkÅ‚adu daje nieco gorsze
oszacowania : dla 2Ã wartość 75%, zaÅ› dla 3Ã wartość 89%.
Zagadnienie z analizowanego przykładu można odwrócić, i zapytać
Zagadnienie z analizowanego przykładu można odwrócić, i zapytać
jakie powinno być k, w wyrażeniu kÃ, aby prawdopodobieÅ„stwo, iż
zmienna losowa X o rozkÅ‚adzie N(m,Ã) przyjmowaÅ‚a wartoÅ›ci
odbiegajÄ…ce mniej od Å›redniej niż kÃ, miaÅ‚o dokÅ‚adnie ustalonÄ… z
góry wartość?
Tzn. ile wynosi k aby P{|X-m|d" kÃ} = Pzadane
Tzn. ile wynosi k aby P{|X-m|d" kÃ} = Pzadane
d" Ã
d" Ã
d" Ã
d" Ã
d" Ã
d" Ã
Przy czym w ogólności k może przyjmować nie tylko wartości
całkowite ale także ułamkowe.
Przykład.
Przykład. Niech stężenie miedzi pozostającej w żużlu po procesie redukcji w piecu
elektrycznym ma rozkÅ‚ad normalny N(m=0.5,Ã
Ã=0.25). Oblicz granice przedziaÅ‚u
Ã
Ã
wartości stężenia miedzi w żużlu, tak byśmy mieli pewność, że 95% rezultatów
wytopów będzie się mieściło w tym przedziale stężenia, a tylko 5% wytopów nie
spełniało tego postulatu.
Nasze zagadnienie polega a wyznaczeniu takiej wartości granicznej uą,
Ä…
Ä…
Ä…
że: P{|U|d" uÄ…}=0.95 gdzie U = (X-m)/Ã .
Ä…
Ä…
Ä…
Zwykle Pzadane=1 Ä… ,
0.4
stąd pola żółte reprezentują
stąd pola żółte reprezentują
0.3
wartość ą/2 (symetria)
P{U< uÄ…}= Ä…/2
Ä… P{U>uÄ…}= Ä…/2
Ä…
Ä…
Ä…
Ä…
Ä…
0.2
a pole położone centralnie
wartość 1 ą
0.1
P{|U|d" uÄ…}= 1 Ä…
Ä…
Ä…
Ä…
0
-4 -2 0 2 4
u
 uÄ… uÄ…
Ä… Ä…
Ä… Ä…
Ä… Ä…
Interpretując w/w wykres, wiemy że pole odpowiadające warunkowi
P{U>uą}= ą/2 można obliczyć z dystrybuanty: Ś(uą) = 1 ą/2
Ä… Ä…
Ä… Ä…
Ä… Ä…
Aby rozwiązać zadanie liczbowo , musimy odwołać się do tablic standardowego
rozkładu normalnego. Mamy zatem:
dla Pzadane= 0.95 = 1 0.05 skÄ…d parametr Ä…=0.05 czyli Åš(uÄ…) = 1 Ä…/2=0.975
Ä…
Ä…
Ä…
W tablicach dystrybuanty szukamy wartości zbliżonej do 0.975 i odczytujemy
wartość odpowiadającą jej wartość u: uą= 1.96
uÄ…= 1.96
Ä…
Ä…
Ä…
Ä…
Ä…
Ä…
Nierówność |U|d" uÄ… jest równoważna zapisowi:  uÄ… <(X-m)/Ã d" uÄ… czyli
Ä… Ä… Ä…
Ä… Ä… Ä…
Ä… Ä… Ä…
|U|d" uÄ… Ô!  uÄ… Ã < (X-m) d" uÄ… Ã Ô! m  uÄ… Ã < X d" m + uÄ… Ã
Ä… Ä… Ä… Ä… Ä…
Ä… Ä… Ä… Ä… Ä…
Ä… Ä… Ä… Ä… Ä…
Szukany przedział wartości stężenia , gdzie lokować się będzie 95% wszystkich
Szukany przedział wartości stężenia , gdzie lokować się będzie 95% wszystkich
wytopów , wynosi
0.5  1.96 *0.25 < X d" 0.5 + 1.96 *0.25
0.01 < X d" 0.99
0.01 < X d" 0.99
d"
d"
d"
d"
d"
d"
Rozważania podjęte w tym przykładzie mają doniosłe znaczenie
przy testowaniu hipotez statystycznych, do czego wrócimy w
dalszym ciągu materiału.
RozkÅ‚ad Ç2
Ç
Ç
Ç
Jeśli X1,X2,...,Xk sa zmiennymi niezależnymi losowymi o rozkładzie
k
normalnym N(0,1), to zmienna losowa
2
Ç = Xi2
"
i=1
ma rozkład o funkcji gęstości prawdopodobieństwa
f (x) = xk / 2-1e- x / 2 / 2k / 2“(k / 2) dla x > 0 ; f (x) = 0 dla x d" 0
( )
gdzie k nazywamy liczbÄ… stopni swobody zmiennej Ç2 .
Dla k" rozkład zmierza do rozkładu normalnego N(0,1). Jeśli
Dla k" rozkład zmierza do rozkładu normalnego N(0,1). Jeśli
k>30 rozkład normalny wystarczająco dobrze przybliża ten rozkład.
0.2 Rozkład ma doniosłe znaczenie dla:
k=4
-testowania hipotez statystycznych
0.15
k=8
oraz
0.1
k=16
-szacowania przedziału ufności dla
0.05
wariancji rozkładów empirycznych.
0
2 4 6 8 10 12 14 16
u
WartoÅ›ci krytyczne Ç2(Ä…,k) rozkÅ‚adu Ç2 dla okreÅ›lonej liczby stopni swobody
k i prawdopodobieÅ„stwa Ä… = P{Ç2e" Ç2(Ä…,k)}
Ä…
2
2
Ç
(
Ä…
,k)
Rozkład Studenta
Jeśli X1,X2,...,Xn są zmiennymi niezależnymi losowymi o rozkładzie
1
normalnym N(m,Ã), to zmienna losowa T
T = X - m
( )
s / n -1
ma rozkład o funkcji gęstości prawdopodobieństwa
k +1
-(k +1)/ 2
“( )
2 x2
f (x) = 1+
( )
k
k
kÄ„ “( )
2
gdzie k=n 1 nazywamy liczbÄ… stopni swobody zmiennej T , s jest
odchyleniem standardowym próby.
odchyleniem standardowym próby.
Dla dużych wartości k rozkład zmierza do rozkładu normalnego.
0.4
k=3
N(0,1)
Zastosowanie:
0.3
- szacowanie przedziału ufności małych
0.2
próbek (n<30)
0.1
- testowanie hipotez statystycznych
0
-5 5
t
Wartości krytyczne t(ą,k) rozkładu Studenta dla określonej liczby stopni
swobody k i prawdopodobieństwa ą=P{|t|e"t(ą,k)}
Ä…
/2
t (
t (
Ä…
,k)
Ä…
/2
 t (
Ä…
,k)
Rozkład F Snedecora
Jeśli X1,X2 są zmiennymi niezależnymi losowymi o rozkładzie
2 2
normalnym N(m1,Ã1) oraz N(m2,Ã2) , to zmienna losowa F
s1 /Ã1
F =
2 2
s2 /Ã2
ma rozkład F-Snedecora o funkcji gęstości prawdopodobieństwa
k1 / 2 -(k1 +k2 )/ 2
k1 +k2
ëÅ‚ öÅ‚ ëÅ‚ öÅ‚
“( ) k1 k1
2
1
f (x) = x(k -2) / 2 ìÅ‚1+ x
ìÅ‚ ÷Å‚
k1 k2
k2 k2 ÷Å‚
“( )“( )
íÅ‚ Å‚Å‚ íÅ‚ Å‚Å‚
2 2
gdzie k1=n1 1 i k2= n2 1 sÄ… stopniami swobody , zaÅ› n1 i n2
2 2
liczebnościami prób pobranych z obu populacji, zaś s i s
liczebnościami prób pobranych z obu populacji, zaś s12 i s22
wariancjami z prób.
0.7
0.6
Zastosowanie:
0.5
0.4 - testowanie hipotez statystycznych
0.3
0.2
0.1
0
1 2 3 4 5
u
Wartości krytyczne F(ą,k1,k2) rozkładu F-Snedecora dla określonej liczby
stopni swobody k1 i k2 prawdopodobieństwa ą=0.05=P{F e" F(ą,k1,k2) }
Ä…
F(Ä…,k1,k2)
Estymacja
Estymacja
Estymacja  wnioskowanie o postaci rozkładu populacji generalnej
na podstawie obserwacji w próbie losowej.
Inaczej mówiąc szacowanie wartości parametrów (lub postaci rozkładu zmiennej
losowej) na podstawie postaci rozkładu empirycznego określonego dla pobranej
próby losowej.
Estymacja parametryczna  szacowanie wartości parametrów
rozkładu populacji generalnej.
rozkładu populacji generalnej.
Estymacja nieparametryczna  szacowanie postaci funkcyjnej
rozkładu populacji generalnej.
Estymacja punktowa  szacowanie wartości parametru
Estymacja przedziałowa  szacowanie przedziału wartości
parametru, w którym z odpowiednim prawdopodobieństwem
zawiera się wartość szacowanego parametru
Estymacja punktowa
Estymator
Estymator to statystyka z próby losowej służąc do szacowania
wartości parametru populacji generalnej
Estymatorem nieobciążonym T jest estymator którego wartość
oczekiwana jest równa wartoÅ›ci parametru rozkÅ‚adu: E(T)=¸
W przeciwnym wypadku (brak równości) estymator jest obciążony.
obciążony
Wartość średnia z próby jest nieobciążonym estymatorem średniej
n
1
dowolnego rozkładu.
µ = Xi
"
n
i=1
Nieobciążonym estymatorem wariancji populacji jest :
n
2
1
s2 = Xi - X
( )
"
n-1
i=1
Estymacja przedziałowa
Niech cecha X ma w populacji generalnej rozkład o nieznanym
parametrze ¸. Na podstawie próby losowej X1,X2,...,Xn wyznaczono
2 funkcje ¸1(X1,X2,...,Xn ) i ¸2(X1,X2,...,Xn ) , takie że ¸1< ¸2, oraz
dla z góry założonego prawdopodobieństwa o wartości (1 ą) jest:
P{¸1< ¸ < ¸2 } = 1 Ä…
PrzedziaÅ‚ (¸1,¸2) nazywamy przedziaÅ‚em ufnoÅ›ci parametru ¸, zaÅ›
przedziałem ufności
prawdopodobieństwo (1 ą) poziomem ufności
prawdopodobieństwo (1 ą) poziomem ufności.
poziomem ufności
poziomem ufności.
Przedział ufności średniej
PrzedziaÅ‚ ufnoÅ›ci Å›redniej w rozkÅ‚adzie normalnym N(m,Ã) :
ëÅ‚ à à öÅ‚
-nie znane m, znane Ã
X - uÄ… ; X + uÄ…
ìÅ‚ ÷Å‚
n n
íÅ‚ Å‚Å‚
-nie znane m i Ã
ëÅ‚ s s öÅ‚
X - tÄ… ,n-1 ; X + tÄ… ,n-1 ÷Å‚
ìÅ‚
n n
íÅ‚ Å‚Å‚
gdzie
uÄ… wyznacza siÄ™ z P{ |U|e" uÄ…}= Ä… Ô! P{  uÄ…korzystajÄ…c z tablic dystrybuanty N(0,1)
korzystajÄ…c z tablic dystrybuanty N(0,1)
tÄ…,n-1 wyznacza siÄ™ z P{ |t|e" tÄ…,n-1}= Ä… Ô! P{  tÄ…,n-1korzystajÄ…c z tablic wartoÅ›ci krytycznych rozkÅ‚adu t-Studenta
Gdy a priori typ rozkładu nie jest znany, a próba jest wystarczająco
duża (np. n>30) wyznaczamy przedział ufności jak w przypadku
znanej wartoÅ›ci Ã, w jej miejsce używajÄ…c odchylenie standardowe
próby s. ëÅ‚ s s öÅ‚
X - uÄ… ; X + uÄ…
ìÅ‚ ÷Å‚
n n
íÅ‚ Å‚Å‚
Przedział ufności wariancji
Załóżmy, że populacja generalna ma rozkÅ‚ad normalny N(m,Ã) o
nieznanych parametrach m,Ã . Pobrano próbÄ™ n elementowÄ….
n
2
Obliczono nieobciążony estymator wariancji
1
s2 = Xi - X
( )
"
n-1
i=1
(n -1)s2
2
Dowodzi siÄ™, że zmienna Ç = ma rozkÅ‚ad chi-
2
Ã
kwadrat o n-1 stopniach swobody.
Przedział ufności na poziomie ufności (1-ą
Przedział ufności na poziomie ufności (1-ą jest następujący:
ą) jest następujący:
Ä…)
Ä…
Ä…
Ä…
Ä…
ëÅ‚
(n -1)s2 (n -1)s2 öÅ‚
;
ìÅ‚ ÷Å‚
2 2
ìÅ‚
ÇÄ… / 2,n-1 Ç1-Ä… / 2,n-1 ÷Å‚
íÅ‚ Å‚Å‚
gdy estymator wariancji s2 jest nieobciążony, zaś gdy jest
obciążony stosujemy
ëÅ‚ öÅ‚
ns2 ns2
;
ìÅ‚ ÷Å‚
2 2
ìÅ‚
ÇÄ… / 2,n-1 Ç1-Ä… / 2,n-1 ÷Å‚
íÅ‚ Å‚Å‚
2
2
Ç1-Ä… / 2,n-1
WartoÅ›ci ÇÄ… / 2,n , odczytujemy z tablic rozkÅ‚adu chi-kwadrat.
-1
Jeżeli próba losowa jest bardzo duża ( n > 100) i obliczone na
podstawie wyników próby odchylenie standardowe wynosi s ( na
podstawie estymatora wariancji  może być nawet obciążony,
bowiem jest asymptotycznie zbieżny do nieobciążonego), to
przedział ufności (1-ą) odchylenia standardowego populacji można
budować na podstawie rozkładu Gauss a :
ëÅ‚ öÅ‚
s s
;
ìÅ‚ ÷Å‚
ìÅ‚ ÷Å‚
ìÅ‚ ÷Å‚
1 + u / 2n 1 - u / 2n
1 + uÄ… / 2 / 2n 1 - uÄ… / 2 / 2n
íÅ‚ Å‚Å‚
íÅ‚ Å‚Å‚
gdzie uą/2 oznacza wartość zmiennej standaryzowanej o rozkładzie
normalnym N(0,1).
Uwaga: Wynika to z faktu, że dla dużej liczby stopni swobody,
rozkład chi-kwdrat zbliża się do rozkładu normalnego.


Wyszukiwarka