STAT wyklad3


1
STATYSTYKA MATEMATYCZNA I PODSTAWY EKSPERYMENTU
dr inż Krzysztof Bryś
wyklad 3,4
Statystyka - poj¸ wst¸
ecia epne
populacja - caly zbiór badanych przedmiotów lub wartości.
próba - skończony podzbiór populacji podlegajacy badaniu.
¸
próba losowa - próba losowana (najcz¸Å›ciej) zgodnie z rozkladem równomiernym, tzn. wylosowanie
e
każdej próby jest jednakowo prawdopodobne.
cechy: mierzalne, niemierzalne
badana cecha = zmienna losowa X
Poszukiwany: rozklad cechy w populacji = rozklad zmiennej losowej X
próba n-elementowa = ciag n niezależnych zmiennych losowych (X1, . . . , Xn) o jednakowym rozkladzie
¸
(takim jak poszukiwany rozklad zmiennej losowej X).
Etapy badania statystycznego
1) Przygotowanie (formatowanie) badania (określenie celu, rodzaju, potrzebnych parametrów wejściowych
badania).
2) Przeprowadzenie badania (wylosowanie próby i określenie wartości badanych cech w próbie).
3) Zebranie uzyskanych podczas badania danych.
4) Opis i wnioskowanie statystyczne (obliczenie parametrów, estymacja, weryfikacja hipotez).
5) Przedstawienie wyników.
Szeregi statystyczne
1) Szereg wyliczaj¸ uporz¸
acy adkowany: (x1, x2, . . . , xn)
przy czym x1 d" x2 d" . . . d" xn.
2) Szereg rozdzielczy punktowy: (x1, x2, . . . , xk), (n1, n2, . . . , nk),
gdzie x1 < x2 < . . . < xk oraz dla każdego i = 1, 2, . . . , k: ni-liczba realizacji (obserwacji) wartości xi,
k
ni = n.
i=1
3) Szereg rozdzielczy przedzialowy: (y0; y1 >, (y1; y2 >, . . . , (yk-1; yk), (n1, n2, . . . , nk),
gdzie y0 < y1 < y2 < . . . < yk-1 < yk oraz dla każdego i = 1, 2, . . . , k: ni-liczba realizacji (obserwacji) wartości
k
należ¸ do przedzialu (yi-1; yi), ni = n.
acej
i=1
Wszystkie wartoÅ›ci należ¸ do przedzialu (yi-1; yi >, i = 1, 2, . . . , k utożsamia si¸ z jego Å›rodkiem xi.
ace e
"
Reguly wyznaczania liczby przedzialów (klas): k H" n, k d" 5 log n.
Parametry empiryczne
Miary polożenia rozkladu
1) Średnia z próby x
- dla szeregu wyliczaj¸
acego:
n
1
x = xi
n
i=1
- dla szeregu rozdzielczego:
k
1
x = ni · xi
n
i=1
2
2) Dominanta (moda, wartość modalna) D = punkt, w którym funkcja prawdopodobieństwa osiaga
¸
najwi¸ a wartość
eksz¸
- dla szeregu wyliczaj¸ najcz¸Å›ciej wyst¸ aca wartość,
acego: e epuj¸
- dla szeregu rozdzielczego punktowego: punkt, dla którego liczebność (cz¸ osiaga najwi¸ a wartość,
estość) ¸ eksz¸
- dla szeregu rozdzielczego przedzialowego (wzór interpolacyjny):
nd - nd-1
D = x0d + · hd,
(nd - nd-1) + (nd - nd+1)
gdzie
x0d - pocz¸ przedzialu zawieraj¸ dominant¸ (przedzialu o najwiekszej liczebnoÅ›ci),
atek acego e
hd - szerokość przedzialu zawierajacego dominant¸ (przedzialu o najwiekszej liczebnoÅ›ci),
¸ e
nd - liczebność przedzialu zawieraj¸ dominant¸ (najwieksza liczebność),
acego e
nd-1 - liczebność przedzialu poprzedzajacego przedzial zawierajacy dominant¸
¸ ¸ e,
nd+1 - liczebność przedzialu nast¸ po przedziale zawierajacym dominant¸
epnego ¸ e.
3) Dystrybuanta empiryczna (cz¸ skumulowana Fn(x)
estość
- dla szeregu wyliczaj¸
acego:
1
Fn(x) = |{i : xi < x, i = 1, . . . , n}|
n
- dla szeregu rozdzielczego:
ni
Fn(x) =
n
i:xi4) Kwantyl empiryczny rz¸ p xp,n:
edu
(punkt w którym dystrybuanta empiryczna po raz pierwszy osiaga wartość niemniejsz¸ niż p)
¸ a
- dla szeregu wyliczaj¸
acego:
xp,n = x np
- dla szeregu rozdzielczego punktowego:
r
ni
xp,n = xq gdzie q = min{r : p d" }
n
i=1
- dla szeregu rozdzielczego przedzialowego (wzór interpolacyjny):
hp
xp,n = x0p + (np - ni) · ,
np
xigdzie
x0p - pocz¸ przedzialu zawieraj¸ xp,n (przedzialu w którym dystrybuanta empiryczna po raz pierwszy
atek acego
osiaga wartość niemniejsz¸ niż p),
¸ a
hp -szerokość przedzialu zawierajacego xp,n,
¸
np -liczebność przedzialu zawierajacego xp,n,
¸
ni - liczebność skumulowana dla przedzialu poprzedzajacego przedzial zawierajacy xp,n (suma liczebności
¸ ¸
xiprzedzialów poprzedzaj¸
acych)
1
Mediana: Me = kwantyl rz¸
edu
2
1
Kwartyl dolny: Q1 = kwantyl rz¸
edu
4
3
Kwartyl górny: Q3 = kwantyl rz¸ .
edu
4
Miary rozproszenia rozkladu
5) Wariancja z próby s2
- dla szeregu wyliczaj¸
acego:
n
1
s2 = (xi - x)2
n
i=1
3
- dla szeregu rozdzielczego:
k
1
s2 = ni · (xi - x)2
n
i=1
"
6) Odchylenie standardowe z próby s = s2.
s
7) Wspólczynnik zmiennoÅ›ci V = · 100%.
x
8) Rozst¸ R = różnica mi¸ najwi¸ a i najmniejsz¸ wartoÅ›cia w próbie.
ep edzy eksz¸ a ¸
9) Wspólczynnik asymetrii As:
- dla szeregu wyliczaj¸
acego:
n
1 1
As = · ( (xi - x)3)
s3 n
i=1
- dla szeregu rozdzielczego:
k
1 1
As = · ( ni · (xi - x)3)
s3 n
i=1
10) Kurtoza (wspólczynnik skupienia) As:
- dla szeregu wyliczaj¸
acego:
n
1 1
K = · ( (xi - x)4)
s4 n
i=1
- dla szeregu rozdzielczego:
k
1 1
K = · ( ni · (xi - x)4)
s4 n
i=1
11) Wspólczynnik skośności A1:
x - D
A1 =
s
Estymacja punktowa
estymator parametru Ś - statystyka (funkcja próby), której wartość zależy od rzeczywistej wielkości
parametru Åš rozkladu populacji.
estymacja punktowa - szacowanie nieznanej wartości parametru Ś na podstawie próby; polega na
wyznaczeniu z próby wartości un estymatora Un parametru Ś i przyjmowaniu tej wartości za oszacowanie Ś.
Estymatory wartości oczekiwanej: średnia z próby x, mediana z próby x0.5,n.
n
Estymatory wariancji: wariancja z próby s2, s2 = s2 (lepszy dla rozkladu N(m, Ã)).
1
n-1
Estymacja przedzialowa
Przedzialem ufnoÅ›ci dla parametru ¸ na poziomie ufnoÅ›ci 1 - Ä… nazywamy przedzial (¸1, ¸2)
spelniaj¸ warunki
acy
a) ¸1, ¸2 s¸ funkcjami próby,
a
b) P (¸1 < ¸ < ¸2) = 1 - Ä…
Uwagi:
1) Przedzial ufnoÅ›ci zmienia si¸ wraz z prób¸
e a.
4
2) Nieznana wartość parametru może być albo nie być w utworzonym przedziale ufności.
3) Mozna stworzyć nieskończenie wiele przedzialów ufności na danym poziomie ufności.
4) Cz¸ wyst¸
estość epowania prób, dla których zbudowany przedzial ufności na poziomie ufności 1 - ą zawiera
nieznan¸ wartość parametru ¸ wynosi w przybliżeniu 1 - Ä… (dla  dużej liczby próbek).
a
Konstrukcja przedzialu ufności:
1) Wybieramy estymator Un = Un(¸), którego rozklad dokladny lub asymptotyczny jest znany.
2) Dla danego Ä… " (0, 1) dobieramy liczby a, b tak aby P (a d" Un d" b) = 1 - Ä…. (najcz¸Å›ciej dobieramy
e
Ä…
symetrycznie tzn. tak by P (Un < a) = P (Un > b) = )
2
3) JeÅ›li nierówność a d" Un d" b da si¸ zast¸ przez ¸1 d" ¸ d" ¸2, to przedzial ufnoÅ›ci jest postaci: (¸1, ¸2)
e apić
Zagadnienie minimalnej liczności próby
Niech "-maksymalny dopuszczalny blad oszacowania (maksymalny dopuszczalny promień przedzialu
¸
ufności).
- przy szacowaniu wartości oczekiwanej m
"
Ä…
Korzystamy z Modelu 3 (zakladaly, ze n e" 100): PromieÅ„ przedzialu ufnoÅ›ci=u1- Ã/ n d" " a zatem
2
Ä…
n e" (u1- Ã/")2
2
- przy szacowaniu wskaznika struktury p (prawdopodobieństwa sukcesu w schemacie Bernoul-
liego)
Zn Zn
Zn Zn
(u1- Ä… )2· (1- )
n n
n n 2
Ä…
Promień przedzialu ufności= u1- (1- ) d" " a zatem n e" .
n "2
2
Przypuszczalna wartość p:
Zn
p0 = jest wyznaczana z badania wst¸ (pilotażowego), szacowana na podstawie wyników poprzednich
epnego
n
1
badaÅ„ lub przyjmuje si¸ p0 = .
e
2
Weryfikacja hipotez statystycznych za pomoc¸ testów istotnoÅ›ci.
a
hipoteza statystyczna- przypuszczenie dotycz¸ nieznanego rozkladu badanej cechy populacji.
ace
hipoteza parametryczna- hipoteza statystyczna dotycz¸ wartoÅ›ci parametru rozkladu badanej cechy.
aca
weryfikacja- odpowiedz na pytanie czy hipoteza statystyczna jest prawdziwa.
test statystyczny- regula post¸ adkowuje decyzj¸ przyj¸ lub
epowania, która danej próbie przyporz¸ e ecia
odrzucenia badanej hipotezy
H0- hipoteza zerowa (podlega badaniu)
H1- hipoteza alternatywna
test istotnoÅ›ci- test statystyczny, w którym wnioskowanie odbywa si¸ przy zalożeniu, że hipoteza H0
e
jest prawdziwa. Pozwala jedynie odrzucić H0 (tzn. przyjać H1).
¸
W przypadku weryfikacji hipotez za pomoc¸ testów istotnoÅ›ci wskazane jest stawianie jako H0 hipotez co
a
do których zachodzi podejrzenie o ich falszywości!
Typy bl¸ popelnianych przy weryfikacji hipotez:
edów
bl¸ 1-go rodzaju - odrzucenie prawdziwej hipotezy H0
ad
bl¸ 2-go rodzaju - przyj¸ falszywej hipotezy H0
ad ecie
poziom istotnoÅ›ci Ä… - prawdopodobieÅ„stwo popelnienia bl¸ 1-go rodzaju
edu
² - prawdopodobieÅ„stwo popelnienia bl¸ 2-go rodzaju
edu
moc testu = 1 - ² - prawdopodobieÅ„stwo odrzucenia falszywej hipotezy H0.
5
Jedyny blad jaki można popelnić weryfikuj¸ hipotez¸ za pomoc¸ testu istotnoÅ›ci to blad 1-go rodzaju!
¸ ac e a ¸
Zbiór krytyczny W - zbiór wartości taki, że przy zalożeniu, że H0 jest prawdziwa: P (un " W ) = ą,
gdzie un-obliczona wartość statystyki testowej
W praktyce Ä… "< 0.01; 0.1 >.
Uwagi:
1) Przy zalożeniu, że H1 prawdziwa: P (un " W ) > ą
2) Jeśli na poziomie istotności ą1 odrzucamy H0, to na poziomie ą2 < ą1 może nie być podstaw do odrzucenia
H0.
Algorytm weryfikacji hipotez za pomoc¸ testu istotnoÅ›ci:
a
1. Wybieramy model.
2. Obliczamy wartość statystyki testowej un.
3. Budujemy zbiór krytyczny W (w zależności od postaci H1).
4. Jeśli un " W , to odrzucamy H0 na poziomie istotności ą. W przeciwnym przypadku mówimy, że nie ma
podstaw do odrzucenia H0.
krytyczny poziom istotnoÅ›ci Ä…k - poziom: istotnoÅ›ci, przy którym nast¸ zmiana decyzji weryfika-
epuje
cyjnej:
jeśli ą < ąk to mówimy, że nie ma podstaw do odrzucenia H0 na poziomie istotności alpha
jeśli ą > ąk to odrzucamy H0 na poziomie istotności ą.
Testy zgodności
Sluż¸ do weryfikacji zgodnoÅ›ci pomi¸ rozkladem zbioru wartoÅ›ci w próbie a pewnym teoretycznym
a edzy
rozkladem prawdopodobieÅ„stwa o dystrybuancie F0 (g¸ prawdopodobieÅ„stwa f0).
estości
Weryfikowana hipoteza ma postać:
H0 : F = F0 albo H0 : f = f0
przeciw
H1 : F = F0 albo H1f = f0,

gdzie F - nieznana dystrybuanta (f - nieznana g¸ prawdopodobieÅ„stwa) zmiennej losowej X reprezen-
estość
tuj¸ badan¸ cech¸
acej a e.
Test zgodności chi-kwadrat Pearsona
Dzielimy zbiór wartości danej próby na rozlaczne przedzialy I1, . . . , Ik. Przy zalożeniu, że hipoteza H0
¸
jest prawdziwa,
pj = P (X " Ij) = F0(Ä…j) - F0(Ä…j-1), gdzie Ij = (Ä…j-1; Ä…j) dla j = 1, . . . , k.
Obliczamy wartość statystyki testowej:
k
(nj - npj)2
Ç2 = ,
npj
i=1
k
gdzie nj jest liczb¸ obserwacji należ¸ do przedzialu Ij, które zaobserwano w próbie, n = nj jest
a acych
j=1
liczb¸ wszystkich obserwacji w próbie, npj nazywamy hipotetyczn¸ liczb¸ obserwacji z przedzialu Ij (jest to
a a a
liczba obserwacji, które powinny należeć do Ij gdyby H0 byla prawdziwa).
JeÅ›li obliczona wartość statystyki Ç2 należy do zbioru krytycznego W = (Ç2(Ä…, k - 1); +"), to odrzucamy
H0 : F = F0 i przyjmujemy H1 : F = F0. W przeciwnym przypadku mówimy, że nie ma podstaw do

odrzucenia H0.


Wyszukiwarka

Podobne podstrony:
Stat wyklad2 11 na notatki
Stat wyklad3 11 na notatki
1 stat wyklad
stat wyklad1,2
Podstawy stat wyklad(1)
Stat wyklad4 11 na notatki
Stat LWZ LZZ wyklad1
Sopot stat 11 wyklad 9 Analiza kowariancji i ogolny model liniowy
wyklad stat 2
stat biot wyklady z mat
wyklad stat 3
4 Stat niewyz wykład
wyklad stat 4
Sieci komputerowe wyklady dr Furtak
Wykład 05 Opadanie i fluidyzacja

więcej podobnych podstron