Temat 5 I Weryfikacja modelu regresji liniowej

Autor opracowania: Marek Walesiak
5. WERYFIKACJA MODELU
REGRESJI LINIOWEJ
JEDNEJ ZMIENNEJ OBJAŚNIAJCEJ
5.1. Procedura weryfikacji statystycznej i merytorycznej
(weryfikacja hipotez modelu ekonomicznego)
5.2. Procedura weryfikacji statystycznej wybrane elementy
5.2.1. Badanie normalności rozkładu składnika losowego
5.2.2. Badanie istotności współczynników regresji
1
Autor opracowania: Marek Walesiak
1. Teoria ekonomiczna
lub model ekonomiczny
2. Formułowanie modelu
ekonometrycznego: dobór
Dane
zmiennych, dobór postaci
analitycznej, specyfikacja założeń
3. Estymacja
4. Weryfikacja hipotez
statystycznych i diagnostyka
modelu ekonometrycznego
Czy model
ekonometryczny jest
odpowiedni?
5. Weryfikacja hipotez
modelu ekonomicznego
6. Wykorzystanie modelu
ekonometrycznego
Schemat kroków w ekonometrycznej analizie modeli ekonomicznych
yródło: opracowano na podstawie pracy: Maddala [2006], s. 37.
2
T
Nie
a
k
Autor opracowania: Marek Walesiak
5.1. PROCEDURA WERYFIKACJI STATYSTYCZNEJ
I MERYTORYCZNEJ (WERYFIKACJA HIPOTEZ
MODELU EKONOMICZNEGO)
A. Weryfikacja merytoryczna weryfikacja hipotez modelu eko-
nomicznego. Czy otrzymane rezultaty są zgodne z wiedzą o
badanych zjawiskach płynącą z teorii ekonomii i zdrowym
rozsądkiem.
B. Weryfikacja statystyczna i diagnostyka modelu ekonometrycz-
nego. Określenie, czy wyniki są zgodne z teorią statystyki.
3
Autor opracowania: Marek Walesiak
Procedura weryfikacji merytorycznej modelu ekonometrycz-
nego polega na sprawdzeniu m.in.:
czy znaki parametrów modelu są sensowne,
czy skala parametrów jest do przyjęcia,
czy model można sensownie ekstrapolować.
4
Autor opracowania: Marek Walesiak
Procedura weryfikacji statystycznej:
1. Badanie rozkładu składnika losowego (a właściwie rozkładu
reszt) w celu zweryfikowania słuszności założeń, które leżały u
podstaw wyboru metody estymacji parametrów strukturalnych.
Weryfikacja założeń MNK:
1.1. Składnik losowy � ma T-wymiarowy rozkład normalny
2
N(0,� I). Założenie to pozwala na weryfikację hipotez staty-
stycznych.
1.2. Dla wszystkich t `" q (t,q =1,K,T ) składniki losowe są
nieskorelowane (nie występuje autokorelacja składników loso-
wych).
1.3. Składnik losowy dla wszystkich t ma stałą i skończoną
wariancję (składnik losowy jest homoskedastyczny).
Niesferyczność (heteroskedastyczność, autokorelacja) składni-
ka losowego oznacza utratę efektywności MNK-estymatora.
1.4. Postać analityczna modelu jest liniowa względem parame-
trów strukturalnych i zmiennej objaśniającej.
2. Zbadanie istotności współczynników regresji (test F, test t)
3. Zbadanie stopnia przylegania modelu do opisywanego frag-
mentu rzeczywistości ekonomicznej.
5
Autor opracowania: Marek Walesiak
Model ekonometryczny: dobór
zmiennych, dobór postaci
analitycznej, specyfikacja założeń
Estymacja parametrów modelu:
metoda najmniejszych kwadratów
Obliczenie reszt
modelu
Nie
1 2
Tak
Tak
IIb IIa
Nie
Tak
3
I
III
Nie
IIb IIa
Tak
4
STOP
IV
Nie
Tak
VI V 5
Nie
Weryfikacja hipotez
Nie
VII Tak
6 modelu
ekonomicznego
1. Czy reszty pochodzą z populacji o rozkładzie I. Metoda największej wiarygodności
normalnym? IIa. Usunięcie przyczyny
2. Czy reszty pochodzą z populacji o znanym roz- IIb. Metoda najmniejszych kwadratów
kładzie? III. Metoda estymacji w przypadku występo-
3. Czy występuje zjawisko autokorelacji? wania autokorelacji odchyleń losowych
4. Czy występuje zjawisko heteroskedastyczności? IV. Metoda estymacji w przypadku występo-
5. Czy model powinien być nieliniowy? wania heteroskedastyczności odchyleń lo-
6. Czy oceny parametrów są istotnie różne od zera sowych
oraz czy model jest dobrze dopasowany? V. Wybór postaci analitycznej modelu
VI. Estymacja parametrów modeli nieliniowych
VII. Poszukiwanie innej zmiennej objaśniającej
Wielostopniowa procedura budowy jednorównaniowego modelu ekonometrycznego
z jedną zmienną objaśniającą
yródło: opracowanie własne na podstawie pracy: Jakubczyc [1982], s. 113.
6
Autor opracowania: Marek Walesiak
Przykład 1
Ć Ć
v = b0 + b1X
gdzie: Y wykryta kwota niezapłaconych podatków
X godziny pracy poświęcone na kontrole
Dane statystyczne
t
Y X
1 29 45
2 24 42
3 27 44
4 35 53
5 26 43
6 28 46
7 30 48
8 28 45
9 33 50
10 27 43
v = -13,3223+ 0,9155 X
(3,4239) (0,0744)
7
Autor opracowania: Marek Walesiak
5.2. PROCEDURA WERYFIKACJI STATYSTYCZNEJ
WYBRANE ELEMENTY
5.2.1. Badanie normalności rozkładu składnika losowego
Składnik losowy � ma T-wymiarowy
2
rozkład normalny N(0,� I)
Zakładamy, że dany jest ciąg składników losowych �1,K,�T ,
który pochodzi z populacji o ciągłej dystrybuancie F(� ). Hipotezę
zerową H0 oraz alternatywną H1 formułuje się w teście Shapiro-
Wilka następująco:
H0: F(� ) = FN (� )
H1: F(� ) `" FN (� )
gdzie: FN (� ) jest dystrybuantą rozkładu normalnego.
Sprawdzianem testu Shapiro-Wilka jest statystyka:
2
Ą#[T / 2] ń#
(�(T - �(t ) )Ą#
"a -t+1 -t+1)
T
ó#
Ł# t=1 Ś#
W = , (1)
T
"(� - � )2
t
t=1
gdzie: aT -t+1 współczynniki odczytane z tablic testu Shapiro-
Wilka,
[T / 2] część całkowita liczby T / 2.
8
Autor opracowania: Marek Walesiak
Procedura sprawdzania H0 w teście Shapiro-Wilka (Domański
i Pruska [2000], s. 174; Jakubczyc [1982], s. 119-120; Borkowski,
Dudek i Szczesny [2003], s. 82-83):
1. Porządkujemy składniki losowe �1,K,�T według rosnących
wartości otrzymując ciąg: �(1) < �(2) < K < �(T ).
2. Obliczamy wartość statystyki W .
3. Dla przyjętego z góry poziomu istotności ą (np. ą = 0,01) i
wielkości próby T z tablic testu Shapiro-Wilka odczytujemy war-
tość krytyczną Wą .
4. Hipotezę H0 odrzucamy, gdy W < Wą .
W badaniach empirycznych składnik losowy �t występujący
we wzorze (1) zastępujemy resztami et otrzymanymi metodą naj-
mniejszych kwadratów. Zatem wzór (1) przyjmuje postać:
2
Ą#[T / 2] ń#
(e(T - e(t )Ą#
"a -t+1 -t+1) )
T
ó#
Ł# t=1 Ś#
W = . (2)
T
2
"e
t
t=1
9
Autor opracowania: Marek Walesiak
Przykład 2 (kontynuacja przykładu 1)
et e(t ) aT -t+1(e(T -t+1) - e(t ) )
t
1,12396 1,12947
1 0,5739 [1,12396 ( 1,12947)]
1,12947 0,79155
2 0,3291 [0,95500 ( 0,79155)]
0,03948 0,62258
3 0,2141 [0,54637 ( 0,62258)]
0,20018 0,20018
4 0,1224 [0,12396 ( 0,20018)]
0,04499 0,04499
5 0,0399 [0,03948 ( 0,04499)]
0,79155 0,03948
6
0,62258 0,12396
7
0,12396 0,54637
8
0,54637 0,95500
9
0,95500 1,12396
10
T [T / 2]
2
(e(T - e(t ) =
"e = "a -t+1 -t+1) )
t T
t=1 t=1
4,82271 2,16135
Nie ma podstaw do odrzucenia H0, ponieważ:
4,67143
W = = 0,9686 > Wą =0,01 = 0,781
4,82271
10
Autor opracowania: Marek Walesiak
5.2.2. Badanie istotności współczynników regresji
Test F
Hipoteza zerowa H0 oraz alternatywna H1:
H0 : b1 = 0
H1 : b1 `" 0
Jeśli H0 jest prawdziwa to statystyka (m =1)
SSR m SSR
F = =
SSE (T - m -1) SSE (T - 2)
lub
T - m -1 R2 R2
F = �" = (T - 2) �"
m 1 - R2 1 - R2
ma rozkład F z 1 i T - 2 stopniami swobody.
Jeśli po obliczeniu wartości empirycznej tej statystyki i porów-
)
naniu jej z wartością krytyczną Fą(1T -2) (odczytaną z tablic rozkła-
(
du F przy danym poziomie istotności ą ) okaże się, że
)
F d" Fą(1T -2)
(
to wówczas nie ma podstaw do odrzucenia hipotezy H0. W prze-
ciwnym przypadku hipotezę zerową H0 odrzucamy na rzecz hipo-
tezy alternatywnej H1.
11
Autor opracowania: Marek Walesiak
Test t
Hipoteza zerowa H0 oraz alternatywna H1:
H0 : bj = 0 ( j = 0,1)
H1 : bj `" 0
Sprawdzianem hipotezy zerowej jest statystyka:
Ć
bj - bj
t = . (8)
j
Ć
S(bj )
Z uwagi na to, że hipoteza zerowa przypisuje parametrowi b
j
wartość zerową statystyka przyjmuje postać (możliwe jest bowiem
sprawdzenie hipotezy, że b przyjmuje jakąś konkretną wartość
j
różną od zera):
Ć
bj
t = . (9)
j
Ć
S(bj )
Statystyka ta ma rozkład Studenta o T - 2 stopniach swobody.
Jeśli po obliczeniu wartości tej statystyki i porównaniu jej z
wielkością krytyczną tą (T -2) odczytaną z tablic rozkładu Studenta
okaże się, że
t d" tą (T -2) dla j = 0,1,
j
to wówczas nie ma podstaw do odrzucenia hipotezy H0 (zmienna
regresyjna ma nieistotny wpływ na zmienną objaśnianą).
12
Autor opracowania: Marek Walesiak
Przykład 3 (kontynuacja przykładu 1)
Ć Ć
v = b0 + b1X ,
gdzie: Y wykryta kwota niezapłaconych podatków,
X godziny pracy poświęcone na kontrole.
v = -13,3223+ 0,9155 X
(3,4239) (0,0744)
Test F
Tablica ANOVA w przypadku regresji prostej
yródło Suma kwadra- Liczba stopni
Iloraz F
zmienności tów odchyleń swobody
odchylenie
SSR = 91,277
1
regresyjne
91,277 /1
F = =
odchylenie
SSE = 4,823
8
4,823/8
resztowe
151,40
odchylenie
SST = 96,1
9
całkowite
Z uwagi na to, że F =151,40 > F01 =11,26 hipotezę zerową
,01(8)
należy odrzucić.
Gęstość
REGION AKCEPTACJI HIPOTEZY
ZEROWEJ
F
1 - ą
ą = 0,01
Wartość
11,26
13
Autor opracowania: Marek Walesiak
Test t
T - 2 =10 - 2 = 8 stopni swobody
ą = 0,01 poziom istotności ą jest to prawdopodobieństwo od-
rzucenia hipotezy zerowej H , gdy jest ona prawdziwa (tzw. błąd
0
I rodzaju).
tą =0,01(8) = 3,355
13,3223
t0 = = 3,891 > t0,01(8) = 3,355
3,4239
0,9155
t1 = =12,305 > t0,01(8) = 3,355
0,0744
REGION AKCEPTACJI HIPOTEZY ZEROWEJ
Gęstość
ą
2
ą
1 - ą
2
3,355
0 123
-1
3,355 -3 -2
Wartość
Przyjmujemy hipotezę H1 o istotności parametrów stojących przy
zmiennej sztucznej oraz przy zmiennej X .
14

Wyszukiwarka

Podobne podstrony:
Temat 4 I Klasyczny model regresji liniowej
3 Istotność parametrów modelu regresji liniowej
Temat 4 II stopien Klasyczny model regresji liniowej1
sokolski,statystyka inżynierska,regresja liniowa
L4 regresja liniowa klucz
Analiza regresji liniowej
Weryfikacja modelu
2 Model regresji liniowej
Regresja liniowa
Regresja liniowa
L4 regresja liniowa (2)
Regresja liniowa
3 Zastosowanie regresji liniowej do obliczania szybkości reakcji chemicznych
Regresja liniowa
KMNK weryfikacja modelu zadanie
Regresja liniowa 7

więcej podobnych podstron