75190 przewodnikPoPakiecieR 1

75190 przewodnikPoPakiecieR 1



I

m

174

Wybrane procedury statystyczne.

P

So good «dvice here is: Bewarc of good iulvicc abont thifł. (Of cTłiirsa. 1 may jiist be an outliar ...)

3.4.4.2 Wykresy diagnostyczne dla residuów

Współczynnik R• określa jak dobrze model opisuje dane. Jest to jednak dobra ocena tylko w sytuacji gdy model jest adekwatny. Po dopasowaniu modelu powinniśmy wpierw sprawdzić czy spełnione są przyjęte założenia. Jeżeli założenia modelu są spełnione, to zakłócenia losowe (błędy) powinny mieć rozkład normalny o równych wariacjach. Założenia modelu możemy badać weryfikując właściwości residuów. Do badania residuów służą tzw. wykresy diagnostyczne. Stosować należy je zarówno w przypadku regresji (liniowej i nieliniowej) jak i w analizie wariancji.

Na rysunku 3.26 przedstawione są cztery wykresy diagnostyczne wyprodukowane przez funkcję plot.lmO. Po lewej stronie przedstawione są wykresy otrzymane dla adekwatnego modelu a po prawej przedstawione są wyniki dla nieadekwatnych modeli. Na każdym wykresie nanoszone są indeksy obserwacji, które najsilniej naruszają założenia modelu. Kolejne przedstawiane wykresy mają następujące nazwy i interpretacje:

•    Wykres o nagłówku „Residuals vs Fitted”. Na osi poziomej przedstawiane są wartości dopasowane przez model a na osi pionowej wartości residuów i, — YiYi. Dla adekwatnego modelu residua mają jednorodną wariancje i lokalną średnią równą zero niezależnie od wartości Vj. Na tym wykresie możemy ocenić, czy średnia wartość residuów zależy od Vj (to źle) czy jest bliska 0 (to dobrze) oraz czy wariancja zmienia się dla różnych wartości (to źle) czy też jest jednorodna (to dobrze). Na prawym przykładowym wykresie średnia wartość residuów zależy od wartości Y co sugeruje złą postać modelu.

•    Wykres o nagłówku „Normal Q-Q” (wykres kwantylowy dla rozkładu normalnego). Na osi poziomej przedstawiono wartości kwantyli rozkładu normalnego odpowiadającym residuom, na osi pionowej przedstawiono kwantyle empiryczne dla standaryzowanych residuów. Dla adekwatnego modelu zakłócenie ma rozkład normalny, a więc punkty na wykresie powinny układać się wzdłuż linii prostej (zaznaczonej przerywaną szarą linią). Odstępstwa od tej linii sugerują brak normaluości oraz upoważniają do zastosowania transformacji nieliniowej badanych zmiennych. Dla dużych prób nie należy się przejmować niewielkim odstępstwem od normalności residuów.

•    Wykres o nagłówku „Scale-Location”. Na osi poziomej przedstawiane są wartości dopasowane przez model V) a na osi pionowej przedstawiane są pierwiastki z modułów standaryzowanych residuów. Dla adekwatnego modelu, podobnie jak w przypadku wykresu o nazwie „Residuals vs Fitted”, spodziewamy się równomiernie rozmieszczonych punktów wzdłuż osi poziomej. Obecność jakiejkolwiek regularności lub trendu sugeruje odstępstwo od założenia o jednorodnej wariancji. Na wykresie po prawej stronie przedstawiono przypadek, w którym wariancja residuów zależy od wartości Y, (rośnie z Y, nie jest więc jednorodna). W tej sytuacji należy rozważyć jakąś transformację zmiennych

Berton CIunU.T (replying to thft cjupstion whal Łho best way to detect an outlier is) fortuno (71)

stabilizującą wariancję.

• Wykres o nagłówku „Residuals vs Leverage”. To bardzo przydatny wykres do wykrywania wartości nietypowych. Na osi pionowej przedstawiane są standaryzowane residua a na osi poziomej tzw. siły dźwigni (miary wpływu tej obserwacji na oceny, ang. levarege), wyznaczone według wzoru

hi = Xi(XT x)~lxj.


Wyszukiwarka

Podobne podstrony:
75190 przewodnikPoPakiecieR 1 I m 174 Wybrane procedury statystyczne. P So good «dvice here is: B
przewodnikPoPakiecieR 1 I m 174 Wybrane procedury statystyczne. P So good «dvice here is: Bewarc
przewodnikPoPakiecieR4 140 Wybrane procedury statystyczne >    U ustawiamy ziarno
przewodnikPoPakiecieR 3 I 178 Wybrane procedury statystyczno W powyższym przykładzie wygląda na to,
przewodnikPoPakiecieR 3 I 178 Wybrane procedury statystyczno W powyższym przykładzie wygląda na to,
przewodnikPoPakiecieR7 166 Wybrane procedury statystyczne mezczyzna piec Niepowodzenia Rysunek 3.23
przewodnikPoPakiecieR 3 I 178 Wybrane procedury statystyczno W powyższym przykładzie wygląda na to,
przewodnikPoPakiecieR7 126 Wybrane procedury statystyczne Statystyki opisowe127 Tabela 3.1: Statyst
przewodnikPoPakiecieR8 128 Wybrane procedury statystyczne 128 Wybrane procedury statystyczne 3.1.1.
przewodnikPoPakiecieR9 130 Wybrane procedury statystyczne Histogram zmiennej wiek Histogram zmienne
przewodnikPoPakiecieR1 134 Wybrane procedury statystyczne Domyślnie, przedział ufności dla med
przewodnikPoPakiecieR3 138 Wybrane procedury statystyczne 138 Wybrane procedury statystyczne Za aut
przewodnikPoPakiecieR4 —■4 140 Wybrane proceduiy statystyczne >    # ustawiamy zi

więcej podobnych podstron