Zamiana szeregu punktowego w szereg z przedziałami klasowymi:
K = liczba przedziałów
i = rozpiętość klasy
Wskaźnik natężenia i struktury
Wskaźnik natężenia
n-liczebność jednej zbiorowości, m-liczebność drugiej zbiorowości
Wskaźnik struktury:
ni = liczebność badanej części zbiorowości
N = liczebność całej zbiorowości
Wskaźnik podobieństwa:
im bliżej 1/100% tym większe podobieństwo
W1i = wskaźnik struktury pierwszej zbiorowości, (2i-drugiej)
Miary średnie
Miary średnie klasyczne
średnia arytmetyczna
szereg szczegółowy:
szereg rozdzielczo-punktowy:
szereg rozdzielczo-punktowy z przedziałami klasowymi:
= środki przedziałów klasowych
- średniej arytmetycznej nie obliczamy dla szeregów z otwartymi przedziałami, oraz tam gdzie występują nietypowe wartości cechy
średnia harmoniczna - (stosowana w odniesieniu do cech stosunkowych - wydajność, prędkość - jest odwrotnością średniej arytmetycznej z odwrotności zaobserwowanych wartości)
szeregów szczegółowych prostych
- średnia geometryczna (G) stosowana np. w odniesieniu do wskaźników dynamiki, inaczej średnie tempo zmian
Miary średnie pozycyjne
wartość modalna - dominanta (ta wartość cechy która występuje najczęściej)
w szeregu szczegółowym i rozdzielczo-punktowym dominantę wskazujemy.
w szeregu rozdzielczym z przedziałami wskazujemy przedział (warunkiem jest żeby przedział ten oraz przedziały sąsiadujące miały te same rozpiętości)
xS = dolna granica przedziału dominanty
hS = rozpiętość przedziału dominanty
nS = liczebność przedziału dominanty
nS-1 = liczebność przedziału poprzedz. przedział dominanty
kwartyle (kwartyl pierwszy, kwartyl drugi-mediana, kwartyl trzeci)
mediana pełni funkcję średniej arytmetycznej tam gdzie nie możemy jej użyć.
szereg szczegółowy:
n=7, nieparzysta liczba jednostek -
Me = 11; Q1 = 7; Q3 = 14
n=8, parzysta liczba jednostek -
szereg rozdzielczo-pktowy i z przedziałami:
obliczamy liczebności skumulowane (nisk), a później numer kwartyla/mediany ze wzoru:
patrzymy w której l. skumulowanej zawiera się ta liczba, otrzymujemy nr kwartyla/mediany, dalej liczymy ze wzoru (dotyczy on także kwartyli):
hS = rozpiętość przedziału mediany; nS = liczebność przedziału mediany; NMe = numer mediany; nisk-1 = wartość skumulowana przedziału poprzedzającego przedział mediany
Miary zróżnicowania, zmienności - (dyspersji, rozrzutu, zmienności, rozproszenia) - opisują˛ stopień rozproszenia wartości badanej cechy wokół średniej.( Miary, które pozwalają ocenić stopień heterogeniczności danej zbiorowości (czyli stopień zróżnicowania) nazywamy miarami zmienności lub zamiennie).
Miary zróżnicowania (zmienności, dyspersji, rozrzutu, rozproszenia) |
||||||
bezwzględne |
względne |
|||||
1. klasyczne |
1. klasyczne |
|||||
a. odchylenie przeciętne, dX |
a. współcz. zmienn. oparty na odch. przecięt. VdX |
|||||
szer. szczegół. |
szer.rozdz-pktowy |
szer. z przedz. klas. |
szer. szczegół. |
szer.rozdz-pktowy |
szer. z przedz. klas. |
|
|
|
|
|
|||
b. odchylenie standardowe, sX |
a. współcz. zmienn. oparty na odch. stand. VSX |
|||||
|
|
|
|
|||
c. wariancja |
2. pozycyjne |
|||||
2. pozycyjne |
a. współcz. zmienn. oparty na odch. ćwiart. VQX |
|||||
a. odchylenie ćwiartkowe, QX - jeśli nie możemy wyznaczyć śr.arytm. |
|
|||||
b. rozstęp, RX = xMAX - xMIN |
|
IV. Miary asymetrii
szereg symetryczny asym. prawostronna asym. lewostronna
1. Wskaźnik skośności
2. Współczynnik skośności
3. Klasyczny współczynnik asymetrii
4. Pozycyjny współczynnik asymetrii (mierzy asymetrię w środkowej części rozkł.)
ZALEŻNOŚCI KORELACYJNE
Z korelacją mamy do czynienia wtedy, gdy wraz ze zmianą wartości jednej cechy zmienia się średnia wartość drugiej cechy (np. X to wzrost, Y to waga; X to zm.niezależna, Y to zm.zależna)
Współczynnik korelacji liniowej Pearsona: - współczynnik do pomiaru siły związku między cechami X i Y w k™órych występuje zależność korelacyjna o charakterze liniowym. Współczynnik r korelacji liniowej Pearsona przyjmuje zawsze wartości z przedziału [-1, 1]. Znak współczynnika informuje o kierunku korelacji (liniowa ujemna lub liniowa dodatnia). Wartość bezwzględna
informuje o sile korelacji liniowej. W szczególnym przypadku, gdy
= 1, wówczas mamy do czynienia z korelacja˛ funkcyjna˛ (tzn. zależność´ Y od X można wyrazić´ za pomocą˛ funkcji Y = aX + b, gdzie a, b są˛ pewnymi stałymi). Współczynnik r mierzy tylko korelację o charakterze prostoliniowym. Gdy r = 0, wówczas mówimy, że nie ma korelacji liniowej (ale może być krzywoliniowa).
(druga część wzoru dla szeregu szczeg.)
|r| - mówi nam o sile korelacji:
mniej niż 0,2 - brak zależności liniowej, może być krzywoliniowa; 0,2 - 0,4 - zależność istnieje ale jest słaba; 0,4 - 0,7 - korelacja liniowa o umiarkowanej sile; 0,7 - 0,9 - korelacja silna, znaczna; 1 - korelacja funkcyjna
Znak współczynnika mówi nam czy korelacja jest dodatnia czy ujemna.
rXY = rYX
Współczynnik korelacji rang Spearmana: obliczana dla danych rangowych jest współczynnik korelacji rang Spearmana. Współczynnik rS przyjmuje wartości z przedziału [-1, 1].
Wartość rS = 1 oznacza, że istnieje całkowita zgodność uporządkowań wg rang ai i bi . Wartość rS = -1 oznacza z kolei pełna˛ przeciwstawność uporządkowań między rangami.
Wartość rS = 0 oznacza brak korelacji rang.
di = ai - bi różnica pomiędzy rangami
ranga - numer miejsca jaki znajduje wartość bądź wariant cechy w uporząd. niemalejąco lub nierosnąco ciągu wartości tej cechy.
rS ∈< -1, 1>
rS=1 istnieje całkowita zgodność uporządk. wg rang ai i bi
rS=-1 pełna przeciwstawność uporządkowań między rangami
rS=0 brak korelacji rang
REGRESJA LINIONA
Zmienna objaśniana (zmienna zależna) - zmienna będąca przedmiotem badania. Na ogół oznaczamy ją symbolem Y.
Zmienne objaśniające (zmienne niezależne) - zmienne, za pomocą których chcemy objaśnić zmiany zmiennej zależnej. Na ogół oznaczamy je symbolami X1; X2…
Funkcja regresji - funkcja odwzorowująca zależność pomiędzy zmienną objaśnianą Y a zmiennymi objaśniającymi.
W przypadku wielu zmiennych objaśniających mówimy o regresji wielorakiej, natomiast w przypadku jednej zmiennej objaśniającej - o regresji jednej zmiennej.
Równanie linii regresji:
a - współczynnik kierunkowy regresji; interpretacja: jeżeli X wzrośnie o jednostkę, to Y zmieni się (wzrośnie, spadnie) o wartość a jednostek.
b - wskazuje poziom zmiennej zależnej Y przy X=0, ale interpretujemy go wtedy gdy ma to uzasadnienie ekonomiczne, np.: x-liczba osób w gosp.dom.; y-wydatki na żywność; y=100x+200 (nie ma sensu interpretować 200 ponieważ nie ma wydatków gdy nie ma ludzi)
współczynniki a i r mają zawsze te same znaki, mogą mieć różne wartości
Relacja łącząca współczynnik regresji i współczynnik korelacji liniowej Pearsona. Współczynniki a i r maja˛ zawsze ten sam znak, przy czym współczynnik b nie musi należeć do przedziału [-1, 1], w przeciwieństwie do współczynnika r korelacji liniowej Pearsona.
Współczynnik determinacji, określa stopień dopasowania wartości teoretycznych do danych empirycznych:
∈<0,1> im bliżej 1 tym lepsze dopasowanie.
R2 = 0,95 około 95% zmiennej Y jest wyjaśniana przez model regresjii.
Średni błąd szacunku:
mówi nam o ile przeciętnie teoretyczne wartości zmiennej zależnej odchylają się (różnią się) od wartości empirycznych.
SZEREGI CZASOWE OKRESU/MOMENTU:
Szereg czasowy momentów, to szereg zawierający informacje o poziomach badanego zjawiska w określonych momentach pewnego przedziału czasowego, np. stan ludności Polski w określonych latach. Szereg czasowy okresów zawiera informacje o rozmiarach zjawiska w ciągu kolejnych okresów danego przedziału czasowego, np. liczba urodzeń w danych latach.
Analiza szeregów:
1. Analiza opisowa szeregu czasowego:
średnia arytmetyczna (szeregi czasowe okresów)
średnia chronologiczna (szeregi czasowe momentów)
wariancja i odchylenie standardowe:
2. Porównanie poziomów zjawiska w czasie - analiza dynamiki zjawisk:
-przyrosty absolutne (różnica pomiędzy poziomem zjawiska w czasie t a poziomem zjawiska w czasie t* przyjętym za podstawę:
inf. o ile wzrósł/zmalał poziom zjawiska w okresie/momencie t w porównaniu z jego poziomem w okresie/momencie bazowym
-przyrosty względne
o ile procent wyższy/niższy jest poziom zjawiska w okresie/momencie t w porównaniu do jego poziomu w okresie/momencie bazowym t*. Określany również mianem wskaźnika tempa przyrostu/spadku.
-indeks dynamiki indywidualny
; y1=oznacza poziom zjawiska w okresie/momencie sprawozdawczym; y0=oznacza poziom zjawiska w okresie/momencie t0 uznanym za podstawę porównań.
Indeksy indywidualne dzielimy na: jednopodstawowe (stała podstawa porównań-np. rok 2000) i łańcuchowe (podstawa porównań to np. rok poprzedni)
Średnie tempo zmian wielkości zjawiska (dla indeksów łańcuchowych):
średnie tempo zmian
n stopień pierwiastka - to liczba indeksów łańcuchowych pod pierwiastkiem(!!!)
-indeks dynamiki zespołowy/agregatowy - stosowany w przypadku zjawisk złożonych, tj. zjawisk będących zespołem zjawisk niejednorodnych.
agregatowy indeks wartości
p1,p0=ceny jedn. prod. w okresie badanym/bazowym; q=ilości
agregatowy indeks ilości (ceny stałe)
agregatowy indeks cen
interpretacja indeksów wg formuły Laspeyresa:
indeksy ilości/cen informują o ile zmieniłaby się (wzrosła/spadła) wartość całego agregatu produktów w porównywanych okresach, gdyby ceny/ilości produktów były stałe na poziomie z okresu podstawowego.
interpretacja indeksów wg formuły Paaschego:
indeksy ilości/cen informują o ile zmieniłaby się (wzrosła/spadła) wartość całego agregatu produktów w porównywanych okresach, gdyby ceny/ilości produktów były stałe na poziomie z okresu badanego.
Równość indeksowa:
Wyodrębnienie tendencji rozwojowe metodą analityczną
Trend - własność szeregu czasowego.
- szacowany poziom zjawiska, t - zmienna czasowa, a - wyraz wolny, b- współczynnik kierunkowy linii trendu
b - mówi o przeciętnych zmianach zjawiska w pewnych okresach czasu.
a - poziom zjawiska w okresie poprzedzającym okres badany.
Q1
Q3
Me
XMIN
XMAX
Interpretacja:
znak współ. (+) - asym. prawostronna
znak współ. (-) - asym. lewostronna
wartość bezwzgl. mówi o sile asymetrii; im bliżej 1 tym silniejsza asymetria