Metodologia SPSS Jakub Niewiarkowski ćwiczenia 4 Statystyki


Jadłospis na dzisiaj:
Jadłospis na dzisiaj:
Dania z zeszłego tygodnia: powtórka
Danie główne : Statystyki

MTC

Miary dyspersji

Miary kwantylowe

Miary kształtu rozkładu
Dania z zeszłego tygodnia: powtórka
Jak SPSS zapisuje systemowy brak danych?
Do czego służy rozkład częstości?
Jakie są możliwe formy rozkładu częstości?
Jak obliczamy procent?
Informacja o procencie to informacja o ...?
Na jakie pytania możemy odpowiedzieć w oparciu
o rozkład częstości?
ZAROBKI
Procent Procent
Częstość Procent ważnych skumulowany
Ważne 735.00
1 2.4 2.6 2.6
803.00 Jakie jest prawdopodobieństwo
1 2.4 2.6 5.1
818.00
1 2.4 2.6 7.7
spotkania osób zarabiających
861.00
1 2.4 2.6 10.3
868.00
4 9.5 10.3 20.5
od 1000 do 2000 zł?
871.00
1 2.4 2.6 23.1
893.00
1 2.4 2.6 25.6
900.00
1 2.4 2.6 28.2
1000.00
2 4.8 5.1 33.3
1009.00
1 2.4 2.6 35.9
1057.00
1 2.4 2.6 38.5
1070.00
1 2.4 2.6 41.0
1126.00
1 2.4 2.6 43.6
1195.00 Albo:
1 2.4 2.6 46.2
1196.00
1 2.4 2.6 48.7
(19x2.6)+(2x5.1)=~0,59
1254.00
1 2.4 2.6 51.3
1285.00
1 2.4 2.6 53.8
albo:
1298.00
1 2.4 2.6 56.4
87.2  28.2 =~0,59
1338.00
1 2.4 2.6 59.0
1424.00
1 2.4 2.6 61.5
zasada:
1425.00
1 2.4 2.6 64.1
to co nas interesuje
1445.00
1 2.4 2.6 66.7
1506.00
1 2.4 2.6 69.2
minus to co nas
1586.00
1 2.4 2.6 71.8
nieinteresuje
1747.00
1 2.4 2.6 74.4
1768.00
1 2.4 2.6 76.9
1824.00
1 2.4 2.6 79.5
1873.00
1 2.4 2.6 82.1
1884.00
2 4.8 5.1 87.2
2117.00
1 2.4 2.6 89.7
2139.00
1 2.4 2.6 92.3
2153.00
1 2.4 2.6 94.9
2181.00
1 2.4 2.6 97.4
2183.00
1 2.4 2.6 100.0
Ogółem
39 92.9 100.0
Braki danych 999998.00
3 7.1
Ogółem
42 100.0
Częstości i Prawdopodobieństwo czego
chcieć więcej?
Częstości i prawdopodobieństwo są bardzo użyteczne
Czasami jednak potrzebujemy dodatkowych informacji
Np.:

Co wynika z faktu, że prawdopodobieństwo spotkania
osoby zarabiającej między 1000 a 2000 zł wynosi około
0,6 (czyli, że 60% osób mieści się w tym przedziale)?

jeżeli dostałem z egzaminu czwórkę, to informacja ta bez
kontekstu jest bezwartościowa
POTRZEBUJEMY JAKIÅš WARTOÅšCI OPISOWYCH
- PODSUMOWUJCYCH
STATYSTYKI
Statystyki - są to charakterystyki danych, służące temu
aby opisywać dane zrozumiałym językiem.
Statystyki wykonuje się po to, żeby móc porównywać
ze sobą różne rozkłady częstości.
Można też porównywać na oko, ale czy to ma sens?
Często przy wielokategorialnych zmiennych (np. 50
kategorii i więcej), porównywanie  na wyczucie jest
mało wiarygodne.
11
10
9
8
7
6
5
4
3
18 26 34 42 50 58 66 74 82 90
22 30 38 46 54 62 70 78 86 94
WIEK RESPONDENTA
Åšrednia SKALA CHECI ZYCIA
Charakterystyki rozkładów:
Miary Tendencji Centralnej (MTC)
Miary procentowe - kwantylowe
Miary Rozproszenia  miary dyspersji
Miary kształtu rozkładu
STATYSTYKI - MTC
Miary Tendencji Centralnej to nic innego jak
podawanie informacji o przypadku typowym,
przeciętnym  czymś co pozwoli scharakteryzować
dane  np. przeciętna pensja, typowy student (do
jakiej kategorii należy), ile najczęściej ludzie jedzą
kulek lodów?
Wyróżniamy trzy miary tendencji centralnej:

średnią

medianÄ™

modalnÄ…
STATYSTYKI - MTC
Średnia  miara, która, jako jedyna z miar tendencji
centralnej, do obliczenia uwzględnia wszystkie
wartości!
Jest najczęściej używaną wartością w przy
charakteryzowaniu różnych danych.
Oblicza siÄ™ jÄ… wg wzoru: Sð(X)/N (czyli suma
wszystkich wartości dzielona przez ich liczbę).
STATYSTYKI - MTC
Mediana  taka kategoria zmiennej poniżej której
znajduje się 50% przypadków. Oblicza się ją w
sposób następujący:

porzÄ…dkujemy (sortujemy) dane

numerujemy (rangujemy)

szukamy wartości, która znajduje się po środku
wypisanych wartości
Można też zastosować wzór: (N + 1)/2  gdzie N
oznacza liczbÄ™ obserwacji
STATYSTYKI - MTC
Przykład 1

Dla podanego rozkładu częstości rzutów kostką
policz MedianÄ™.
5 3 2 6 9 10 4
co robić?
Wartością odpowiadającą Me jest ...
A co jeśli: 5 3 2 6 9 10 4 11
Wartością odpowiadającą Me jest ...
STATYSTYKI - MTC
Kwantyle (ntyle)  miary procentowe
mediana należy do zbioru miar opartych na rozkładach
procentach tzw. kwantyli (ntyli lub centyli).
Mediana to połowa zbioru wartości. Kolejne znane
centyle to:
Kwartyle
Percentyle
Decyle
STATYSTYKI - MTC
Modalna wartość najczęściej występująca  np. jaki
był najczęściej wybierany kolor?
Żeby podać modę (modalną) wystarczy spojrzeć na
częstość
Może być kilka modalnych  rozkłady wielomodalne
Jeżeli dwie najczęstsze wartości występują koło siebie
np. 1 2 2 3 3 4 (wartość 2 i 3) to za modalną
podajemy średnią tych dwu wartości (2,5).
STATYSTYKI - MTC
Jeżeli wartości modalne nie sąsiadują ze sobą to
podajemy dwie wartości  wówczas nie możemy
mówić o modalnej, że wyraża tendencję centralną.
Może nie być wartości najczęstszej  rozkład
prostokÄ…tny
STATYSTYKI - MTC
Zadanie 1

Dla podanego rozkładu częstości rzutów kostką
policz MTC.
1 - 3
2 - 1
3 - 4
4 - 2
5 - 2
6 - 1
STATYSTYKI - MTC
Kiedy jaka MTC?

Najlepszą miarą TC jest średnia

Średnia jest zależna od wartości ekstremalnych
(takie wart.  przyciągają średnią do siebie)

Kiedy rozkład jest niesymetryczny (np. zarobki,
albo poczucie szczęścia) to lepsza od średniej jest
MEDIANA
STATYSTYKI - MTC
Jak siÄ™ liczy MTC w SPSSie?
MTC to część rozkładu częstości, a zatem...
Analiza > opis statystyczny > częstości >
STATYSTYKI
\\wykladowca\all99.sav
Dla której zmiennej ze zbioru można policzyć MTC?
Które MTC się tutaj nadają  które mają sens?
mtc
STATYSTYKI - Rozproszenie
Czasami MTC sÄ… niewystarczajÄ…ce do
scharakteryzowania określonego rozkładu
Ilustruje to poniższy przykład dwóch pomiarów
temperatur:

15 16 16 17 10 16 16 22
obydwa rozkłady mają tę samą:

średnią (M) = 16,

medianÄ™ (Me) = 16

modalnÄ… (Mo) = 16

ALE...?
STATYSTYKI - Rozproszenie
nie sÄ… takie same:
Różnią się rozproszeniem wartości.
Miary rozproszenia:

Rozstęp

Wariancja

Odchylenie standardowe
STATYSTYKI - Rozproszenie
Rozstęp - różnica między wartością największą (Maks.)
a najmniejszÄ… (Min)

Rozstęp jest całkowicie zależny od pomiarów
ekstremalnych.

Im większy jest rozstęp tym większa zmienność
wyników (czy zawsze?).

10 18 19 35 40 50 10 12 12 13 14 50
STATYSTYKI - Rozproszenie
Wariancja i Odchylenie standardowe to dwie
najbardziej popularne miary używane w statystyce.
Założenia i sposób obliczania:

Im większa zmienność wyników, tym bardziej
oddalone są one od średniej.
Przykład:

Pomiar wzrostu:
160 170 180 150 170 190
STATYSTYKI - Rozproszenie
odchylenie wyników od średniej (x- M)

[Sð(x- M) = 0]

[Sð (x- M)2]

W statystyce opieramy się na wartościach
przeciętnych
Sð(x- M)2/N  kiedy obliczamy wariancjÄ™ w populacji
(sð2)
Sð(x- M)2/(N  1)  kiedy obliczamy wariancjÄ™ w próbie
(s2)
STATYSTYKI - Rozproszenie
Dzięki dzieleniu przez mniejszą liczbę (N  1),
zmniejszamy prawdopodobieństwo popełnienia błędu.
Wariancja, jest wyrażona w jednostkach kwadratowych

Wariancja z wagi = 100 to 100 kg2

Wariancja wzrostu = 36 to 36cm2
Pierwiastek z wariancji, daje nam trzeciÄ… miarÄ™
rozproszenia  odchylenie standardowe.
STATYSTYKI - rozproszenie
Jak siÄ™ liczy Rozproszenie w SPSSie?
Rozproszenie jak i MTC to część rozkładu częstości, a
zatem...
Analiza > opis statystyczny > częstości > STATYSTYKI
Co się zmienia w naszej wiedzy o rozkładzie zarobków?
Notatka

Jak uzyskać miary: tendencji centralnej, rozproszenia i
kwantyle w spss (ścieżka dostępu)?

Czym się różnią od siebie MTC i miary rozproszenia?

Jaki jest mianownik we wzorze na wariancję w próbie?

Jaki jest stosunek wariancji do odchylenia standardowego?

Kiedy nie należy korzystać ze średniej?
GDZIE ZNALEyĆ INFO?
 Wieczorkowska s. 51  74 (rozdział 2  rozkład
częstości)
 Pierwsze kroki w teorii z magazynu lub strony
Dla chętnych materiały od Ireny z www pt:  Kwartyle
Praca domowa

Ze strony www.qstat.prv.pl pobierz plik szablon.sav.

w pliku na podstawie wpisanej osoby nr 1:

wprowadz dane z ankiet

zadeklaruj wartości braków danych,

dla zmiennej  ulubiona kuchnia wprowadz maksymalnÄ…
szerokość = 20
Praca domowa
Korzystając z pliku all99.sav zrób rozkład
częstości zmiennej TOTUNEMP

Zadeklaruj odpowiednie wartości jako braki danych

Jakie jest prawdopodobieństwo spotkania osób
niepracujÄ…cych:

12 mcy

Między 10 a 24 mce ( 9 < X < 25)

Jaka jest liczba osób niepracujących:

Między 10 a 24 mce ( 9 < X < 25)

Między 2 a 120 mcy ( 1 < X < 121)


Wyszukiwarka

Podobne podstrony:
Metodologia SPSS Jakub Niewiarkowski ćwiczenia 12 Test
Metodologia SPSS Jakub Niewiarkowski ćwiczenia 10 Test t
Metodologia SPSS Jakub Niewiarkowski ćwiczenia 3 Rozkład częstości
Metodologia SPSS Jakub Niewiarkowski ćwiczenia 2 Zasady nazywania zmiennych
Metodologia SPSS Jakub Niewiarkowski ćwiczenia 11 Zadania
Metodologia SPSS Jakub Niewiarkowski ćwiczenia 8 Korelacje
Metodologia SPSS Jakub Niewiarkowski ćwiczenia 3 Zadania
Metodologia SPSS Jakub Niewiarkowski ćwiczenia 5 Standaryzacja
Metodologia SPSS Jakub Niewiarkowski ćwiczenia 7 Tworzenie wskaźników
Metodologia SPSS Jakub Niewiarkowski ćwiczenia 6 Podzbiory
Metodologia SPSS Jakub Niewiarkowski
ćwiczenia statystyka 4
ćwiczenia statystyka 2
cwiczenia statystyka 1
METODOLOGIA badan politologicznych cwiczenia

więcej podobnych podstron