statystyka wybrane zagadnienia


Paweł Tatarzycki
STATYSTYKA
Wybrane zagadnienia
ELEMENTARNE ZAGADNIENIA STATYSTYKI
Termin statystyka pochodzi od łacińskiego  status , co oznacza  stan rzeczy . W
ujęciu historycznym terminem tym określano uporządkowany, tj. podany w tabelarycznej
formie, zbiór danych liczbowych, dotyczących stanu państwa. Obecnie dyscyplinę naukową
jaką jest statystyka można zdefiniować jako  zbiór metod służących pozyskiwaniu,
prezentacji i analizie danych 1.
Przedmiotem statystyki jest badanie prawidłowości, jakie dają się zauważyć w tzw.
zjawiskach masowych, tj. takich, które zachodzą dostatecznie dużo razy 2. Przykładowo,
trudno określić jaki jest przeciętny dochód na osobę na podstawie wybranego gospodarstwa
domowego. Rozkład dochodu poznamy analizując np. kilkaset gospodarstw domowych o
różnym statusie materialnym i zlokalizowanych w różnych województwach.
Zbiorowość statystyczna (populacja) to zbiór jednostek (osób, rzeczy lub zjawisk)
objętych badaniem statystycznym.
Jednostka statystyczna to najmniejszy element zbiorowości statystycznej. Będziemy
go także określać mianem obserwacji. Liczba obserwacji stanowi wielkość populacji.
Cecha statystyczna to pewna właściwość jednostki statystycznej. Cechy statystyczne
mogą przyjmować różne stany (wartości) określane mianem wariantów 3.
I. Cechy stałe  służą jedynie do określenia zbiorowości statystycznej pod względem
rzeczowym, czasowym i przestrzennym.
II. Cechy zmienne  przyjmują dwa lub więcej wariantów statystycznych i podlegają
obserwacji statystycznej. Ze względu na rodzaj przyjmowanych wariantów wyróżnia się:
1. Jakościowe  warianty można wyrazić jedynie za pomocą słów (liczby pełnią rolę
etykiet i nie można na nich wykonywać działań matematycznych). Wyróżnia się:
a) cechy nominalne (por. skala nominalna)  warianty cechy są jednakowo ważne
(np. nazwa województwa, nazwa składnika aktywów, płeć, nazwa produktu itp.),
b) cechy porządkowe (por. skala porządkowa)  warianty cechy można
uporządkować, porządkując tym samym zbiorowość statystyczną (np.
wykształcenie, skala Likerta, skala rang, klasy ryzyka funduszy inwestycyjnych od
Funduszy Rynku Pieniężnego po Fundusze Akcji),
1 J. Józwiak, J. Podgórski: Statystyka od podstaw. Polskie Wyd. Ekonomiczne. Warszawa 2000, s. 17.
2 Por. M. Sobczyk: Statystyka. Wyd. Naukowe PWN. Warszawa 1998, s. 9.
3 Ibidem, s. 10.
2. Ilościowe  warianty cech są liczbami na których można wykonywać już
określone działania matematyczne jak np. obliczanie średniej arytmetycznej (zob.
skale pomiarowe przedziałowe/ilorazowe).
a) cecha skokowa  warianty tej cechy wyrażone są za pomocą liczb należących do
zbioru przeliczalnego lub skończonego: pomiędzy tymi liczbami nie ma wartości
pośrednich (np. obecności w szkole  albo jestem albo mnie nie ma, ewentualnie
spózniłem się),
b) cecha ciągła  cecha, której warianty wyrażone są za pomocą liczb rzeczywistych,
gdzie pomiędzy dwiema dowolnymi wartościami liczbowymi danej cechy można
teoretycznie zawsze znalezć wartość pośrednią cechy (typowymi jednostkami
miary cech ciągłych są m.in.: czas, metry, kilogramy, wiek).
UWAGA! W praktyce do cech ciągłych zaliczamy też cechy takie, jak waluta (pomiar
z dokładnością do 1 grosza sprawia, że cechę tę traktujemy jako ciągłą a nie skokową); kursy
akcji w notowaniach ciągłych (nowy kurs ustalany jest często, ale nie co przysłowiową
sekundę). Od rodzaju cechy zależy sposób grupowania danych (cechy ciągłe z definicji
grupujemy w szereg rozdzielczy z przedziałami klasowymi, zaś cechy skokowe w zależności
od liczby powtórzeń wariantów w punktowy lub właśnie z przedziałami klasowymi).
Między wprowadzonymi pojęciami można przedstawić zależność:
" Zbiorowość statystyczna: spółki branży medialnej giełdy warszawskiej (stan na 16.02.2007 r.)
" Jednostka statystyczna: poszczególne spółki (wiersze tabeli), przykładowa obserwacja: WSiP.
" Cechy statystyczne: właściwości jednostek statystycznych (zmienne: nazwa spółki, kurs
zamkn., obroty szt., obroty zł).
" Warianty cechy statystycznej: poszczególne wartości cechy (np. obroty szt. kolejnych spółek).
Tabela 1. Wybrane dane finansowe obrazujące jednostki, cechy i warianty statystyczne.
Sektor Kurs zamkn. Zmiana Obroty
Spółka Obroty (szt.)
(cecha stała) (zł) (proc.) (zł)
MEDIA AGORA 38.00 +1.69 137799 10448241
MEDIA ATMGRUPA 175.00 +0.63 422 146360
MEDIA BANKIER.PL 10.99 +1.48 39153 853445
MEDIA INTERIA.PL 61.55 -3.15 1964 244137
MEDIA MNI 5.34 -0.37 98615 1066527
MEDIA MUZA 7.15 -0.83 5225 73840
MEDIA NETMEDIA 10.90 -0.91 2489 53897
MEDIA PPWK 3.30 +3.13 236582 1573679
MEDIA RMFFM 142.50 +0.99 813 231527
MEDIA TVN 24.50 +0.41 899073 44261184
MEDIA WSIP 11.88 +1.45 91116 2154261
yródło: Opracowanie na podstawie danych z Portalu Finansowego  Money.Pl , http://www.money.pl
ETAPY BADANIA STATYSTYCZNEGO
Badanie statystyczne to ogół czynności zmierzających do poznania określonej
zbiorowości statystycznej ze względu na jedną lub więcej cech. Badanie statystyczne
obejmuje cztery etapy 4:
I. PROJEKTOWANIE BADANIA:
1. Określenie celu diagnostycznego i praktycznego badania.
2. Określenie zbiorowości i jednostki statystycznej.
3. Określenie rodzaju cech statystycznych.
4. Wybór metody badania statystycznego.
II. OBSERWACJA STATYSTYCZNA:
5. Wybór zródeł danych.
6. Opracowanie narzędzi pomiaru danych (kwestionariusz).
7. Kontrola formalna i merytoryczna zebranego materiału statystycznego.
III.OPRACOWANIE I PREZENTACJA MATERIAAU STATYSTYCZNEGO:
8. Kodowanie i grupowanie danych.
9. Zliczanie danych.
10. Tabelaryczna i graficzna prezentacja danych.
IV. ANALIZA STATYSTYCZNA:
11. Opis statystyczny.
12. Wnioskowanie statystyczne (ten dział pomijamy).
4 Por. M. Piłatowska: Repetytorium ze statystyki. Wyd. Naukowe PWN. Warszawa 2006, s.11-21; M. Sobczyk:
Statystyka. Wyd. Naukowe PWN. Warszawa 2002, s. 20-30.
KLASYFIKACJA METOD BADANIA STATYSTYCZNEGO
Kryterium I. Ze względu na częstotliwość badania:
1. Badania dorazne(sporadyczne, jednorazowe, ad hoc)  są prowadzone wówczas, gdy
zapotrzebowanie na określony rodzaj informacji pojawia się sporadycznie.
2. Badania okresowe są badaniami powtarzalnymi, które przeprowadza się w określonych
momentach czasu (np. raporty kwartalne spółek notowanych na Giełdzie Papierów
Wartościowych).
3. Badania ciągłe polegają na tym, że obserwacja i rejestracja określonych zdarzeń i faktów
odbywa się w sposób ciągły. Badania te dotyczą jednak tylko ściśle określonych aspektów
(np. analiza jakości, notowania ciągłe na GPW).
Kryterium II. Ze względu na liczbę jednostek objętych badaniem 5
1. BADANIA PEANE  obejmuje wszystkie jednostki statystyczne wchodzące w skład
zbiorowości statystycznej.
2. BADANIE CZŚCIOWE  obejmuje wybrane jednostki zbiorowości statystycznej.
Metody badania pełnego
1. Spis statystyczny polega na gromadzeniu informacji bezpośrednio od wszystkich
jednostek tworzących zbiorowość statystyczną. Informacje te są zbierane przez rachmistrzów
spisowych drogą bezpośredniej obserwacji statystycznej. Spisy statystyczne dostarczają
szczegółowych informacji o badanej zbiorowości (np. Narodowy Spis Powszechny Ludności i
Mieszkań z 2002 roku przeprowadzony przez Główny Urząd Statystyczny).
2. Rejestracja statystyczna polega na wpisywaniu zdarzeń i faktów do odpowiednich
rejestrów. Rejestracja statystyczna ma węższy zakres tematyczny aniżeli spis statystyczny.
Ponadto przy rejestracji statystycznej nie występuje bezpośrednia obserwacja statystyczna,
lecz informacje będące przedmiotem rejestracji są zgłaszane w punktach rejestracyjnych.
Wyróżnia się:
 dorazną rejestrację statystyczną  polega ona na tym, że w wyznaczonym czasie określone
osoby zgłaszają się w wyznaczonych miejscach i udzielają informacji objętej tematyką
rejestracji (np. ewidencja pojazdu),
 bieżącą rejestrację statystyczną  polega ona na ciągłym ewidencjonowaniu zdarzeń i
faktów określonych przez instytucję prowadzącą rejestrację (np. ewidencja zdarzeń
gospodarczych w przedsiębiorstwie).
5 Por. M. Piłatowska: Repetytorium ze statystyki. Wyd. Naukowe PWN. Warszawa 2006, s. 13-14; M.
Sobczyk: Statystyka. Wyd. Naukowe PWN. Warszawa 2001, s. 14-15.
3. Sprawozdawczość statystyczna polega na przekazywaniu przez jednostki sprawozdawcze
określonych informacji w postaci standardowych sprawozdań za pomocą odpowiednich
formularzy statystycznych wraz z instrukcjami ich wypełniania. Ponadto należy określić
termin ich przekazywania (np. formularze PIT do końca kwietnia, formularz GUS F-01).
Metody badania częściowego
1. Metoda monograficzna polega na wszechstronnym opisie i szczegółowej analizie
pojedynczej jednostki statystycznej lub niewielkiej liczby typowych jednostek badanej
zbiorowości. Można tu uwzględnić stosunkowo dużą liczbę cech statystycznych. Podstawowe
znaczenie w tej metodzie ma opis w oparciu o dane liczbowe.
2. Metoda ankietowa polega na skierowaniu ankiety do określonej grupy respondentów z
zaproszeniem do dobrowolnego wypowiedzenia się w określonej sprawie. Ankieta może
zostać skierowana do szerokiego grona osób lub do niewielkiej grupy respondentów (np. do
Słuchaczy Studium).
3. Metoda reprezentacyjna opiera się na próbie pobranej ze zbiorowości generalnej w
sposób losowy. Fakt ten sprawia, iż jest to szczególny rodzaj metody badania statystycznego,
gdzie zastosowanie znajduje rachunek prawdopodobieństwa.
Metody szacunkowe:
 interpolacja polega na znajdywaniu nieznanych wartości w dowolnym punkcie
przedziału na podstawie dostępnych wartości należących do tego przedziału (np. ustalanie
miejsc zerowych wielomianu).
 ekstrapolacja polega na ustaleniu nieznanych wartości w dowolnym punkcie
leżącym poza przedziałem wartości posiadanych (np. prognozowanie).
PRZYKAADY
ZAKRES CZSTOTLIWOŚĆ PRZEPROWADZANIA BADAC
BADANIA
badanie dorazne badanie okresowe badanie ciągłe
Narodowy Spis Powszechny Publikowanie okresowych Ewidencja ludności
Ludności i Mieszka 2002 raportów finansowych przez
Badanie pełne
spółki notowane na Giełdzie
Papierów Wartościowych
Badanie popytu na nowy Sprawdzanie wiedzy Badanie jakości produkcji w
produkt zlecone firmie nabywanej w trakcie oparciu o tzw. karty kontrolne
Badanie częściowe konsultingowej przez nauczania statystyki (sygnałem ostrzegawczym jest
zainteresowane (ewaluacja bieżąca) przekroczenie dolnej lub
przedsiębiorstwo górnej linii kontrolnej)
yródło: Opracowanie własne.
LOSOWY DOBÓR PRÓBY 6
Losowy dobór próby jest to taki sposób wyboru jednostek statystycznych, przy którym
są spełnione następujące warunki:
1. Każda jednostka statystyczna (obserwacja) ma dodatnie znane prawdopodobieństwo
znalezienia się w próbie.
2. Istnieje możliwość ustalenia prawdopodobieństwa znalezienia się w próbie dla każdego
zespołu elementów populacji.
Próbę otrzymaną w wyniku doboru losowego nazywamy próbą losową. Istnieje szereg
sposobów doboru jednostek statystycznych do próby, określanych mianem schematów
losowania. Podstawowym schematem losowania jest tzw. losowanie proste  wszystkie
obserwacje mają jednakowe prawdopodobieństwo znalezienia się w próbie, przy czym
prawdopodobieństwo to nie zmienia się w trakcie losowania (mówimy tu o losowaniu
niezależnym). Próbę losową uzyskaną w wyniku losowania prostego nazywamy próbą prostą.
W praktyce pobieranie próby prostej z populacji skończonej odbywa się za pomocą tzw.
tablic liczb losowych na podstawie pełnej listy ponumerowanych elementów populacji.
PRZYKAAD
Krok 1. Określamy listę potencjalnych ponumerowanych jednostek statystycznych (np. listę
znajomych, którzy wypełnią przygotowaną ankietę: 1. Kowalski; 2. Nowak, & .). Jest to tzw.
operat losowania. Załóżmy, że N = 100 osób.
Krok 2. Określamy stałe prawdopodobieństwo pojawienia się danej osoby wśród
respondentów:
1/N = 1/100  0,01
Krok 3. Następnie odcinek 0-1 dzielimy na 100 części (N = 100):
[0-0,01), [0,01-0,02), [0,02-0,03) & .
Krok 4. Zakładamy wielkość próby losowej: n = 10. Zamiast tablic liczb losowych
generujemy liczby losowe z wykorzystaniem funkcji Excela:
=los()
Funkcja ta generuje liczby w przedziale 0-1.
Krok 5. Sprawdzamy do jakiego przedziału (zob. krok 3) należy wygenerowana liczba i
przypisujemy jej numer z listy potencjalnych respondentów. Jeśli się powtórzy nr obserwacji,
to w jej miejsce musimy wygenerować kolejną  inną.
6 J. Józwiak, J. Podgórski: Statystyka od podstaw. PWE. Warszawa 2000, s. 20-21.
SKALE POMIAROWE 7
Definicje
Nominalna  warianty cechy można porównywać na zasadzie relacji
 równe/różne (nie jesteśmy w stanie uszeregować wariantów cechy rosnąco
bądz malejąco). Jest to skala charakterystyczna dla cech jakościowych
nominalnych (np. płeć, pytania typu TAK/NIE, nazwa spółki, nazwa
województwa itp.). W przypadku tych skal możemy obliczyć wskazniki
struktury, dominantę, współczynnik V-Cramera.
Porządkowa  wariant cechy można porównywać na zasadzie relacji
 mniejsze/większe . Na tym etapie nie możemy jednak stwierdzić o ile dany
obiekt różni się od innego. Ten typ skali odpowiada cechom porządkowym (np.
preferencje nabywcy:  produkt bardzo zły, zły, dobry ; zyski:  niskie ,
 średnie ,  wysokie ). Dla skali porządkowej obliczymy już medianę (szereg
szczegółowy uporządkowany rosnąco) oraz współczynnik korelacji rang.
Przedziałowe  skala ta zachowuje własności skali porządkowej, a ponadto
możliwe jest określenie różnic pomiędzy wariantami cechy. W przypadku tego
typu skal punkt zerowy nie jest naturalny  ustala się go umownie (np. wys.
n.p.m., temperatura w stopniach Celsjusza). W przypadku tych skal możemy
obliczyć już średnią arytmetyczną, współczynnik korelacji liniowej Pearsona.
Ilorazowa  skala ta zachowuje własności skal słabszych, a ponadto umożliwia
określenie relacji typu  A większe od B trzy razy . Jest to najsilniejszy typ skali
pomiarowej adekwatny dla cech ilościowych posiadających naturalny punkt
zerowy (np. przychody, waga, wiek, liczba przedsiębiorstw, stopy zwrotu).
Możliwe jest obliczenie także miar względnych (np. współczynnik zmienności).
Adekwatną miarą korelacji jest współczynnik korelacji liniowej Pearsona.
Uwaga! Należy podkreślić, iż możliwe jest  zejście ze skal mocniejszych ku
słabszym, co wiąże się z utratą informacji. w drugą stronę relacja ta nie
zachodzi, stąd znaczenia nabiera umiejętne skalowanie np. pytań w
kwestionariuszu ankietowym.
7 Por. A. D. Aczel: Statystyka w zarządzaniu. Wyd. Naukowe PWN. Warszawa 2000, s. 37.
Przykłady skal pomiarowych
Skala Likerta:
1. Czy w Twojej szkole panuje przemoc?
a) zdecydowanie tak
b) raczej tak
c) raczej nie
d) zdecydowanie nie
e) trudno powiedzieć
Skala rang:
2. Uporządkuj preferowane przez Ciebie sposoby sprawdzania wiedzy
(wpisz w kratkę odpowiednią literę):
A  odpowiedz ustna, B  sprawdzian pisemny, C  praca domowa
1  sposób najbardziej korzystny
1. 2. 3.
Skala semantyczna:
3. Określ jak są najczęściej prowadzone lekcje w Twojej szkole:
nudnie interesująco
Skala Stapela:
4. Oceń ważność kryteriów przy wyborze kursu (-3 to ocena najniższa):
-3 -2 -1 +1 +2 +3
Cena kursu
Doświadczenie kadry dydaktycznej
Dogodna lokalizacja
Rangowa skala sumowanych ocen:
5. Ustal odpowiednie dla Ciebie proporcje kursu ze statystyki:
Część teoretyczna: ____ % Część praktyczna: ____ % RAZEM: 100 %
PYTANIA KWESTIONARIUSZA - KLASYFIKACJA:
1) OTWARTE & & & & & & & & & & & & & &
2) PÓAOTWARTE  zawierają kafeterię półotwartą typu: inne (jakie?) & &
& ..
3) ZAMKNITE:
A) Dychotomiczne  możliwy wybór jednego z dwóch wariantów odpowiedzi.
B) Kafeteria dysjunktywna  możliwy wybór jednego z więcej niż dwóch wariantów
odpowiedzi .
C) Kafeteria koniunktywna  możliwy wybór kilku wariantów odpowiedzi.
4) TABELE  pozwalają na zaznaczenie szeregu odpowiedzi na danej skali.
5) FILTRUJCE  odmiennie sformułowane w odległych miejscach
kwestionariusza w celu wychwycenia nieścisłości w udzielaniu
odpowiedzi.
6) METRYCZKOWE  dotyczą płci respondenta, jego wieku, wykształcenia
z reguły zadawane na końcu kwestionariusza.
Spis treści
ELEMENTARNE ZAGADNIENIA STATYSTYKI.................................................................2
ETAPY BADANIA STATYSTYCZNEGO...............................................................................4
KLASYFIKACJA METOD BADANIA STATYSTYCZNEGO...............................................5
Kryterium I. Ze względu na częstotliwość badania:.............................................................. 5
Kryterium II. Ze względu na liczbę jednostek objętych badaniem .......................................5
LOSOWY DOBÓR PRÓBY ..................................................................................................... 7
SKALE POMIAROWE ............................................................................................................. 8
Definicje................................................................................................................................. 8
Przykłady skal pomiarowych................................................................................................. 9
PYTANIA KWESTIONARIUSZA - KLASYFIKACJA:........................................................10


Wyszukiwarka

Podobne podstrony:
I Wybrane zagadnienia Internetu SLAJDY [tryb zgodności]
3 Standardy urbanistyczne dla terenow mieszkaniowych wybrane zagadnienia
Analizowanie wybranych zagadnień prawa materialnego
Eneida wybrane zagadnienia
Wykład 2 Wybrane zagadnienia dotyczące powierzchnii elementów maszyn
Skrypt wybrane zagadnienia psychologii
Lasy miejskie – przegląd wybranych zagadnień na podstawie literatury

więcej podobnych podstron