Pomoc statystyczna Analizy statystyczne ankiet
More Website Templates at TemplateMonster.com!

Testy chi-kwadrat

Są to najczęściej wykorzystywane testy podczas analizowania ankiet. Warto uzupełniać testy, testami V Kramera lub Phi Yula, gdyż sam test daję nam tylko informację czy dana zależność występuję, natomiast nie informuję nas o sile wykazanej zależności. W teście chi kwadrat porównujemy wartości obserwowane z wartościami oczekiwanymi. Wzór tego testu ma postać:

*

*źródło Wikipedia
Gdzie:
O – wartość obserwowana
E – wartość oczekiwana

Bardzo istotne jest by wartość E była większa od 5, jeśli ten warunek nie nastąpi trzeba wprowadzać odpowiednie poprawki do testu chi kwadrat, a najlepiej jest połączyć tak grupy by uzyskać wartości większe niż 5.

Test chi kwadrat zgodności


Stosowany w celu sprawdzenia równoliczności grup oraz gdy porównujemy doświadczalny (empiryczny) rozkład zmiennej z rozkładem teoretycznym.
Przykałd:
Zadano pytanie 100 ankietowanym, czy opłacają abonament telewizyjny. W fikcyjnym świecie rozkład odpowiedzi przedstawiałby się w ten sposób, że 50% osób opłacałoby abonament a 50% nie. Jednakże prawdziwy rozkład odpowiedzi przedstawiał nieco inne proporcje: 20 osób płaciło a 80 nie uiszczało opłat.
Hipoteza zerowa brzmi:
Nie ma różnic pomiędzy liczbą osób uiszczających abonament a liczbą osób niepłacących.
Hipoteza alternatywna brzmi:
Istnieją różnicę pomiędzy liczbą osób nieopłacających, a opłacających abonament.
Teraz spójrzmy na wzór, musimy od liczby osób, które opłacały abonament (20) odjąć liczbę osób, która abonament opłacałaby teoretycznie (50) a następnie podnieść uzyskaną różnicę do kwadratu. Wynik dzielimy przez wartość oczekiwaną (50).

Tak samo robimy w przypadku osób, które nie opłacałyby abonamentu.


Następnie uzyskane ilorazy sumujemy.

18 + 18 = 36

Uzyskany wynik to nasza wartość statystyki chi kwadrat.
Aby stwierdzić czy uzyskany wynik jest istotny, musimy obliczyć stopnie swobody z następującego wzoru:

df = (r – 1) * (c – 1)

gdzie:

r i c to ilość poziomów zmiennych, dla których obliczamy chi kwadrat.
W naszym analizowanym przykładzie, występuję tylko jedna zmienna (opłata abonamentu), która przyjmuje dwa poziomy (opłacany abonament, nieopłacany abonament).

df = (2-1) = 1

Przyjęliśmy poziom istotności alfa = 0,05. Naszą wartość krytyczną chi kwadrat wyszukujemy z tablic. Na skrzyżowaniu kolumny poziomu alfa z wierszem stopni swobody odczytujemy wartość, która w naszym przykładzie wynosi 3,841. Ponieważ nasza wartość statystyki jest większa od wartości tablicowej, odrzucamy hipotezę zerową. Istnieją różnicę pomiędzy liczbą osób opłacających a nieopłacających abonament, przy istotności alfa równej 0,05. Warto jeszcze zauważyć że nasz wynik jest również istotny dla poziomu alfa 0,005. Im mniejszy poziom istotności założymy, tym mniejsze prawdopodobieństwo popełnienia błędu I rodzaju.

Test chi kwadrat niezależności


Stosowany w celu sprawdzenia czy dwie zmienne są niezależne od siebie (brak korelacji). Używany w przypadku zmiennych o charakterze nominalnym (jakościowym). Posłużmy się przykładem, aby zaprezentować jak obliczyć test chi kwadrat niezależności.
Zapytano dorosłych respondentów o swoje wykształcenie, oraz o to czy palą papierosy. Hipoteza zerowa brzmi: wykształcenie ankietowanych nie ma wpływu na palenie papierosów (brak zależności między zmiennymi), hipoteza alternatywna brzmi: wykształcenie ankietowanych miało wpływ na palenie papierosów (zmienne są zależne, korelacja występuję). Rozkład odpowiedzi przedstawia poniższa tabela:


Obliczamy na początek wartości oczekiwane, posługując się poniższym wzorem:


Najłatwiej będzie to wykonać w tabeli:


Po obliczeniu otrzymujemy nasze wartości oczekiwane:


Mając już nasze wartości oczekiwane (E), podstawiamy je do naszego wzoru na statystykę chi kwadrat. Dla przypomnienie, literą E oznaczonę są nasze wartości oczekiwane (obliczone powyżej), a literą O oznaczamy nasze wartości obserwowane (uzyskane w trakcie wywiadu). Obliczamy naszą statystykę dla każdej komórki w tabeli:


Po obliczeniu, powinniśmy otrzymać następujące wyniki:


Wartość zsumowanych obliczeń to nasza statystyka chi kwadrat (zaznaczono na czerwono). Czyli nasza wartość chi kwadrat równa się 19,05.
W kolejnym etapie musimy sprawdzić istotność naszej statystyki. Do tego celu musimy obliczyć stopnie swobody, posługując się poniższym wzorem:

gdzie:
r i c to ilość poziomów zmiennych, dla których obliczamy chi kwadrat.
W naszym przykładzie mamy dwie zmienne, jedna z nich przyjmuję dwa poziomy (pali, nie pali), druga zmienna trzy poziomy (podstawowe i zawodowe, średnie, wyższe). Po podstawienie do wzoru otrzymujemy:

Założony przez nas poziom istotności wynosi 0,05, aby sprawdzić czy nasza zależność jest istotna musimy porównać naszą obliczoną statystykę chi kwadrat = 19,05, z statystyką teoretyczną. Naszą wartość teoretyczną szukamy w tablicach rozkładu chi kwadrat. Na skrzyżowaniu kolumny, gdzie odszukujemy nasze stopnie swobody (2) i wiersza z założonym poziomem istotności (0,05), odczytujemy naszą statystykę teoretyczną, która wynosi 5.99.
Jeżeli nasze chi kwadrat teoretyczne jest mniejsze od wyliczonego to jest istotna zależność pomiędzy zmiennymi. W naszym przypadku, wartość teoretyczna (5.99), jest mniejsza od obliczonej (19,05). Odrzucamy hipotezę zerową, która mówiła że wykształcenie nie wpływało na to czy ktoś pali papierosy, czy nie. Nasza zależność jest istotna statystycznie przy poziomie istotności 0,05.
Spójrzmy jeszcze na naszą tabelę chi kwadrat, zauważamy że dla niższych poziomów p nasza statystyka jest nadal istotna statystycznie. Im niższa wartość p tym prawdopodobieństwo, że nasza zależność jest prawdziwa jest większe. Dlatego możemy śmiało napisać, że istnieje związek między paleniem tytoniu, a wykształceniem dla p=0,001.

Jak można zauważyć, test chi-kwadrat daje nam informacje o istotności związku między dwiema zmiennymi, aby określić siłę tego związku należy posłużyć się współczynnikami kontyngencji.

Jeśli potrzebuję Państwo szerszej pomocy w opracowaniu statystycznym swoich wyników badań, mają Państwo problem z analizą wyników pracy magisterskiej, lub inne pytania związane ze statystyką, zapraszamy do zapoznania się z naszą ofertą.

Website template designed by TemplateMonster.com