Študenti, ki nimajo veliko izkušenj s statistično analizo anketnih podatkov, imajo lahko v odgovarjajočem empiričnem delu težave. V tem okviru so v nadaljevanju podana elementarna navodila, kako pristopiti k tipski analizi.

Poudariti velja, da spodnje besedilo v osnovi zgolj dopolnjuje podpoglavje Statistične analize, kjer je problematika celovito obravnavana. Kot rečeno, je pričujoče gradivo namenjeno predvsem za specifične skupine študentov, ki nimajo izkušenj s konkretno empirično analizo podatkov v družboslovju.

Dodati velja, da je v pogledu tabel in grafov smiselno upoštevati tudi podpoglavje Tabele in grafi, v pogledu analize in interpretacije pa tudi podpoglavji Analitičnost in Argumentacija in interpretacija, kot tudi ostale usmeritve glede pisanja raziskovalnih poročil.

Za začetnika je posebej primerno, če analizo izvaja ob tesnem zgledovanju na nek dober primer. V tem okviru lahko navedemo naslednje zglede:

  • Poročilo o študetmskih anketah UL na prvih dveh stopnjah in tretji stopnji.
  • poročilo RIS (tabele analiz določene ciljne spremenljivke po več kontrolnih spremenljivkah hkrati), posebej stran 26 (tabela, kjer je več ciljih spremenljivk hkrati analiziranih po več kontrolnih spremenljivkah),
  • Poročila pri predmetu PRP (nekatera sicer bolj, druga manj).

Uvod: Pri analizah anketnih podatkov – smiselno pa velja to upoštevati tudi za druge podatke – se pogosto soočamo z osnovnim vprašanjem, kako analizirati določen sklop vprašanj, za katerega imamo zbrane odgovore na vzorcu enot. Sklop običajno vključuje ciljna vsebinska oziroma problemska vprašanja (npr. politična vprašanja, sociološka vprašanja ipd.) ter demografijo (spol, starost, izobrazba ipd.). V nadaljevanju je podan prikaz tipskega poteka tovrstne analize. Krepko poudarjeno besedilo lahko služi tudi kot opomnik za preverjanje, če smo upoštevali najbolj pomembne usmeritve.

Kot prvo velja upoštevati, da moramo podatke obravnavati sistematično, tako da ne izpustimo nobenih vprašanj, hkrati pa sledimo nekemu vsebinskemu konceptu oziroma zaporedju sklopov. Analiz torej ne izvajamo povsem mehanično, npr. kot enostavno zaporedje vprašanj iz vprašalnika ali celo iz računalniškega izpisa opisnih statistik. Vsako spremenljivko – če se pri tem naknadno izkaže, da kakšna od spremenljivk v bistvu ni pomembna ali je narobe izmerjena, jo lahko tudi izpustimo – nato sistematično obdelamo v skladu s spodnjimi priporočili.

1) Osnovna analiza: Najprej predstavimo bistvene opisne statistike, in sicer:

  • za razmernostne, intervalne in običajno tudi za ordinalne spremenljivke uporabimo povprečja (morda tudi standardni odklon):
  • pri kategorialnih (ordinalne in nominalne) spremenljivkah predstavimo odstotke (deleže) oziroma frekvence. Pri tem v tabelah, če je le mogoče, praviloma vedno predstavljamo odstotke (deleže), absolutne frekvence pa običajno navedemo zgolj na nivoju odgovarjajočih vsot (100%). Samo kadar gre v vsebinskem smislu za zelo pomembne količine, poleg vsakega deleža (odstotka) navedemo še absolutno vrednost. Le res v zelo izjemnih primerih pa predstavljamo zgolj absolutne frekvence, brez deležev. Prikaz kategorij v tabeli oziroma grafu praviloma razvrstimo (sortiramo) od največjih do najmanjših. Za ordinalne spremenljivke prikažemo odstotke le, če so zelo pomembni.

Zelo pomembno je, da smo pri tem čim bolj lakonični, vendar izčrpni in ne navajamo odvečnih številk. Še bolj pomembno je, da številk ne ponavljamo. Nekatera specializirana analitična podjetja celo prepovedujejo, da bi se številka iz tabele ali grafa sploh še ponovila v tekstu.

*V primeru ocenjevanja na lestvici 1 – 5 (ordinalna spremenljivka) je npr. posebej primerna spodnja sumarna tabela, ki zavzema zelo malo prostora, hkrati pa na enem mestu vsebuje vse podrobne informacije (odstotke, povprečja, numerus). Pogosto pa nas taka natančnost niti ne zanima in damo tako tabelo v prilogo, v glavnem poročilu pa navedemo le povprečja.

Vprašanje

Odgovori (%)

Enot

Povprečje

1

2

3

4

5

Skupaj
Podvprašanje 1

30

20

20

10

20

100

213

2.7

Podvprašanje 2

10

10

10

50

20

100

267

3.6

2) Enostavni grafični prikaz: Namesto tabel – izjemoma lahko tudi hkrati (odvisno od okoliščin) – podatke predstavljamo grafično. V običajnem poročilu izhajamo iz osnovnih analiz (točka 1) in z grafi lahko tudi povsem nadomestimo tabele, lahko pa omejimo grafe predvsem za ključne poudarke. Še bolj primerno je, da grafe uporabimo zgolj za bolj kompleksne prikaze (glej točko 4). Vsekakor običajno ni primerno, da bi hkrati navajali za iste podatke tabele in grafe, čeprav lahko obstajajo tudi take situacije.

Če so tabele bolj natančne in imajo informacijo, ki v grafu ni razvidna, tabele praviloma priložimo v Dodatku (Appendix).

Lahko se sicer odločimo in prikazujemo vse rezultate izključno grafično, kar je pogosto predvsem za kratke medijske, mnenjske in promocijske predstavitve. Posebej so primerni stolpci (in ne krogi) ter radarji. V primeru ordinalnih, intervalnih, razmernostnih spremenljivk (npr. časovnih) lahko uporabimo tudi poligonsko črto (nikakor pa ne v primeru nominalnih spremenljivk). Z grafi ne gre pretiravati in jih delati mehanično za povsem trivialne rezultate.

Dodati velja, da v določenih primerih univariatnih analiz – torej enostavnih tabel oziroma grafov – tega sploh ne izvajamo, ampak jih prikažemo kar kot del (npr. zadnji sumarni stolpec v tabeli) bivariatnih analiz (glej točko 3).

*Pri vsaki tabeli in vsakem grafu tudi navedemo morebitno filtriranje ozioroma pogoj, kadar je bilo vprašanje izvedeno na podzvorcu (npr. zgolj ženske, uporabniki družbenih omrežij ali respondenti, ki so pred tem navedli, da določen problem poznajo).

3) Analiza po kontrolnih spremenljivkah: Kot strokovnjaki za področje, ki ga proučujemo, moramo na osnovi teorije in literature vedeti, kateri so ključni kontrolni dejavniki (npr. starost, spol, izobrazba) za naš proučevani problem. Če je npr. spol ključen, moramo vse pomembne ciljne spremenljivke preveriti za moške in ženske; običajno to naredimo v ustrezno orientirani tabeli – neodvisne spremenljivke (npr. spol, starost) navpično, vodoravno pa odstotki oziroma povprečja (ene ali več) odvisne spremenljivke.

Uvodoma zato izdelamo pregled kontrolnih spremenljivk:

  • katere kontrolne spremenljivke sploh imamo in katere so za nas pomembne in tudi primerne za analizo;
  • presodimo, katere kategorije so primerne za določeno kontrolno spremenljivko – morajo namreč biti pomembne, relevantne in dovolj velike (praviloma vsaj 10 enot, res zelo izjemoma do 4 ali 2), zato je treba kategorije združevati, še posebej, če se ciljne spremenljivke v sosednjih kategorijah obnašajo podobno; lahko pa kakšno majhno in nepomembno kategorijo tudi izpustimo.

Ravno tako moramo uvodoma skrbno pregledati, katere so naše ciljne (odvisne) spremenljivke,:

  • na osnovi vsebinske presoje identificiramo ključne ciljne spremenljivke, za katere bomo izvedli analizo po kontrolnih spremenljivkah;
  • nato po tehtnem premisleku za vsako od ciljnih spremenljivk presodimo, kateri parameter uvrstimo v kontrolno tabelo. To je največkrat povprečje, mediana, standardni odklon oziroma izbrani odstotek ali vsota odstotkov.

Na tej osnovi naredimo ustrezne bivariatne analize, npr. dvorazsežne (kontingenčne) tabele (angl. contintgency tables) ali povprečja po skupinah (angl. means), kjer analiziramo, če imajo kontrolne spremenljivke učinek na ciljne spremenljivke. V primeru interakcij lahko v stolpce vključimo več kontrolnih spremenljivk hkrati, npr. moški iglede na tri starostne skupine, ter ženske glede na tri starostne skupine.

Za kakovostno analizo izvedemo tudi ustrezno preverjanje domnev (hi kvadrat, analiza variance ali t-test) in nato v tabeli obarvamo statistično značilne celice (hi kvadrat, analiza variance) ali vrednosti (t-test), npr. kadar je vrednost- ali delež ciljne spremenljivke pri določeni kontrolni spremenljivki (npr. pri moških) značilno večji od povprečja. Lahko pa se namesto za obarvanje statično značilnih razlik odločimo tudi za obarvanje relativnih razlik.

Če povezanosti ni, podrobnih analiz in rezultatov včasih niti ne navajamo, ampak to ugotovitev zgolj navedemo v analizi in tudi ob zaključku. Za pomembne vidike, npr. preverjanje osnovne hipoteze, pa seveda podrobno izvedemo celoten postopek, ne glede, ali povezava obstaja ali ne.

Priporoča se, da spremenljivke za določen sklop obravnavamo v eni sami tabeli oziroma v čimmanj tabelah, pri čemer vsaka tabela vključuje vsebinsko povezane ciljne spremenljivke. Pri tem so kontrolne spremenljivke praviloma navpično kot npr. v poročilu RIS na strani 26, 23 in predvsem 26 (sploh je primerno si ogledati navedeno poročilo), pa tudi tabelo 7 v raziskavi o 1KA in tabelo 18.3 v poročilu o Študentskih anketah. Še več primerov in predlog je TUKAJ>>, Izjemoma so lahko tudi vodoravno, kot je navedeno spodaj, posebej v primerih, ko je ciljnih spremenljiv (npr. trditev) veliko ali pa imajo dolg opis, ki je neroden za celico v vrsticah.

Vprašanje

Odstotki (%) respondentov ki so ZA

Moški

Ženske

Mlajši

Srednji

Starejši

n
Vprašanje. 1

20

40

20

30

10

300

Vprašanje 2

50

30

20

50

40

400

Zelo pomembno pri izdelovanju tabel je, da jih v poročilo – če je le mogoče (obstajajo tudi izjeme, ki pa morajo biti utemeljene) -, ne vrivamo kot slike, ampak kot tabele.

4) Izdelava naprednih grafičnih prikazov. Bivariatne analize lahko posebej učinkovito prikažemo grafično (npr. povprečna plača po regijah, delež uporabnikov interneta po starostnih skupinah, povprečja po spolu ipd.). Podobno kot v primeru enostavnih analiz praviloma hkrati ne prikazujemo tabel in grafov, ampak tabele, če je to potrebno, dodamo v Prilogo (Appendix). Če nismo izkušeni, so primernejše tabele, saj to grafi bolj zahtevni.

5) Primerjava s prejšnjim leti in drugimi raziskavami: če imamo podatke za prejšnja leta ali rezultate kakih drugih raziskav, jih obvezno prikažemo v dodatni skupni pregledni tabeli. V primeru podatkov po letih je posebej primeren poligon povprečij (ali odstotkov) za različna leta. V primeru, da imamo za vsako leto več ordinalnih/razmernostnih kategorij (npr. slabo, srednje, dobro), potem lahko za vsako leto naredimo svojo linijsko črto (torej je na abscisi kategorija in ne leto). Če kategorije niso urejene, je primernejši radar, kjer so na krakih kategorije, na linijah pa leta.

Pomembno: Pri analizi je torej smiselno in običajno tudi potrebno, da uporabimo vseh pet komponent. Praviloma bodo torej v poročilu skoraj vedno nastopile vse točke 1-5. Pri tem bo formalna struktura poglavij takšna le izjemoma.

V vsakem primeru pa ob točkah 1-5 podajamo vsebinsko interpretacijo:

  • celotno statistično interpretacijo, ki pa ne sme biti trivialno ponavljanje podatkov iz tabel (tako npr. v primeru spola rečemo, da je moških značilno več kot žensk),
  • vključitev informacij virov izven ankete (npr. v primeru spola navedemo, kakšno je siceršnje razmerje v populaciji, npr. 48.%),
  • vsebinsko interpretacijo (npr. zakaj je moških toliko več),
  • predvsem pa navajamo posledice in kontekst glede na cilje, hipoteze in teoretski okvir (npr. kakšna je posledica za odvisne spremenljivke, v čem se moški razlikujejo, kaj lahko rešimo z uteževanjem ipd.). Pri tem upoštevamo siceršnja priporočila glede analitičnosti.