Z nekaj izjemami (npr. umetniške akademije, muzikologija, filozofija, jeziki ipd.) je statistika oziroma kvantitativna metodologija vključena v večino študijskih programov.

Nikjer ni priljubljena, povsod pa je pomembna, kar mnogi študenti spoznajo šele v procesu diplomiranja, praviloma torej šele po tem, ko so jo v času študija doživljali kot nujno zlo ter nekoristno in nepotrebno breme, in jo temu primerno tudi zanemarjajo.

Če v naši diplomi uporabljamo statistične pristope, je smiselno najprej pobrskati po gradivih in lastnih zapiskih odgovarjajočega predmeta študijskega programa. S tem se bomo namreč  daleč najučinkovitejše spomnili konceptov in razumevanja, ki ga pri uporabi statistike v naši diplomi tudi najbolj potrebujemo.

V tem pogledu uporabe statistike so med področji in študijskimi programi seveda znatne razlike, predvsem v strokovnih posebnostih in tudi v poglobljenosti. V nadaljevanju je zato podanih zgolj nekaj najsplošnejših napotkov o umeščanju statističnega razmišljanja v proces diplomiranja.

  1. Rezultate statističnih analiz vedno pospremimo z ustreznimi statističnimi interpretacijami, kjer navedemo, kaj točno določena številka pomeni. Pri tem ne pretiravamo s trivialnostmi, zato ne prepisujemo in v stavčni obliki ne ponavljamo vseh odstotkov iz tabel, k čemur so sicer močno nagnjeni mnogi študenti. V primeru tabele je, če ni njena vsebina res povsem očitna, treba navesti in interpretirati kvečjemu eno številko, tako da bralec razume njeno postavitev, kontekst in sporočilnost. Pomembneje je ob izračunih navesti, ali je npr. določen regresijski, korelacijski ali kontingenčni koeficient statistično značilen, in tudi to, ali je v obravnavanem statističnem okviru relativno velik ali majhen. Pri tem gre za podajanje osnovne statistične interpretacije, ki je v svojem bistvu tehnična dokumentacija in je zato načeloma neodvisna od izvajalca. Tako je npr. statistično značilnost določene ocene mogoče pojasniti na en sam strokovno predpisan in standarden način. Podobno je tudi na mnogih drugih področjih, kjer določen izvedenec podaja objektivno interpretacijo, ki se v osnovi (vsaj na področju naravoslovja in tehnike) ne bi smela veliko razlikovati od interpretacije drugega izvedenca. Tako npr. rentgenolog poda standardizirano tehnično interpretacijo rentgenskih izvidov, kjer ugotavlja tehnično stanje stvari, nato pa zdravnik izvede vsebinsko interpretacijo, kjer mnenje izvedenca (rentgenologa) poveže še z drugimi izvidi in sestavi celovito diagnozo. Šele pri tovrstni vsebinski interpretaciji lahko prihaja do večjih razlik, pri izvedenskem mnenju, posebej pri tehničnih razlagah kot je statistična interpretacija –   pa so pojasnila bistveno bolj standardizirane.
  2. Statističnim interpretacijam vedno dodajamo smiselno vsebinsko interpretacijo oziroma razlago. Pri tem seveda prioritetno ponujamo tiste razlage, ki so bile v literaturi že dobro obdelane. Nekaj ilustracij:
  • V primeru ugotovitve, da »moški pogosteje nakupujejo prek interneta kot ženske«, ki smo jo npr. podkrepili s statistično značilnim t-testom, je lahko možna npr. vsebinska razlaga, da so moški po naravi (ali pa zaradi vzgoje) že od otroštva bolj tehnično orientirani in zato z manj odpora in težav izpeljejo proces spletnega nakupa, ki je v določeni meri še vedno precej tehničen. Seveda za tako utemeljitev poiščemo podporo v čim kakovostnejši literaturi.
  • V primeru kompleksne interakcije (»med mladimi generacijami so ženske bolj izobražene kot moški, med starejšimi pa imajo moški boljšo izobrazbo kot ženske«) je možna vsebinska razlaga lahko naslednja: »Včasih so bile možnosti za šolanje ženskam bistveno bolj omejene, zato so med starejšimi generacijami moški bolj izobraženi. Danes so možnosti šolanja izenačene; ker pa šolski sistem nagrajuje vestnost in marljivost, so dekleta pri formalni izobrazbi uspešnejša kot fantje.« Naša razlaga bo imela seveda več teže, če jo bomo podprli s čim kakovostnejšo študijo oziroma virom, kjer je to že bilo obravnavano, npr. zgodovinsko študijo o selekciji pri izobraževanju v 20. stoletju.
    Pri vsebinski interpretaciji smo sicer razmeroma svobodni. Običajno namreč obstaja več možnih vsebinskih interpretacij (ne pa tudi več statističnih interpretacij). Paziti moramo le, da naša interpretacija ni v nasprotju s podatki, splošno sprejetimi spoznanji na določenem področju in zdravo pametjo. Upoštevati velja tudi vsa načela, ki so bila obravnavana v podpoglavju 4.2 Teorija in argumentacija.
  1. Zelo jasno je treba ločevati statistično značilnost določenih razlik, ki se v primeru, ko imamo vzorec, pojavi v kontekstu statističnega sklepanja, in njihovo pomembnostjo (relevantnostjo).  Statistična značilnost pomeni zgolj to, da je vzorec dovolj velik, da določene ocene iz vzorca lahko ločujemo tudi na nivoju populacije. Tako imamo lahko npr. dovolj velik vzorec, da za razliko v plači med 1,000 € (ženske) in 1010 € (moški), z minimalnim tveganjem trdimo, da je razlika statistčno značilna in torej razlika obstaja tudi v populaciji (ne le v vzorcu). Lahko bi sicer imeli celo tako velik vzorec, da bi bila statistčno značilna tudi razlika med 1,000 € in 1,001 €. Če pa bi bi imeli populacijske podatke, pa bi bile vse razlike “značilne”, saj so v populaciji povsem točne in dokončne, tudi npr. razlika med 1,000,00 in 1,000.04. V takem primeru namreč o statstični značilnosti  ne moremo govoriti, ker imamo populacijo in ne več vzorec. Ukvarjamo se lahko zgolj z vprašanjem, ali je razlika pomembna.  To je tudi sicer ključno metodološko in hkrati vsebinsko vprašanje, ki je neodvisno od problema statistične značilnosti. Slednje se namreč dodatno pojavil le v primeru, ko imamo opravka z vzorcem. V družboslovju se za osnovo o presoji pomembnosti pogosto vzame relativno spremembo za 5 ali 10 % oziroma 0.05 ali 0.10). V primeru povprečnega zadovoljstva na lestvici 1–5 pomeni povečanje za desetino (relativna sprememba 10 %) npr. spremembo od 3.0 na 3.3, kar je torej razliko, za katero bi lahko na osnovi zgoraj navedenega kriterija rekli, da je pomembna oziroma relevantna. Seveda ima to smisel le, če je bila razlika pred tem tudi statistično značilna, sicer relativne pomembnosti niti ne ugotavljamo in je seveda tudi ne interpretiramo. Tako npr. razlika v podpori določeni politični stranki med 12.1 % in 12.4 %, ki smo jo dobili v dveh mesečnih anketah velikosti n = 700, ne more biti predmet vsebinske interpretacije, saj zagotovo ni statistično značilna. Manjše razlike (npr. relativna sprememba pod 0.05 ali 0.10) torej običajno niso pomembne, saj so lahko rezultat slučajnih nihanj, kar velja tudi v primeru, ko so morda statistično značilne. Tako npr. relativna sprememba  v določenem zadovoljstvu za zgolj npr. 2 % ne predstavlja osnove za vsebinsko interpratacijo. S tako majhnimi relativnimi spremembami se v interpretacijah običajno ne ukvarjamo in zanje tudi ne iščemo vsebinskih razlag. V tem okviru se je treba izogniti tudi vsem predimenzioniranim interpretacijam, ki izhajajo npr. iz statistične značilnosti hi-kvadrat testa, posebej v primeru večjih vzorcev (npr. 10,000), kjer so praktično vse povezave statistično značilne (niso pa pomembne). Vse navedeno velja predvsem za tipične stališčne spremenljivke, ki jih merimo v anketah. V splošnem so majhne relativne razlike sicer v določenih primerih seveda lahko pomembne,kar je odvisno od narave proučevanjega pojava. Tako je npr. sprememba teže za 1 – 2 % (npr. od 60 na 61) lahko že precej pomembna, kar lahko velja tudi npr. za razlike v plači, saj se npr. sindikati v urejenih družbah pogosto pogajajo za npr. 2 % dvig plač. Majhne razlike so pomembne tudi za spremembe v stopnji gospodarske rasti (npr. 3.5 % na 3.6 %), saj taka razlika lahko pomeni milijarde evrov. Podobno velja za  stopnje brezposelnosti, kjer lahko v velikih državah desetinka odstotka (npr. 10.0 – 10.1%) pomeni sto tisoč brezposlenih. Ekstremen primer pomembnosti majhnih razlik so športni rezultati, kjer lahko v nekajminutnem teku ali vožnji štejejo že stotinke sekunde, torej gre za ralativne razlike, ki se merijo v desetisočinkah od vrednosti (npr. 0.02 %).
  2. V primeru, ko proučujemo populacijo in ne vzorec, velja opozoriti še na eno posebnost, Čeprav celoten kontekst statističnega sklepanja (npr. intervali zaupanja, preverjanje domnev) v takem v celoti odpade, saj imamo na voljo prave in točne populacijske vrednosti – in ne ocene iz vzorca, ki se med različnimi vzorci lahko spreminjajo –, se namreč včasih kljub temu obnašamo, kot da imamo vzorec. Tako npr. v primeru, ko obravnavamo podatke 29 držav EU, s t-testom formalno preverjamo domnevo o določenih razlikah med novimi in starimi članicami. Podobno je npr. v primeru, ko je v razredu s 30 otroci ali študeni analiziramo razlike med dekleti in fanti. Načeloma je statistično sklepanje v takem primeru seveda nepotrebno, nesmiselno in celo napačno, saj imamo vendar prave populacijske vrednost, zato so vse morebitne razlike avtomatično “statistično značilne” in se lahko zato v celoti posvetimo zgolj realtivnim razlikam. Kljub temu se včasih obnašamo, kot da so enote naše populacije zgolj vzorec iz neke večje (hipotetične) populacije oziroma so realizacija nekega superpopulacijskega modela (npr, slučajni izbor 30 enot iz normalne porazdelitve, ki ima določene parametre). To je lahko legitimen pristop, če je za določeno problematiko vsebinsko primeren in če tak pristop pred tem tudi izrecno utemeljimo. Narobe pa bi bilo, če bi  zaradi površnosti enostavno pozabili, da imamo populacijo, ne pa vzorec, in bi nato z vso resnostjo izvajalii “statsitično sklepanje”.
  3. Pri proučevanju vzročnosti oziroma kavzalnosti, torej vzrokov in posledic, se moramo zavedati, da v neeksperimentalnem raziskovanju lahko vedno obstaja spremenljivka, ki povsem spremeni naše ugotovitve. Tako bi npr. v primeru interakcije spol–izobrazba–starost zgolj bivariatna analiza povezanosti spola in izobrazbe – npr. »moški so enako izobraženi kot ženske« – močno zavajala oziroma poenostavljala, saj je to res le, če ne ločujemo generacij, kar pa v tem p rimeru ni pravilno. V resnici sta spol in izobrazba v tem primeru močno povezana, vendar v vsaki starostni skupini drugače. Brez vključitve starosti je zato analiza spola in izobrazbe povsem drugačna (ne ugotavlja povezanosti) in zato napačna. Pred tovrstnimi učinki se pri vzročni/kavzalni analizi vneeksperimentalnem raziskovanju (ki vključuje tudi skoraj vse anketne raziskave) ne moremo v celoti zavarovati. Največ, kar lahko naredimo, je, da vključimo vse potencialne relevantne spremenljivke (na osnovi literature in svoje pameti), posebej npr. izobrazbo, spol in starost, nato pa izvedemo kakovostne statistične analize (npr. regresija, analiza variance, strukturni modeli). Podrobna obravnava problematike se nahaja v podpoglavju 4.2.3 Vzročnost.
  4. Če so rezultati statističnih analiz oziroma sami podatki čudni ali nekonsistentniin za to nismo našli niti metodološkega niti vsebinskega razloga, je to lahko vzrok za našo veliko zaskrbljenost. Rešitev je običajno zelo enostavna: najbolje je, da to odkrito povemo, skupaj z navedbo, da gre za nekonsistentnost, za katero ne najdemo razlage. Pri tem je ključno navesti, da opažena nekonsistentnost za naš problem ni bistvena (kar velja za veliko večino primerov), zato bi njeno podrobno proučevanje in preračunavanje preseglo okvir naše diplome. Spreten analitik bo znal to izpeljati in zapisati na eleganten in sprejemljiv način. Seveda pred tem v celoti raziščemo, ali gre morda za napako v postopku zbiranja podatkov ali statistični analizi. Pogosto npr. spregledamo, da so na lestvici 1–5 odgovori »ne vem« kodirani z vrednostjo 9 ali 99 in so zato izračuni povprečij, kjer teh enot ne izločimo, seveda napačni. Ravno tako izrecno preverimo, če gre morda za majhen vzorec in lahko odstopanje pripišemo običajnemu (5 %) statističnemu tveganju, ki nastane pri nizkem številu enot. Neredko so nekonsistentnosti v podatkih ali statičnih analizah zgolj navidezne, saj gre le za prvi vtis oziroma prvi pogled. V tem okviru so lahko nekonsistentnosti koristne, saj zahtevajo našo poglobljeno obravnavo, ki pogosto pokaže, da nekonsistentnosti v resnici ni, temveč je treba nekoliko spremeniti razlago in razumevanje. V redkih primerih, ko je nekonsistentnost rezultatov za naš problem bistvena oziroma usodna, saj morda izniči vse naše delo, hkrati pa smo z gotovostjo izločili metodološke napake, je položaj seveda bolj neugoden. Če do takega primera nekako pride, to terja zelo posebno obravnavo, kjer se je treba seveda obrniti na mentorja, po potrebi pa tudi na specialista z določeno statistično metodo.
  5. Pri statističnih analizah je posebej pomembna tudi ustrezna etična drža. Posebej kritični so morebitno izmišljanje (fabriciranje) podatkov oziroma rezultatov statističnih analiz ter morebitno spreminjanje, izpuščanje in potvarjanje (falsificiranje) nekonsistentnih podatkov oziroma statističnih ugotovitev. Problematično je tudi preveliko izpostavljanje določenih ugotovitev in zanemarjanje (ali celo zamolčevanje) Podobno velja za naklepno izbiro in prilagajanje statističnih analiz, ki jih morda celo izvedemo na način, s katerim bodo potrdile naša pričakovanja. V teh primerih sicer ne gre za neposredno ponarejanje in izmišljanje statističnih podatkov in rezultatov, ampak za bolj rafinirane oblike etične kršitve, ki pa so ravno tako nesprejemljive. Statistične analize in interpelacije morajo biti namreč v vsakem primeru izvedene z vso objektivnostjo in na osnovi našega trenutnega najboljšega poznavanja (angl. to the best of our knowledge) statističnih metod. Vsi zgoraj navedeni primeri in še mnogi drugi zato pomenijo nesporno kršitev fakultetnih predpisov, ki opredeljujejo študentsko ravnanje, hkrati pa so tudi v nasprotju z vsemi etičnimi kodeksi strokovnih združenj, ki jih je v primeru kakršnihkoli dilem smiselno upoštevati. Problematika je izčrpno obravnava tudi v podpoglavju 4.2.5 Etika argumentacije,  predvsem pa v podpoglavju 3.4 Avtorstva in etika.
  6. V tehničnem smislu lahko upoštevamo priporočila glede običajnega poteka analiz anketnih podatkov, ki se nahajajo v virih (Raziskovalno poročilo).
  7. Formalni vidiki oblikovanja statističnih tabel in grafov so obravnavani v podpoglavju 5.5 Formalnosti. Posebej velja izpostaviti naslednje:
    • Pri številkah uporabljamo decimalno piko (in ne vejice, ki jo uporabljamo za razmejevanje tisočic), npr. 123,425.67. Tak pristop je namreč preglednejši in tudi običajnejši v tuji strokovni literaturi. Res je sicer, da slovenski pravopis priporoča decimalno vejico in ne decimalne pike, torej 123.425,67. V primeru, da tako določajo fakultetna pravila, pa se jim je seveda treba ukloniti.
    • Nikakor ni smiselno pretiravati z natančnostjo, zato odstotke praviloma zaključujemo brez decimalk (npr. 71 % in ne 71.1 %), povprečja na lestvicah (in praviloma tudi ostala povprečja) pa na eno decimalko, torej 3.3 in ne 3.211. Nadaljnje decimalke nimajo namreč nobene statistične informacije, relevantnosti niti vsebinske interpretacije, ampak so enostavno odveč in lahko v primeru, ko pretiravamo, zgolj razkrivajo, da smo statistični diletanti.
  8. V primeru statističnega preverjanja domnev je bila uvodna obravnava že v razdelku 4.3.4 Anketno raziskovanje, točka G. Statistično sklepanje. Pri praktični uporabi statističnega preverjanja domnev pa velja upoštevati predvsem naslednje:
  • Jasno je treba ločevati statistično značilnost, ko ugotovimo določeno vrednost ali povezanost s tveganjem, ki je npr. manjšo od p=0.05 od pomembnosti te povezave. Če je nekaj statistično značilno, namreč to še ne pomeni, da je pomembno. Na drugi strani pa ugotovitev, ki niso bile statistično značilne, sploh ne moremo obravnavati kot pomembne in jih vsebinsko interpretirati. Če imamo populacijske podatke (ali dovolj velik vzorec), pa je v formalnem smislu tudi sicer prav vsaka razlika statistično značilna, npr. razlika 0.01 ure v tedenskem številu ur učenja med dekleti 10.01 in fanti 10.00. Navedenih 0.01 je sicer lahko statistično značilnih oziroma je to že kar populacijska razlika, vendar je v vsebinskem smislu povsem zanemarljiva in irelevantna razlika. Zato je ne dovoljuje sklepa in vsebinske razlage, da dekleta porabljajo več časa za učene kot fantje. V tem pogledu velja upoštevati zgornjo točke E (Pomembnost in relevantnost).
  • Ker je natančen statističnih žargon, ki je povezan s preverjanjem domnev, razmeroma zapleten, je treba biti pri formuliranju stavkov natančen in previden. V tem okviru je v smislu odgovarjajočih interpretacij in konkretnega oblikovanja stavkov študent najprej dolžan pobrskati po zapiskih in domneve (hipoteze) formulirati domneve na ustrezen način ter samostojno izvesti odgovarjajoče izračune in interpelacije. Najbolje je, da za osnovo vzame kar primer iz odgovarjajočega učbenika oziroma študijskega gradiva. V tem pogledu se velika večina diplom, ki v družboslovju uporabljajo statistične metode, sicer omejuje na t-test, hi-kvadrat, kontingenčne koeficiente in regresije, kar vse je običajno pri odgovarjajočem statističnem predmetu tudi obdelano. Od študenta se praviloma ne pričakuje statističnih metod, s katerimi se ni seznanil v študijskem programu.
  • Pri preverjanju statističnih domnev je sicer potrebna velika skrbnost. Posebej kritičen je problem veljavnosti (glej 4.3.2 Empirija v družboslovju in 3.5 Anketne raziskave), kar pomeni, da se mora trditev, ki jo preverjamo, ujemati s tem, kar želimo preverjati. Vendar je tudi v primeru, ko imamo za svojo domnevo (hipotezo) veljavne, zanesljive in drugače kakovostne podatke, potrebna velika previdnost pri operacionalizaciji in interpretaciji. Vedno namreč obstaja vprašanje, kako se statistični rezultat ujema z našo domnevo (hipotezo) in kakšne dodatne omejitve nas pri tem vežejo.
  • Posebej kritična je previdnost pri statističnih interpretacijah, kjer se moramo zavedati omejitev naših podatkov. Nekaj primerov: če s t-testom ugotovimo, da srednješolska dekleta porabijo v določenem šolskem letu za internet več ur tedensko kot fantje, s tem ne moremo preverjati hipoteze, da ženske v splošnem uporabljajo internet več kot moški. Če s hi-kvadrat testom ugotovimo povezanost med spolom in negativno oceno na izpitu pri določenem predmetu v določnem študijskem letu, ne moremo preverjati, da so dekleta pri študiju na splošno uspešnejša od fantov. Če z regresijo ugotovimo, da na tedensko število ur rabe interneta osnovnošolcev v določeni šoli v določenem šolskem letu vpliva izobrazba staršev, ne moremo na tej osnovi trditi, da izobrazba staršev povečuje rabo interneta osnovnošolcev.
  • Pri interpretacijah se ne držimo preveč strogo običajnih kritičnih mej, npr. t=1.96 in odgovarjajočih stopenj značilnosti (p=0.05), kjer nato v primeru večjih p vrednosti (npr. p=0.06) domnevo avtomatično zavrnemo, v primeru manjših (p=0.04) pa jo vedno sprejmemo. Raje upoštevamo dejansko stopnjo značilnosti našega konkretnega primera (npr. p=0.07) in povemo, da ničelno domnevo zavračamo s tveganjem npr. 7 %. Ob tem navedemo, da tveganje sicer presega običajno mejo tveganja (p=0.05), kar pomeni, da bi v običajnih okoliščinah tako domnevo enostavno zavrgli in hkrati s tem navedli, da ne gre za statistično značilno vrednost oziroma razliko. Ob tem pa bi tudi dodali, da gre kljub temu še vedno za zmerno nizko tveganje. V primeru nekoliko blažjih kriterijev (npr. p=0.10), ki jih pogosto uporabljamo pri poslovnih odločitvah, namreč taka vrednost (p=0.07) pomeni statistično značilno vrednost. Celo vrednost t=1.0, ki odgovarja tveganju p=0.32, namreč pomeni, da pri zavračanja odgovarjajoče ničelne domneve (npr. trditev, da ni razlik med dekleti in fanti) tvegamo zgolj 32 %. To je sicer s formalnega vidika statistične stroke nesprejemljivo visoko tveganje. V statistiki namreč velja dogovor, da se ne postavlja oziroma objavlja ugotovitev, kjer obstaja tveganje, da se motimo v več kot 1 od 20 primerov oziroma 5 % (izjemoma v 1 od 10 primerov oziroma 10 %). Kljub temu pa tudi tveganje, da se motimo celo 32 %, še vedno ni slaba informacija oziroma ni povsem nekoristna, saj je kar dve tretjini možnosti, da se ne motimo. Pri igrah, stavah in poslovnih odločitvah pa so lahko koristne in na dolgi rok zmagovite že odločitve, kjer je tveganje 49 %. V marketinškem raziskovanju so zato v statističnih analizah pogosto izpostavljene (označene) tudi že vrednosti, kjer je odgovarjajoča t vrednost zgolj  t=1 (p=0.32).
  • Pri približni oceni vrednosti t-testa za razliko med dvema povprečjema oziroma deležema v neodvisnih vzorcih lahko uporabimo Viri: Excel tabelo t-testa, kjer so navedeni tudi odnosi med t-vrednostmi in stopnjo značilnosti (p), ter tabele t-testa.
<< Nazaj Naprej >>