V družboslovnem raziskovanju primarne podatke posebej pogosto zbiramo z anketnim raziskovanjem. Ankete temeljijo na standardiziranem vprašalniku, s katerim sprašujemo respondente določena (vnaprej pripravljena) vprašanja. Zbrane podatke nato uporabimo za statistično analizo proučevane populacije, zato v primerih, ko gre zgolj za administrativno ali poslovno procesiranje individualnih odgovorov (npr. izpiti, psihološki testi, administrativni obrazci, volitve, glasovanja), ne govorimo o anketah, ampak o kvizih, testih, prijavah, glasovanjih, registracijah, formularjih, formah ipd.
V anketnem raziskovanju običajno uporabimo vzorec populacije, na osnovi katerega sklepamo na celotno populacijo, včasih pa anketiramo tudi kar celotno populacijo (npr. ankete zadovoljstva v podjetju, študentske ankete, popis prebivalstva). Med navedenima primeroma nastajajo v nekaterih pogledih interpretacije in posploševanja rezultatov zelo velike razlike (glej podpoglavje 4.3.6 Statistične analize).
V nadaljevanju je obravnavnih nekaj ključnih konceptov, ki jih moramo v primeru, da naša diploma vključuje anketiranje, ne le poznati in razumeti, ampak tudi ustrezno uporabljati.
- Obstajajo različni načini anketiranje (angl. survey modes). Zgodovinsko se je anketiranje začelo z osebnimi terenskim anketiranem (ang. face-to-face survey mode), z naraščajočo izobrazbo splošne populacije pa tudi s pisemskim anketiranjem (ang. mail survey mode). S pojavom telefonov se je hitro širilo telefonsko anketiranje (angl. telephone survey mode), ki skupaj z osebnim terenskim anketiranjem, sodi v osebno anketiranje (angl. interview survey mode), saj je v procesu anketiranja prisoten anketar, ki postavlja vprašanja in beleži odgovore. Drugače je v pisemskem anketiranju, kjer gre za samo-anketiranje (angl. self-administration). S pojavom računalnikov se je razširilo računalniško podprto anketiranje, predvsem CAPI (angl. computer assisted personal interviews) in CATI (angl. computere assisted telephone interviews). Z vzponom interneta se je pojavilo anketiranje po elektronski pošti (ang. email survey) in predvsem spletno anketiranje (angl. web surveys), ki danes tudi prevladuje. Pri spletnih anketah gre praviloma za samo-anketiranje, torej brez anketarja, zato so oznake, ki implicirajo prisotnosti anketarja ali intervju (npr. CAWI – computer-assisted web interviewing) neprimerne in se jim je treba izogibati, čeprav se morda pogosto pojavljajo.
Načini anketiranja se lahko še nadalje strukturirajo. Pri tem je treba upoštevati, da ima vsak način določene značilnosti (npr. hitrost, stroški, kvaliteta, primernost za določeno problematiko) in tudi določene učinke anketiranje (angl. mode effect). Tako bi npr. respondenti v spletni anketi verjetno priznali uživanje kanabisa v bistveno večjem obsegu kot ga priznajo v osebni (terenski ali telefonski) anketi. Posebej pomembno je ločevati način anketiranja od vseh drugih vidikov anketnega procesa (npr. neodgovori, nepokritje, vzorčni okvir), ki so od načina anketiranja načeloma neodvisni. Tako je npr. lastnost verjetnostnega ali neverjetnega vzorca povsem neodvisna od načina anketiranja. Neverjetnostne ali verjetnostne vzorce imamo torej lahko tako pri osebnem anketiranju kot pisemskem ali spletnem. - V (prevladujočem) primeru, ko anketo izvajamo na vzorcu populacije, predpostavljamo, da je vzorec verjetnosten, kar pomeni, da poznamo verjetnosti vključitve za vse enote v populaciji (ne le za enote v vzorcu), pri čemer morajo biti verjetnosti vključitve za vse enote tudi pozitivne. Z nekoliko poenostavitve to pomeni, da so enote iz celotne populacije v vzorec izbrane slučajnostno, z nekim objektivnim mehanizmom radnomizacije, ki je neodvisen od raziskovalca (npr. namenska izbira), od anketarja (npr. priložnostna izbira na ulici) in tudi od respondenta (npr. samoizbira na spletu). Tipični primer slučajnostne izbire je sistem tombole, ki je osnova tudi za izbiro na osnovi slučajnih števil in za sistematično izbiro enot iz seznama vseh enot, kjer uporabljamo fiksni korak ter slučajni začetek. Verjetnostne vzorce včasih poimenujemo tudi znanstvene vzorce, saj so predpogoj za ustrezno znanstveno sklepanje iz vzorca na populacijo. Vzorci, ki ne izpolnjujejo kriterijev za verjetnostni vzorec, se imenujejo neverjetnostni vzorci. Gre za vzorce, ki jih lahko zberemo izredno hitro in poceni (npr. splošno vabilo v anketo na spletu). Žal pa v primeru neverjetnostnih vzorcev običajno statistično sklepanje, kjer izračuni iz vzorca služijo kot dobra ocena za parameter iz populacije (npr. povprečje iz vzorca je ocena povprečja v populaciji), ni mogoče,
- V primeru, ko anketo izvedemo na verjetnostnem vzorcu ciljne populacije, je treba ugotovitve iz vzorca prenesti na celotno populacijo, kar ni enostavno. Posploševanje običajno izvedemo s pomočjo formalnih postopkov statističnega sklepanja (angl. statistical inference), predvsem s točkovnimi ocenami, z intervali zaupanja in s preverjanjem domnev. V ponavljajočih vzorcih bi namreč lahko zaradi slučajnega variiranja pri sestavi enot v izbranem vzorcu – in dodatno tudi zaradi problema zanesljivosti – dobivali različne ocene. Pri tem bi želeli, da je to variiranje čim manjše, predvsem pa bi želeli, da je obseg tega variiranja znan vnaprej. Na tej osnovi bi lahko vnaprej ocenili, kakšno je tveganje, da se ocena, dobljena na vzorcu, od prave vrednosti razlikuje za vnaprej določeno vrednost, pri čemer bi vnaprej opredelili tudi dopustno tveganje, da se pri takem posploševanju motimo. Običajno dopustno tveganje pri statističnem sklepanju je 5%, za manj pomembne ocene 10 %, za zelo pomembne pa 1 % ali celo 0.1 %. Pri tem je najosnovnejši vzvod za manjšanje tveganja pri posploševanju predvsem velikost vzorca, saj dajejo večji vzorci, ki pa so seveda tudi dražji, v vseh pogledih boljše ocene. Vse to se v praksi najpogosteje izraža z intervali zaupanja (angl. confidence interval). Tako ima lahko določena volilna napoved (angl. poll) interval zaupanja 20 ± 4 %, kar pomeni, da se pri običajnem tveganju (5 %) prava populacijska vrednost nahaja znotraj intervala 16–24 %. Navedeno tveganje (5 %) pomeni, da se motimo le pri enem od 20 primerov postavljanja takih trditev. V tem okviru velja ponovno poudariti, da postopki statističnega sklepanja, s katerimi izračune v vzorcu posplošujemo na celotno populacijo, zahtevajo oziroma predpostavljajo poznavanje verjetnosti za vključitev enot v vzorec. Brez tega statistično sklepanje ni izvedljivo. Če statistično sklepanje kljub temu izvedemo na neverjetnostnih vzorcih, kjer verjetnosti za vključitev v resnici ne poznamo, s tem avtomatično predpostavimo ne le, da poznamo vse verjetnosti za vključitev (kar seveda ni res), ampak pogosto predpostavimo tudi, da so vse verjetnosti za vključitev enot v vzorec enake (kar pa sploh ni res). Problematika neverjetnostnih vzorcev je podrobneje obdelana v podpoglavju 4.3.5 Neverjetnostni vzorci.
- Pri anketnem raziskovanju je nadvse pomembna odločitev o velikosti vzorca. Pri verjetnostnih vzorcih obstaja v tem pogledu več kriterijev, predvsem absolutna napaka (margina oziroma širina intervala zaupanja) in relativna napaka (koeficient variacije za cenilko). Za vse to je treba nekaj statističnega znanja, ki pa se sicer običajno predava na večini dodiplomskih programov statike in metodologije. Pri tem lahko kot izhodiščni kriterij postavimo zahtevo, da je naša ciljna spremenljivka ocenjena vsaj z relativno natančnostjo 0.10 (še bolje 0.05), kar v primeru približno normalno porazdeljene spremenljivke na lestvice 1-5 pomeni okoli 10 enot, v primeru ocenjevanja deleža okoli 0.2 pa se zahteva vzorec okoli 350 enot. Že iz navedenih dveh primerov izhaja, da je bistveno bolje ocenjevati povprečja kot deleže, zato vedno, če je le mogoče, anketno vprašanja postavimo na lestvici, in ne v obliki dihotomije DA/NE (npr. bolje »Kako ste na lestvici 1-5 zadovoljni z …« in ne »Ali ste zadovoljni z …«).Obstaja sicer nekaj praktičnih in grobih približkov (angl. rules of the thumb) oziroma pogostih praks, ki so lahko določena orientacija, ne pa tudi avtomatičen recept:
- V mnenjskih anketah, katerih rezultati se objavljajo v najbolj udarnih medijih, so vzorci večinoma okoli 800 enot, kar je neodvisno od velikosti populacije (npr. populacija Domžal, Ljubljane, Slovenije, ZDA ali Kitajske), saj je z nadaljnjim naraščanjem velikosti vzorca, pridobitek v natančnosti – glede na ostale napaka (neodgovori, nepokritje, merska napaka) – razmeroma majhen.
- Pomembne družboslovne ankete (npr. Slovensko javno mnenje, Evropska družboslovna raziskava) imajo velikost praviloma v intervalu 1,000-2,000.
- Za zaokroženo obravnavno določenega problema, kjer nas zanima le nekaj podskupin (npr. moški, ženske), je velikost pogosto 200-300. Podobno velja, kadar želimo postaviti določen model (npr. regresija).
- V splošnem je 10 enot skrajni minimum za celico oziroma skupino, ki jo želimo analizirati. Če nas npr. zanimajo osebe glede na spol (2 kategoriji), starost (3 kategorije) in izobrazbo (4 kategorije), potem očitno potrebujemo najmanj 2×3×4×10=240 enot. Za resnejšo analizo namesto 10 potrebujemo v vsaki celici okoli 30 enot, kar je pogosto tudi minimum, ki ga zahtevajo resne organizacije (npr. statistični uradi) za objavo določene ocene. Še bolje je seveda imeti 100 enot, v primeru, da nas v vsaki celici zanimajo deleži, pa še več.
Odločitev o velikost vzorca je v vsakem primeru odvisna od okoliščin in od specifičnih namenov. Predvsem je pomembno na samem začetku razčistiti:
- kako natančne želimo imeti ocene,
- katere relativne razlike so vsebinsko pomembne,
- katere so naše ciljne spremenljivke,
- katere razlike po podskupinah nas zanimajo,
- kakšne teze, hipoteze in modele imamo.
Presenetljivo dejstvo je, da so zaradi slabega poznavanja problematike vzorci pogosto preveliki, posebej, kadar nas zanimajo spremenljivke, ki so porazdeljene približno normalno (npr. lestvice 1-5, plače, količine ipd.).
V primeru neverjetnostnih vzorcev ne obstajajo neka lastna ali posebna pravila, ampak se kot približek privzamejo oziroma uporabljajo načela verjetnostnih vzorcev. S tem seveda veljajo tudi vsa tveganja in opozorila, ki spremljajo verjetnostne vzorce (glej podpoglavje 4.3.5 Neverjetnostni vzorci).
- V splošni predstavitvi empiričnega raziskovanja je bil že obravnavan (podpoglavje 4.3.2 Empirija v družboslovju) koncept veljavnosti (angl. validity) merjenja, ki je v anketnem raziskovanju posebej podrobno razdelan. V okviru anketnega raziskovanja namreč obstajajo specifični pristopi za preverjanje veljavnosti določenega anketnega vprašanja, ki nastopa kot specifičen merski instrument, in na tej osnovi so izdelani posebni statistični indikatorji veljavnosti. Anketno vprašanje z visoko veljavnostjo (npr. vrednost 0.8 – 1.0) pomeni, da z njim dejansko merimo to, kar želimo meriti, nizka vrednost (npr. blizu nič) pa pomeni, da anketno vprašanje teoretskega konstrukta, ki ga želimo meriti, ne meri najbolje oziroma ga sploh ne meri.
- Z veljavnostjo tesno povezan koncept je tudi nepristranskost oziroma pristranskost (splošen uvod v koncept pristranskosti merjenja v družboslovju je podan že v podpoglavju 4.3.2 Empirija v družboslovju), saj ima v kontekstu anketnega raziskovanja posebej razdelano vlogo. Anketno vprašanje, ki ima nizko veljavnost, je namreč neredkopovezano tudi z določeno pristranskostjo. Pri proučevanju dohodkov se tako lahko zgodi – posebej, če metodologija ni ustrezno izbrana (npr. uporabljen je neustrezen način anketiranja) ali je kako drugače nekakovostna (npr. slaba ubeseditev vprašanja) –, da respondenti v anketi navajajo manjše dohodke kot jih imajo v resnici. Podobno se lahko zgodi, da respondenti ne poročajo npr. o uporabi kanabisa, čeprav ga konzumirajo. V takih primerih dobimo zaradi nizke veljavnosti merskega instrumenta pristranske ocene (npr. premajhen povprečni dohodek, prenizek delež uporabnikov kanabisa). V anketnem raziskovanju je namreč pristranskost opredeljena kot razlika med pričakovano vrednostjo anketne ocene v naši anketni raziskavi (npr. povprečna neto plača je 800 €) ter med pravo vrednostjo določenega populacijskega parametra. (uradna povprečna neto plača v populaciji je 1,100 €), kar nato pomeni pristranskost (npr. 300 €).
- Pristranskost ocene na osnovi anketne raziskave lahko nastane – poleg problemov zaradi veljavnosti merskega instrumenta – tudi zaradi drugih razlogov. To so lahko v primeru, da raziskava poteka na vzorcu, posebnosti statističnih postopkov, saj imajo npr. določeni izračuni oziroma cenilke na osnovi podatkov iz vzorca določeno pristranskost, posebej npr. pri izračunu variance. Posebej pogost vir pristranskosti rezultatov je tudi neustrezen oziroma neverjetnostni vzorec (glej podpoglavje 3.5 Neverjetnostni vzorci). V tem okviru velja posebej izpostaviti nepokritje, kjer vzorčni okvir, ki ga za anketo uporabljamo, ni dovolj izčrpen. Tako lahko v populaciji, ki ima fiksne telefone, dobimo v napšem vzorcu oceno deleža uporabnikov interneta vrednost p=0.5, čeprav je prava populacijska vrednost P=0.8. Pristranskost zaradi nepokritja (angl. noncoverage bias) v tem primeru znaša 0.3 (0.8 – 0.5) in nastaja npr. zato, ker je med uporabniki fiksnih telefonov preveč upokojencev, ki internet uporabljajo v manjšem obsegu. Ocena na osnovi take ankete je torej pristranska in s tem tudi napačna. Ocenjevanje deleža uporabnikov interneta z anketnimi vprašanji v vzorcih, ki temeljijo na fiksnih telefonih, očitno ni veljaven način merjenja tega pojava.
- Poseben primer pristranskosti je tudi pristranskost zaradi neodgovorov (angl. nonresponse bias). V anketi se namreč zlahka zgodi, da določene enote ne želijo sodelovati ali pa niso dosegljive. Če npr. uporabniki kanabisa v večji meri zavračajo sodelovanje anketi, bomo obseg rabe kanabisa zaradi tega seveda podcenili. Podobno bo v primeru, ko osebe z visokimi dohodki ne želijo sodelovati v anketi, anketna ocena povprečnega dohodka na osnovi sodelujočih respondentov prenizka. Problem je lahko tudi dosegljivost enot v primeru ankete o potovanjih, če takšno anketo izvajamo preko fiksnih telefonov, saj bodo osebe, ki veliko potujejo, za našo anketo nedosegljive, hkrati pa bodo dosegljive predvsem osebe, ki ne potujejo veliko in so pogosteje doma (npr. upokojenci), s čimer bo obseg potovanj v taki anketi podcenjen.
Ekstremen primer učinka neodgovora je hipotetična pisemska anketa, kjer enote v verjetnostnem vzorcu slovenske populacije sprašujemo, če sodelujejo v pisemskih anketah. Če v pisemskih anketah dejansko sodeluje le okoli npr. 10 % populacije, bomo namesto dejanskega deleža, ki je v resnici 10 %, na osnovi odgovorov kooperativnih enot (respondentov) v taki pisemski anketi dobili delež zelo blizu 100 %, saj bodo odgovorile le osebe, ki se na take ankete odzivajo. Dobljena ocena bi bila zaradi neodgovorov seveda povsem napačna, in to kar za 90 %.
Dejstvo je, da so danes stopnje odgovorov (angl. response rate), kar računamo kot razmerje med enotami, ki so odgovarjale, ter vsemi za raziskavo ustreznimi enotami, zelo nizke in vse bolj upoadajo. Le najboljše uradne ali akademske ankete lahko v osebnem terenskem anketiranju dosežejo stopnjo odgovorov 60 % ali več ustreznih enot, skoraj nobena pa ne preseže 70 %. V marketinških in komercialnih raziskavah so stopnje odgovorov v osebnih terenskih anketah dramatično nižje, in to za najmanj dvakrat, torej so praviloma pod 30 %. Podobno razmerje velja tudi za telefonske ankete splošne populacije, kjer javne in akademske ankete dosegajo stopnjo odgovorov okoli 40 – 50 %, marketinške in komercialne pa ne presežejo 20 % in so pogosto eno-številčne. Še nižje stopnje odgovorov v splošnem dosegajo pisemske in spletne ankete. Vse navedeno seveda velja le za verjetnostne vzorce splošne populacije in za standardne metodološke pristope. Slednje običajno pomeni, da se v primeru neodgovora izvedejo vsaj trije kontakti, hkrati pa se ne uporablja posebnih nagrad. Stopnje odgovorov pa se seveda lahko močno spremenijo v primeru anketiranja posebnih populacij (npr. zaposleni, člani društva, potrošniki, naročniki, ipd.) in v primeru posebnih metodološki pristopov, ki višajo sodelovanje (npr. večje število kontaktov, kombinirani načini anketiranja, nagrade).
Upoštevati je tudi treba, da pri neverjetnostih vzorcih stopenj odgovorov sploh ni mogoče računati, saj v raziskavo z verjetnostnim mehanizmom niso vključene vse ustrezne enote, kar preprečuje, da bi lahko stopnje odgovorov računali. V primeru neverjetnostnih vzorcev namreč lahko računamo le stopnje sodelovanja (angl. cooperation rate), ki kažejo razmerje med povabljenimi in sodelujočimi.
Pri vsem tem je pomembno razumevanja, da nizke stopnje odgovorov ne pomenijo avtomatično tudi pristranskosti zaradi neodgovorov. Nesporno je, da pri manjših stopnjah odgovorov, posebej pod 60 %, nevarnost pristranskosti hitro narašča. Pristranskost pa je lahko visoka tudi pri 95 % stopnji odgovorov, če je med nerespondenti ravno celoten segment, ki nas zanima (npr. uživalci določene droge, brezposelni). V tem okviru je zelo poučen tudi že omenjeni primer hipotetične pisemske raziskave o sodelovanju v anketah, pa tudi anketa Slovensko javno mnenje, ki je bila izvedena pred plebiscitom o samostojni Sloveniji 1990. V njej so pri stopnji odgovorov 80 %, ravno osebe, ki niso podpirale samostojne Slovenije, pogosteje odklonile odgovor na vprašanja, ki so bila povezana s plebiscitom. Na tej osnovi je bil delež nasprotnikov samostojnosti močno podcenjen (7 % namesto 13 %). Kadarkoli je vsebina visoko povezana s sodelovanjem, lahko torej nizka stopnja sodelovanja povzroča visoko pristranskost zaradi neodgovorov.
Na drugi strani pri določenih marketinških vsebinah (npr. analiza tržnih deležev gaziranih pijač ali operaterjev mobilne telefonije) tovrstne povezanosti morda sploh ni, in lahko dobimo nepristranske ocene celo pri 1 % stopnji odgovorov.
Povezanost med stopnjo odgovorov in pristranskostjo zaradi neodgovorov je torej v veliki meri odvisna od narave spremenljivke. V vsakem primeru pa je v tem pogledu potrebna previdnost. Smiselno je, da v literaturi poiščemo, ali je naša spremenljivka občutljiva na neodgovore. V takem primeru lahko kot prvo uporabimo določene metode za obravnavo problema neodgovorov (glej npr. Callegaro et all, 2015), kar pa je običajno metodološko precej zahtevano. V vsakem primeru pa morebitne visoke stopnje odgovorov in tudi dejstva, ki govorijo o nevarnosti pristranskosti zaradi neodgovorov, vključimo v interpretacije. Če npr. proučujemo uporabo kanabisa, zato pri interpretaciji rezultatov izrecno navedemo, da npr. pregled odgovarjajoče literature kaže, da so anketne ocene premajhne za približno dvakrat polovico. Podobno lahko pri študiji gaziranih pijač med študenti navedemo raziskave, kjer primerjava anketnih oceni in dejanskih prodajnih podatkov kaže, da so ocene na osnovi anket nepristranske, čeprav je stopnja neodgovorov zelo nizka.
- Podrobneje je v anketnem raziskovanju razdelan tudi koncept zanesljivosti (splošen uvod v koncept zanesljivosti merjenja v družboslovnem raziskovanje se nahaja že v podpoglavju 4.3.2 Empirija v družboslovju). Na tej osnovi so izdelani posebni indikatorji zanesljivosti (angl. reliability), ki izhajajo iz primerjave odgovorov med osnovno in ponovljeno meritvijo. V primeru popolne zanesljivosti ima odgovarjajoči indikator vrednost 1 (vsi respondenti v ponovnem merjenju podajo enak odgovor), v primeru popolne nezanesljivosti pa ima vrednost 0 (vsi respondenti ob ponovni meritvi podajo drugačen odgovor). Običajno želimo, da je indikator zanesljivost anketnega vprašanja nad 8 ali vsaj nad 0.6. Glavni dejavnik zanesljivosti je seveda kakovostno oblikovano anketno vprašanje, pomemben vpliv pa ima seveda tudi vsebina vprašanja, saj je npr. dejstva (npr. spol, starost, pojav določenega dogodka ali obnašanja) mogoče meriti bistveno bolj zanesljivo kot pa stališča (npr. odnos do vlade). Določen vpliv imajo lahko tudi druge okoliščine (npr. vpliv anketarja, prisotnost tretjih oseb, način anketiranja itd.). Posebej velja dodati, da se pri merjenju konceptov, katerih merjenje je zaradi njihove narave manj zanesljivo (npr. stališča, odnosi, zadovoljstva, strinjanja) običajno uporabi več vprašanj (vsaj dve), ki naslavljajo isti koncept, saj s tem pomembno večamo zanesljivost merjenja. V tem okviru so nam lahko v veliko pomoč že izdelana in testirana vprašanja, kjer so navedeni tudi indikatorji veljavnosti in zanesljivosti (npr. Survey Quality Predictor, http://sqp.upf.edu, Handboook of marketing scales, https://www.marketingscales.com).
- Izraz natančnost (angl. precision) je tesno povezan s statističnim sklepanjem, saj izraža obseg variiranja določene ocene v ponavljajočih vzorcih. Odgovarjajoča cenilka, npr. vzorčno povprečje, bi namreč v različnih vzorcih, ki pa so enake velikost in so bili iz populacije izbrani na enak način, nekoliko variirala okoli pričakovane vrednosti. Natančnost se izraža v širini intervala zaupanja, pa tudi z obratno vrednostjo standardne napako ocene ali vzorčne variance. Seveda si želimo čim večjo natančnost in s tem čim ožje intervale zaupanja.
- V tem okviru se pojavlja tudi pojem točnosti (angl. accuracy), kjer sta združeni komponenti pristranskosti in natančnosti. Ocene na osnovi vzorca so namreč lahko zelo natančne (npr. zelo velik vzorec), vendar kljub temu pristranske (npr. na osnovi vzorca fiksnih telefonskih števil). Na drugi strani pa so lahko nenatančne (npr. majhen vzorec), vendar so nepristranske, ker se uporablja kakovosten vzorčni okvir (npr. register prebivalstva). Katera kombinacija je v določnem primeru optimalna, je stvar konkretnih okoliščin in izračunov, kjer v ta namen uporabimo (in minimiziramo) srednjo kvadratno napako (angl. mean squared error – MSE), ki je vsota vzorčne variance in kvadrata pristranskosti. Za običajno uporabo je računanje srednje kvadratne napake prezahtevno. Kljub temu pa je pomembno, da pojem točnosti, če ga že navajamo, pravilno uporabljamo.
- V anketnem raziskovanju se pogosto omenja, da je določen vzorec za ciljno populacijo reprezentativen. To je slabo opredeljen in razmeroma nenatančen pojem, zato se ga je načeloma dobro izogibati. Reprezentativnost se namreč kot prvo nanaša na ocene in v osnovi ni lastnost vzorca. V strogo formalnem smislu pomeni, da ima reprezentativna ocena na osnovi vzorca vnaprej znano natančnost, ki ustreza tudi določenim strokovnim standardom. Pri tem se najpogosteje uporablja kriterij relativne natančnosti, kjer se zahteva, da je koeficient variacije odgovarjajoče cenilke npr. pod 0.10 (glej Kalton & Vehovar, 1992, st. 127). Lahko pa se kot kriterij uporablja tudi širina intervala zaupanja in v tem okviru lahko npr. zahtevamo, da se ocenjeni delež v vzorcu ne sme od dejanske vrednosti razlikovati več kot za dve odstotni točki (2 %). Osnovni problem koncepta reprezentativnosti je vsekakor v tem, da ima lahko vsaka spremenljivka drugačne kriterije oziroma drugačno natančnost. Določen vzorec oziroma anketna raziskava lahko zato omogoča ocene ki so reprezentativne za določeno spremenljivko, za drugo pa ne. Kljub temu se danes pojem reprezentativnost uporablja zelo široko, ohlapno in slabo opredeljeno. V splošnem je zato treba navedbo, da je nek vzorec reprezentativen – kar je kot rečeno že samo po sebi problematično, saj je reprezentativnost lastnost cenilke za določeno spremenljivko, ne pa vzorca – , razumeti predvsem v smislu, da so ocene na osnovi določenega vzorca reprezentativne (dosegajo določeno v stroki predpisano natančnost, npr. koeficient variacije 0.10) za nek minimalni nabor ključnih ciljnih spremenljivk, ki se v določeni anketni raziskavi obravnavajo. V ožjem smislu se navedeni minimalni nabor lahko nanaša zgolj na socio-demografske spremenljivke. Trditev, da je določen vzorec reprezentativen za slovensko populacijo, lahko zato v takem okviru pomeni, da se vzorec s populacijsko strukturo ujema v npr. spolu, starosti, izobrazbi, dohodku gospodinjstva in regiji. Pri tem velja ponoviti, da je v primeru kakovostnih verjetnostnih vzorcev z visoko stopnjo sodelovanja edini zadržek, da ne bi imeli reprezentativnosti, pravzaprav zgolj velikost vzorca. Če je namreč verjetnostni vzorec dovolj velik, lahko cenilka doseže poljubno veliko natančnost, in s tem doseže reprezentativnost, saj se lahko v zadostni meri približa pravi populacijski vrednosti.
Pojem reprezentativnosti se sicer praviloma nanaša na verjetnostne vzorce. Pri trditvi, da je reprezentativen določen neverjetnostni vzorec, se namreč pojavi cela vrsta dodatnih težav. Kot prvo za neverjetnostne vzorce same natančnosti vnaprej načeloma sploh ni mogoče izračunati, zato formalno o reprezentativnosti v primeru neverjetnostnih vzorec ne moremo govoriti. Kljub temu se izraz neredko uporablja tudi za neverjetnostne vzorce, kar je dodatni razlog, da se mu izogibamo. Če pa se pojem reprezentativnost v kontekstu neverjetnostnih vzorcev že uporablja oziroma nanj naletimo, ga okvirno razumemo na podoben način kot v primeru verjetnostnih vzorcev. Sporoča nam, da je določen vzorec za obravnavni problem oziroma za nabor odgovarjajočih ključnih spremenljivk nekako ustrezen oziroma primeren (karkoli že to pomeni). Takšno sporočilo oziroma zagotovilo je večinoma seveda zgolj subjektivno mnenje avtorjev raziskave in ga je treba jemati z velikim zadržkom, saj bi ga strogo gledano avtorji težko dokazali, še posebej ker je sam pojem reprezentativnosti razmeroma nejasen. V ožjem smislu pa navedba, da je določen neverjetnostni vzorec reprezentativen, sporoča, da se vzorec ujema s populacijo v vseh ključnih socio-demografskih spremenljivkah. Pri tem je seveda dobro poizvedeti in preveriti, v kakšnem obsegu je bilo to ujemanje doseženo naknadno z uteževanjem in kakšna so bila razmerja pred uteževanjem. V primeru, da smo avtorji take raziskave mi sami, pa je seveda primerno, da skrbno navedemo in izčrpno objavimo primerjavo socio-demografskih značilnost našega vzorca in populacije.
- V kontekstu obravnave pojma reprezentativnosti velja omenit tudi pojem robustnosti, ki se nanaša na dejstvo, da določena zakonitost kljub odstopanjem od predpostavk še vedno velja. Tipični primer so odstopanja od verjetnostnega vzorca, kjer v primeru robustnosti lahko določene statistične zakonitosti verjetnostnih vzorcev še vedno veljajo – kljub neizpolnjeni predpostavki o verjetnostnem vzorcu. Nekaj tipičnih primerov robustnosti:
- Vzorčno povprečje ali delež je lahko kljub neverjetnostni izbiri še vedno razmeroma dobra ocena populacijskega povprečja, čeprav za to načeloma ni osnove, ki bi izhajala iz statističnega sklepanja, saj slednje predpostavlja verjetnostni vzorčenje. Navedeno še posebej velja za spremenljivke s področja marketinga. Tako npr. za ocene tržnih deležev gaziranih pijač lahko rečemo, da so robustne, saj dobimo razmeroma pravilne deleže tudi v primeru neverjetnostnih vzorcev.
- Še bolj kot povprečja so v neverjetnostnih vzorcih robustne ocene korelacij, saj so kljub neverjetnostnemu vzorčenju neredko pravilne in dobro ocenjujejo vrednosti korelacij v populaciji.
- Podobno so pogosto robustni tudi izračuni povprečij in varianc za spremenljivke na ordinarni lestvici 1-5, čeprav pri tem ni izpolnjena predpostavka intervalne lestvice, ki je za te izračune sicer potrebna.
- Ravno tako so neredko razmeroma robustni tudi izračuni v multivariatni analizi, kjer formalno predpostavljamo večrazsežne normalne porazdelitve spremenljivk, vendar so izračuni lahko ustrezni tudi v primeru odstopanj od normalne porazdelitve.
<< Nazaj | Naprej >> |