Statistička analiza testa (tzv. "item" analiza), koja se provodi nakon očitavanja obrazaca ili sakupnljanja odgovora online, ima dvostruku ulogu: Izračunava se broj studenata na testu, srednja vrijednost, medijan, standardna devijacija, najviši i najniži rezultat.
Indeks teškoće pojedinog pitanja Teškoća (odnosno lakoća) svakog pitanja (P) je udio točnih odgovora za svako pitanje. Određuje se nakon testa izračunom % točnih odgovora. Lakoća pitanja = ukupni broj točnih odgovora/ broj pristupnika testu Težina pitanja = 1 - lakoća pitanja Pitanja na koja odgovaraju gotovo svi ili nitko su "loša" tj. preteška ili prelagana i valja ih izbaciti iz testa, test treba rebrojati (revalorizirati), a pitanja ispraviti u bazi za narednu uporabu.Preporuča se iz psiholoških razloga da par prvih pitanja u testu budu lagana (oko 0,9). Također prelagana pitanja su ipak prihvatljiva, ako se radi o dijagnostičkom testu ili prethodnom testu za provjeru znanja ne samo pojedinca već posebno skupine polaznika. Optimalna teškoća MCQ pitanja s n predloženih odgovora može se izračunati iz formule: P = 0,5 + 0.5 (1/n) Za pitanja vrste točno/netočno optimalna je teškoća 0,75, a prihvatljiv raspon 0,65 do 0,85. Pitanja ispod ili iznad preporučenog raspona treba ispraviti. Najbolja MCQ pitanja s 3 distraktora imaju teškoću 0,67 Najbolja MCQ pitanja s 4 distraktora imaju teškoću 0,63 Najbolja MCQ pitanja s 5 distraktora imaju teškoću 0,60 Općenito govoreći prihvatljiva težina pitanja je od 0,3 do 0,7. Pitanja ispod 0,3 su preteška, a iznad 0,7 prelagana.
Analiza nakon testa | Nastavnik nakon testa, uz primjenu IT-a, treba provesti statističku analizu. Ona omogućuje korekciju testa i provjeru ispravnosti pitanja, i utječe nakonačne rezultate. Također daje podatke za ispravljanje pitanja u bazi (za ponovu upotrebu) i smjernice za sastavljanje novih pitanja |
Indeks diskriminativnosti pojedinog pitanja Nakon testa se indeks diskriminacijske vrijednosti pojedinačnih pitanja računa tako da se svi studenti (x) podijele u, uvjetno rečeno, "lošije" tj. donja trećina (27%) i u "bolje", tj. gornja trećina na rang listi (27%). Za svako se pitanje prebroji broj točnih odgovora u lošijoj (L) i u boljoj (B) skupini, pa se izračuna indeks pomoću formule:
Diskriminativnost = 2(B-L)/x |
Što je veći broj, pitanje je "bolje". Iznad 0,35 su pitanja izvrsna. Između 0,35 do 0,25 su dobra, između 0,25 i 0,15 još prihvatljiva, ali ih treba za drugi test ispraviti, a pitanja ispod 0,1 treba izbaciti iz testa i test ponovo vrednovati bez njih. Vrlo lagana, kao i vrlo teška pitanja slabo diskriminiraju studente po znanju. Međutim ipak se preporuča, iz psiholoških razloga, staviti prva dva, tri pitanja testa lakša od ostalih. Drugi način mjerenja diskriminativnosti je izračunavanje koeficijenta biserijalne korelacije (PBCC, prema eng. poin biserial correlation coeffficient). Time se izračunava zapravo korelacija između učestalosti točnog odgovora na određeno pitanje i ukupnog rezultata studenata. Zbog toga što uzima u obzir sveukupne rezultate svih studenata, ovaj je pokazatelj bolji od jednostavnog omjera diskriminativnosti. Poželjni koeficijent je između 0,2 i 0,8. Međutim, imaju li sva pitanja visok koeficijent (iznad 0,6) test će vjerojatno biti pretežak.
Učestalost pojedinih odgovora u svakom pitanju Ima li distraktora koji ne "zavode" ama baš nikoga, treba ih do slijedećeg ispita promijeniti."Prejake" distraktore treba provjeriti da možda nisu točni.
Ponovljivost testa Treba izračunati Kuder Richardson 20. Dobar test KR 20 ima 0.70 ili veći. Radi se o testiranju ujednačenosti testova u različitim rokovima. Kad bi isti student pristupio testu s visokom ponovljivošću (KR20) on bi postigao isti rezultat. KR20 je ovisan i o duljini testa, tako da raste što je test obimniji.
I na kraju dobra vijest i dodatan razlog zašto uporabiti IT-a u obradi pismenih testova: Dobri softverski paketi za obradu pismenih ispita provode analizu testa automatski ili jednim klikom mišem. Također rezultate za svako pitanje automatski unose povratno u bazu pitanja. |