logotip carneta logotip referalnih centara
  Samoprocjena i procjena znanja u e-obrazovanju english
logotip referalnog centra
 
 

Referalni centri / Samoprocjena i procjena znanja u e-obrazovanju / Teorija procjene znanja / -pismena procjena / -analiza testa

Analiza nakon provedenog testa, a prije objave rezultata

 

Statistička analiza testa (tzv. "item" analiza), koja se provodi nakon očitavanja obrazaca ili sakupnljanja odgovora online, ima dvostruku ulogu: 

   korekcija konačnih rezultata testa, ako se nađu pitanja koja valja izbaciti ili korigirati točan odgovor
   ispravak pitanja u bazi i dobivanje smjernica za pisanje novih pitanja.

 Dijelovi statističke analize testa

 Osnovna deskriptivna statistika

 Izračunava se broj studenata na testu, srednja vrijednost, medijan, standardna devijacija, najviši i najniži rezultat.

 Indeks teškoće pojedinog pitanja

 Teškoća (odnosno lakoća) svakog pitanja (P) je udio točnih odgovora za svako pitanje. Određuje se  nakon testa izračunom % točnih odgovora.

Lakoća pitanja = ukupni broj točnih odgovora/ broj pristupnika testu
Težina pitanja = 1 - lakoća pitanja

Pitanja na koja odgovaraju gotovo svi ili nitko su "loša" tj. preteška ili prelagana i valja ih izbaciti iz testa, test treba rebrojati (revalorizirati), a pitanja ispraviti u bazi za narednu uporabu.Preporuča se iz psiholoških razloga da par prvih pitanja u testu budu lagana (oko 0,9).
Također prelagana pitanja su ipak prihvatljiva, ako se radi o dijagnostičkom testu ili prethodnom testu za provjeru znanja ne samo pojedinca već posebno skupine polaznika.
 Optimalna teškoća MCQ pitanja s n predloženih odgovora može se izračunati iz formule: 
P = 0,5 + 0.5 (1/n)
 Za pitanja vrste točno/netočno optimalna je teškoća 0,75, a prihvatljiv raspon 0,65 do 0,85. Pitanja ispod ili iznad preporučenog raspona treba ispraviti.
Najbolja MCQ pitanja s 3 distraktora imaju  teškoću 0,67
Najbolja MCQ pitanja s 4 distraktora imaju  teškoću 0,63
Najbolja MCQ pitanja s 5 distraktora imaju  teškoću 0,60
 Općenito govoreći
prihvatljiva težina pitanja je od 0,3 do 0,7. Pitanja ispod 0,3 su preteška, a iznad 0,7 prelagana.

Analiza nakon testa

 Nastavnik nakon testa, uz primjenu IT-a, treba provesti statističku analizu. 

 Ona omogućuje korekciju testa i provjeru ispravnosti pitanja, i utječe nakonačne rezultate.

 Također daje podatke za ispravljanje pitanja u bazi (za ponovu upotrebu) i smjernice za sastavljanje novih pitanja

 Indeks diskriminativnosti pojedinog pitanja

Nakon testa se indeks diskriminacijske vrijednosti pojedinačnih pitanja računa tako da se svi studenti (x) podijele u, uvjetno rečeno, "lošije" tj. donja trećina (27%) i u "bolje", tj. gornja trećina na rang listi (27%).
Za svako se pitanje prebroji broj točnih odgovora u lošijoj (L) i u boljoj (B) skupini, pa se izračuna indeks pomoću formule: 


Diskriminativnost = 2(B-L)/x
 

Što je veći broj, pitanje je "bolje". Iznad 0,35 su pitanja izvrsna. Između 0,35 do 0,25 su dobra, između 0,25 i 0,15 još prihvatljiva, ali ih treba za drugi test ispraviti, a pitanja ispod 0,1 treba izbaciti iz testa i test ponovo vrednovati bez njih. Vrlo lagana, kao i vrlo teška pitanja slabo diskriminiraju studente po znanju. Međutim ipak se preporuča, iz psiholoških razloga, staviti prva dva, tri pitanja testa lakša od ostalih.
 Drugi način mjerenja diskriminativnosti je izračunavanje koeficijenta biserijalne korelacije (PBCC, prema eng. poin biserial correlation coeffficient). Time se izračunava zapravo korelacija između učestalosti točnog odgovora na određeno pitanje i ukupnog rezultata studenata. Zbog toga što uzima u obzir sveukupne rezultate svih studenata, ovaj je pokazatelj bolji od jednostavnog omjera diskriminativnosti. Poželjni koeficijent je između 0,2 i 0,8. Međutim, imaju li sva pitanja visok koeficijent (iznad 0,6) test će vjerojatno biti pretežak.

 Učestalost pojedinih odgovora u svakom pitanju

  Ima li distraktora koji ne "zavode" ama baš nikoga, treba ih do slijedećeg ispita promijeniti."Prejake" distraktore treba provjeriti  da možda nisu točni.

Ponovljivost testa

 Treba izračunati Kuder Richardson 20. Dobar test KR 20 ima 0.70 ili veći. Radi se o testiranju ujednačenosti testova u različitim rokovima. Kad bi isti student pristupio testu s visokom ponovljivošću (KR20) on bi postigao isti rezultat. KR20 je ovisan i o duljini testa, tako da raste što je test obimniji.

  I na kraju dobra vijest i dodatan razlog zašto uporabiti IT-a u obradi pismenih testova:
      Dobri softverski paketi za obradu pismenih ispita provode analizu testa automatski ili jednim klikom mišem. Također rezultate za svako pitanje automatski unose povratno u bazu pitanja.

 
 

Copyright © CARNet
design: logotip kimajaka