[go: up one dir, main page]

Sari la conținut

Docimologie

De la Wikipedia, enciclopedia liberă

Docimologia este disciplina științifică care cercetează problemele examinării și notării elevilor și a candidaților la examene și concursuri,[1] în scopul îmbunătățirii condițiilor și metodelor de examinare.[2] Ea studiază modurile de notare, variabilitatea notării la examinatori diferiți și la același examinator, a factorilor subiectivi ai notării, precum și mijloacele pentru asigurarea obiectivității examenului.[3]

Numele său provine din limba greacă, dokime însemnând probă, iar logos, știință.[3][4] Primul care s-a ocupat de problemele examinării și a creat termenul de „test” este James M.K. Cattrell, asistent al lui Wilhelm Wundt, care în 1890 publică un studiu despre teste mintale. Data nașterii docimologiei este considerată în 1922, când Henri Piéron împreună cu soția sa și Henri Laugier au prezentat la cea de a IV-a Conferință Internațională de Psihotehnică lucrarea Étude critique de la valeur sélective du certificat d'études et comparaison de cet examen avec une épreuve par tests. Contribution à une docimastique rationnelle (română Studiu critic al valorii selective a certificatului de studii și compararea acestui examen cu o probă formată din teste. Contribuție la o docimastică rațională), un studiu efectuat pe 117 elevi având vârsta medie de 12 ani și 6 luni. În 1979 Piéron a definit docimologia drept „studiul sistematic al examenelor (moduri de notare, variabilitatea individuală și intra-individuală a examinatorilor, factori subiectivi etc.)”. Este o disciplină din familia psihologiei experimentale, având tangențe cu fiziologia.[4]

Test, examen, concurs

[modificare | modificare sursă]

Termenul de examen (latină examen) înseamnă cântărire. Scopul unei examinări este de a pune un diagnostic, o apreciere.

Examinarea se face pe baza unor teste (probe) scrise, orale, practice, publice, care sunt echivalente cu o măsurare. Rezultatul examinării se exprimă printr-o notă numerică sau un calificativ verbal. Pentru ca aprecierea să fie obiectivă trebuie ca proba și rezultatul ei să aibă aceeași semnificație pentru toți, atât cei examinați, cât și examinatori. Obiectul măsurării trebuie să fie același și să existe o unitate de măsură, invariabilă.[5]

Obiectul măsurătorilor poate fi divers: cantitatea de informație memorată, capacitatea de înțelegere, selecție, aprofundare și organizare a informației, capacitatea de a da un răspuns la o problemă concretă. Testul trebuie să fie adecvat scopului urmărit, conform „legii lui Sutton”[6].[7] Dacă se dorește testarea memoriei se va folosi o probă pentru memorie, dacă se urmărește puterea de judecată se vor folosi probleme care necesită raționament: inductiv, deductiv, analogic, de analiză sau de sinteză.[8]

Spre deosebire de examen, termenul de concurs (latină concursus) înseamnă luptă, confruntare. Concursul implică un număr limitat de locuri (latină numerus clausus), ceea ce face ca limita inferioară a notei să nu mai fie fixă, ea fiind aceea care plasează candidatul în numărul de locuri disponibile. Dacă examenul are preponderent un caracter școlar, apare în special în perioada de formare, concursul este preponderent social. Succesul la un examen asigură candidatului o anume poziție școlară, iar succesul la concurs îi asigură un rol, legat de drepturi și obligații.[9]

Scări, unități

[modificare | modificare sursă]
Echivalența notă numerică - calificativ verbal[10]
Notă Calificativ
0 nul[11]
1 foarte rău
2 rău
3 slab
4 mediocru
(nesatisfăcător)[1]
5 acceptabil
(satisfăcător)
6 destul de bine
7 bine[1]
8 foarte bine[1]
9 excelent[1]
10 perfect
[1] În scara cu 4 trepte.

La apreciere se folosesc scări cu 4, 5, 10 sau 20 de trepte. Scările cu un număr mic de trepte sunt mai susceptibile de a facilita punerea în acord a examinatorilor, în timp ce scările cu un număr mai mare de trepte permit o apreciere mai nuanțată. Se consideră însă că un număr de trepte peste 20 lasă prea mult loc hazardului.[12]

Una dintre întrebări se referă la necesitatea treptelor sub linia de admitere. Calitatea lor comună este de a clasa candidatul sub limita admisibilității, așa că unii dintre examinatori nu folosesc decât una din trepte. Rolul acestor trepte este însă de a evalua situația la începutul studiilor și a evidenția progresele. Efectul se observă și deasupra liniei de admitere, spre finalul studiilor ideal ar fi ca aprecierile să tindă spre treptele cele mai înalte.[13]

Pentru comparații relative, performanțele se apreciază în funcție de poziția în curba de distribuție, care sunt distribuții statistice de tip Gauss. O distribuție semnificativă se poate construi folosind cel puțin o mulțime omogenă de 100 de candidați. O probă poate fi etalonată pe baza distribuției sau prin compararea rezultatelor cu cele obținute la o probă similară, deja etalonată.[14]

Subiectivitatea examinatorilor

[modificare | modificare sursă]

Un test trebuie să fie valid și fidel. Prin validitate se înțelege că rezultatul obținut la un test se corelează cu rezultatul obținut în situația reală, adică testul măsoară valoarea dorită, iar prin fidelitate se înțelege că rezultatul va avea aceeași semnificație indiferent de persoana care măsoară.[15]

Examinatori diferiți, aceiași candidați, aceeași probă

[modificare | modificare sursă]

În literatură sunt citate studii în care cazuri în care la corectarea acelorași lucrări s-au observat diferențe apreciabile între examinatori. La corectarea unei aceleiași lucrări (la geometrie) de către 118 examinatori, pe scara de 100 s-au obținut valori între 28 și 92 de puncte, cu eroarea probabilă de 7,5 puncte.[16] Piéron prezintă alt caz, în care aceiași candidați sunt clasificați de două comisii diferite. Candidatul clasificat pe primul loc din 16 de o comisie era pe locul al 13-lea în clasificarea celei de a doua comisii, iar cel clasificat pe primul loc de a doua comisie era clasificat pe locul al 11-lea de prima.[17] Și alte studii din perioada respectivă (anii 1950 –1960) indicau aceleași divergențe.[17]

Alt caz este examinarea a două jumătăți de grup omogen de două comisii diferite. Candidații ale căror nume de familie începea cu o literă din intervalul A – L au fost considerați 71 % buni și 29 % mijlocii (cei respinși nu intră în acest procent) de una dintre comisii, iar cei ale căror nume de familie începea cu o literă din intervalul M – Z au fost considerați 30 % buni și 70 % mijlocii de cealaltă comisie, deși este evident că între numele de familie și performanță nu poate exista vreo corelație.[18]

Comisii diferite, candidați diferiți, aceeași programă

[modificare | modificare sursă]

Un studiu efectuat pe 3126 de lucrări scrise la examenul de admitere la facultățile din Iași (3 de la Universitate și 3 de la Medicină) au arătat lipsa de unitate în notare. La evaluarea acelorași lucrări de corectori diferiți diferențele au fost și de 5 puncte pe scara de 10. De asemenea, s-au constatat mari diferențe între probele scrise și cele orale, la proba la limba română obținându-se 56 de calificative „foarte bine” la oral și doar 6 la scris.[19]

Același examinator, aceeași probă, momente diferite

[modificare | modificare sursă]

Problema modificării aprecierii în timp a fost semnalată încă din 1925.[20] Laugier și Weinberg prezintă cazul în care la două corectări ale unor acelorași lucrări la interval de 3,5 ani se constată diferențe de până la 8 puncte pe scara de 20.[21][22]

Efectul „contrast”

[modificare | modificare sursă]

Efectul apare la aprecierea unei probe în comparație cu alta. Rot și Bujas au introdus lucrări etalon, apreciate „bine” într-un lot de lucrări apreciate „slab”, respectiv aceleași lucrări în alt lot, apreciate și ele „bine”. În urma reevaluării în aceste condiții, lucrările etalon au fost mult mai bine apreciate de cei ce au examinat lotul slab față de cei ce au apreciat lotul bun.[23] Bonniol indică într-un studiu că ordinea evaluării contează. Un lot de lucrări a fost evaluat într-o ordine dată, apoi în ordine inversă. O lucrare a fost mai bine cotată dacă a fost evaluată după o lucrare slabă, decât dacă a fost evaluată după o lucrare bună.[24]

Efectul „ordine”

[modificare | modificare sursă]

Efectul apare datorită schimbării gradului de exigență al examinatorului pe durata evaluării unui lot de lucrări. În studiul lui Bonniol exigența examinatorului a crescut treptat, ultimele lucrări au fost mai slab cotate ca primele. Studiul a contrazis presupunerea că situația ar fi inversă, însă a confirmat că efectul se manifestă.[24]

Efectul „halo”

[modificare | modificare sursă]

Efectul a fost numit astfel de psihologul Edward Lee Thorndike în 1920 și constă în faptul că aprecierile generale asupra unei persoane au tendința să se extindă asupra unor aspecte particulare legate de acea persoană. În învățământ, rezultatele bune obținute de un elev la disciplinele considerate mai importante influențează și notele de la celelalte discipline, media pe un trimestru influențează mediile pe celelalte trimestre, o ierarhie stabilită într-un an influențează ierarhia în anii următori etc. Acest efect este explicabil la nivel general prin corelația dintre inteligență și efortul depus și rezultate, însă poate fi un factor de eroare în cazul în care este nevoie de aptitudini particulare. Tot datorită acestui efect se interzice examinarea unui candidat de către un examinator cu care este înrudit.[25]

Critica examenelor tradiționale

[modificare | modificare sursă]

Supradimensionarea informațională a programelor școlare a materiilor de examen duce la aspecte grave ca surmenaj și memorare mecanică[26].

  1. ^ Florin Marcu Marele dicționar de neologisme (MDN), București: Editura Saeculum, 2000
  2. ^ Florin Marcu Dicționar de neologisme (DN), București: Editura Academiei, 1986
  3. ^ a b Pavelcu, p. 9
  4. ^ a b Martin, Jérôme (). „Aux origines de la « science des examens », 1920–1940”. Histoire de l'éducation (în franceză). Paris - Lyon - Rouen: Le Service d'histoire de l'éducation. 94: 177–199. ISSN 0221-6280. 
  5. ^ Pavelcu, p. 19
  6. ^ Willie Sutton, spărgător de bănci, întrebat de ce sparge tocmai băncile a răspuns „deoarece banii se află de obicei acolo”.
  7. ^ Pavelcu, pp. 20-25
  8. ^ Pavelcu, p. 31
  9. ^ Pavelcu, pp. 28-29
  10. ^ Pavelcu, p. 34
  11. ^ Această notă nu este folosită în învățământul din România, iar calificativul verbal este atribuit notei „1”.
  12. ^ Pavelcu, pp. 34-36
  13. ^ Pavelcu, pp. 36-37
  14. ^ Pavelcu, p. 40
  15. ^ Pavelcu, pp. 40-41
  16. ^ Introduction à la pédagogoe quantitative (în franceză). Bruxelles. . p. 27. 
  17. ^ a b Piéron, Henri (). Examens et docimologie (în franceză). Paris: Les Presses Universitaires de France (PUF). 
  18. ^ Pavelcu, Vasile (). „Factorul subiectiv în notare și organizarea concursurilor”. Revista de pedagogie. 4: 91–95. 
  19. ^ Pavelcu, pp. 70-71
  20. ^ Initiation à la méthode des tests (în franceză). Paris: Delagrave. . 
  21. ^ „Le facteur subjectif dans les notes d'examen”. Annales de Psychologie (în franceză). 28: 236–244. . 
  22. ^ „Le facteur subjectif dans les notes d'examen”. Annales de Psychologie (în franceză). 31: 239–241. . 
  23. ^ Rot, Nicola (). „Les distributions de notes scolaires, comparées aux distributions des résultats obtenus dans les tests de connaisance”. Actes du XIIIeCongrès de l'Association Internationale de Psychologie appliquée (în franceză). Paris: 513–519. 
  24. ^ a b Bonniol, Jean-Jacques (). „Les divergences de notation tenant aux effets de d'ordre de correction”. Cahiers de psychologie (în franceză). Paris. 8 (2-4): 181–188. 
  25. ^ Pavelcu, pp. 102-103
  26. ^ Pavelcu, p. 58
  • Vasile Pavelcu - Principii de docimologie, București: Editura Didactică și Pedagogică, 1968.