教育也需要“診斷報(bào)告”——大規(guī)模教育測(cè)試結(jié)果報(bào)告的若干趨勢(shì)
【世界教育之窗】
作者:劉軒(南京工業(yè)大學(xué)副教授,教育學(xué)博士)
近年來(lái),隨著教育評(píng)價(jià)理念的不斷更新和測(cè)試技術(shù)的快速發(fā)展,國(guó)際上諸多大規(guī)模教育測(cè)試把關(guān)注的重心放到了測(cè)試結(jié)果上。就像到醫(yī)院體檢后會(huì)得到一份詳細(xì)的“診斷報(bào)告”一樣,參加大規(guī)模教育測(cè)試的學(xué)生也會(huì)得到相應(yīng)的結(jié)果報(bào)告——用來(lái)分析自己水平高低或能力強(qiáng)弱及其背后的成因,從而實(shí)現(xiàn)精確診斷和快速改進(jìn)的目的。
結(jié)果報(bào)告成為大規(guī)模教育測(cè)試的關(guān)鍵環(huán)節(jié)
從心理學(xué)的角度來(lái)看,大規(guī)模測(cè)試就是通過(guò)一系列外部刺激來(lái)收集被試的行為反應(yīng),并進(jìn)一步推斷其潛在特質(zhì)水平的過(guò)程。之所以稱(chēng)這種特質(zhì)是“潛在的”,是因?yàn)樗鼰o(wú)法和物理測(cè)量中的身高、體重那樣被直接觀測(cè)和度量。不同的測(cè)試,其測(cè)量的潛在特質(zhì)是不一樣的,它可以是能力、成就、個(gè)性?xún)A向、人格態(tài)度、價(jià)值觀等,也可以是教育領(lǐng)域中的學(xué)業(yè)水平、學(xué)術(shù)成就。當(dāng)我們用一定數(shù)量的試題來(lái)收集學(xué)生的作答反應(yīng),并把不同考生的水平用數(shù)量化的方式描繪出來(lái)時(shí),這就是考試。由于測(cè)量目標(biāo)、功能等方面的差異,不同測(cè)試在處理考生作答時(shí)采用的統(tǒng)計(jì)分析方法很不一樣,這導(dǎo)致測(cè)試最后提供的結(jié)果報(bào)告也各不相同。有些結(jié)果報(bào)告非常簡(jiǎn)單,就給出一個(gè)分?jǐn)?shù)或等級(jí),有些則經(jīng)過(guò)極其復(fù)雜的分?jǐn)?shù)轉(zhuǎn)換來(lái)給出詳細(xì)的描述。
對(duì)廣大被試或考生來(lái)講,參加考試最重要的就是得到一個(gè)體現(xiàn)自己真實(shí)水平的結(jié)果。在實(shí)踐領(lǐng)域,測(cè)試結(jié)果常常被用于各種重要決策,如高校選拔、升學(xué)鑒定、優(yōu)劣評(píng)判等。這不得不讓研究者和從業(yè)者高度重視結(jié)果報(bào)告的科學(xué)性、公平性?!叭绻鲆暳藴y(cè)試的結(jié)果報(bào)告,那之前的所有努力都將白費(fèi)”,這已經(jīng)成為國(guó)際測(cè)試行業(yè)的共識(shí)。目前,國(guó)際上最權(quán)威的行業(yè)標(biāo)準(zhǔn)——《教育與心理測(cè)試標(biāo)準(zhǔn)》就多次提到了結(jié)果報(bào)告的重要性,甚至對(duì)一些具體的技術(shù)指標(biāo)做出了明確規(guī)定:如測(cè)試機(jī)構(gòu)應(yīng)該負(fù)責(zé)提供關(guān)于測(cè)試結(jié)果的正確解釋?zhuān)唤Y(jié)果報(bào)告的信息應(yīng)該包括內(nèi)容范圍、測(cè)試結(jié)果的含義、精確性、結(jié)果使用等;結(jié)果報(bào)告要給出每個(gè)分?jǐn)?shù)或等級(jí)的測(cè)量誤差,并且提供與結(jié)果解釋有關(guān)的信息。教育是大規(guī)模測(cè)試應(yīng)用最為廣泛的領(lǐng)域。每年全世界都有數(shù)以?xún)|計(jì)的考生參加各種考試。受《教育與心理測(cè)試標(biāo)準(zhǔn)》等國(guó)際行業(yè)標(biāo)準(zhǔn)的影響,當(dāng)前大規(guī)模教育測(cè)試在結(jié)果報(bào)告上呈現(xiàn)出了以下幾個(gè)新趨勢(shì)。
趨勢(shì)一:結(jié)果報(bào)告經(jīng)過(guò)相應(yīng)的分?jǐn)?shù)轉(zhuǎn)換
無(wú)論什么樣大規(guī)模測(cè)試,最后都要呈現(xiàn)一個(gè)數(shù)字化或等級(jí)化的結(jié)果來(lái)對(duì)測(cè)試群體的水平進(jìn)行區(qū)分。在教育考試中,這個(gè)結(jié)果一般體現(xiàn)為分?jǐn)?shù)或等級(jí)。出于科學(xué)性和公平性的考慮,目前國(guó)際上知名的考試如SAT、ACT、TOEFL、IELTS以及大規(guī)模測(cè)試項(xiàng)目如PISA、TIMSS,其結(jié)果都是經(jīng)過(guò)復(fù)雜的統(tǒng)計(jì)處理而得出的,這個(gè)過(guò)程通常都涉及必要的分?jǐn)?shù)轉(zhuǎn)換。以TOEFL為例,作為一個(gè)面向全球的考試,它需要滿(mǎn)足來(lái)自不同國(guó)家和地區(qū)的考生,在不同時(shí)間參加不同版本試卷測(cè)試的需求。而在申請(qǐng)大學(xué)時(shí),TOEFL的分?jǐn)?shù)又必須是準(zhǔn)確一致和高度穩(wěn)定(成績(jī)兩年內(nèi)有效)。這必然要求考試設(shè)計(jì)者采用相應(yīng)的考試技術(shù),以確保各次考試分?jǐn)?shù)盡可能不受試題難度的影響。如果某次TOEFL考試的試題過(guò)難或過(guò)易,那對(duì)參加該次考試的考生就非常不公,高校在選拔學(xué)生時(shí)也會(huì)無(wú)法評(píng)估考生的真實(shí)水平。備受關(guān)注的PISA,其測(cè)試使用的試卷并不是全球都完全一樣,而是有多種試題組合并形成不同版本的試卷。PISA在全球幾十個(gè)國(guó)家和地區(qū)測(cè)試時(shí)就面臨與TOEFL一樣的問(wèn)題。分?jǐn)?shù)轉(zhuǎn)換是對(duì)考試結(jié)果進(jìn)行技術(shù)處理后的一個(gè)必要環(huán)節(jié),它使得測(cè)試結(jié)果更加科學(xué)公平和更容易解釋。因而,轉(zhuǎn)換后的分?jǐn)?shù),因其操作過(guò)程的模式化和結(jié)果的穩(wěn)定性,常被認(rèn)為是一種具有相應(yīng)標(biāo)準(zhǔn)的分?jǐn)?shù)。
趨勢(shì)二:結(jié)果報(bào)告具有診斷和改進(jìn)功能
對(duì)于一個(gè)大規(guī)模測(cè)試來(lái)說(shuō),分?jǐn)?shù)或等級(jí)是結(jié)果報(bào)告的主要呈現(xiàn)形式。但如果僅僅局限于這樣一些數(shù)字,那顯然是不夠的。隨著測(cè)評(píng)技術(shù)的發(fā)展,診斷性的結(jié)果報(bào)告在實(shí)踐中產(chǎn)生了深遠(yuǎn)影響。與傳統(tǒng)單一的“分?jǐn)?shù)條”相比,診斷性結(jié)果報(bào)告的內(nèi)容更加豐富、細(xì)致,對(duì)測(cè)試者的能力、水平的剖析也更加精準(zhǔn)。例如,在PISA公布的測(cè)試結(jié)果中,我們不僅可以看到各國(guó)或地區(qū)在各個(gè)素養(yǎng)上的總分,還可以進(jìn)一步了解在某個(gè)素養(yǎng)的次級(jí)維度上的表現(xiàn)以及在某個(gè)維度上的不同水平,這使得測(cè)試結(jié)果具有相應(yīng)的診斷功能,也更有利于參測(cè)的國(guó)家或地區(qū)深入分析成績(jī)的歸因并采取有針對(duì)性的改進(jìn)措施。在教育考試領(lǐng)域,SAT、ACT的結(jié)果報(bào)告在內(nèi)容上不僅更加豐富,而且還按需提供給多個(gè)利益相關(guān)者,其中包括大學(xué)、中學(xué)、政府甚至媒體和公眾。其中,SAT提供給學(xué)生的結(jié)果報(bào)告包括總分、分項(xiàng)成績(jī)、分測(cè)驗(yàn)分?jǐn)?shù)、跨學(xué)科分?jǐn)?shù)、子維度分?jǐn)?shù)以及相對(duì)應(yīng)的百分位數(shù)。在面向其他對(duì)象的結(jié)果報(bào)告中,SAT提供了更為詳細(xì)的結(jié)果,包括在國(guó)家或者州參照群體中的位置、在各類(lèi)問(wèn)題上表現(xiàn)、作答情況、原始分?jǐn)?shù)等等。ACT的結(jié)果報(bào)告同樣豐富而且涉及范圍更廣,除了各種分?jǐn)?shù)、百分位數(shù)、水平等級(jí)等基本的統(tǒng)計(jì)結(jié)果之外,還包括學(xué)生的高中、大學(xué)、職業(yè)、專(zhuān)業(yè)選擇和生涯規(guī)劃的信息。這些結(jié)果綜合了考生的背景、學(xué)習(xí)狀況、學(xué)科能力、個(gè)性?xún)A向、興趣愛(ài)好等等,基于此對(duì)學(xué)生做出的評(píng)價(jià)顯然更加全面和深入,也有利于學(xué)生提升自我認(rèn)知水平,有利于高校提高人才選拔成效,有利于中學(xué)改進(jìn)日常教學(xué)和管理工作。
趨勢(shì)三:在真實(shí)情景中對(duì)結(jié)果報(bào)告進(jìn)行描述和解讀
從統(tǒng)計(jì)測(cè)量的角度來(lái)進(jìn)行分?jǐn)?shù)解釋豐富了結(jié)果報(bào)告的內(nèi)容,完善了測(cè)試的功能,但僅僅圍繞這些統(tǒng)計(jì)數(shù)字來(lái)分析仍舊是有局限的。舉個(gè)簡(jiǎn)單的例子,只要有一把尺子,我們就很容易測(cè)量出一個(gè)成年男性的身高,比如170cm,這是一個(gè)客觀測(cè)量值,但這樣的身高究竟意味著什么,則在很大程度上取決于測(cè)量目的。如果說(shuō)為了選拔國(guó)家籃球隊(duì)的運(yùn)動(dòng)員,這個(gè)身高恐怕遠(yuǎn)遠(yuǎn)不夠。但在日常生活中,對(duì)這樣的身高也不能輕易得出個(gè)頭矮的結(jié)論。測(cè)評(píng)領(lǐng)域的專(zhuān)家早就認(rèn)識(shí)到:一系列統(tǒng)計(jì)分析后的結(jié)果可以用來(lái)判定優(yōu)劣和區(qū)分測(cè)試者,可無(wú)論這些結(jié)果多么豐富,還是無(wú)法解釋其背后深層次的含義。近年來(lái),國(guó)際測(cè)試行業(yè)開(kāi)始結(jié)合測(cè)量目標(biāo)本身來(lái)嘗試新的結(jié)果解釋方式。通俗地講,就是在原來(lái)描述測(cè)試結(jié)果“是什么”和“怎么樣”的基礎(chǔ)上,進(jìn)一步描述得到這些結(jié)果的測(cè)試者“能做什么”。例如,上面提到的ACT,它給考生的結(jié)果報(bào)告除了多個(gè)分?jǐn)?shù)的統(tǒng)計(jì)值外,還有與這些分?jǐn)?shù)相對(duì)應(yīng)的行為描述,并且進(jìn)一步預(yù)測(cè)學(xué)生在大學(xué)不同專(zhuān)業(yè)上獲得成功的概率。同樣,TOEFL考試的結(jié)果報(bào)告也有對(duì)取得該分?jǐn)?shù)考生所對(duì)應(yīng)能力的描述,包括水平分析、分?jǐn)?shù)說(shuō)明和學(xué)習(xí)建議。TOEFL閱讀部分的測(cè)試結(jié)果甚至納入藍(lán)思分級(jí)閱讀框架體系中。這個(gè)框架體系是用來(lái)評(píng)估英語(yǔ)閱讀能力和閱讀材料難度的一套標(biāo)準(zhǔn),在國(guó)際上擁有較高的權(quán)威性和廣泛影響力。TOEFL的閱讀分?jǐn)?shù)和它對(duì)接之后,有利于考生看到分?jǐn)?shù)所代表的真實(shí)閱讀能力,并據(jù)此來(lái)選擇與自身水平相適應(yīng)的閱讀材料,從而達(dá)到精準(zhǔn)匹配的目的。
最后需要強(qiáng)調(diào)的是,國(guó)際上這些具有廣泛影響的大規(guī)模教育測(cè)試,之所以需要引入復(fù)雜的統(tǒng)計(jì)技術(shù)來(lái)對(duì)測(cè)試結(jié)果進(jìn)行分?jǐn)?shù)轉(zhuǎn)換,除了考試實(shí)施的客觀需求和在科學(xué)與公平上的不懈追求外,一個(gè)很重要的原因是由其特殊的結(jié)果使用方式?jīng)Q定的。大規(guī)模教育測(cè)試一般都伴隨著重要決策,但在很多國(guó)家,這些測(cè)試結(jié)果僅僅是影響決策的一個(gè)重要因素,而不是唯一因素。如SAT、ACT和TOEFL等用于升學(xué)錄取的考試,其考試結(jié)果僅僅是高校人才選拔中的眾多指標(biāo)之一??忌谏暾?qǐng)這些高校時(shí),除了考試成績(jī)之外,一般還需要準(zhǔn)備多方面的材料,甚至還會(huì)參加面試。大規(guī)模測(cè)試是一個(gè)并不復(fù)雜的技術(shù)活,但測(cè)試結(jié)果的使用方式背后則有著深刻的文化、制度、社會(huì)、心理等方面的成因。不管怎樣,讓測(cè)試結(jié)果更加科學(xué)、公平和精準(zhǔn),讓測(cè)試結(jié)果更好地發(fā)揮診斷和改進(jìn)功能,是國(guó)際測(cè)試領(lǐng)域一個(gè)長(zhǎng)期努力的方向。
?。ū疚臑槿珖?guó)教育科學(xué)規(guī)劃2022年度教育部重點(diǎn)課題《新高考結(jié)果評(píng)價(jià)改進(jìn)的創(chuàng)新應(yīng)用研究》〔編號(hào):DFA220435〕的階段性成果)
版權(quán)聲明:凡注明“來(lái)源:中國(guó)西藏網(wǎng)”或“中國(guó)西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來(lái)源中國(guó)西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。
- 冬至陽(yáng)生春又來(lái)
- 【奮進(jìn)新時(shí)代·展品背后的故事】一張社???,凝聚珠澳共融情
- 260元“定制”一張身份證,該提升假證制售的違法成本了
- 代購(gòu)國(guó)外新冠治療藥?對(duì)癥買(mǎi)藥別盲目囤藥
- 最新動(dòng)態(tài):澤連斯基啟程訪(fǎng)美 普京說(shuō)俄將完成特別軍事行動(dòng)既定任務(wù)
- 中國(guó)寶武與中鋼集團(tuán)實(shí)施重組 中鋼集團(tuán)整體劃入中國(guó)寶武
- 藝術(shù)必須要美嗎?——談《藝術(shù)的真諦》
- 實(shí)現(xiàn)“雙碳”目標(biāo),計(jì)量和標(biāo)準(zhǔn)能做什么
- 公安部交管局提示:寒潮強(qiáng)降雪來(lái)襲 注意行車(chē)安全
- 戰(zhàn)斗英雄、“共和國(guó)勛章”獲得者張富清逝世