作者|溫才妃
“我是老師,不是行政考核的工具。”
不久前,一張中南大學軟件學院吳姓教師在朋友圈“吐槽”教務辦強制要求學生成績符合“正态分布”的圖片在網絡流傳。
對于此事,中南大學的回應是“分數無誤,溝通有誤”。
然而,這一回答并沒有止住人們對成績正态分布的激烈讨論。
究竟正态分布“惹”到了誰?教師評分時該不該參考正态分布?學業評價到底又該由誰說了算?
内卷化與不公平
事情的起因是這樣的。
在不久前結束的中南大學期末考試中,吳姓教師的課程參考人數為153人,最終成績90~100分占比70%以上,幾乎沒有低分。
其中,平時成績全都在95分及以上。
“教務辦要求我将50名學生的成績從90分改成80分,以符合‘正态分布’。”
吳姓教師在朋友圈吐槽,“抱歉,我隻在意學生……給多少人90分以上是試卷的結果,不是教務辦定的指标……”
這件事被傳上網絡,一時間引發熱議。
何為成績正态分布?
所謂“正态分布”是一種概率分布的特殊表現形式,在統計某次考試成績分布規律的時候,将成績按分數段制成統計圖,靠近平均成績的得分占多數,其餘成績以平均成績為中軸,向兩側逐次降低。
為何正态分布會引起如此強烈的抗議?
最大的不滿來自學生群體。
早在2011年,浙江大學學生就曾因通識核心課的成績執行正态分布,引發了激烈的讨論。
河南某高校建築專業本科生張韬告訴《中國科學報》,如果每門考試成績都要求正态分布的話,事實上加劇的是學生競争的内卷化。
比如,在做設計課作業時,為了區分高下,張韬和同學們“被迫過度競争”,死命地摳細節,“表面上看是作業質量更高了,但卻是熬了整整三個通宵換來的。有同樣的時間,不如用在做更有意義的事情上”。
而正态分布的思路又讓沖績點的學生感到“岌岌可危”。
“沖績點意味着幾乎毎門課程都不能失敗,而正态分布卻設置了較低的優秀率。”張韬說。
當然,一些高校設置正态分布的初衷,是為了防止學生盲目沖績點。
然而學生對此并不理解,為了保研、出國,到了期末找任課教師要分者大有人在,讓任課教師“撓頭不已”。
安徽某高校教師周京也認為,一味執行正态分布并無必要。
“正态分布的前提是樣本足夠多。如果學生人數不夠多,正态分布的前提假設就不成立。人為執行正态分布,迫使教師不得不調低學生的卷面分數,這對學生來說也是不公平的操作。”
相對評價與絕對評價
然而在現實中,執行成績正态分布的高校遠不止一兩家。
據記者了解,包括上海交通大學在内的不少高校中,都有“成績應呈正态分布”的相關規定。
“拉開檔次,中間居多,優秀、落後占少數,更符合人們一般的認知習慣。”華東師範大學上海終身教育研究院副教授侯定凱說。
但實際上,一門課的分數是否集中在某一區間,是否呈現正态分布,這是受到很多因素影響的。
分數集中在某一區間不外乎三種原因。
“一是學生能力集中在一個範圍,二是試卷難度太大或太小,三是評判尺度前後不一緻或有其他因素考量,這些都會導緻分數區分度不高。”侯定凱說。
如果隻是因為一門課的成績不符合正态分布,便機械地套用統計學上大數據所呈現的規律,未免過于“生搬硬套”。
但對于高校行政部門而言,要求學生成績體現某種區分度也有自己的道理。
侯定凱告訴《中國科學報》,成績評價方式大緻可分為相對評價和絕對評價兩類。
相對評價是指在某個特定的群體中分出高下,它出于管理的需要,并不完全代表實際的學生能力,适用于排名、評優、選拔等。
絕對評價考查的是學生實際達到的既定學業水平,某個學生的成績不會受他人或整體成績的影響,适合達标性考試。
那麼,高校裡哪些課程應采用相對評價或絕對評價?
記者查閱了相關規定。
有的高校表示:“對于全校公選課及大類課程,嚴格執行分數段比率人數限制,如90分不大于20%,80分不少于30%。專業課程無給分限制。”
周京認為,相比較一刀切的正态分布,類似的規定稍顯合理。
提供服務與同行評議
此次事件中,有人認為,行政人員的做法是基于從前的經驗導緻操作不當。
但中國教育科學研究院研究員儲朝晖指出,對于這一事件的讨論不能止步于具體做法的評價,而是應該厘清學業評價權的界限。
應采用何種評分方式?這一權力究竟當屬任課教師還是行政部門?對此,受訪者均表示,應當屬于教師,而非教務部門。
記者了解到,美國高校的教務部門通常不會對教師的評分決定進行幹預。
由于評分标準事先已明确寫入教學大綱,教師擁有評分的自主權和最終的決定權,而教務部門主要的職責是服務和支持科研、教學等教師日常工作。
“國内高校的行政部門應更多地承擔起服務者的角色。”
侯定凱說,在處理方式上,教務部門首先應在事前而非事後與任課教師講明評分要求,提醒教師在出題時注意鑒别學生能力的差異。
其次,事後如出現明顯的成績分布異常,教務部門應與任課教師共同讨論原因,查清究竟是學生能力、命題難度還是評價尺度中的哪個環節出現了“異常”,再決定下一步的處理辦法。
侯定凱建議,教務部門掌握了曆年課程成績的大數據,可以據此形成某門課程的參考标準。
“我們經常讨論分數貶值、分數膨脹等問題,這方面最常用的讨論依據是找到近幾年某位教師或某個專業的打分情況,與前10年甚至前20年的打分作比較。這一思路同樣可用于教學服務上,也就是說,我們可以在掌握分數總體變化趨勢的同時,深入分析背後各種可能的影響因素,并就如何不斷提升命題的科學性向教師提出建議。”
當然,我們還要直面這樣一個問題——命題難度,尤其是在評教壓力下,一些教師可能會出難度較低的考題,讓學生通過。
而這恰恰是行政人員監管成績評價的初衷之一。
如果把評價權交給教師個人,是否會存在這樣的疏漏,将學生“放水”通過?
侯定凱建議,試卷命題可以嘗試建立教學領域的同行評議機制,把相關領域的專家、評估專家集合在一起,分析某份卷子的命題質量到底如何。
對此儲朝晖表示認同,但他同時也提醒道,這樣的方式需要“多”而非“唯”,非專業的行政管理方式過于集中,是無法實現“多”的。
同行評卷涉及更多的是深層的大學管理和評價體制改革,而這并不是一個部門能夠解決的。
《中國科學報》 (2021-01-26 第6版 動态)
編輯 | 趙路
排版 | 郭剛
,