亞太科學教育論壇,第九期,第一冊,文章十四(二零零八年六月) 鐘媚 國內學生學業成就評價研究綜述
|
《新課程背景下高中學生學業評價》課題組於2003年開始對學生學業成績評價進行理論研究和實踐探索。該項目研究分為兩個階段,第一階段是2003-2005年,主要就高中學業評價的基本理念和框架、模組終結性測驗的定位和方案、過程性評價的理念和方法、開放性試題的命制等進行了探討;第二階段是2005-2008主要就高中必修課程學業評價進行探討,主要考察必修模組的水準測試,在命題與考試方面開展實踐研究。這裏主要對該課題組在過程性評價的理念和實施、開放性試題的命制和開發兩個方面進行探討。
該課題組認為,過程性評價不是對微觀意義上的學習過程的評價,也不是只注重過程而不注重結果的評價,而是對課程實施意義上的學習動機、過程和效果的三位一體的評價(高淩飆,2004)。 為此,相對於終結性的或形成性的測驗方式,過程性評價更關注動態的學習表現,評價的內容主要包括以下三個方面(高淩飆,2004;鐘媚,2005)。
這裏指的學習方式來源於英語“approaches to learning”,具體含義包括:當學生面對學習任務時,他們對學習任務的價值取向和興趣,以及他們對學習本身的認識,導致他們對學習效果產生特定的期望,這種期望驅使學生採用特定的策略和方法完成學習的任務,從而產生與期望相匹配的結果。可見,學生學習前的預備狀態(presage)、學習過程中思考和活動的方式(process)、學習的結果(product),是一個密切相關的系統。簡言之,學習動機 + 學習策略 = 學習方式,學習方式是決定學習品質的重要一環,對學生的學習結果產生重大的影響。根據所涉及的動機和策略的不同,比格斯(Biggs,1987)把學習的方式分為表層式、深層式和成就式等。新課程所宣導的是深層式的學習,即學習者的學習由內在動機或好奇心產生,為滿足興趣、探究意義而自發、主動學習。
終結性測驗可以很好地考察經過一個學習階段後學生對知識技能的理解和掌握,而對反映學生智力發展的過程性成果則無法很好地反映。這就成為過程性評價關注的內容之一,具體來說,包括:①學習策略和方法。在學習過程中,以過程性評價作為交流的平臺,通過學生之間的相互觀察和提醒,可以促進他們不斷自我反思,從而提高學生的學習策略和方法水準。②與學科學習緊密相關而難以通過終結性評價衡量的智力因素,如解決現實科學問題的能力、創新能力等,這是考試測驗不能完全考出來的。③通過學科學習而達成的高層次學習目標,如正確的科學觀等。
學生的學習過程受多種因素的影響,其中非智力因素對學生的學習有十分重要的作用。過程性評價通過考察與學習密切相關的非智力因素,比如對學習任務的意向,學習的習慣,以及透過學習過程反映出來的情感和態度等,給學生以資訊回饋,促進學生進行反思和總結,使其對自身建立更加全面和深入地認識,從而提高學習的效果和品質。
2.過程性評價的實施
如何進行過程性評價?評價的實質在於價值判斷。從操作層面上看,評價的過程包括設計評價方案和工具,利用評價工具收集資料資料,對資料資料進行分析得出結論,對評價結論進行解釋。因此,過程性評價的實施應該包括以下四個工作環節(鐘媚,2005):
從評價的使用目的及結果來看,過程性評價屬於課堂學習評價,一般由學校自 主進行,評價的主體是教師和學生。在評價的過程中,教師雖然也作為評價者參與評價過程,但更多的是作為評價的監控者和組織者,所以評價的主體主要是學生, 評價的責任也就相應地落到了學生的身上。因此,評價工作的第一步是使學生理解評價的內涵和功能,明確評價的內容和標準。過去,由於學生長期處於被評價者的 地位,對於什麼是評價,評價的目的和作用是什麼,以及如何正確地評價自己和他人等的認識是比較薄弱的,導致在評價過程中不能正確地把握和對待評價的標準。 如何使學生提高對過程性評價的認識,使評價的水準由完全的下意識或潛意識水準以及情感水準逐步上升到理智水準,應該成為評價過程中的一項重要內容。當然, 教師作為評價的組織者和主體之一更應該積極地提高對評價的認識,在教學的過程中逐步引導學生學會評價。
從評價的內涵中可以看出,過程性評價是基於人們對學習品質的認識提出來的, 是一種較具體方法更為上位的評價方式,因此,不能將過程性評價與某種特定的評價方法甚至評價工具等同起來,應該根據學校和學生的實際情況,針對具體問題, 選擇合適的評價工具。該課題組開發了評價量表作為過程性評價的工具(見表2-1)。
表2-1:高中語文過程性學習評價用表(資料來源:鐘媚,2005)
模組 高 級 班 學生 學 號 200 年 月
評價
項目
評價內容
評價等級
自評
組評
1.情感、態度、價值觀
(1)熱愛祖國的語言文字,積極提高運用欣賞能力
(2)維護祖國的語言文字,抵制不良語言現象
(3)關注生活中的語言現象,並能分析判斷、取捨
(4)按質按量完成學習任務
(5)學習中表現得自信、勤奮、堅毅,追求卓越
2.過程與方法
(1)獨立思考,善於發現問題,有自己獨到的見解
(2)合作意識強,勇於表達,專注傾聽,樂於交流
(3)注重體驗美,創造美,陶冶性情,涵養心靈
(4) 善於計畫、比較、反思、總結、調整
(5) 勤於整理、辨析、積累,以各種方式充實自己
3.學習成果
(1) 閱讀廣泛,讀高文化品味著作,讀完整著作
(2) 表達交流語言規範、清晰、誠懇、有感染力
(3) 積累豐富、完整、準確,靈活運用
(4) 書寫工整認真,整潔美觀
(5) 作品豐富、完整,有創意;筆記有條理,清晰
特長及成果展示列舉
背誦的篇章
閱讀的書籍
發表及其它
個人
小結
小組
評議
自評等級
本人簽名
組評等級
組長簽名
教師總評
教師簽名
表格填寫說明:
1.過程性學習評價的方式為等級制,分四個等級:A等(優秀)、B等(良好)、C等(合格)、D等(仍需努力)。
2.各“評價欄目”的等級確認辦法:先給5個具體分項評定等級;再將等級轉換為分值:A等為3,B等為2,C等為1,D等為0分;最後把5個分數相加,得12-15分的為A等,8-11分為B等,4-7分為C等,0-3分為D等。
在學年或一個學習階段結束之後,應如何報告、解釋、利用過程性評價的結果?有的學校建議把“過程性評價的結果賦予權重,折算成一個分數,然後 與終結性評價的結果相加,作為最終學習結果”。那麼,過程性評價與終結性評價要不要整合?過程性評價屬於個體內差異評價,評價的目的並不是對 學生的學習下一個終結性的結論,而是促進學生的學習與發展;評價的內容主要不是學生最後達到的水準,而是學生的進步情況。教師和學生應該通過對收集資料的 分析,讓學生瞭解自己的進步和不足,在此基礎上提出建議,使學生明確將來繼續努力的方向。所以,簡單地把過程性評價的情況折算為一個分數加到考試成績裏面 去是沒有意義的。過程性評價的結果與終結性評價的結果應該分別給予呈現報告。
整個評價方案實施結束以後,還需要對於評價方案進行再評價,也稱“元評價”,即“在評價的過程中,為檢討評價方案, 實施過程與結果,藉以總結成功的經驗和糾正評價工作之不足,而對正在進行或已完成的評價進行價值判斷。”元評價的關鍵是確定元評價的標準問 題,即一份好的方案的標準是什麼。我們可以以下述問題作為準則考察評價的方案:
①有效。這個方案是為了解決什麼問題,是否最合理地解決了問題,在多大程度上達到了我們的目標?
②可行。方案的要求是否超出了學校現有的條件和能力?評價的工具是否繁瑣,是否給教師和學生帶來很大的負擔?
③可信。評價的標準是否恰切?評價工具收集的資訊是否準確?
通過對這三方面的考察,學校和教師可以找出評價方案的不足,改進評價的方式和工具,更好地完成下一步的評價工作。過程性評價是一個動態多元的,而不是一個僵化單一的評價方式,因此,即使在實施的過程中,學校和教師仍然可以根據變化的情況及時修正評價方案。
新課程強調學生的模組學分由各高中學校自主授予,這一措施大大增加了高中學校的辦學自主權和靈活性,有利於各高中學校根據自己的實際進行教學,全面落實素 質教育方針,形成自己的風格和特色。然而,由於學校條件和辦學理念上的差異,各高中學校的教學品質也有一定的差別。需要通過適當的檢測,對各高中學校的教 學品質進行監控,保證每一間高中學校的教學品質以及每一位高中畢業學生的學業都達到國家規定的基本要求。為此,教育部華南師範大學基礎教育課程研究中心, 從2006年開始,系統組織了高中語文、數學、英語、物理、化學、生物、政治、歷史、地理九學科的必修課學業水準測試。為了避免過去考試命題過於倚重封閉性試題的弊端,該課題組對開放性試題的命制方法進行了有益的探索。
過去的學業測評主要採用封閉性試題,該課題組認為,適當採用開放性試題在很大程度上彌補了封閉性試題的種種不足,特別在考查學生思維的靈活性和廣泛性,考查學生的實踐能力和創新意識,以及情感、態度、價值觀等方面有著封閉性試 題所無法取代的優點。開放性試題更符合新課程發展性評價的理念,在新課程的模組學業評價中應提倡適量使用開放性試題(高淩飆,吳維寧,2004)。
該課題組認為,開放性在編制上需要注意兩方面的問題:①試題是否有明確的檢測目標和檢測效度;②試題是否違背學科的基本規律。為了避免開放性試題評分主觀隨意性的弊端,該課題組集中研究了SOLO分類法(Structure of the Observed Learning Outcome)在命題中的運用。SOLO分類評價法的基本理念源于皮亞傑的認知發展階段論。皮亞傑的認知發展階段論指出,兒童在成長的過程中認知的發展是有階段性的,不同的階段之間的認知水準有質的區別。比格斯(Biggs,1982)和 他的同事通過研究發現,人的認知不僅在總體上具有階段性的特點,在對具體知識的認知過程中,也具有階段性的特徵。人在學習新知識過程中表現出來的思維階段 是可以觀察到的,因此稱為“可觀察的學習成果結構”。也就是說,學生在具體知識的學習過程中,都要經歷一個從量變到質變的過程, 每發生一次躍變,學生在對於這一種知識的認知就進入更高一級的階段,可以根據學生在回答問題時的表現來判斷他所處的思維發展階段,進而給予合理的評分。SOLO分類法將學生學習的結果由低到高分為五個不同的層次,即前結構(prestuctural)、單點結構(unistructural)、多點結構(multistructural)、關聯結構(relational)、拓展抽象結構(extended abstract)等。這五種結構的基本含義如下。(1)前結構:沒有形成對問題的理解,回答問題邏輯混亂,或同義反復;
(2)單點結構:回答問題時,只能聯繫單一事件,找到一個線索就立即跳到結論上去;
(3)多點結構:回答問題時,能聯繫多個孤立事件,但未形成相關問題的知識網路;
(4)關聯結構:回答問題時,能夠聯想多個事件,並能將多個事件聯繫起來;
(5)拓展抽象結構:回答問題時,能夠進行抽象概括,結論具有開放性,使得問題本身的意義得到拓展。
SOLO的五種層次代表了學生對於某項具體知識的掌握水準,從學生對某個問題的回答中,教師可以對照上述標準就學生對該項知識內容的掌握情況做出判斷。因此,這種評價方式可以幫助教師進行教學診斷,同時,也可以向學生提供有用的 反饋,所以SOLO分類法可以用於形成性的學生學業評價;另一方面,如果將上述五個層次賦予不同的等級分數,那麼學生對問題回答的品質就可以被量化,量化的分數可以作為終結性評價的依據。以下是依據SOLO的基本思想進行等級評分的歷史開放性試題和物理開放性試題,從中我們可以瞭解基於SOLO的評分標準編制的一般方法。
題目:請結合英國資產階級革命的相關史實,談談你對英國議會制度的理解(資料來源:黃牧航,2004)。
本題為一道問答題,考查學生思維能力的種類包括再現歷史知識、概括歷史知識、分析歷史事物的本質、闡述歷史發展的規律等等。而根據SOLO分類法,可以把學生的回答分為以下五種情況:①前結構的回答。這種回答只出現了一個簡單的判斷,我們不知道學生得出這種判斷的根據何在;或者只提供了一個史實,我們不知道這個史實說明了什麼問題。如:
答(1):英國的議會制度對英國歷史產生了巨大的作用。
答(2):1649年,議會把查理一世送上了斷頭臺。
②單點結構的回答。這種回答只依據了一個方面的史實,說明學生還沒有充分理解歷史發展的複雜性。如:
答:英國資產階級革命期間,議會組成了議會軍,打敗了王黨軍隊,使立憲立憲制能夠在英國確立。
③多點結構的回答。這種回答能夠依據兩個以上的史實,但是未能建立起這些史實之間的聯繫。如:
答:1640年,查理一世為籌措軍費而被迫重新召開議會,而議會卻以此為契機要求限制王權。當兩者的矛盾不可調和時就只能兵戎相見了。1645年,議會軍最終擊敗了王軍,並於1649年把國王送上了斷頭臺。
④關聯結構的回答。這種回答不但能夠提供多個史實,而且能夠在這些史實之間建立起某種聯繫。如:
答:英國資產階級革命其實是國王與議會之間的矛盾鬥爭引起的。1640年,查理一世為籌措軍費而被迫重新召開議會,而議會卻以此為契機要求限制王權。當兩者的矛盾不可調和時就只能兵戎相見了。1645年,議會軍最終擊敗了王軍,並於1649年把國王送上了斷頭臺。但是,議會與國王之間的矛盾並未根本解決。1660年,因為議會內部矛盾不斷,查理二世借機復辟。斯圖亞特王朝復辟後,國王與議會的矛盾更加尖銳,最後,議會不得不拋棄查理二世,把荷蘭的執政威廉三世迎來英國當國王,使立憲君主制最終在英國確立,國王與議會的矛盾也最終得以解決。
⑤抽象拓展結構的回答。這種回答不但能夠提供多個史實,而且能夠把對問題的認識上升到抽象的理論認識層次,能夠從理論上分析為什麼會出現這種現象,以及這種現象的發展規律。如:
答:英 國的議會起源於中世紀,議會與國王之間的矛盾是一直存在的。在中世紀,兩者的矛盾主要體現在王權與貴族特權的紛爭。到了近代,隨著資產階級勢力的發展,兩 者的矛盾則體現在新興的資產階級對君主專制統治的不滿,要求分享政治的權利。……(省略具體的史實)“光榮革命 ”後,資產階級立憲君主制最終在英國確立起來,表面上這種制度的特點是國王與議會並存,而實質上是議會的權力日益超過國王,因此,資產階級終 於能夠通過議會來實現對國家政權的控制。
教師任務:將一氣墊導軌傾斜放置,用尺規標明導軌上各點的位置,讓滑塊從導軌的高端滑下。不斷重複這一過程(資料來源:高淩飆,2005)。
學生任務:觀察上述過程並進行你認為必要的測量(可以利用自己的手錶和導軌上的尺規),記錄下結果,利用觀察和測量的結果,對上述過程進行描述。應清楚地寫出必要的文字說明、推導論證、公式計算、資料結論、圖線表格等等。
評分細則: 本題無參考解答,教師可參照下面標準給學生評分:
0 分:沒有回答,或給出的回答言不及義、不對題。
1 分:只有定性的描述,基本上能說清滑塊的運動過程。
2 分:有定性的描述和定量的測量。其中定量的測量只是測出幾個時間及距離而沒有做進一步的分析整理,也沒有結論;或測得的資料與實際的差距很大。
3 分:有定性的描述和定量的測量。其中定量的測量包括對滑塊運動到不同位置時,滑塊與原點的距離及運動所經過的時間,並能用這一資料計算出滑塊運動的平均速度或即時速度這兩個量中的一個。測得的資料基本上合理。
4 分:情況同上,但能將滑塊運動的平均速度和即時速度兩個量都求出來。
5 分:在前面的基礎上,整個報告的敍述,包括目的、原理、過程、資料記錄和整理、最後的結論等,條理清楚,結論明確。
7 分:在前面的基礎上,進一步求出滑塊運動的加速度。
9 分:在前面的基礎上,能利用所掌握的多種數學工具,包括圖表、圖線等等,將實驗觀察的結果非常清楚地表達出來。
10 分:在前面的基礎上,能從實驗事實出發對滑塊的運動以至普遍情況下的勻加速運動,或其他任何問題進行討論,且言之成理。
其他形式的答案,可參照上述等級給分。