1、十二年國教的五堂課多元評量設計實務,王碧莉2013.08.27,29方案已準備十多年,1.建構式教學 (第1、2、3節)2.多元評量的理論意義與現實意義 (第4、5節)3.雙項細目表及實作(第6節),從小,老師就不喜歡我考卷上的答案,一直被否定。,台中角頭翁奇楠命案槍手廖國豪,建構:建立結構皮亞傑研究認知發展所提出來的,建構式教學培養學生主動思考與表達的能力,建構式教學,教師給題目學生用自己的方法解答任何方法都可以討論分享找出適合自己的解答方式。接納:合理肯定,老師給題目,學生各自用各自之方法解題,再請學生上台發表各自不同解法之觀點。引出學生之想法、操作時主動參與、解題時反思。,沒有選擇題的教
2、育,2001-04-01 天下雜誌 239期,分香蕉,http:/ Intelligences),建構主義與教育革新,a.改變教師的教學b.改變教學的內容c.改變學生的學習d.改變學習評量的觀點e.改變師資培育,多元智慧的重要觀點,a、 每個人都具備所有八項智慧b、 大多數人的智慧可以發展到充分勝任的標準c、 智慧通常以複雜的方式統合運作d、 每一項智慧都有多種表現智慧的方法e、 與其他教師交換意見f、 與家長交換意見g、 與學生面談h、 設計特殊活動,人類的基本智慧,a.語言智慧b.邏輯-數學智慧c.空間智慧d.肢體-運作智慧e.音樂智慧f.人際智慧g.內省智慧h.自然智慧,教育改革的重點,
3、(一)課程的改革(二)師資培育方式的改進(三)重新架構所謂的學習評量,新式評量的學習觀,(一)學習是主動的(二)學習是基於先前的知識(三)學習是學習者概念重組的動態過程(四)學習是透過社會互動的過程(五)評量貫穿整個學習過程(六)學生被評量的是多樣性的學習表現,多元評量,(一)傳統評量:紙筆測驗法 (是非、填充、簡答、申論題)(二)表現評量 記錄分析法、活動分析法、作品 評量法、實作評量法等。(三)歷程檔案評量,多元評量的設計與實施,教學系統圖,教師,情境,目標,課程,學生,方法,1.老師教我,我容易忘記。2.老師示範給我看,我可能會記得。3.老師讓我參與,我會一輩子記得。 黑幼龍,一、評量的
4、目的在幫助學習, 測驗測什麼內容學生就得到什麼內容 (what you test is what you get) 有什麼樣的測驗就有甚麼樣的教學(what is tested is what gets taught) 考試領導教學,二、評量與教學的關係,三、教學評量宜審慎,教學評量命題的基本原則,看到的,不一定是真的!,比較看看兩條藍色的線哪一條比較長?,資料來源:擷取自網路,三、教學評量宜審慎,艾賓浩斯錯覺(Ebbinghaus illusion),比較看看兩個圖中的圓心有一樣大嗎?,資料來源:擷取自網路,三、教學評量宜審慎,內容,比較看看兩個球有一樣大嗎?,資料來源:擷取自網路,三、教學
5、評量宜審慎,資料來源:擷取自網路,乍看這張圖你(妳)發現圖中的人有什麼不同?,三、教學評量宜審慎,資料來源:擷取自MBC綜藝節目無限挑戰的截圖,圖中的人在車上做什麼 ?,三、教學評量宜審慎,資料來源:擷取自張仁家教授講義內容,圖中你看到了什麼 ?,三、教學評量宜審慎,資料來源:日本視覺大師北岡明佳(Akiyoshi Kitaoka)在他的網站中提到,這張圖是由一個日本的網頁設計師Nobuyuki Kayahara所製作。,網路流傳著每個人看到這張圖的旋轉方向不同是由於左右腦的作用。難道只憑一張旋轉女人圖,就能測出人類智商的高低嗎?,三、教學評量宜審慎,對很多人而言,從未懷疑過外在世界藉由光線傳
6、導而進入我們眼中所見的影像。事實上,視覺錯覺、不穩定圖像等現象,便說明了人類視覺系統不只被動傳遞由外界進入的訊息,更在傳遞訊息的同時主動的解釋各項訊息。,所以在教學的崗位上,您是否也用了主觀判斷來評價了學生的學習成就呢?,三、教學評量宜審慎,你的智商有多高?,只有0.02%的人能看到全部旋轉方向http:/ 先從腳踝慢慢的向上看,到臀部的位置再把視線移回腳踝。轉換視角:難易度 靠身體移動先站起來從仰角的位置看圖,再坐下從俯視的角度看圖。3.眨 眼:難易度 臉要靠近螢幕,視線放在臀部以下,每眨一次眼就能改變旋轉方向。4.遮蔽圖形:難易度 利用遮蔽圖形,讓視線集中圖片的某部分,有助於更快控制圖片旋
7、轉方向。5.強迫思考:難易度 集中精神努力的去想,用強迫思考的方式就能改變旋轉的方向。,白衣人傳球數?,http:/ Question(一),以紙筆測驗為例 Question(一),2.銅管焊接使用何種焊條最適宜? (A)銅焊條 (B)鐵焊條 (C)鋁焊條 (D)銀焊條,以紙筆測驗為例 Question(一),3.銅管焊接使用何種焊條最適宜? (A)膠 水 (B)糨 糊 (C)口 水 (D)銀焊條,1.施做伸展操時應該使用何種方法為宜?,以紙筆測驗為例 Question(二),以紙筆測驗為例 Question(二),2.施做伸展操時應該使用何種方法為宜? (A)動態被動式伸展法 (B)動態主動
8、式伸展法 (C)PNF伸展法 (D)靜態主動式伸展法,以紙筆測驗為例 Question(一),3.施做伸展操時應該使用何種方法為宜? (A)跑步 (B)跳繩 (C)PNF伸展法 (D)仰臥起坐,學生的學習目標,知識理解原理解釋計算分析溝通技巧動作技能運動技能概念應用情意特質等,認知領域情意領域技能領域,系統化教學設計,在教學上,一個再優的教學計畫,如果少有效的評,就像騎匹千馬,一狂馳,但卻知道方向在哪。(王文中,2000),評量在教學中的角色,60,60,貳、教學評量的基本原則,1.不同的命題可以改變學生的成績2.可以激勵或削減學生的學習動機3.不同的誘答選項可看出命題品質4.命題技巧是教學過
9、程的重要能力,教學評量之重要意義,評量是承接轉合的關鍵部份, 而不是教學歷程的終點站,教學評量的主要目的,在於分析教學得失及診斷學習困難, 作為實施補救教學和個別輔導的依據。,教學評量之類別-依教學歷程之分,預備性評量,形成性評量,總結性評量,教學前,教學中,教學後,教學評量模式,依評量資料之解釋方式分(1/2),標準參照評量(criterion-referenced evaluation) :標準(或效標)參照評量是指依教師在教學前所訂定的標準來解釋個別評量分數是否達成這項既定標準的一種評量。,依評量資料之解釋方式分(2/2),常模參照評量(norm-referenced evaluatio
10、n) :常模參照評量是指依團體分數之平均數(即常模)來解釋個別評量分數在團體中所處的相對位置的一種評量。,標準參照測驗與常模參照測驗之比較,教學評量基本概念,在古典測驗理論(CTT,又稱古典信度測驗)中最重要的基本假設: t + e:實得分數,t:真實分數,e:誤差分數,教學評量的用途,(一)達成教學瞭解學生的起點行為做為改進教學的參考確保教學目標的達成(二)診斷學習診斷學生的學習改進命題的技巧評定學生的學習成果-努力、進步、長處 (三)幫助學習激勵學生的學習動機幫助學生的記憶和學習遷移促進學生的自我評量,是非題的命題原則,1.避免使用一般的用語,如:通常、一般、時常及有時。2.避免過於瑣碎的
11、描敘。3.避免使用負面的描敘,尤其是雙負語。4.避免過長,複雜的句子。5.避免使用兩個概念的描敘,除非具有因果關係。6.避免使用無資料來源的八卦命題。7.避免描敘的長度不同。8.避免使用不適當的題數分配。,這些題目是否合乎命題技術?,1.是非題最易受猜測因素影響,而選擇題最容易編製2.巴黎不是美國的首都3.只有讀高中,才有機會上大學4.所有的細菌都會引起疾病5.臺灣的南部氣溫很高6.五權分立的政府比三權分立的政府要好7.師大的學生很優秀,選擇題的命題原則-2,試題必須只有一個正確或是較佳的選項選項的文法必須與題幹一致避免有暗示答案的線索出現儘量避免使用以上皆是或以上皆非均勻分布答案的次數與位置
12、保持同意測驗的每道試題各自獨立使用經濟有效的格式試題不宜過多以免成為速度測驗,選擇題-誘答性,有A、B兩個正方形,A的邊長是B的3倍,請問A的面積是B的多少倍? 3倍 6倍 9倍 12倍阿強每天都到7-11商店打工,晚上11:00上班,隔天早上6:00下班。請問他每天工作多少小時? 5小時 7小時 17小時 19小時 有一段路需要鋪設柏油,已經鋪好2100公尺,剛好占全路長的40,求這條路全長多少公尺? 3150公尺3500公尺840公尺5250公尺,簡答題(填充題)的命題原則,1.試題用字必須簡明扼要。2.勿直接截取課本的敘述成為題目。3.如果答案是用單位與數字來表示,那就需註明單位。4.每
13、個空格均應放在問題右側且長度一致。5.使用完整的題幹,勿使用太多的空格。,中國的鐵都是:_中國的煤都是:_,中國的鐵都是:_中國的鐵都是硬的中國的煤都是:_中國的煤都是黑的,別以為自己的最好,其實,是自己知道的太少!,論文題(申論題)的命題原則,較複雜或較高層次的學習評量才使用問題儘量與所要測量的學習結果有關明確敘述問題,使學生了解問題所在儘量避免學生可以選擇部分題目作答給予充足的作答時間並告知避免命題過於窄化,貳、傳統教學評量之省思 1/2,一、評量目標: 1.較少顧及教學目標。 2.忽略技能和情境評量。 二、評量方式: 1.大多均採紙筆測驗。 2.忽略其他評量方式。 三、評量時機: 1.多
14、數以總結性評量為主。2.形成性評量大多採坊間測驗。 3.忽略診斷性、安置性評量。,四、結果解釋: (2/2)1.過份強調個別間競爭。 2.過份重視各班成績的比較。 3.公布成績常損及學生尊嚴。 五、命題觀念: 1.忽略較高層次思考的評量。 2.命題未編製細目表。 六、命題技術: 1.題目形式不當。 2.忽略命題原則。 3.忽略教科書重要內容。 七、家長觀念: 1.斤斤計較卻忽略人格發展。 2.過度期盼或放任不管。,80,80,參、多元評量的設計與實施,評量原則,評量在歷程中進行評量並非侷限於紙筆測驗避免刻板印象主導評量之客觀性,案 例,情境:母親在曉蔓姐姐喪禮後,要求曉蔓書寫感謝函向每一位到場
15、之賓客致謝!病徵:曉蔓書寫到第三張感謝函時,右手忽然無法動彈!持續處理:經各科別醫生診斷,均無器官功能之病變。診斷:,多元評量的意義 多元評量係以教師教學與評量專業為基礎,依據教學目標研擬適切的評量方式、評量內涵、評量人員、及評量時機與過程,並呈現多元的學習結果,以提供更適性化的教學來增進學生成長。,多元評量的迷思,(一)多元評量並非廢除紙筆測驗。 (二)多元評量並非一種評量。 (三)多元評量莫為多元而多元。 (四)多元評量並非目的。 (五)多元評量並非學習終點。 (六)多元評量並非主觀評量。 (七)多元評量並非萬靈丹。,“多元”是否又是語文評量?,評時,學生將教學中習得的解題方式應用於許多似
16、題型之上,中下程的學生,如果解足、記憶夠強,就難以在評中獲得好成績,習也就於記憶;從學習單、平時測驗、到期中評,等於再製的迷思。學生只要聽到習或複習,沮喪又無。如此刻板的學科評相形於語文評設計的縝密與生動,顯得貧乏且僵化。,多元評量的多元特質(李坤崇, 2005),(一)專業多元(二)內涵多元(三)過程多元(四)時機多元(五)情境多元(六)方式多元(七)人員多元(八)計分多元(九)結果多元:能力與努力(十)呈現多元:質與量,一、專業多元,(一)掌握教學目標。 (二)專業判斷知能。 (三)兼顧技能與情意的評量。 (四)剖析教材內容。 (五)設計雙向細目表。 (六)規畫評量方式或慎選題目類型。 (
17、七)善用命題技術。 (八)適切解釋評量結果。,二、內涵多元,(一)兼顧認知、情意、技能等內涵。 (二)兼顧學生的學習歷程、生活世界與社會行為。(三)Gardner多元智慧(八項半智慧):語文、邏輯數學、肢體動覺、音樂、空間、自然觀察者、人際、內省,及半項智慧-存在。,三、過程多元,(一)安置性評量 (二)形成性評量 (三)診斷性評量 (四)總結性評量,四、時機多元,(一)定期評量:兩至三次的定期評量。(二)平時評量:充分考量學校願景、教師素養、學生特質、家長需求等因素。,五、情境多元,(一)評量情境包括教室、教室外情境 (二)隨著評量方式的多元化,常跳脫教室情境,六、方式多元,(一)紙筆測驗(
18、筆試) (二)檔案評量(資料蒐集整理、書面報告) (三)實作評量(表演、實作、作業、鑑賞、實踐、軼事記錄) (四)口語評量(口試、口頭報告、晤談) (五)軼事記錄,“紙筆”評量一般的命題原則,原創性、生活化、敘述扼要、直接切入重點、使用字彙適合受試者。每個題目必須獨立存在,內容不宜相互重疊、不要提供正確答案的線索。排序由易到難。分佈依據雙向細目表 。勿超過單元教學的目標。,七、人員多元,(一)教師評量 (二)同儕評量 (三)組長評量 (四)自己評量 (五)家長評量,八、計分多元,(一)直接給單一學習總分。 (二)經由基本分數與加權分數合計而得 單一學習總分 。 1.個別學習時,教師為鼓勵學生參
19、與學習歷程,先給予基本分數,再視其學習歷程與結果給予加權分數,兩者合為個別學習的分數。 2.小組合作學習時,基本分數常為小組的分數,而加權分數則為組內個人的表現分數或組內人員互評所得的分數。,九、結果多元:能力與努力,十、呈現多元:質與量,(一)量化:分數、圖示、等級(優、甲、乙、丙、丁) 。 (二)質化:文字敘述、具體建議。,肆、各類教學評量的種類與實例,一、檔案評量檔案評量乃教師依據教學目標與計畫,請學生持續一段時間主動收集、組織與省思學習成果的檔案,以評定其努力、進步、成長情形。予以彙整後即成為一份完整的學習檔案,而用檔案評量來評量學習檔案乃最佳之策略。,檔案評量的原則,檔案評量編製步驟
20、 (1)界定檔案評量的目的 (2)決定檔案評量的類型 (3)訂定檔案實作的規準 (4)轉換檔案實作規準為檔案項目 (5)擬定評量標準 (6)製作使用說明與製作檔案,二、實作評量,實作評量乃具相當評量專業素養的教師,編擬與學習結果應用情境頗類似的模擬測驗情境,讓學生表現所知、所能的學習結果。實作評量評量旨在評量知識、理解化為行動的能力,常見者為行為或態度評量表、行為檢核表。,行為或態度評量表係指一組用來作為判斷依據的行為或特質,及能指出學生在每種屬性中不同程度的量表,可用以評量學生學習態度、策略與興趣,或人格、情意發展狀況。行為檢核表係依據教學或評量目標先將學生應有、可觀察的具體特質、行為或技能
21、,依照先後發生順序或其他邏輯規則逐一詳細分項,並以簡短、明確的行為或技能描述語句來條列出行為或技能標準,後請檢核者(包括教師、家長或學生)就學生的實際狀況依序勾選,以逐一評定學生行為或技能是否符合標準。,編製步驟 (1)確定評量的目的 (2)以工作分析法擬出實作的項目 (3)訂定實作表現評定的標準 (4)提供實作表現的情境 (5)評定實作表現的成績,實作評量的原則,三、口語評量,常用口語評量乃口試、問問題。口試較常用於總結性評量,如用演講、辯論、口頭報告、經驗分享故事接龍來評量,或採放聲思考,日常應用心得分享、口頭報告、表演等方式來評量。,口語評量的原則,口語評量應注意的原則 (1)口語表達須
22、與教學目標相關 (2)避免廣泛模糊的題目 (3)使用直接、簡單的問題 (4)給予學生充足時間回答 (5)候答態度應和藹 (6)審慎衡量運用時機 (7)事前建立公正客觀的評量標準,四、遊戲化評量(系列實作評量),採取較活潑生動的教學、將知識轉化為能力,將學習與生活結合。隨著教學生動化、活潑化,評量亦必須納入遊戲化評量(系列實作評量)。讓學生在遊戲中學習、由習中評量。,五、高層次認知測驗,評量本學習領域宜審慎運用紙筆測驗,應揚棄低層次認知之記憶、理解評量,然亦不應排斥高層次認知之評量。因此,仍需以高層次認知測驗內涵之紙筆測驗,作為進一步改善之依據。,六、軼事記錄,軼事記錄乃教師觀察學生日常生活表現
23、,詳細寫下重要而有意義的偶發個人事件和行為的紀錄。軼事記錄通常做為評量佐證資料,而非評量的唯一依據,因學生日常生活的點點滴滴難以在教師設計的評定量表、檢核表、檔案資料、或紙筆測驗中完全呈現,若能以教師在班級情境的直接觀察作為佐證資料,當能提高評量結果的效度。,實例(實習課程的觀察),評等或計分方式:,(一)本學習領域以不呈現分數為原則, 教師可依教學目標、工作負擔、學生或 家長需要,採取評定等級、文字 敘述的方式。 (二)教師評定等級後,宜視需要於分享 欄,輔以文字深入說明,並予學生適切 增強。(三)若必須採取核算等級計分方式,可依 下列評量表中,六項評量項目逐一計分。,評等或計分方式:,(四
24、)每個評量項目之能力向度計分,如下表: (五)努力向度:出現一次加1分,- 出現一次減1分。 (六)若檔案未交則以0分計算,補交則 給基本分,補交時間由教師規定。,伍、評量在教學中之運用,教學決定需要評量的訊息評量與教學的關係,1.教學決定需要評量的訊息,評乃超越資搜集技巧,是一個有系統的過程,始於確認教學目標,終於判斷這些目標達到的程(Linn & Gronlund, 2000, p.29)。非正式的教室觀察指引著許多教學上的決定,如口頭問答可以帶學生對教材做一統整回顧;教室討可以發現學生某些迷思概(Linn & Gronlund, 2000, p.29)。雖然觀察是一個非正式的評,在有效教
25、學中扮演著可或缺的角色。它提供多非正式的方法讓教師獲得學生學習的訊息。,2.評活化學習的程,無教學或評,教師所給予的鷹架支持是容忽視的,尤其面對一個具有挑戰性的任務時,學生需要斷的去試驗、蒐集資、建假設、並且評估自己的工作進(Linn & Gronlund, 2000)才容促進表現品質。評任務完成的同時,教學也告一段,評與教學同時發生,評本身所促進的,是師的教學能,也是孩子的學習過程。,3教學評量設計與實施,決定測驗之目的,常模參照效標參照形成性評量總結性評量,測驗結果,決定測驗之目的,發展雙向細目表,準備測驗題目,組合測驗之題目,施 測,評價測驗題目,雙向細目表,發展雙向細目表,步驟:確定教
26、學目標分配各教材所佔的比重編製細目表,一、雙向細目表(two-way specification table)是較常評量內容效度的工具,也是教師命題的工具之一。 二、雙向細目表之定義-包含了一份測驗所 應包含的內容與所應測量到的能力。三、功能-協助教師命題, 內容效度的判斷。,雙向細目表,雙向細目表,國文科領域教育目標之能力層次,內容,國文科領域教育目標之能力層次,活動: 撰寫雙向細目表 (30mins),1.每組一張空白A1海報紙 及10張A4的白紙2.每組兩支麥克筆(一藍一黑)3.每組僅有20分鐘的時間討論與命題, 有10分鐘的時間繪製海報,共30分鐘4.命題的題型不限5.命題範圍可任選一
27、個科目3-4個章節 (大約一次月考的範圍較佳),3.分配各教材內容之比重,平均分配依據重要性分配加權比重,誘答率-每一個選項的作答人數佔總人數的百分比值。例如某試題正確選項(A)作答率為0.893,(D)作答率為0.107,顯示該選項具有誘答力,有約10.7的學生有此錯誤概念;選項(B)及選項(C)沒有人選,則誘答率為0。難易度-試題的容易程度, P(PH+PL)/2鑑別度-指試題能區別受試者能力高低的程度, D(PHPL),試題分析,測驗結果的分佈-常態分配,13.59,34.13,2.14,0.14,正偏態的分配,負偏態的分配,要如何打分數?,-分數常態分配圖,次數(人),原始成績分數(分
28、),此圖假設平均分數為55分,要如何打分數?,-負偏態,此圖假設平均分數為75分,次數(人),原始成績分數(分),要如何打分數?,-負偏態,次數(人),原始成績分數(分),此圖假設平均分數為85分,測驗分數之運用(1),瞭解學生起點行為作為改進教學參考確保教學目標達成評定學生學習成果診斷學生的學習,改進命題的技巧作為補救教學依據激勵學生學習動機幫助學生的記憶與學習遷移,測驗分數之運用(2),測驗分數之運用(3),協助擬定教學計畫評定成績診斷教學過程選擇學生安置學生諮商與輔導,測驗可能的副作用,可能侵犯學生的隱私可能帶來焦慮並干擾學習難免分類學生,影響學生的自尊可能對高創意或聰明的學生不公平可能
29、對語文能力較差的學生不公平可能帶來自我應驗的效果測驗的範圍只能涵蓋學習成果的一部份,測驗分析,作為改進學生學習的參考作為實施補救教學的依據作為修改課程建議的依據增進教師編製測驗的經驗增進測驗題庫運用的效能,評量分數標準化操作,以班級為單位進行。以任教同年級同類組(科)之班級進行。以全校同年級同類組(科)進行。,教育測驗的趨勢,靜態評量變為動態評量機構化評量變為個人化評量單一評量變為多元評量虛假評量變為真實評量,感謝各位聆聽 敬請指教,有教無類 因材施教 適性揚才 多元進路 優質銜接,十二年國民基本教育五堂課-多元評量,內容,有教無類 因材施教 適性揚才 多元進路 優質銜接,動物學校,落實多元評
30、量於教學現場,十二年國民基本教育五堂課-多元評量,內容,有教無類 因材施教 適性揚才 多元進路 優質銜接,十二年國民基本教育,教育願景,菁英論,平等論,適性論,派典轉移,十二年國民基本教育五堂課-多元評量,內容,有教無類 因材施教 適性揚才 多元進路 優質銜接,主要參考文獻,張美玉(2012),新觀點的教學與評量。教育部國民中小學多元評量案例。張仁家(2013),教育部多元評量種子教師培訓課程講義。田玲瑚(2012),從全人教育觀點探討台南市國小低年級實施多元評量之研究。江文慈(2007),超越測量-評量典範轉移的探索與啟示。李坤崇(1999),多元化教學評量。涂金堂(2009),教育測驗與評量。陳明終(2000),多元評量面面觀。教育Wiki,http:/content.edu.tw/wiki/index.php。,十二年國民基本教育五堂課-多元評量,多元評量研習結果評估請就以下說明,舉手表示認同度:1.瞭解 2.尚可 3.不瞭解一、我對多元評量之理念與策略已瞭解。二、我對多元評量之策略已瞭解。三、我對多元評量之設計已瞭解。四、我對多元評量之教學實作已瞭解。五、我會將多元評量運用在教學上。六、我會持續將多元評量之實作內容完成。七、我會持續參加多元評量進階研習。,