精品91麻豆免费免费国产在线_男女福利视频_国产一区二区三区小向美奈子_在教室里和同桌做校园h文

<var id="0c0dh"></var>

第二節教學測量與評價的方法和技術

教學評價包括認知、情感和技能三個方面。對于認知和技能領域的學業成就，最常用的教學評價手段是標準化成就測驗和教師自編測驗。而對于情感以及道德行為表現則常常采用非測驗性的評價手段，如案卷分析、觀察、問卷量表以及談話等。這些非測驗性的評價手段也可作為學業成就評價的補充。

一、標準化成就測驗

（一）標準化成就測驗的含義及特點

標準化成就測驗是指由專家或學者們所編制的適用于大規模范圍內評定個體學業成就水平的測驗。

其特點大致為：測驗是由專門機構或專家學者按一定測驗理論和技術，根據全國或某一地區所有學校的共同教育目標來編制的。所有受試人所做的試題、時限等施測條件相同，計分手段和分數的解釋也完全相同。

（二）標準化成就測驗的優越性

第一，客觀性。在大多數情境下，標準化測驗是一種比教師發展出的測驗更加客觀的測量工具。

第二，計劃性。專家在編制標準化測驗時，已經考慮到所需的時間和經費，因此標準化測驗比大部分的課堂測驗更有計劃性。

第三，可比性。標準化測驗由于具有統一的參照標準，使得不同考試的分數具有可比性。

標準化測驗的局限性：

第一，與學校課程之間的關系很不協調。

第二，測驗結果的不當使用，我們通常利用標準化成就和能力測驗對學生分

類和貼標簽，對個體造成了不良影響。它們的使用對得低分的學生傷害尤大。

二、教師自編測驗

(一)自編測驗的含義與特點

教師自編測驗是由教師根據具體的教學目標、教材內容和測驗目的，自己編制的測驗，是為特定的教學服務的。教師自編測驗通常用于測量學生的學習狀況，而標準化成就測驗則用來判斷學生與常模相比時所處的水平。

(二)測驗前的計劃

1．確定測驗的目的。

2．確定測驗要考查的學習結果。

3．列出測驗要包括的課程內容。

4．寫下考試計劃或細目表。細目表是將考試具體化的最重要的工具，使得測驗能夠與教學的目標和內容保持一致。細目表的形式是兩維表，一般縱欄表示學習結果，橫欄表示課程的內容或范圍。中間的欄目，就是教師根據自己的情況填上在測驗中計劃測量多大比例的學習結果和課程內容。

5．針對計劃測量的學習結果，選擇適合的題型。自編測驗包括客觀題和主觀題兩種類型。教師使用哪一種類型的題目是由測驗的目的、內容和時間決定的。一般來說，由于這兩種題型各有優點和不足，最好加以綜合使用。

(三)自編測驗的類型

1．客觀題

客觀題具有良好的結構，對學生的反應限制較多。學生的回答只有對、錯之分，因此教師評分也就只可能是得分或失分。這類題目包括選擇題、是非題、匹配題和填空題等。

(1)選擇題。選擇題是由題干和兩個或更多的選項組成的。題干可以是直接提問或者以不完整的句子的形式出現，目的是為了設置問題情境。而選項則提供可供選擇的答案，包括一個正確答案和若干具有干擾性的錯誤項或迷惑項。學生的任務就是閱讀題目，再從一系列選項中挑選出正確的項目。

此外，選擇題還有一種常用變式，選項中有一至多個正確答案，即通常被稱為多選題。這種題型的難度大大高于常規的選擇題（單選題），可以有效地檢查高一級的學習成果，在測驗中使用得較廣。

(2)是非題。是非題與選擇題有一點相似之處，學生需要識別、選擇出正確答案。常用的形式是，陳述一句話要求學生判斷對錯或是非。是非題可用于測量不同水平的教學目標。

是非題形式簡單，能夠在一份試卷內覆蓋大量的內容。教師在評判時也較客觀，計分簡便省時。但是，一個重要的問題是：學生只有兩種選擇——對或錯，所以即使在完全猜測的情況下，他們也有50%的機會選擇到正確答案。一種可行的辦法是，增加題目的數量。由于題量大，對題目總體的取樣較全面，學生很難只憑猜測獲得高分。

(3)匹配題。匹配題是另一種可提供多種選擇的考試形式。通常，題目包括兩列詞句，一列是問題選項，一列是反應選項。學生根據題意按照某種關系將左右的項目連接起來。匹配題形式簡單，能夠有效地測量學生對知識聯系的掌握情況，且易于計分。但是，它只能用于測查彼此存在著簡單關系的知識。

(4)填空題。填空題是呈現給學生一句或一段不完整的話或者直接提問，要求學生簡要做答。當教師的目的是考查學生對知識的回憶時，填空題十分有用，它可將學生猜測的可能性降到最小。如果經過精心設計，也可以通過填空題來考查學生對知識記憶和理解、以及推理和判斷能力。填空題的問題在于，學生的答案各不相同甚至還會出現出人意料的答案，學生的答案還會受筆跡、用詞等無關因素的影響。

2．主觀題

主觀題則要求學生自己組織材料，并采用合適的方式表達陳述出來。這類題型包括論文題及問題解決題。教師在評分時，對學生的回答需要給出不同量的分值，而不僅僅是滿分或零分。

(1)論文題。論文題是指要求學生用文字論述方式闡述相關觀點的題目，回答字數可以從幾段到幾大頁不等。一般較常使用的有兩種類型，有限制的問答題和開放式論文。

論文題可以測驗知識、理解或運用水平，也可考查學生的分析、綜合、類比和評估知識的能力，還可考查學生組織信息或表達陳述某項意見的能力。

使用論文題也有不妥之處。首先，學生回答論文題需要花費很多時間，對課程內容的取樣也就非常有限。通過增加小的論文題(即簡答題或問答題)，可以避免這個問題。其次，對于熟悉自己學生的教師，在判卷時很難做到客觀，導致信度較低。在評分時，經常出現一種現象——暈輪效應，即教師對學生的總體印象影響到對論文題目的評價。因為平時的接觸或者前面幾道題解答的情況，陡得教師對學生形成了某種印象，從而影響到對之后題目的評判。

(2)問題解決題。問題解決題是向學生提供一定的問題情境和目標情境，要求學生通過對知識進行組織、選擇和運用等復雜的程序來解決問題。通常有兩種形式，一種是間接測驗，采用紙筆測驗來評價學生的學業成就或能力。另一種方式則是直接測驗，也叫做操作評價。例如，為了考查學生學習本節內容的情況，讓學生編制一份測驗小學兩步應用題的測題。操作評價對于考查高級思維技能十分有效，但是往往費時費錢，而且主觀性較大，并且效度也經常受到質疑。

★例，單選（陜西 2009年）

在教師自編測驗里，下面哪一類題型是主觀題（ d ）

a 選擇題 b 判斷題 c 填空題 d 論述題

（四）有效自編測驗的特征

1．信度

信度：是指測驗的可靠性，即多次測驗分數的穩定、一致的程度。它既包括在時間上的一致性，也包括內容和不同評分者之間的一致性。

例如，采用性格量表測量學生，他們在這一個月的結果，如果大致等于六個月前和三個月前的得分，那么我們就認為測驗的信度較高。

★例，單選（甘肅 2008年）

某一測驗在多次施測后所得到的分數的穩定、一致程度，即 ( a )

a 信度 b 效度

c 難度 d 區分度

★例，名詞解釋（浙江 2008年）

信度：

2．效度

效度：是指測量的正確性，即一個測驗能夠測量出其所要測量的東西的程度。

效度的重要性大干信度，因為一個低效度的測驗，即使具有很好的信度，也不能獲得有用的資料。

例如，用磅秤稱量體重，連續多次都會得到相同的值，而且準確地反映了個體的重量，那么信度和效度都很高；但是如果使用它來測量身高，雖然測量值之間總是保持一致的，即信度很好，但是并沒有說明個體的高度，因而不是適宜的測量身高的工具。

★例，單選（湖北 2009年）

衡量一個測驗有效性、正確性的重要指標是（ b ）

a.信度 b.效度

c.難度 d.區分度

★例，判斷（北京 2010年）

標識測驗的正確性、準確性的是測驗的效度。

3．區分度

區分度：是指測驗項目對所測量屬性或品質的區分程度或鑒別能力。它是根據學生對測驗項目的反應與某種參照標準之間的關系來估計的。例如，可用年級或教師評定的等級作標準，看測驗的項目能否把不同年級或不同水平的學生區分開來。

(五)自編測驗的常見錯誤

1．教師過于相信自己的主觀判斷：而忽視測驗的信度和效度指標。

2．許多教師對測驗準備的重要性缺足夠的認識，對測驗準備不夠充分，甚至沒有準備。

3．許多教師編制的測驗太簡單，題：量太小。總之，測驗準備不充分、題量小、相信主觀判斷，都會導致過分強調無關細節，從而忽略本章提到的那些重要的原則或注意事項。

三、非測驗的評價技術

尤其是情感領域的教學評價更需要采用非紙筆測驗。情感教學不屬于任何一個學科，其效果可能產生在任何一種認知學科的教學過程中。

(一)案卷分析

案卷分析是一種常用的評價策略，其內容主要是按照一定標收集起來的學生認知活動的成果。例如，學生的家庭作業或課堂練習、論文、日記、手工制作的模型、繪畫等各種作品。對學生的作品進行考查分析，并形成某種判斷和決策的過程就是案卷分析。

(二)觀察

通過教學過程中的非正式觀察教師也能夠搜集到大量的關于學生學業成就的信息。這種觀察不只限于智能的發展，還包括學生生理、社會和情緒的發展。

1．行為檢查單

教師可以使用檢查單來記錄其在教學中的觀察結果。檢查單一般包括一系列教師認為重要的目標行為，通常采用有／無的方式記錄，但有時也記錄下次數。行為檢查單使用簡便易行，對于教師非常有用。尤其在課堂上，教師可以利用檢查單及時記下所觀察到的行為，便于指導和幫助學生。如果行為是屬于某一個好一壞連續體上的某一點，那么更適宜的方式是等級評價量表。當觀察目標是具體、特定的經過r明確界定的行為時，檢查單非常有效。

2．軼事記錄

軼事記錄是描述所觀察的事件。與檢查單相比，軼事記錄可提供比較詳細的信息，這些記錄一般按照發生時間排列的。教師可以在事先有明確的觀察目標，就某一方面的行為進行記錄；也可以沒有明確目的，事后再專門分析或考查某一件事，這時教師就需要記下很多資料，甚至包括一些無關信息。軼事記錄要求教師純粹記載下所觀察到的內容，而不要摻雜進個人的意見或觀點。許多教師在他們的教案或工作日記上，都有軼事記錄。但是，軼事記錄比較費時，而且也很難排除主觀偏見。

3．等級評價量表

等級評價量表對于連續性的行為，可能更為有效。它可用于判斷某種行為的發生頻率，以及某種操作或活動的質量，使得觀察信息被量化。評價量表是一種間接的觀察技術，通過量化所觀察的信息，可以迅速簡便地獲得概括化的信息。評價量表和行為檢查單有一定關系。二者都要求教師對學生的行為進行判斷，可以在觀察過程中或結束后使用。但是它們的評價標準不同，檢查單只需要做定性的判斷，而等級評價量表是做定量的判斷。

（三）情感評價

許多時候，教師有必要針對學生的情緒、學習動機、個人觀點等進行評價。固然，在對結果的評價時，教師也需要寫一份詳細的報告，形式類似于上文的觀察報告。

四、教學評價結果的處理與報告

(一)評分

評分時必須以一定的比較標準為依據，評分的標準可分為絕對標準和相對標準兩種：

絕對標準是以學生所學的課程內容為依據。它對應的評價方式，是標準參照評價。

相對標準是以其他學生的成績為依據，對應于常模參照評價。相對標準的評價不僅與學生自己的成績有關，還與其他同學的成績有關。

合理的評分過程應包括如下步驟：①搜集有關學生的信息，信息可以來源于不同類型、性質的測驗甚至觀察的評價方式。例如，教師對學生期末學習成績的評價，通常是期末考試成績占70％，平時作業和考試成績占20％，課堂表現占10％。②系統地記錄下評價的結果，并隨時保持最新的結果。③盡量：將搜集的資料量化，用數據來表示學生的學習情況。④為了把評價的重點放在最終的學習成就，教師需要加大最后測驗得分的權重。⑤評價應該以成就為依據，而其他特征的評價，不要和成就的評價混雜起來。

（二）合格與不合格

有些課程采用合格與不合格來評價學生的成就。教師可以根據學生是否完成了每次作業來評價，也有可能根據學生的幾次作業情況評分，甚至評分的標準可以是學生的出勤情況。

（三）其他報告方式

除了常用的評分方法，教師還可以使用其他方式來報告評價結果。教師寫學生的個人鑒定或定期的綜合評價，提供給家長和學生。觀察報告也是一種報告評價結果的形式。此外，通過與家長面談，也可以交流關于學生的學習、行為和態度等方面的資料。

課后練習題