時間:2023-03-30 11:30:39
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內心深處的真相,好投稿為您帶來了七篇教育評價論文范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創作。
然而,目前我國尚未形成有效的學生、教師、學校評價機制,影響了教育改革的步伐。認清制約教育評價的因素,探索符合素質教育和基礎教育課程改革的評價機制,對當前的教育教學改革具有深遠的意義。
一、教育評價的發展過程教育評價(reducationevaluation)是評價者按照一定的評價標準在對教育活動及其相關因素進行系統分析的基礎上,就教育活動滿足社會和個體需要的程度的判斷的特殊認識活動
教育評價的發展大體經過四個階段:
(一)心理測驗時期。自19世紀中葉起到20世紀30年代的80多年,為教育評價的第一個時期,教育測量的研究取得了一些成果,特別是在考試的定量化、客觀化與標準化方面,取得了很大的進展。強調以量化的方法對學生學習狀況進行測量。然而,當時的考試與測驗較為片面地要求學生記誦教材的知識內容,無法真正反映學生的學習過程。
(二)目標中心時期。20世紀30年代至50年代是教育測量的第二個時期,當時泰勒(Tyler•R)提出了以教育目標為核心的教育評價原理,并明確提出了“教育評價”的概念,從而把教育評價與教育測量區分開來,教育評價學就是在泰勒原理的基礎上誕生與發展起來的。
(三)標準研制時期。20世紀60年代是教育評價的第三個時期,以布盧姆為主的教育家,提出了對教育目標進行評價的問題。美國教育學家斯克里文(Scriven.M.)、斯塔克(Stake.R.E.)和開洛洛(Kellogg•T.E.)等人對教育評價理論作出巨大的貢獻,學者們把這一年定為美國教育評價發展的轉折點。
(四)結果認同時期。20世紀70年代以后,教育評價發展到第四個時期。在這一時期關注的是評價結果的認同問題。關注評價過程,強調評價過程中評價給予個體更多被認可的可能,重視評價對個體發展的建構作用。近年來,隨著我國素質教育的全面推進和基礎教育課程改革的不斷深入,有智慧的教育和培養有特長的學生已成為時代教育改革和發展的主旋律。教育評價在教育發展中起著導向、鑒定、改進、反饋、展示、激勵、檢查、監控的作用,評價機制的改革與創新倍受社會關注。但現行的基礎教育的評價和考試制度與全面推進素質教育的要求還有一些不相適應的地方,影響了素質教育的推進和新課程的改革步伐,制約了素質教育的積極有效推進。
二、影響教育評價的因素
(一)教育體制教育體制是影響教育評價的重要因素之一,集權的教育體制,強調評價模式的統一性,強化評價的鑒定評比功能;而分權的教育體制容易形成多元化的教育評價模式,并把評價的功能主要放在為教育的發展與完善提供咨詢信息上,我國的教育體制正處在集權化向分權化轉化的過程中,各級各類學校在辦學方面的主動權不大,主要控制在國家及省市等各類教育行政部門的手中,且教育評價還使用統一的評價方案,從而影響了教育評價的發展。
(二)評價對象窄化評價對象作為評價的內容主體在教育評價中占有非常重要的地位,因為整個教育評價都是圍繞評價對象展開的,不同類別的評價對象、不同發展階段的同一類評價對象,對應的評價模式都是不同的。我國傳統的教育評價是由上級評價下級,管理者評價被管理者,教育行政部門評價校長,學校(校長)、教師為恒定的評價主體,而校長、教師、學生分別成了評價的客體,實際的評價對象主要集中在學生學業成績、優秀教師的比例、學校硬件條件幾個方面,而把評價的其他內容放在了次要位置。
(三)評價方法單一評價方法指的是為達到某種目的,根據評價原則選定的有利于各種評價力量協同工作的一套活動方式和操作程序。它是計劃、組織、調控、評價實施活動的技能和手段,以及搜集、整理、優化評價信息資料的知識和經驗。我國近幾年在評價方法方面投入的力量很多,主要集中在實證主義方法論范疇,重點研究的是如何制定指標體系,從而造成目前主要以定量分析為主的教育評價模式,對指標體系能否真正反映評價對象的本質考慮的不多,用這種單一的方法來評價教育,必然會造成不良的評價后果。
(四)教育價值觀念的影響教育價值觀直接影響評價指標的確定與它們的判別標準。教育評價觀是一種關于教育事物價值判斷的過程,它是以人們的教育價值觀為基礎的,持不同教育價值觀的人對同一教育事物的評價結果必然有差異,而教育管理的主體和客體因各自所從事的實踐不同,就必然會產生不同的教育價值觀。目前我國的教育評價的價值取向主要強調教育的工具價值,而忽視了教育主體的發展價值,評價往往是外在的強制性的,強調其鑒定功能,忽視評價的改進、激勵和發展功能,注重外部目標的實現,忽視了評價對象的內部需要,忽視了利用評價機制激發主體的內部動機和促進評價對象的主動發展,籠罩著功利主義、實用主義和行政管理主義的色彩。
(五)教育評價基礎理論薄弱,評寫作論文價者素質不高我國的教育評價研究及實踐是從20世紀70年代末80年代初開始的,時間短,評價基礎理論薄弱,對教育評價中的有些問題還很難找到合適的方法,如對學生的非認知因素、思想道德素質、心理健康水平等方面,缺乏科學有效的評價技術手段,教育評價指標體系的設計缺乏堅定的科學依據,可操作性較差;另一方面評價者的素質不高,教育評價是一項專業性很強的工作,要求教育評價者不但要懂得本門學科的專業知識,還要掌握教育學、心理學、測量學及評價學方面的知識,有豐富的實踐經驗者才能勝任。
三、提高教育評價質量應采取的對策
(一)加深對教育評價的認識,樹立正確的教育價值觀教育評價的基本目的就是為教育的發展提供必要的證明、改進、決策、定向的作用,因此教育評價不應該是外在的力量強加給學校的一次性管理活動,而應成為學校完整的科學管理過程中的一個重要環節,把它作為學校賴以生存和發展的內在基礎,是學校教育活動實現自我調控、自我發展、自我完善的內在活力,應成為學校的自覺行為。同時必須明確我國教育評價的價值取向的主要依據是黨的教育方針和培養目標,也就是說教育評價的價值取向應該是看其是否有利于提高民族素質。
(二)使用多樣化的評價方法教育現象的復雜性和評價過程的多階段性,決定了評價方法的多樣性和整體性。發展性的教育評價,強調的是評價者要對評價對象的過去、現在作全面了解,根據評價對象過去的基礎和現實表現,預測評價對象的未來發展目標,鼓勵學生之間、同行之間互評,評價對象可以自選評價者,或者評價者和評價對象共同協商制定發展目標。自我評價也是當前比較提倡的方法,因為它能調動自身的積極性和主動性,不受時間和場合的局限,簡單易行,并可長時間反復使用。評價方法必須作到四個結合:終結性評價與形成性評價有機結合;靜態評價與動態評價有機地結合;定性評價與定量評價有機地結合,綜合評價與單項評價結合。超級秘書網
(三)突出評價對象的主體地位教育評價的整體過程要圍繞評價對象,不僅是學生、教師、校長、教育界領導等,還涉及課程、教學計劃、政策法規、教育改革方案、教育發展戰略等各種教育現象和事物,包括軟件評價,也包括硬件的評價。評價的目的是促進教育事業向更完善的方向發展。評價對象是發展的主體,教育評價應重視提高評價對象的參與價值,重視評價對象的主體意識、創新精神,教育評價應是一種雙向性的評價活動,應采取教育行政部門與校長、校長與教師、教師與學生互評,消除原來主客體之間的不平等關系,這對于雙方揚長避短、互相學習、促進工作,提高教育教學質量大有裨益。
素質教育的根本目標是促進學生的全面發展,而教育評價自然應該關注學生的綜合素養。《關于積極推進中小學評價與考試制度改革的通知》指出:中小學評價要“從德、智、體、美等方面綜合評價學生的發展”,對學生的評價內容也要多元化,“既要重視學生的學習成績,也要重視學生的思想品德以及多方面潛能的發展,注重學生的創新能力與實踐能力”。而2013年6月頒布的《教育部關于推進中小學教育質量綜合評價改革的意見》所附《中小學教育質量綜合評價指標框架(試行)》,也將教育評價內容定為“品德發展水平”“學業發展水平”“身心發展水平”“興趣特長養成”和“學業負擔狀況”等五個方面,并提出了20項教育評價的關鍵指標,這說明我國已充分認識到教育需要綜合評價才能全面考察學生的綜合素養。而該信中提到的“對你的成績我們感到非常驕傲,我們覺得你已經盡了你最大的努力”則反映出該校的教育評價并不是只關心學生的考試成績,它還對學生的學習態度做了肯定性評價。學生的考試分數雖然是一種評價指標,但它卻不是唯一的評價指標,因為分數無法考察出信中所提到的學生的“演奏音樂”“唱歌”“跳舞”“寫詩或者寫歌”等多種能力,也不能考察出學生“善良,深思,可信賴”的人格魅力,更無法考察出學生“每一天都在讓自己變成一個更好的人”的積極心態。所以,教育評價應徹底改變只關注學生分數的現狀。今天的教育評價更應關注學生的綜合素養,這樣才能全面而公正地評價學生,并讓學生全面地認識自我。
二、教育評價應以積極性評價為主
以表揚和鼓勵為主的積極性評價能夠對學生起到激勵和督促作用,促使學生看到自己的成就和不足,找到或發現成功或失敗的原因,激發學生的學習動機,調動學生學習的主動性和積極性,增強學生學習的熱情和信心,最終保證教育過程順利有效地進行。同時,積極性評價還可以正面引導學生按照評價活動所提倡的方向發展,對整個教育工作起到定向指導的作用。該信中提到對學生的成績“感到非常驕傲”,顯然是具有激勵作用的積極性評價。此外,信中還對學生成績以外的各個方面都給予了關注,這也是積極性評價,具有正面引導的作用,不僅能幫助學生建立自信,還能幫助學生形成正確的世界觀、人生觀和價值觀。而信的末尾還特別提醒學生要記住“人可以有很多種偉大的存在方式,考試絕對不是唯一的一種”,這句忠告堪稱教育箴言,是進一步對學生進行正面引導,不僅能鼓勵成績欠佳者看到自己未來的希望,而且還能讓成績優秀者戒驕戒躁,從而使每個學生都能正確地認識自我。
三、教育評價要將形成性評價和終結性評價相結合
在教育教學過程中,我們對學生的評價應該將形成性評價和終結性評價相結合。過去的教育評價常常以終結性評價為主,更多地關注以學生成績為主的教育結果,卻忽略了對學生成長過程的關注,缺少了學生學習過程中的形成性評價。而形成性評價是一種面向未來的評價,更關注學生學習和成長的過程,它不僅關注學生過去的成績,還要根據學生的日常表現從多個角度加以分析、反饋,來促進學生自我反思和調整,并確定其未來發展的努力方向。所以,今后教育工作者在日常的學生評價過程中應盡量淡化學生之間的評比,而應提倡學生與新課程標準、教育目標作比較,并與自己的過去作比較,以此來引導學生發現自己的進步與不足。在此基礎上,還可以提出具體的改進建議,使學生知道怎樣可以做得更好,從而激勵學生向更高水平的目標邁進。該信中提到對學生的成績“感到非常驕傲”,同時又以排比句列舉了學生諸多方面的能力和優秀品質,這正體現了形成性評價和終結性評價相結合的教育評價方式,值得我們學習和借鑒。《關于積極推進中小學評價與考試制度改革的通知》指出:對學生的評價“不僅要注重結果,更要注重發展的變化過程。要把形成性評價與終結性評價結合起來,使發展變化的過程成為評價的組成部分”。而《教育部關于推進中小學教育質量綜合評價改革的意見》也明確提出教育評價要“將形成性評價與終結性評價相結合,注重考查學生進步的程度和在學校的努力程度,改變單純強調結果不關注發展變化的做法”。這都為教育工作者的教育評價方向提供了很好的指導。
四、教育評價要將定性評價和定量評價相結合
在教育教學過程中,我們對學生的評價還應該將定性評價和定量評價相結合。所謂定性評價,是指采用開放的形式獲取評價信息,運用定性描述的方法做出結論的評價。如教師在學生手冊中填寫的教師評語,往往是對學生各方面的表現進行綜合評價,指出其進步、潛能及不足,這就屬于定性評價。該信中提到的學生各方面的表現也屬于定性評價。而定量評價是指采用結構式的方法,預先設定操作化的評價內容,收集并量化學生的信息,運用數學方法做出結論的評價。如該信中提到的“成績”即是通過統一考試得出的具體分數,就屬于定量評價。定量評價往往只能考查學生某一時段、某一方面的學習結果,而無法考察學生的學習過程、學習態度,也無法考察學生的綜合素養。以往的教育評價過多地強調定量評價,而忽視了定性評價?!督逃筷P于推進中小學教育質量綜合評價改革的意見》指出:教育評價要“將定量評價與定性評價相結合,注重全面客觀地收集信息,根據數據和事實進行分析判斷,改變過去主要依靠經驗和觀察進行評價的做法。”這為教育工作者進行教育評價提供了指導。今后,我們對學生進行教育評價,應將定性評價和定量評價相結合,可在教育教學過程中為學生建立成長記錄袋,收集反映學生學習過程和結果的各種信息資料,從而反映學生多樣化的發展需求、優勢及不足,記錄學生成長的過程,促進其自我認識能力的提高。這樣的評價方式才能促進學生綜合素養的提高,才會有利于學生的成長和發展。
1.督導能促進教育評價系統的有效性。在某種意義上說,督導機制能監控評價工作的順利實施,保證評價工作的客觀性、公正性,使評價工作意向明確、方法有效、結果可信。進而,通過教育督導既能提高基礎教育階段素質教育評價系統的信度,更能提高基礎教育階段素質教育評價系統的內在效度和外在效度。內在效度往往以素質教育評價自身系統目標指向的實現率為體現,外在效度則以素質教育評價系統的應用范疇的有效程度為體現。無論是素質教育評價系統的信度,還是素質教育評價系統的內外效度,都依賴于教育督導對評價系統的功能的發揮。2.督導能促成評價信息的及時反饋。評價本身的功效還在于激勵、選擇、導向。無論哪一種評價功能的發揮,都有賴于評價信息的及時反饋,而評價信息的及時反饋則有賴于督導機制。通過督導,可以使評價所獲得的信息及時地雙向反饋,即上情下傳,下情上達,進而能溝通評價者與被評價者之間的關系,溝通評價者之間的關系,乃至于被評價者之間的關系,使評價信息真正發揮應有的功效,即有效的為評價者和被評價者所用,也使評價工作能真正成為教育性活動,使素質教育評價成為基礎教育階段素質教育活動過程中的生動現實。3.督導能促成評價工作的制度化。通過素質教育評價系統對教育督導系統的包含,可以使素質教育評價工作在一定時間期限內定期地進行或者使素質教育評價工作經?;?、常態化,保證評價工作對教育活動的驅動。通過督導式評價,可以使評價過程所獲得的信息或材料規范化地匯總,完善其評價系統的檔案制度,使評價工作真正體現其過程性和有序性,從而有助于全面、動態、客觀地分析、比較被評價者的變化發展情況。因此,督導式評價體系能夠真正體現其更加完善的工作制度,使素質教育評價工作經?;⑾到y化與制度化。4.督導能促成評價范圍的必要拓展。通過督導式評價系統的構建,可以解決傳統意義上的評價范圍的有限性問題。使基礎教育階段素質教育評價不單是教育系統內部的事,而拓展成社會大系統之事,我們不僅可以評價教育內部系統,我們還可以評價教育外部系統即影響教育的社會系統;評價主體不僅可以是教育者或受教育者,還可以是家庭、社區、政府行政機制以及教育行政部門。通過督導機制在評價系統中的充分發揮,可以使評價的內容系統、評價的主體系統、評價的客體系統、評價的指標系統等方面得到進一步的擴展,使評價系統與教育系統建立在同一社會系統基礎之上,并有效地納入整個社會人系統中,成為互相驅動的兩個自然組織系統。
二、構建基于督導評估的素質教育評價機制應解決的關鍵問題
(一)基礎教育階段素質教育評價體系涉及的范疇及因素基礎教育階段的素質教育評價是一個長期而復雜的系統工作,它關系到“讓誰來評”、“去評價誰”、“評價些什么”、“按照什么去評”以及“該怎么來評”,這些問題自然就涉及評價的主體、客體、內容、標準、方法等諸多問題。教育評價的作用在于客觀準確的找出影響教育正向發展的外在因素,這就要求在進行教育評價的時候,除了要嚴格按照教育評價的程序執行外,還必須健全評價主客體系統,完善評價指標系統,優化教育評價方法系統,建立一個協同而互動的教育評價大系統。素質教育評價的目的旨在通過社會、政府、學校、教師、家長、學生全面地對教育系統的學校、校長、教師、學生進行科學評價,從而發現問題與不足,為教育教學的改進與完善提供依據。所以素質教育評價體系應該是一個評價主客體多樣化、評價方法模式科學化、評價指標多元化、評價內容全面化的體系。在教育評價工作中,既要注重評價的結果,也要注重評價的過程;在評價的方法上既要定性也要定量;在素質教育評價系統中,不但要對評價客體進行評價,也要注重對評價系統自身的元評價,還要對外部評價系統的作用進行評價,從而有效地保障教育教學的質量,為教育教學工作做出正確的指導。然而這一保障機制要實現就必須擁有完善的評價系統,而完整的素質教育評價系統又包含了評價的主客體系統,這個主客體系統當然涵蓋了外部評價主體,所以完整的評價系統必須在由教育督導機制下的外部評價系統的參與下才能實施,這便是基于教育督導的素質教育評價的價值所在。
(二)素質教育評價對督導機制的需求及要求上個世紀80年代,在存在主義和現象學、解釋學、建構主義等哲學思潮的影響下,庫巴和林肯(Guba,E.G.&Lincoln,Y.S.)提出了自然主義探究評價模式,主張教育評價應該在自然的情境下進行,認為評價所得到的結果往往會適用于特定的某種情境。針對以往的教育評價大多是以促進管理而不是以服務為主要目的、同時缺少對評價客體進行更多的主體性關注的傾向,自然主義探究評價模式正是充分地借鑒了斯塔克應答評價模式的基本理論,認為教育評價的主要意義在于服務,所以評價主體首先需要關心的是評價對象的問題、興趣和焦點,以“回應”評價對象為起點。這就需要評價主體運用一定的質性研究方法,從評價客體的基本需求出發,以促進評價客體的未來的發展為主要目的,更多地去考慮評價客體的相關發展背景以及整體的發展情境對評價結果的影響,充分地聽取各個方面的看法、建議,通過評價主體、評價客體以及所有教育評價參與者進行不斷的對話和交流,最后形成科學的評價結果,達成一定的共識。這種新的評價方法,改變了以往評價主體與評價客體之間制約與被制約的關系,體現了多元并存的價值理念。素質教育評價正是這樣一種新的教育評價機制,它不同于以往的評價,素質教育評價是一種民主多元化的評價機制,它更多地關注評價客體的未來發展,更加關注過程性評價,注重評價結果的導向功能,而基于教育督導的素質教育評價機制正是整合了內部評價體系和外部評價體系,形成了系統完整的評價機制,更好地服務于素質教育評價。以此理論為指導,建立的包括教育督導在內的素質教育評價大系統,這種評價系統就給教育督導評估提出了新的要求。在評價目的上,由側重鑒別、選拔和獎懲轉向側重促進發展和改進工作,從關注結果的評價轉向更加關注診斷性評價和過程性評價;在評價內容上,注重全面性和整體性,從辦學的理念和目標、辦學條件、課程與教學、隊伍建設、教育質量等多方面進行全面、綜合的評價;在評價方法上,強調多樣化,注重把質性評價與量化評價結合起來,運用測驗、問卷調查、自然觀察、訪談等多種方法;在評價主體上,強調多元性和合作性,注重調動評價對象的參與性,重視自評和互評的作用;在評價指標的設計上,強調彈性化、個性化和特色化;在評價者和評價對象的關系上,追求平等,協商解決問題;在評價結果的生成上,重視評價者與評價對象的共同認可和接受,等等。
(三)教育評價與教育督導的聯系與區別教育督導評估是以教育督導機構為評估主體,代表政府或教育行政部門對下級政府及教育行政部門和學校等教育機構的教育教學工作進行的教育評價。它是國家對教育進行管理的一種政府行為,也是政府對教育進行管理的行政執法行為,它還是教育法律對教育實施監督過程中的一種行政監督行為,是教育行政部門的教育行政監督行為。教育評價則不同,它“是按照一定的價值準則對系統收集起來的關于某教育客體的各方面信息進行處理、分析、綜合,對客體做出價值判斷的活動過程”。1.評價主體的不同。督導評估是以教育督導機構為評估主體,代表同級政府或教育行政部門對下級政府及教育行政部門和學校的教育工作進行的教育督導評估。而教育評價的主體可以是政府(督導室),或是教育行政部門,也可以是其他具有監督職能的國家機關、組織和機構以及辦學單位自身,甚至還可以是社會中介組織。實質上,二者在評價主體上的區別主要體現在主體權限范圍及關系上,因此,明晰教育督導評估和其他教育評價的關系本質上是要理順教育督導部門與其他教育評價主體之間關系。2.評價對象的不同。教育督導評估的對象十分廣泛,既包括督政,又包括督學,涵蓋了教育工作的諸多方面。督導評估的范圍除中小學校和幼兒園、成人教育機構外,還包括各級政府部門和教育行政機構。既涉及下級人民政府和教育行政部門的教育工作、學校的教育工作,還會涉及相關教育管理者———地方各級政府的有關領導、教育行政部門的領導以及中小學校的校長。而我國現行的教育評價制度評價的主要對象是各級各類學校、教師以及學生,目的是為了加強政府對各級各類學校的宏觀調控,以提高學校的辦學水平和教學質量。其對象往往是一個個辦學實體、教師或學生群體。3.評價內容的差異性。督導評估對象的廣泛性,使得督導評估的內容豐富化。首先,對于教育評價和教育督導評估對象的交集———學校來說,二者在評價內容上各有側重。督導評估主要包括中小學實施素質教育工作評估,對學校的管理體制、領導班子、教師管理與培訓,辦學方向、辦學條件、教學質量、辦學效益以及校園文化、校外教育等方面的督導評估??茖W有效的教育督導評估的內容具有整體性、綜合性的特點。其次,督政是教育督導評估特有的內容,包括對同級或下級政府部門教育執法行為的督查,對學習化社區的評估等。而教育行政部門或教育機構的評價則側重于對學校教育教學活動或相關教育要素等微觀層面的評估,評價內容往往是具體的、專項的。例如對教師綜合素質、某學科教學質量、學生對知識的掌握水平、實驗室設施設備等相關方面進行具體客觀的評價。
三、構建督導視野下的素質教育評價機制的路徑思考
督導式的評價組織應屬于政府與教育系統的中間機構,也是教育行政部門的內部常設機構。它的督導評價對象既包括教育內部系統,也包括教育外部系統即社會系統,責任在于監督、檢查、評價與指導。教育督導評估機制下的素質教育評價體系可以行使教育評價客體系統中的外部系統即社會系統的評價,它進行的是一種垂直方式的,即自上而下的督導評價,它要求是上級督導組織對下級政府部門的教育評價。這一評價組織通過對政府部門等教育外部系統的教育評價,可以排除外在干擾,優化教育的外部環境,切實保證教育條件的真正滿足。
(一)從多元化的層次構建督導視野下的素質教育評價機制素質教育不同于應試教育,他要求全面提高學生思想道德,文化科學,勞動技能和身體心理素質,所以素質教育的評價目的也就不是以前簡單的選拔、篩選學生,從而為高一級的學校輸送精英人才了,素質教育的評價目的主要是通過社會、政府、學校、教師、家長、學生全面地對教育系統的學校、校長、教師、學生進行科學評價,從而發現問題與不足,為教育教學的改進與完善提供依據。1.從宏觀層面構建督導視野下的素質教育評價機制。宏觀層面的素質教育評價機制是通過社會、政府、家庭、學校、個人的聯動效應而組成的一個動態的、系統的、全程的教育評價機制。這個評價機制從整體出發,運用整齊劃一的形式把素質教育評價的各個部分統一起來,從而使教育評價發揮作用。建立督導視野下的素質教育評價機制可以按統一的方式來運行,從而發揮不同層次或不同方面教育評價的作用,為教育教學活動的改進提供科學有效的依據。2.從微觀層面構建督導視野下的素質教育評價機制。微觀的素質教育評價機制是指從素質教育評價的各個組成部分著手,充分調動各個組成部分的積極性來發揮教育評價的作用。對于素質教育評價而言,就是要把評價的主體、評價的客體、評價內容、評價的方法手段、評價模式等因素的積極性充分調動起來,通過各個單體因素發揮其自身的積極性因素,從而發揮素質教育評價整體的功能,構建基于教育督導的素質教育評價機制正是充分結合教育督導的外部社會評價功能和一般的學校教育評價的積極性因素,從而更好地發揮素質教育評價的作用。這種微觀教育評價機制的特點一個在于它的基層性,另一個就是它的個別性。
(二)構建形式多樣的督導視野下的素質教育評價機制1.行政計劃式的素質教育評價機制。這種機制充分發揮了督導的作用,政府各級督導部門以及督學可以運用行政的手段和計劃的手段將素質教育評價的各個部分有機地整合起來,使之發揮更有效的作用。諸如可以運用下發行政文件、例行開會、不定期的檢查、科學評估和按期匯報等方式把各級各類學校素質教育評價的方方面面統一起來,從而使教育評價更加高效的運行。2.指導服務式的素質教育評價機制。指導服務式機制是教育督導評估在素質教育評價中獨特的作用方式。在素質教育評價中教育督導部門可以給予相關評價機構一定的指導或者提供實質性的服務,但不直接參與評價,在有關指導的方面,教育督導部門對于評價的主體只是提供有益的建議,適當的指正;而在提供實質服務上,政府督導部門對評價主體僅僅是提供一定物質上的支持和有關信息資料上的參考建議等。這種評價機制實質上也就是政府督導領導下的第三方評價機制。
教育評價是一種在教育價值觀的指導下的價值判斷,可是目前由于過于專注于事實判斷。缺乏監督和制約,評價壟斷性和隨意性較強,只以這一規則為準,所以依舊以傳統的紙筆考試為主,來當做主要判斷標準,仍過多地倚重量化的結果,而很少采用體現新評價思想的、質性的評價手段與方法。
二、忽略學生的主動性
新課改要求在教育過程中,學生為主體,學生要主動學習而不是被動。評價不是評價者的獨占物,它需要評價者與評價對象的共同參與、相互作用。而目前的現狀是,課堂上,老師硬性的教學生發聲方法,沒有互動,也沒有創新,依舊是被動學習。
三、掌握建立評價體系的要求及基本規則
以促進發展為主要目的。評價與目標是相適應的,建立評價體系就是要與教育相輔相成,起一個監督和制約的作用。通過教育評價體系反饋給我們的信息來反思我們在教育過程中存在的問題,也可以發現我們的優點,從而發揚光大。所以,必須要以促進發展為主要目標。要體現全新的教育觀念和課程評價發展的趨勢。關注全人類的發展,我們不能完全沉浸在知識的世界里,兩耳不聞窗外事,要時常轉變內容及規則,強調評價的民主化和人性化的發展,以適應時代的發展。評價內容綜合化,要將政府評價、社會評價和學校自我評價三者有機地結合起來。要滿足社會多樣化的需求,就要使外部評價與內部評價共存,二者取長補短、相互促進。關注發展過程,有機結合形成性評價與終結性評價。關注學生、教師、學校和課程發展中的需要,突出評價的激勵與調控的功能。學生的成長和發展是一個漫長、漸進的過程,在這個過程中,學生會經歷不同的階段,有著不同的心理特征,所以,我們要時刻關注并且給予高度重視,這也直接關系到學生未來的發展。
四、結合聲樂教育特點,建立健全評價體系
通過查閱文獻和在美國訪學期間對美國東西海岸著名大學和知名大學的一些理工科課程考試試題進行了研究,其考題大多數來源于實際問題的解決,其最突出的優勢就是考核的科學性和實用性。如加工一個特定功能的部件,該選擇什么性能的材料?加工過程有什么特別的工藝要求?如何檢驗評價最終成品的功能?物料成本多少?有時試題中夾有學生興趣問卷,注重激發學生學習興趣。在英國和日本,大學課程的考核則注重能力考查,考試的層次和內容多元化。在國內,盡管創新教育和素質教育的口號喊了二三十年,可高?,F行的考試體系依然存在違背素質教育和創新教育宗旨的弊端。課程學習的考查依然主要沿襲幾十年來采用的閉卷筆試形式,絕大多數的課程考試的內容以課堂教學采用的課本為唯一的內容。這樣的考試幾乎都可以在書本上找到答案,忽略了學生對知識的理解和運用能力的考查。因此,隨著教育改革向素質教育和創新教育方向的不斷推進,改革現行的考試形式和內容勢在必行,設計不同層次的考試形式,內容新穎、科學性和趣味性強的試題,激發學生學習興趣,使學生能夠積極主動探索和創新。
二、高?,F行課程教學考試評價體系存在的主要問題
從某種意義上講,高?,F行的課程教學評價體系基本上是傳統考試制度延續,這種考試制度的弊端主要體現在以下幾個層面:
1.對考試評價目的認識層面出現偏差。
(1)注重考試過程和試卷分數,輕視考試信息分析。課程考試的目的之一在于更充分評價學生對所學知識的理解、掌握和運用的基本情況;反映教師教學效果和教學質量以便及時發現問題和改進教學方法。而現行的考試雖然也要求教師對考試試卷反映的教學問題進行分析,但實際上大多數對學生答題中反映出來的教學問題及學生知識應用能力的分析只是敷衍應付而已。
(2)現有的考試體系抑制了學生的個性化發展,不利于創新型人才的培養,不適于素質教育模式改革。高校教育的評價體系直接決定高校培養和造就人才的模式。然而現行的考試關注的是學生對書本知識的記憶,忽略了學生個性化發展和創造力的考察。在知識經濟為主要特征的今天,這樣的考試導向不利于高校創新人才的培養,同時也不能適應當今社會對創新精神和創新能力人才大量需求的新要求。
2.考試形式限制了學生多方面能力培養。
高校的課程考試絕大部分在課程教學結束后或期末進行,考試成績對學生學習優劣的評價占據了很大的權重。顯然,一次考試,因受試卷考題涵蓋的教學內容及主要知識點的考查限制,很難完整地反映學生獲取的知識水平和綜合運用知識的能力。因此,僅憑期末考試成績不能全面、客觀、準確地反映教學全過程的實際效果。不同性質課程的特點很難通過一次閉卷筆試體現,一次閉卷考試形式也難以按教學大綱的要求考查學生創新意識和創新能力以及運用知識的綜合技能,從而導致學生僅為應付考試過關而學習,限制了自身創新意識的養成和創新能力的培養。其次,高?,F行的課程考試體系呈現如下特點:閉卷考試多,開卷考試少;筆試方式多,面試、答辯考試少;理論考試多,技能、操作、實踐能力考察少;統一考試多,因材施考少。最后,目前高校課程考試評價體系直接導致學生只關注分數不重視能力,因為考試分數不僅直接關系到大學生的升級、畢業、學位等,而且還成為大多數高校學生獎學金、評優推優的主要依據。
3.考試內容呆板,阻礙了學生想象力與創造力的展示。
至今,絕大多數高校課程考試命題范圍只限課堂所講授的內容,通常很少顧及對教學大綱所要求掌握的知識體系的全盤考慮。主要體現在:
(1)命題內容幾乎局限于教材和課堂筆記??疾榈闹皇菍W生對課堂知識的死記硬背,體現不出學生對所學知識的理解與運用能力。這樣的考試極大制約了對學生獨立思考能力和靈活運用知識能力的培養,導致學生知識面狹窄,逐漸喪失學習興趣。
(2)試題類型缺乏新意。長期以來,國內絕大多數高校課程考試題型幾乎主要采用填空、單選、多選、判斷、簡答等有限的傳統題型,而綜合性與設計性考題、分析論述題等主觀性試題較少。這種幾十年不變的考試內容及形式已經不能適應當今高等教育的新發展。
4.試卷命題質量不高。
高質量的試題應該體現出學生對知識掌握和運用能力的全面考察以及教師教學效果的整體評價。一套高質量的試題,除應符合教學大綱的基本要求外,還應檢驗出老師實現教學目標的情況和測試學生掌握所學知識和能力的程度和水平,不僅如此,還應能區別測出每個學生學習情況的個體的差異。
5.教師命題自由度受限,妨礙“因材施考”。
高等教育的宗旨除傳授知識外,更主要的是要培養學生獨立判斷與選擇的能力以及創新精神、協作精神等當今社會所要求的基本素質。高校課程教學的重點應著重培養學生的創新精神和創新能力,教會學生如何發現問題、分析和總結問題的方法;真正做到授人以漁,使學生能終身受用;鼓勵學生在質疑中思維。然而,現行的考試制度與此宗旨似乎背道而馳。受教學大綱的限制,同一門課程由若干不同教師授課,而不同老師教授的學生采用同一試題測評,要求試題必須完全符合教學大綱,且教師授課必須嚴格按照教學大綱的要求從事教學活動。這樣的課程教學只會限制充分發揮每個教師的教學特色、扼殺學生的個性。
三、幾點建議
高等教育應以人的個性發展和培養創新意識為根本。高等教育現行的管理培養模式單一化和標準化與全社會對人才多樣化和人才成長模式多樣化的需求形成了強烈反差。我國的教育方針早就強調全面均衡發展,而如今幾乎所有高校都在用統一流程和標準的“流水線”進行人才生產,鮮有學生的個性發展空間和環境;與此同時,標準化考試的引入使得教育工作者及其管理者方便用“標準答案”統一學生的思維,不樂見甚至很難容忍學生對教育現狀提出的批評。這些在高校教育理念中刻下的深深的烙印處處體現在我們的管理和培養模式和對課程教學活動的評價即考試中,限制著學生個性的發展與創新意識的養成。
1.破除傳統“分數決定一切”的舊觀念,建立科學的教與學的考試評價體系。
破除“分數決定一切”的舊觀念是教學考試評價體系改革的前提。科學的考試評價制度強調的是人的素質的全面協調發展,應體現從“人”出發。課程教學考試評價的目的不僅是為了檢查學生對所學知識的掌握和運用狀況,更重要的是通過考試評價活動引導學生學會主動積極學習,促進學生強化掌握知識的能力。同時,科學的評價制度要求增加對學生非智力因素的考查,促進學生在掌握知識技能的同時,形成科學的世界觀、人生觀、價值觀,充分體現其教育功能。因此,建立科學的教育評價體系,為改革人才培養模式和營造良好的思想氛圍,對深化高等教育改革、推進高校素質教育和大學生創新能力培養都有重大意義。
(1)確立課程考試是對前一段課程學習的學習效果總結不是為了課程學習過關。毋庸諱言,不少在校大學生有“60分萬歲”的思想,其可怕之處就是為課程過關而學習,其后果就是消極應付課程學習,漸漸失去學習興趣。
(2)樹立考試是師生對課程教學的一種互動方式的理念,不是課程教學的結束。通過考試,教師可以了解學生對知識的掌握程度,知曉自己的教學效果和教學過程中的疏忽和缺陷,以便日后與學生的交流中能針對性指出前期學習中的不足,鼓勵他們積極思考和深入探索。
2.樹立構建主義學習思想,激勵大學生主動積極學習。
構建主義學習理論認為,學習不是師生間知識的簡單傳遞,而是學生自己構建知識體系的過程,主要包括兩個方面:一是弄清事物的本質、規律及內在聯系,將所學知識所反映的信息盡量與自己已有的認知結構相聯系,并對這種聯系認真思考,實現對新信息意義的構建。二是在原有的經驗基礎上對已有的知識的再理解與再創造過程。這種過程必須是由學生自己親自去完成,其他人替代不了。對剛入大學的學生用已有的知識解決常見問題并不困難,但他們對老師的依耐性導致缺乏知識的自我構建能力,一旦遇見新情況、新問題就顯得束手無策。
3.針對課程特點,改進充實新型評價考試形式。
現在大學課程教學的教與學評價還主要是卷面考試,很難全面反映學生對課程知識掌握和運用的真實水平和能力,這種評價分數不能夠全面考查學生的綜合素質。
(1)依據課程內容特點,選擇有效可行的科學考試方式。大學課程考試基本形式主要有:閉卷考試、開卷考試、面試或答辯考試、操作合作考試和網絡考試等形式。不同的考試形式各有其自身的特點,一般來說,對于平行班教學課程考試,由于涉及考試效率與環境容易控制等因素,大多習慣采用閉卷考試形式,這種考試考查的知識面廣,可設計的題型多。對知識的理解能力、綜合應用能力、學習能力和查閱資料的能力的考核,開卷考試有獨到的優勢。面試或答辯考試不僅能客觀評價學生對所學知識掌握的廣度與深度,還可以全面考查和檢測其口頭表達能力、思維能力、反應能力、想象能力、環境適應能力和創造性思維能力以及心理素質、儀表風度和個性特征等。這種開放式的面試或答辯考試既能將學生置于提問范圍所創設的環境中,讓其隨心所欲運用所學知識表達自己的見解,充分展現自己的才能,又能較好地激發學生學習興趣,培養創新能力和綜合應用所學知識解決實際問題的能力。對于操作技能和協作素質相關的能力評價,操作合作考試是較好的考試形式。此外,這種考試能夠較好地增進學生間的相互配合與分工協作,促進學生的團隊精神。計算機網絡考試方式,不但可以有效評價學生的計算機操作能力,還可以客觀考核學生的認知能力。在信息化社會應加強研究和開發這種考試評價方法,大力完善并推廣這種高效綠色的考試方法。
(2)改進規范評價標準,讓考試有機地融合于學習全過程?;诳荚囋u價實踐的現實,充分完善和規范課程評價考核的制度建設,增強其科學性和有效性是關鍵。通過評價考核的導向效應,最終實現課程教學評價考核目標多元化、考核內容多樣化、考核方式靈活化以及考核評價個性化的改革。
(3)通過課程考核實現“要我學”到“我要學”的轉變。作為評價教學活動質量的重要手段,考試要實現全面、客觀和公正評價的目標,評價工作就必須貫穿教學全過程。在平時的教學活動中,老師可設計一些討論題或小論文,要求學生在規定時間內完成,教師安排討論學生論文中的各種問題,鼓勵創新,營造學生獨立思考的學習氛圍,有意識地培養學生綜合分析問題及解決問題的能力。在課程結束后,通過設計若干個綜合題,以開卷的形式在規定時間內通過查閱文獻完成考試,學生可以自主選擇獨自或小組合作完成考試。這樣不僅鍛煉了學生調研和查閱文獻的實際能力,還增強實際寫作能力,分散減輕了學生期末考試壓力,讓考試變成實現和體驗自我價值的一種“游戲”,引導大學教育向能力培養方向邁進。
4.依據大綱創新設計考試內容。
現行的考試命題大多數是知識再現型,考試考查的是學生的記憶能力,不是對知識的構建能力和創新能力。當今社會對人才能力需求的日益提高,要求高校課程教育考試在內容上應堅持考查能力為主,同時注重培養和考查創新精神,公正客觀評價綜合素質。這就要求老師在考試命題和評分標準方面力求開放性和人性化。
(1)考試命題不僅要著重立足培養目標的全局,反映課程教學的目的,還要激發學生獨立思考,突出能力考核,評價標準要鼓勵學生發表自己的獨到見解。大學教育應該充分調動學生自主學習的主觀能動性。實現真正意義上的開放。這種開放性要求:教師命題要事先設置好問題背景,科學提出問題,要求學生全面進行分析,提出解決問題的方法,考查學生解決問題的能力。試題答案無標準化答案。根據試題的要求,學生根據自己的理解可充分發揮想象進行解答。答題方法的開放。允許學生采取各種有效的答題方法,鼓勵創造性思維。
(2)考核評價標準人性化。命題的開放性也決定了評價標準的靈活性。人性化的評價標準將激勵學生通過研究,得出有創意并符合科學的答案從而獲優異成績,而根據教材原文或課堂筆記做出答案的學生則不能得到高分獎勵。這種人性化的評價標準使得學生在考試過程中樂于獨立思考,勇于展現自己的個性和創新能力。
四、總結
關鍵詞:義務教育階段;中小學;績效評價;體系構建
隨著社會主義市場經濟體制的完善和建設服務型政府的推進,很多地方政府和部門在學校管理中引入了政府績效評價,并把它作為管理創新的突破口。以義務教育階段各中小學校為研究對象,將各項主觀性的評估指標進行改進量化,構建出一套適合中小學校日常管理評估的績效評價體系,既有利于學校進行科學決策,合理配置教育資源,診斷分析出教學管理中存在的問題從而加以改進,也有利于國家和地區更好的制定義務教育階段的戰略發展規劃,統籌考慮教育教學資源的利用與配置問題,監督引導學校講求效益、關注效果、強化績效意識。
一、中小學??冃гu價的指標設計原則
(一)綜合性原則
義務教育階段中小學校的績效評價是一項系統性很強的工作,由多項評價指標共同構成,這些指標之間相互聯系但又側重點不同,因此對于指標的選取要綜合考慮、平衡各方面因素,從多方面、多角度去綜合考量分析。
(二)客觀性原則
為了更加科學客觀的反映被評估對象的實際情況,在指標設計時應盡量選取量化的客觀性的數據指標,同時充分考慮到數據之間的可比性,減少主觀評判性指標的選取。
(三)可操作性原則
對中小學??冃гu價指標的選取應可操作、易獲得,這就要求設計指標時要明確清晰的表述指標的含義和構成,定量化指標容易被評估人員統計,對評估人員技術要求不高。
二、中小學??冃гu價體系的構建
根據《黑龍江省縣級政府教育工作督導評估指標體系》要求,對于縣域義務教育均衡發展的評估主要包括履行政府職責和教育水平兩大部分。政府職責主要考察教育地位、教育規劃、教育管理、教育資源、教育投入、教育經費管理、教師隊伍建設七個方面,其中:對于教育地位、教育規劃、教育資源三個方面的考察權重總和不到2%,且均為主觀評價,因此在構建績效評價體系時將這三方面排除;對于教育管理、教育投入、教育經費管理、教師隊伍四個方面,將其按照評估側重點歸納為兩方面進行量化指標評估,即教育經費投入、教師隊伍建設;同時,考慮到中小學校對教育教學器材設施的需求,增加教學設施方面的績效評估指標。教育水平主要考察學前教育、義務教育、普通高中、職業教育、特殊教育、民族教育、其他教育七個方面,由于本文的研究重點為義務教育階段中小學??冃гu價體系建設,因此將學前教育、義務教育、普通高中、職業教育、特殊教育、其他教育六方面教育成果整理歸納為一項,即教育成果,重點突出對中小學校教育教學成果的績效考核;考慮到各縣域間少數民族分布及特點存在差異,因此將民族教育作為績效評價指標體系的附加項進行考評;同時,考慮到近年來學生及家長等社會因素對教育情況的影響,增加社會滿意度方面的績效評估指標;并將學生體質健康、社會實踐活動、安全工作納入指標評價體系,以期更加全面客觀綜合對教育水平進行績效評價。為了消除不同縣域間經濟發展水平、人口、地域面積等因素的差異,使得縣域間中小學??冃Ч芾砭哂锌杀刃?,將絕對化的數值改進為可供比較的相對化比例數值。如:在考慮教育經費投入時,由于不同縣域之間財力不同,單純比較財政撥付的教育經費絕對指標也就毫無意義,因此本文將教育財政撥款這項絕對數指標進行改進完善,研究財政教育支出占財政總支出的相對比例、財政撥付教育經費占財政計劃撥付教育經費的比例即教育經費撥付率,將絕對性指標改為相對性的指標進行比較,使縣域間中小學校的績效評價指標更具有可比性。
三、結語
綜上所述,對義務教育階段中小學校進行績效評價,要同時兼顧政府履行職責和取得的教育成效兩個部分,并考慮數據之間的可比關系,盡可能將各項主觀性的評估指標進行改進量化,從而構建出一套適合義務教育階段中小學校日常管理評估的績效評價體系。
參考文獻:
[1]陳明選.中小學校園網投入教育績效評價指標體系的構建[J].電化教育研究,2007(7):72-75.
10 年間中國大陸地區教育技術學領域研究人員的科研績效進行了評價,評選得到了“1998 至 2007 年段中國大陸地區教育技術 學領域最具科研績效的前 30 位研究人員”,并對 h 指數與其他評價指標進行了相關性分析。分析結果表明,利用 h 指數來評價 研究人員的科研績效,一定程度上可以反映“總被引頻次”、“論文數量”、“篇均被引頻次”三項指標的評價結果,h 指數可以 說是一項更為綜合的評價指標。
【關鍵字】h 指數;教育技術學;研究人員;科研績效評價
【中圖分類號】G40-051 【文獻標識碼】A 【論文編號】1009―8097(2009)01―0021―07
一 問題的提出
h 指數是美國加州大學圣迭哥分校的物理學家 J.E.Hirsch 教授在 2005 年提出的一項旨在評價科學家個人績效的指標。h 指數的定義是:一個科學家的分值為 h,當且僅當在他(她) 發表的 Np 篇論文中有 h 篇論文每篇獲得了不少于 h 次的引文 數,科學家剩下的(Np-h)篇論文中每篇論文的引文數都小于h 次。[1]根據 h 指數的定義,假如一個研究人員的 h 指數為 9,則意味著他發表了至少 9 篇論文,并且僅有 9 篇論文的被引次 數不少于 9 次。在計算某位研究人員的 h 指數時,可以將這位 研究人員的論文按照其引文數降序排列,然后從排序最高的論 文開始向下逐條計數,一直到某篇論文的排序號大于該篇論文 的引文數,則該篇論文的序號數減 1 就是該位研究人員的 h 指 數數值。Hirsch 討論了 h 指數在評價研究人員個人績效中的應 用,并且提出了他們晉升應達到的門檻。例如,他認為研究型 大學教師晉升為正教授的指數的典型值應約為 18。[2]
在 h 指數的基礎上,中國科技大學的吳強提出一種新的科學家個人績效的評價指標――w 指數。[3]w 指數與 h 指數類似, 但做了些巧妙的修改。舉例來說,假如一個研究人員的 w 指數 為 9,意味著研究者發表了至少 9 篇論文,并且僅有 9 篇論文 的被引次數不少于 90 次。吳強指出,w 指數是對 h 指數的重要 改進,因為它“更準確的反映了一個科學家的高質量論文的影 響”,并且他也承認這一指數“可以被稱為 10h 指數”。根據 吳強的研究,研究人員的 w 指數為 1-2 意味著他“已經具備了 某一領域的基礎”。w 指數為 3-4 意味著這位研究人員已經掌 握了“科學活動的藝術”,而“杰出的研究者”屬于那些 w 指數為 10 以上的人。吳強把“頂尖科學家”留給了通過 20 年工作 w 指數達到 15 或者通過 30 年工作達到 20 的科學家。
在 h 指數提出之前我們通常是采用信息計量學的方法來 評價研究人員,從信息計量的角度定量地對研究人員進行評 價,其結果比較客觀、比較準確。在信息計量學中,研究人 員的學術成就和對學科貢獻主要體現在發表的文獻數量和文 獻被引次數兩個方面,其中文獻數量說明作者生產的文獻產 量或科研能力,而文獻被引頻次則更能說明作者生產的文獻 的質量,交流程度和學術水平。因此,一般從論文數量和被 引頻次兩個方面考察作者的影響力。路秋麗、田雨等人(2008) 曾從論文數量、總被引頻次、篇均被引頻次三個方面考察中 國教育技術學領域研究人員的科研績效,并評選出了 16 位教 育技術學領域的關鍵學者。[4]然而,正如 J.E.Hirsch 教授 所指出的,應用“論文數量”、“總被引頻次”、“篇均被 引頻次”等單項評價指標存在一定的缺陷。他認為“論文數 量”的缺點是不能測度論文的重要性和影響力;“總被引頻 次”的缺點是作者的影響力會被少數重要的合作論文夸大; “篇均被引頻次”缺點是數據不容易獲得,容易造成獎少懲 多。[1]J.E.Hirsch 教授認為 h 指數能夠測度科學家個人工作 的主要影響力,并能夠避免上述指標的一系列缺點。 J.E.Hirsch教授進一步指出,即使兩個科學家的論文數或 引文數量有很大差別,但假如他們具有相似 h 指數,那么仍 然可以認為他們的整體科學影響力是可比的。反之,科學生 涯相同的兩個科學家,即使具有相近的論文或引文數量,假 如他們的 h 指數有很大差別,同樣可以認為具有較高指數的科學家是一位更加“優秀”的科學家。因此,本研究將采用 h 指數作為主要指標來對中國大陸地區教育技術學領域的研究 人員進行科研績效評價(這里“中國大陸地區”用于限定研 究人員的學術活動范圍,而不是限定研究人員的所在研究機 構),并輔之以 w 指數的計算,同時與“論文數量”、“總被 引頻次”、“篇均被引頻次”等三項指標的評價結果進行比 較,以發現不同評價指標之間的差異。
二 研究方法
本文的研究對象是中國大陸地區教育技術學領域的研究 人員,我們可以從中國大陸地區教育技術學領域重要的學術期 刊中獲得該領域研究人員的信息以及論文被引用的 信息,并以此為基礎開展對研究人員科研績效的評價。筆者參 考《CSSCI 來源期刊(2006-2007)》[6],選取該引文索引來源期 刊中屬于教育技術學領域的學術期刊包括《電化教育研究》、《中國電化教育》、《中國遠程教育(上)》、《開放教育研究》、《現代教育技術》、《現代遠距離教育》等六個期刊(后文簡稱 為“六大學術期刊”),并獲得這六大學術期 1998 年至 2007 年 所刊發的論文及其引文信息以作為分析數據(盡管在《CSSCI 來源期刊(2008-2009)》[5]中,《現代遠距離教育》已經不在其中, 但這并不影響對該期刊 2007 年以前的論文的分析)。本研究所 選擇的期刊范圍較路秋麗、田雨等人(2008)選取的期刊范圍 更廣,可以對中國大陸地區教育技術學領域的研究人員科研績 效做出一個更為客觀的評價。研究的具體過程包括利用中國知 網(CNKI)的中國期刊全文數據庫[7]完成“六大學術期刊”論 文基本信息下載與整理、利用中國知網(CNKI)的中國引文數 據庫 0完成“六大學術期刊”被引用信息下載與整理、研究人 員所的數量、總被引頻次與平均被引頻次計算、研究 人員的 h 指數和 w 指數計算、各項評價指標的綜合比較等環節。
這里筆者沒有采用 CSSCI 數據庫,因為從 CSSCI 數據 庫中下載相關數據效率較低。當然,CSSCI 的引文數據庫更 具權威性,其引文來源僅限于 CSSCI 為數不多的來源期刊。 而中國知網(CNKI)的中國引文數據庫的引文來源則更為廣 泛,其來源包括中國知網(CNKI)的中國優秀碩士學位論文全文數據庫、中國知網(CNKI)的中國博士學位論文全文數 據庫、中國知網(CNKI)的中國期刊全文數據庫、中國知網(CNKI)的中國重要會議論文全文數據庫等,相比于 CSSCI 引文數據庫,更能反映論文的影響范圍。兩個引文數據庫各 具特色,在本研究中筆者選用中國知網(CNKI)的中國引文 數據。感興趣的讀者可以采用 CSSCI 的引文數據庫來分析。
1期刊論文基本信息下載與整理
中國期刊全文數據庫提供專業檢索界面,可編寫檢索語句,于是筆者編寫了如下檢索語句,如圖 1 所示。
經檢索(檢索時間為 2008 年 9 月 2 日),返回 14102 條 記錄,其片段如圖 2 所示。
在中國知網(CNKI)的中國期刊全文數據庫的初級檢索系統中不能進行每個作者所發論文數量的分類匯總計算,我們需要將這些結果逐頁復制到 Microsoft Excel 軟件的表格中, 并清除所有格式,可得到如圖 3 所示的 Excel 表格。
在這個表格的基礎上我們便可以進行分類匯總計算了。由于具有 10000 行以上記錄的 Excel 表格操作起來非常緩慢, 于是筆者將 Excel 表格中的數據導入到 SQL SERVER 2000 數 據庫中,得到“論文數據表”,其片段如表 1 所示。
通過 T-SQL 語言對論文數據表進行查詢分析,可對“六大學術期刊”的所有作者及發表文章情況進行統計。經對“論 文數據表”以“第一作者”作為分類字段(這里忽略同名作者 的干擾),以論文計數作為匯總方式進行分類匯總,得到“作 者-論文分類匯總表”,共有 6462 名作者(這里指第一作者, 下同)以及每位作者的數量,其片段如表 2 所示。
然而,僅僅依據“論文數量”進行排名,大量來自“六 大學術期刊”的編輯將進入前列(如表 2,論文數量位居前 5 位的就有 4 位期刊編輯),這就會大大影響研究人員在“論文 數量”上的排名。這里,筆者將借助下文提到的“引文數據 表”(因為通訊稿或評論等文章的被引頻次往往很低),先查 詢“引文數據表”得到“總被引頻次”居于前 100 位的作者 列表,再查詢“論文數據表”得到“論文數量”排名居于前100 位的作者列表,然后取這兩個列表的交集,發現“論文數 量”排名居于前 100 位的作者列表中有 34 位作者不在交集 中。通過查詢這 34 位作者的單位信息,發現有 16 位是期刊編輯。這 16 位編輯的文章需要從“論文數據表”中剔除出去。 另外,筆者發現,編輯所撰寫的文章在論文記錄的“單位”信 息上均有“本刊記者”的字樣,于是筆者先查詢論文記錄的 “單位”字段包含“本刊記者”的記錄,并對這些記錄中的作 者字段進行分類匯總,發現共有 40 位作者。將前后兩次得到 的編輯名單加以合并,并將這些編輯發表的論文從“論文數據 表”中剔除。然后對“論文數據表”以“第一作者”作為分類 字段,以論文計數作為匯總方式再次進行分類匯總,并以“論 文數量”逆序排列,得到新的“作者-論文分類匯總表”,其 中數量居前 50 位的研究人員列表如表 3 所示。
2期刊被引用信息下載與整理
筆者通過中國知網(CNKI)的中國引文數據庫的專業檢 索界面,編寫如圖 4 所示檢索語句。經檢索(檢索時間是 2008 年 9 月 2 日下午 3 時),共得到 7927 條記錄,結果如圖 5 所示。
同樣,在中國知網(CNKI)的中國引文數據庫中無法進 行每位研究者的被引頻次求和計算,也需要將這些結果逐頁 復制到 Excel 表格中,在去除標記并對一些列如“被引文獻作 者”、“被引文獻來源”進行分列操作后,如圖 6 所示。
為方便計算,筆者將這個 Excel 表格導入到 SQL SERVER 2000 的數據庫中,得到“引文數據表”,其片段如表 4 所示。
然后通過 T-SQL 語言對引文數據表進行查詢分析。通過SQL SERVER 的查詢分析器,可以對每位作者的“總被引頻 次”、“平均被引頻次”、“被引文獻數”等三項指標進行 計算。經對“引文數據表”以“第一作者”作為分類字段, 以“被引頻次”求和作為匯總方式進行分類匯總,接著再以 論文計數作為匯總方式進行分類匯總,并計算每位作者的“篇均被引頻次”,最后以“總被引頻次”逆序排列,得到“作者-引文分類匯總表”(這里忽略同名作者的干擾),該 表共有 4211 名作者(這里的作者指的是第一作者,下同)以 及每位作者的“被引文獻數”、“總被引頻次”和“篇均被 引頻次”。其中,“總被引頻次”居前 50 位的研究人員列表 如表 5 所示。
3研究人員的 h 指數和 w 指數計算
按照 h 指數和 w 指數的定義,筆者利用 SQL SERVER的查詢分析器編寫相關算法對“引文數據表”中所有作者進行兩個指數的計算,并將計算結果按 h 指數逆序排列,得到“作者-h 指數-w 指數數據表”,其中 h 指數不小于 7 的作者 共有 36 位,如表 6 所示。
筆者認為,導致教育技術學領域研究人員 h 指數偏低的原因有兩個:一是本研究選取的文獻數據持續時間不長,只有 10 年,相對于一個研究人員的科研生涯還是比較短暫的;二是國 內論文的參考文獻數量普遍偏低,根據張偉遠(1999)的一項 比較研究[9],中國大陸地區有參考文獻的文章中,60%的文章只有 1 到 4 份參考文獻,在英美兩國的期刊中,60%的論文有9 份以上的參考文獻,45%的論文有 20 份以上的參考文獻。
前文已經提到,w 指數為 3-4 意味著這個研究者已經掌握了“科學活動的藝術”。表 6 是依據 h 指數排名得來,可能會 將一些發文量較少、然而“篇均被引用頻次”卻很高的作者排除在外。下面筆者再以 w 指數為條件,選取 w 指數不小于 3 的作者名單,仍然按 h 指數逆序排列,得到如表 7 所示結果。
表 7 中灰色區域部分的作者是表 1 中未曾出現的作者, 這些作者雖然較少,但論文的被引頻次卻很高,如 李克東教授 1998 至 2007 年間在“六大學術期刊”以第一作者名義 8 篇,有 5 篇論文的被引頻次在 50 次以上。
4各項評價指標的綜合比較
為了比較研究人員科研績效評價不同評價指標之間的差異,下面筆者把按照三項不同的評價指標即“論文數量”、 “總被引頻次”、h指數分別得到的“作者-論文分類匯總 表”(取前 50 條記錄,記為數據表 T1,其內容即文中的表 3)、 “作者-引文分類匯總表”(取前 50 條記錄,記為數據表 T2, 其內容即文中的表 5)、“作者-h 指數-w 指數數據表”(取 h 指數不小于 7 的記錄,記為數據表 T3,其內容即文中的表 6) 進行整合,把這三個表中所包含的所有作者的三項指標計算 出來,并對作者是否在 T1、T2、T3 等三個數據表出現加以標 識(1 表示出現,0 表示未出現),并按 h 指數為主關鍵字, “總被引頻次”為次關鍵字,“論文數量”為第三關鍵字, 三個關鍵字均為逆序排列,得到“作者-三項指標綜合數據 表”。筆者將在 T1、T2、T3 等三個數據表均出現的作者選擇 出來,形成如表 8 所示的研究人員列表,共 30 位作者。筆者 將這 30 位作者界定為“1998 至 2007 年段中國大陸地區教育 技術學領域最具科研績效的前 30 位研究人員”。
關于表 8,這里需要做一些說明:
(1) 列“T1”用于表示該作者是否在數據表 T1 出現,
1 表示出現,0 表示未出現;列“T2”用于表示該作者是否在 數據表 T2 出現,1 表示出現,0 表示未出現;列“T3”用于表 示該作者是否在數據表 T3 出現,1 表示出現,0 表示未出現。
(2)每位作者在“作者-論文分類匯總數據表”中的排 名在列“論文數量排名”中給出,在“作者-引文分類匯總數 據表”中的排名在列“被引總頻次排名”中給出。讀者可以 比較表 8 中的三個不同排名以了解不同評價指標的差異。
(3) “作者單位”根據每位作者最新發表的論文的署 名單位得來。
(4) 表 8 中,有兩位作者是例外,即張倩葦和胡小勇, 這兩位作者由于論文數量的關系未能在 T1 中出現,但是由于 這兩位作者的 h 指數較高,因此筆者仍然將這兩位作者納入 到“1998 至 2007 年段中國大陸地區教育技術學領域最具科研 績效的前 30 位研究人員”行列。
以表 8 為基礎,筆者對不同評價指標進行相關性分析, 以進一步了解不同評價指標之間的關系。筆者采用 SPSS 15.0 For Windows 的 Pearson Correlation 相關性計算方法對四項評 價指標即 h 指數、“總被引頻次”、“論文數量”、“篇均 被引頻次”兩兩之間的相關性進行計算,其結果如表 9 所示。
從表 9 中我們可以看出,h 指數與其他三項指標均呈顯 著的正相關,且與“總被引頻次”的相關性系數非常高,達 到了 0.906;論文數量與篇均被引頻次的相關性系數為 0.038, 相關性不顯著。以上相關性分析表明,利用 h 指數來評價研究人員的科研績效,一定程度上可以反映“總被引頻次”、“論文數量”、“篇均被引頻次”三項指標的評價結果,h 指 數可以說是一項更為綜合的評價指標。當然,在使用 h 指數作 為評價指標時,仍然需要結合其他評價指標來對具有相同 h 指 數的作者進行內部排名。
為進一步了解大陸地區教育技術學領域科研機構的科研績 效情況,筆者對表 8 以“作者單位”作為分類字段,以“第一 作者”計數作為匯總方式進行分類匯總,得到如表 10 所示結果:
如表 10 所示,上述 30 位作者中,有 7 位來自北京師范大學,4 位來自華南師范大學,占總人數的 36.7%,說明這兩 所學校在教育技術學領域有著較強的學術實力。
三 研究結論
本研究采用 h 指數作為主要評價指標,并輔之以 w 指數,對中國大陸地區教育技術學領域 1998 年至 2007 年 10 年間研 究人員的科研績效進行了評價,評價得出了“1998 至 2007 年 段中國大陸地區教育技術學領域最具科研績效的前 30 位研究 人員”,這是對路秋麗、田雨等人(2008)評價得出的“中 國教育技術學領域的關鍵學者”的一次較大調整,有助于對 當前階段中國教育技術學領域的研究人員狀況有一個更為客 觀的認識;并與其他評價指標進行了相關性分析,分析結果 表明利用 h 指數來評價研究人員的科研績效,一定程度上可 以反映“總被引頻次”、“論文數量”、“篇均被引頻次” 三項指標的評價結果,可以說是一項更為綜合的評價指標, 一定程度上改進了路秋麗、田雨等人(2008)采用的科研績 效評價方法。當然,本研究所作出的科研績效評價結果并不 能完全真實的反映當前中國大陸地區教育技術學領域研究人 員科研績效,究竟此次得出的“1998 至 2007 年段中國大陸地 區教育技術學領域最具科研績效的前 30 位研究人員”是否客 觀還需交由教育技術學領域的廣大研究人員一起來評議。
本研究所采用的論文和引文數據的持續時間只有 10 年, 這對于一個研究人員的科研生崖和研究人員 h 指數的計算都 顯得過于短暫,這可以說是本研究的主要缺陷。由于國內的 期刊數據庫起步較晚,許多期刊雖然創刊較早,但是期刊數 據庫中的數據卻只存儲了近十幾年的數據,而不是全部的數 據。以《中國電化教育》和《電化教育研究》為例,兩個雜 志創刊于 20 世紀 80 年代初,中國知網(CNKI)期刊數據庫 中所收錄的這兩個期刊的論文卻是從 1994 年開始的。因此, 要利用 h 指數對中國教育技術學領域的某一代研究人員作出 更為全面的評價,還需等待 15 到 20 年時間。
參考文獻
[1] J.E. Hirsch.衡量科學家個人成就的一個量化指標[J].科學觀 察,2006,(1):2-7.
[2] Henk F. Moed,劉俊婉,金碧輝. h 指數構建有創意 用于評價 要慎重[J].科學觀察,2006,(1):15.
[3] Qiang Wu. The w-index: A significant improvement of the h-index[DB/OL].省略/ftp/arxiv/papers/0805/0805.4650.pdf, 2008-9-3.>
[4]路秋麗,田雨,魏順平.教育技術領域關鍵學者研究[J].電化教 育研究,2008,(8):26-31.
[5] 南京大學中國社會科學研究評價中心.CSSCI 來源期刊(2008-2009)學科分類[DB/OL]. [6] 南京大學中國社會科學研究評價中心.CSSCI 來源期刊(2006-2007)學科分類[DB/OL].
[7] 中 國知網 (CNKI). 中 國期刊 全文 數據庫 [DB/OL].省略/login/autonavi.aspx?id=1, 2008-9-3.>