發(fā)布時(shí)間:2013-09-04 10:30:36
點(diǎn)擊數(shù):88242 次
人才測(cè)評(píng)已經(jīng)成為企業(yè)快速評(píng)價(jià)人才的工具和手段。在美國(guó),1/3的小企業(yè)和2/3的大公司都在它們的管理過程使用人才測(cè)評(píng);在英國(guó),有85%的公司在招聘新員工時(shí)使用人才測(cè)評(píng),不少在職經(jīng)理也被要求經(jīng)常參加各種人才測(cè)評(píng)。在我國(guó),人才測(cè)評(píng)雖然還處于起步階段,但是已經(jīng)有越來越多的外資、民營(yíng)企業(yè)和咨詢公司認(rèn)識(shí)到了人才測(cè)評(píng)的重要性,并開始在其工作中使用人才測(cè)評(píng)。但是在實(shí)際的使用過程,經(jīng)常出現(xiàn)這樣那樣的問題,究其原因就是對(duì)人才測(cè)評(píng)的基本問題,包括測(cè)評(píng)的信度、效度和標(biāo)準(zhǔn)化等,并沒有引起足夠的重視。
一、信度
信度是測(cè)驗(yàn)結(jié)果的可靠性或一致性,也就是測(cè)評(píng)所得到的分?jǐn)?shù)的穩(wěn)定、一致性程度。它既包括時(shí)間上的一致性,也包括內(nèi)容和不同評(píng)分者之間的一致性。
采用測(cè)評(píng)對(duì)人進(jìn)行評(píng)價(jià),都需要對(duì)人進(jìn)行定量評(píng)價(jià)(也就是給人打分),這樣我們才能根據(jù)所有被評(píng)價(jià)者的得分情況,確定究竟錄用誰不錄用誰。在這里我們有一個(gè)潛在的假設(shè),也就是對(duì)一個(gè)的評(píng)價(jià)結(jié)果就是他的實(shí)際情況。比如,如果我們對(duì)某一個(gè)人進(jìn)行評(píng)價(jià),其基本能力得分為80,則我們認(rèn)為他的基本能力就是80。其實(shí),我們永遠(yuǎn)不可能完全準(zhǔn)確地知道被評(píng)價(jià)者在某一特征上的真實(shí)情況,也就是其真實(shí)水平(可以稱為真分?jǐn)?shù))。我們只能借助一定的工具對(duì)其進(jìn)行評(píng)價(jià),然后得到這個(gè)人在這個(gè)特征上的分?jǐn)?shù)(可以稱之為測(cè)驗(yàn)分?jǐn)?shù))。理想的結(jié)果是,真分?jǐn)?shù)和測(cè)驗(yàn)分?jǐn)?shù)完全一致,即真分?jǐn)?shù)=測(cè)驗(yàn)分?jǐn)?shù)。實(shí)際上,這種結(jié)果是很難得到了。舉例來說,如果一個(gè)人的身高是165厘米(真實(shí)分?jǐn)?shù)),也許由同一個(gè)人用同一把尺子來量,昨天得到的結(jié)果是166厘米(測(cè)驗(yàn)分?jǐn)?shù)),今天得到的結(jié)果是164厘米(分?jǐn)?shù)),而明天可能又會(huì)得到另外一個(gè)結(jié)果……
從上面這個(gè)例子,我們可以看出:真分?jǐn)?shù)≠測(cè)驗(yàn)分?jǐn)?shù)。這就讓我們不得不去考慮,究竟我們?cè)诙啻蟪潭壬峡梢韵嘈攀褂脺y(cè)評(píng)工具所得到的結(jié)果?在上面的例子,也就是在多大程度我們可以相信這把尺子的測(cè)量結(jié)果。要回答這一問題,我們就必須計(jì)算“真分?jǐn)?shù)”與“測(cè)驗(yàn)分?jǐn)?shù)”之間的一致性(從統(tǒng)計(jì)的角度來講,就是兩者“相關(guān)”),這就是“信度”。上面的例子中,其“真分?jǐn)?shù)”是165厘米,兩次測(cè)量分?jǐn)?shù)分別166厘米,164厘米。如果采用這把尺子進(jìn)行多次測(cè)量,得到的結(jié)果都在165厘米附近,則我們所用的這把尺子的一致性比較高,也就是“信度”比較高;而如果進(jìn)行多次測(cè)量,每次測(cè)量的結(jié)果與真分?jǐn)?shù)相比很大,最后計(jì)算出來的“真分?jǐn)?shù)”與“測(cè)驗(yàn)分?jǐn)?shù)”的相關(guān)很低,則我們可以說這把尺子的信度比較低,采用這把尺子所得到的結(jié)果不一致。
信度對(duì)于人才測(cè)評(píng)來說有著極為重要的意義,如果一個(gè)測(cè)評(píng)工具的信度比較低,而我們采用這一工具來對(duì)人才進(jìn)行評(píng)價(jià),則極有可能今天得到的是一個(gè)結(jié)果,明天得到的是另外一個(gè)結(jié)果,使得我們的人才任用決策結(jié)果極不準(zhǔn)確。然而對(duì)于這一點(diǎn),很多企業(yè)并沒有足夠重要,在購(gòu)買外部的人才測(cè)評(píng)工具時(shí),并沒有重視測(cè)評(píng)工具的“信度”指標(biāo);在內(nèi)部的評(píng)價(jià)過程中,并沒有重視“信度”這一指標(biāo),常見的問題就是出現(xiàn)不同評(píng)價(jià)者對(duì)同一被評(píng)價(jià)者會(huì)有極為不同的評(píng)價(jià)。根據(jù)美國(guó)人才測(cè)評(píng)專業(yè)委會(huì)員的建議,一個(gè)好的評(píng)價(jià)工具、技術(shù)或者過程其信度指數(shù)應(yīng)該至少達(dá)到0.70以上,其測(cè)評(píng)結(jié)果才是一致的,可靠的。在實(shí)踐操作過程中,企業(yè)可以以這以指標(biāo)作為準(zhǔn)繩來檢驗(yàn)自己所采用的工具、技術(shù)和評(píng)價(jià)過程,并采用各種方式和手段來提高測(cè)評(píng)的信度,比如購(gòu)買信度較高的測(cè)評(píng)工具,對(duì)評(píng)價(jià)者進(jìn)行相關(guān)的培訓(xùn)等。
二、測(cè)評(píng)的效度
效度是指測(cè)評(píng)工具的準(zhǔn)確性,有效性程度,也就是一種測(cè)評(píng)工具能夠測(cè)量出其所需要測(cè)評(píng)的特征的程度。比如,當(dāng)我們需要評(píng)價(jià)一個(gè)人的計(jì)劃能力時(shí),如果我們采用某個(gè)測(cè)評(píng)工具測(cè)評(píng)的是被評(píng)價(jià)者的計(jì)劃能力,則可以說這個(gè)測(cè)評(píng)工具有較高的效度;而如果我們采用該測(cè)評(píng)工具測(cè)評(píng)的并不是被評(píng)價(jià)者的計(jì)劃能力,而只是被評(píng)價(jià)者關(guān)于計(jì)劃的知識(shí),或者其他的內(nèi)容,則可以認(rèn)為這項(xiàng)工具的效度比較低。采用效度低的測(cè)評(píng)工具最終得到的肯定是荒唐的結(jié)果,就象采用“尺子”來量“體重”(尺子量體重,效度接近0)得到的也是荒唐的結(jié)果一樣。遺憾的是,在現(xiàn)實(shí)的人才測(cè)評(píng)中,人們對(duì)測(cè)評(píng)工具或者手段的效度并沒有引起足夠的重視,在對(duì)人才進(jìn)行評(píng)價(jià)時(shí)所采用的測(cè)評(píng)工具或者手段的效度往往非常低。比如,很多公司在招聘秘書時(shí),開始都希望能找著真正工作出色的秘書,但是到了最后都難以避免會(huì)掉進(jìn) “以貌取人”的陷進(jìn),而采用“以貌取人”來判斷一個(gè)人的“能力高低”其效度是非常低的。一般來說,在人才測(cè)評(píng)中人們經(jīng)常關(guān)注是以下兩種效度:
內(nèi)容效度。測(cè)評(píng)工具所包括的題本能否真正代表所需要測(cè)評(píng)的內(nèi)容。比如,在結(jié)構(gòu)化面試的時(shí)候,為了對(duì)候選人的計(jì)劃能力、組織能力、應(yīng)變能力等進(jìn)行評(píng)價(jià),我們?cè)O(shè)計(jì)了一套結(jié)構(gòu)化面試的題目。如果這套題目能涵括所需要評(píng)價(jià)的能力,包括計(jì)劃能力、組織能力和應(yīng)變能力,則可以所這套題目的內(nèi)容效度比較高;而如果不能涵括所需要評(píng)價(jià)的能力,則其內(nèi)部效度比較低。在實(shí)際的工作中,企業(yè)一定要購(gòu)買、設(shè)計(jì)和使用內(nèi)容效度比較高的測(cè)評(píng)工具。為了確保測(cè)評(píng)工具的內(nèi)容效度,有條件的企業(yè)最好購(gòu)買國(guó)內(nèi)比較權(quán)威機(jī)構(gòu)研制的測(cè)評(píng)工具,或者聘請(qǐng)相關(guān)方面的專家對(duì)所編制測(cè)評(píng)工具的內(nèi)容效度進(jìn)行評(píng)價(jià)。在這一方面,國(guó)內(nèi)很多企業(yè)并沒有引起高度重視,在對(duì)候選人進(jìn)行評(píng)價(jià)時(shí),公司并沒有提供統(tǒng)一、規(guī)范和內(nèi)容效度比較高的測(cè)評(píng)工具,而由招聘人員根據(jù)他們自身的經(jīng)驗(yàn)對(duì)候選人進(jìn)行提問。殊不知而很多招聘人員由于經(jīng)驗(yàn)的不足,或者專業(yè)訓(xùn)練的不夠,提出的問題并沒有真正代表所需要評(píng)價(jià)的內(nèi)容。就象前面我們提到,本來想評(píng)價(jià)候選人的“計(jì)劃能力”,最后變成了評(píng)價(jià)候選人關(guān)于“計(jì)劃的知識(shí)”,使得整個(gè)評(píng)價(jià)“牛頭不對(duì)馬嘴”。在這一方面,企業(yè)還需要注意的一點(diǎn)就是,在評(píng)價(jià)之前,一定要真正分析所需要評(píng)價(jià)的內(nèi)容,也就是說一定要進(jìn)行職位分析(Job Analysis),或者建立勝任特征模型(Competency Model),這樣才能根據(jù)所確定需要評(píng)價(jià)的內(nèi)容,并根據(jù)需要測(cè)評(píng)的內(nèi)容采用內(nèi)容效度高的測(cè)評(píng)工具。而如果在確定需要評(píng)價(jià)的內(nèi)容時(shí)發(fā)生了錯(cuò)誤,比如確定所需要評(píng)價(jià)的內(nèi)容不是真正所需要的內(nèi)容,確定需要評(píng)價(jià)的內(nèi)容過多,或者確定需要評(píng)價(jià)的過少,則不管我們采用什么樣的評(píng)價(jià)工具,最后的內(nèi)容效度都會(huì)比較低。
效標(biāo)關(guān)聯(lián)效度。內(nèi)容效度是指測(cè)評(píng)工具所包括的題本能否真正代表所需要測(cè)評(píng)的內(nèi)容;效標(biāo)關(guān)聯(lián)效度則是指測(cè)評(píng)的結(jié)果與被預(yù)測(cè)的內(nèi)容關(guān)聯(lián)程度,這里我們把需要預(yù)測(cè)的內(nèi)容稱為“效標(biāo)”。比如,如果我們采用某一測(cè)評(píng)工具對(duì)候選人的計(jì)劃能力進(jìn)行評(píng)價(jià),結(jié)果發(fā)現(xiàn)在測(cè)評(píng)中得分比較高的候選人計(jì)劃能力強(qiáng),而得分比較低的候選人計(jì)劃能力差,則我們所使用的測(cè)評(píng)工具的效標(biāo)關(guān)聯(lián)效度比較高;反之,如果在測(cè)評(píng)中得分比較高的計(jì)劃能力并不一定強(qiáng),得分比較低的計(jì)劃能力并不一定差,則我們所使用的測(cè)評(píng)工具的效標(biāo)關(guān)聯(lián)效度比較低。
根據(jù)所使用的效標(biāo)的不同,可以把效標(biāo)關(guān)聯(lián)效度分為兩種:預(yù)測(cè)效度和同時(shí)效度。預(yù)測(cè)效度是指先采用測(cè)評(píng)對(duì)研究對(duì)象進(jìn)行測(cè)評(píng),等過一段時(shí)間之后再對(duì)研究對(duì)象的“效標(biāo)”進(jìn)行測(cè)評(píng),然后計(jì)算兩者之間的關(guān)系。比如,公司在招聘銷售人員的時(shí)候,先采用某一測(cè)評(píng)工具對(duì)所有候選人進(jìn)行了測(cè)評(píng),這樣每名候選人員都有一個(gè)得分(測(cè)驗(yàn)分?jǐn)?shù))。等這些候選人在公司工作了一段時(shí)間之后,搜集這些人員的效標(biāo)數(shù)據(jù)(這里為實(shí)際業(yè)績(jī))。然后,計(jì)算測(cè)驗(yàn)分?jǐn)?shù)和實(shí)際業(yè)績(jī)之間的相關(guān)。如果測(cè)驗(yàn)分?jǐn)?shù)和實(shí)際業(yè)績(jī)之間的相關(guān)很高,則所使用的測(cè)評(píng)工具的預(yù)測(cè)效度很高,公司在今后招聘銷售人員時(shí)可以繼續(xù)使用這一測(cè)評(píng)工具;反之,如果兩者之間的相關(guān)很低,則所使用的測(cè)評(píng)工具的預(yù)測(cè)效度很低,公司在今后招聘銷售人員時(shí)應(yīng)該放棄使用這一測(cè)評(píng)工具。
由于預(yù)測(cè)效度需要的時(shí)間長(zhǎng),所以很多時(shí)候我們都采用同時(shí)效度。比如,公司需要考察某一測(cè)評(píng)工具的預(yù)測(cè)效度(即采用這一工具來招聘新的員工是否合適),可以先采用該工具對(duì)公司內(nèi)部人員進(jìn)行測(cè)評(píng),然后獲取公司內(nèi)部人員的效標(biāo)數(shù)據(jù)(這里一般為實(shí)際業(yè)績(jī)),然后計(jì)算測(cè)評(píng)結(jié)果與實(shí)際業(yè)績(jī)之間的相關(guān)(同時(shí)效度)。同時(shí)效度在獲取上相對(duì)來說更為容易,但是因?yàn)橥瑫r(shí)效度受到會(huì)受到參加測(cè)評(píng)人員的工作經(jīng)驗(yàn)的影響,因而從預(yù)測(cè)準(zhǔn)確性的角度來看要略低于預(yù)測(cè)效度。
國(guó)外的研究表明,在各種測(cè)評(píng)方法中,評(píng)價(jià)中心的效標(biāo)關(guān)聯(lián)效度最高,面試(行為事件訪談)其次,而最低的就是人們所相信而又經(jīng)常使用的面試(非行為性的)。
三、測(cè)評(píng)的標(biāo)準(zhǔn)化:
談到標(biāo)準(zhǔn)化大家自然就會(huì)想到“單項(xiàng)選擇題”,“多項(xiàng)選擇題”,誠(chéng)然“單項(xiàng)選擇題”和“多項(xiàng)選擇題”都是標(biāo)準(zhǔn)化的一種形式,但是并不代表標(biāo)準(zhǔn)化的全部?jī)?nèi)涵。所謂標(biāo)準(zhǔn)化是指測(cè)評(píng)題本的編制、測(cè)評(píng)的實(shí)施、記分和測(cè)評(píng)結(jié)果的解釋必須遵循嚴(yán)格的、統(tǒng)一的科學(xué)程序,保證對(duì)所有被測(cè)評(píng)者來說,測(cè)評(píng)的內(nèi)容、條件、記分過程、解釋系統(tǒng)都相同。
只有采用標(biāo)準(zhǔn)化的測(cè)評(píng)工具和過程,才能對(duì)不同人的測(cè)評(píng)結(jié)果進(jìn)行比較,才能得到比較客觀公正的結(jié)果。然而在實(shí)際工作,我們經(jīng)常采用的是非標(biāo)準(zhǔn)化的測(cè)評(píng)工具和過程,而又拿著測(cè)評(píng)結(jié)果來對(duì)不同的人員進(jìn)行比較。比如,很多招聘工作者在招聘時(shí),碰到這個(gè)人采用一套評(píng)價(jià)流程,碰到那個(gè)人采用另外一套評(píng)價(jià)流程;碰到這個(gè)人問這樣的問題,碰到那個(gè)人問那樣的問題;碰到這個(gè)人時(shí)面試的時(shí)間為20分鐘,碰到另外一個(gè)人時(shí)面試的時(shí)間為1個(gè)半小時(shí)……諸如此類已經(jīng)成為招聘人員司空見慣的操作方式。也正是這種操作方式,使得招聘過程的準(zhǔn)確性大打折扣,使得我們的招聘出現(xiàn)這樣那樣的問題。企業(yè)要提高招聘的有效性,必須引進(jìn)標(biāo)準(zhǔn)化的測(cè)評(píng)工具,采用標(biāo)準(zhǔn)化的測(cè)評(píng)過程,并對(duì)所有招聘工作者的測(cè)評(píng)技術(shù)進(jìn)行培訓(xùn),也只有這樣才能做到真正對(duì)人才進(jìn)行科學(xué)、客觀的評(píng)價(jià)。