Feil og feil som påvirker ytelsesvurdering

Siden menneskelig dom er altfor ofte underlagt påvirkning av forstyrrelser, fordommer og andre subjektive og utenlandske påvirkninger, er problemet med å oppnå objektive og nøyaktige vurderinger som ikke er farget av disse påvirkningene svært vanskelig. Guilford (1954) har klassifisert ulike typer konstante feil som kan forekomme i vurderingsprosessen og foreslår visse forholdsregler som kan tas. Konstante feil er de som skyldes noen systematisk forspenning fra raterens side og er vanligvis litt enklere å takle enn de raterfeilene som ikke er systematisk eller tilfeldig.

1. Feil ved samhandling:

Hvert rater har en tendens til å bære rundt sitt eget innebygde sett av standarder eller referanseverkst som han bruker til å lage prestasjonsvurderingsdommer. Et av hovedproblemene er å likestille ulike evaluatorer for forskjeller i deres standarder slik at deres karakterer kan sammenlignes.

Noen ratere kan best beskrives som generelt "enkle" eller lette, mens andre kan bli klassifisert som "hard" eller alvorlige i sine vurderinger eller vurderinger. Når en rater er altfor alvorlig, sies han å være en feil av negativ smidighet, mens enkle raters gjør feilen av positiv tilnærming. Følgende diagram illustrerer fordelingen av karakterer man kan få fra to forskjellige raters-en som er altfor lindrende og den andre som er altfor alvorlig.

Det er flere måter som klassifiseringssystemer kan utformes for å unngå samsvarsfeil. Den første metoden er å definere klart kategoriene eller "ankerpunkter" som brukes på skalaen. Hvis vi for eksempel ba oppdragsgivere om å rangere sine underordnede på "totalferdighet", kunne vi bruke en av de to skalaene som er vist nedenfor.

Skala A har ingen anker- eller referansepunkter som rateren kan bruke som en guide; han må etablere seg selv. Risikoen er at ulike ratere vil definere punktene annerledes. Med skala B er en rekke poeng definert for rateren, med sannsynlighet for å redusere problemet. Disse ankerpoengene løser ikke fullstendig problemet, siden en rater er "lav", kan være en annen raters "gjennomsnitt". Den verbale skalaen introduserer imidlertid muligheten for en felles referanseramme.

En forankringsprosedyre som er potensielt mer effektiv enn den som er gitt i Skala B, er kjent som "Key-Man" -metoden. En av de mest brukte metodene for å bekjempe samsvarsfeilen er å benytte tvangsdistribusjonsteknikken. Dette er en prosedyre som krever at rateren legger en viss andel av svarene sine i forskjellige kategorier. En slik fordeling er vist i figur 7.1.

Kreves at alle ratifiserer skal overholde en standardfordeling når det gjelder antall personer som må tilordnes hver kategori, er en effektiv metode for å unngå svakhetsfeil. Det gjør imidlertid ofte at ratifikasjonene blir litt misfornøyde ved å bli tvunget til så streng et svarmønster. Det tar også mye mer tid siden omsorg må tas for å få riktig nummer i hver kategori.

2. Halo-effekten:

Halo feilen er en tendens til å la vår vurdering av en person på ett trekk påvirke vår vurdering av personen på andre spesifikke trekk. Derfor, hvis vi følte at Worker X var en toppnotert ansatt på en måte, kan vi derfor ha en tendens til å rangere ham veldig høyt på alle trekk, selv om han kanskje er ganske middelmådig på noen.

Dette er en veldig vanlig type feil og er også en som er svært vanskelig å korrigere. Symonds (1925) har antydet at det mest sannsynlig vil forekomme med følgende trekk:

1. Egenskaper som ikke er lett observert

2. Ukjente egenskaper

3. Egenskaper som ikke er lett å definere

4. Egenskaper som involverer mellommenneskelige reaksjoner

5. Karaktertrekk

3. Logiske vurdering feil:

Denne feilen er ganske lik den halo feilen. I halofeilen lar rater uvitende sin vurdering av bestemte egenskaper påvirkes av hans vurdering av individet på andre egenskaper. En logisk feil involverer en rytter som har en tendens til å gi en person en høy poengsum på en bestemt egenskap, bare fordi han føler at personen har mye av et annet spesifikt trekk, og han føler at de to egenskapene er logisk relaterte. Når en rater har en tendens til å overvurdere det sanne forholdet mellom trekk, forplikter han sannsynligvis denne vurderingsfeilen.

4. Kontrast og likhetsfeil:

Kontrastfeilen er en ganske interessant type forspenning. Det refererer til en generell tendens hos en rytter til å dømme andre i en mariner motsatt av måten han oppfatter seg på. Hvis han ser seg som veldig ærlig, vil han for eksempel være å vurdere andre litt lavere enn normalt på "ærlighet" dimensjonen.

Det motsatte av en kontrastfeil, som kan kalles en likhetsfeil, er for rytteren å vurdere andre mennesker på samme måte som han oppfatter seg selv. En illustrasjon av dette ville være en rater, føler seg veldig ærlig, som også gir høy ærlighet til alle andre individer. Med andre ord bør ratere trenes for å vurdere andre og ikke seg selv.

5. Feil i sentrale tendenser:

Noen dommere eller talsmenn er ofte svært motvillige til å gjøre ekstreme vurderinger av andre personer. Denne motviljen resulterer i at de ikke har til hensikt å bruke ekstremskala score på ratinginstrumentet. Dette resulterer igjen i en vesentlig forandring av form i fordelingen av score for den rateren, som det fremgår av figur 7.2. Legg merke til at dispersjonen (variabiliteten) av dommene er mye mindre for rytteren som gjør en sentral tendensfeil. Denne typen feil resulterer således i en begrensning av rekkevidde av kriteriet score-en artefakt som kan ha en effekt på påfølgende validitetskoeffisienter. En av de bedre måtene å unngå denne feilen er å bruke tvangsdistribusjonssystemet som tidligere ble diskutert.

6. Nærhetsfeil:

Den siste feilen vi vurderer, kommer vanligvis fra hvordan de ulike elementene er plassert eller bestilt på ratingskjemaet. Noen ganger referert til som en "ordre-effekt", illustrerer denne feilen hvilken innflytelse de omkringliggende elementene har på karakteren man gir en person på et bestemt element.

Hvis det foregående elementet var et trekk som individet ble gitt en meget gunstig vurdering på, kan rater ha en tendens til å la det gunstige svaret "sett" overføre til neste punkt på listen. Resultatet vil være en vurdering på neste punkt litt høyere enn det ellers kunne gis. Det er alltid mulighet for omvendt reaksjon. Hvis de foregående punkter har vært på trekk der arbeideren generelt var vurdert høyt, når rateren blir til et trekk der arbeideren virkelig fortjener bare en "moderat" rangering, kan han gi en ganske ugunstig score bare på grunn av kontrastvirkningen av de foregående punkter.

Den vanligste prosedyren for å minimere nærhetsfeil er å ha flere forskjellige former for karakterskalaen, med elementene i en annen rekkefølge på hver form. Dessverre, når antall elementer blir store, blir systematisk kontroll over elementordre ekstremt kompleks og vanskelig i de fleste praktiske situasjoner. Vanlig praksis for å unngå denne feilen er vanligvis begrenset til å bygge bare to former, med elementene som er tildelt hver form ved hjelp av en tabell med tilfeldige tall.