Metoder som brukes til vurdering av jobbytelse

Den industrielle psykologen har et valg av metoder for å etablere en prosedyre for vurdering av jobbprestasjoner som involverer dommer fra enkeltpersoner. Disse metodene kan grupperes i klasser avhengig av hvilken type sammenligning som kreves av den enkelte som foretar vurderingen. De tre mest brukte er rating systemer, rangering systemer, og parret sammenligninger.

1. Rating Systems:

Mekanikken til et hvilket som helst vurderingskalsystem er ganske enkelt. Dommerens oppgave er å avgjøre hvilken grad individet har, eller beskrives av, en bestemt egenskap. Selv om det kan ta mange forskjellige former, er det en kjennetegn ved at dommeren kan gi to personer samme poengsum, en funksjon som ikke finnes i de to andre metodene.

Numerisk vurderingskalaer:

Dette skjemaet er trolig den mest populære og vanlige typen vurderingskala. Slike skalaer kalles ofte "grafiske skalaer".

Et eksempel er gitt nedenfor:

Dommerens oppgave er å gi hver arbeidstaker en score fra 1 til 9 som best beskriver hans "grad av pålitelighet." Kriteriepoeng for en arbeidstaker er vanligvis gjennomsnittspoengsummen til alle dommere. I situasjonen hvor en rekke forskjellige spørsmål omfatter kriteriet (for eksempel grad av pålitelighet, generelt nivå av arbeidskunnskap, forhold til andre arbeidere, etc.) blir problemet mer komplisert. Ofte er det totale kriteriet som brukes, rett og slett total score på alle spørsmålene.

Men når flere spørsmål brukes til å evaluere arbeidstakere, må man umiddelbart møte kompositt versus flere kriteriumproblemer. En tilnærming blir mer populær i slike situasjoner er å faktor analysere spørsmålene for å fastslå underliggende uavhengige kriteriedimensjoner og deretter tildele "faktorpoeng" på hver av disse dimensjonene som deretter brukes som kriteriene.

Standardskalaer:

En annen type vurderingskala innebærer bruk av et sett med standarder eller eksempler for sammenligningsformål. Disse brukes i stedet for, eller sammen med, de verbale forankringspunkter som er funnet med grafisk skala.

En standardskala utformet for å evaluere pålitelighet kan se slik ut:

Rateren kan da sammenligne mannen han vurderer med menn på jobben som er utpekt som skala referansepunkter. Denne metoden er også noen ganger referert til som en man-til-mann sammenligning skala. Den store vanskeligheten med standardskalaer eksisterer ved å finne passende standarder. Dette krever vanligvis litt forsiktig forhåndskalering av en gruppe av nåværende ansatte. Det er også veldig berørt problemet med å bruke navnene på disse mennene uten forlegenhet. Dermed må man være veldig forsiktig med at standardskalaen ikke får offentliggjøres. Et annet problem er at intervallen mellom mennene på skalaen ofte ikke er like stor.

Fordelen med metoden er ganske tydelig. Så lenge en gruppe dommere kan bli enige om kvalifikasjonen til en liten gruppe arbeidere som er godt kjent for alle dommere, er det gitt en ferdig sammenligningsskala som sikrer at alle dommerne vil ha en felles referent som vurderer resten av mennene.

Kumulert poengskala (sjekkliste):

Mange karakterskalaer krever at dommeren skal kontrollere eller angi hvilket av et antall setninger, adjektiver eller attributter som er beskrivende for personen som er vurdert. Eksempelvis er vurderingsskjemaet vist i figur 7.3 representativt for en adjektiv sjekkliste.

Hver person er tildelt en totalpoeng basert på de bestemte elementene som er merket. I det viste eksemplet kan en person motta en + 1 for hver gunstig adjektiv og a - 1 for alle ugunstige adjektiver. I mer utførlige tjeklister kan de forskjellige elementene tildeles differensialvekter. For eksempel har Uhrbrock (1961) skalket 2000 uttalelser om arbeiders adferd.

Hver erklæring har blitt gitt en gjennomsnittlig skalaverdi av sin oppfattede favørlighet ved å beskrive en arbeidstaker. Uttalelser kan da velges for bruk på en sjekkliste som i sin tur brukes av veiledere til å rangere sine ansatte. Metoden for scoring kan være basert på enten den totale (algebraiske summen) poengsum for de elementene som er sjekket eller kanskje median (middel) skalaverdien av alle elementene som er merket. Noen eksempler på Uhrbrocks uttalelser, sammen med deres skaleringsverdier, er vist i tabell 7.3.

Kritisk hendelses sjekkliste:

Den kritiske hendelsen teknikken er en prosedyre utviklet av Flanagan (1954). Som normalt brukt, kan det sannsynligvis best beskrives som en sjekkliste vurdering prosedyren. Det er imidlertid også tilstrekkelig forskjellig i utviklingen at den fortjener at det skal nevnes særskilt.

Metoden innebærer tre forskjellige trinn:

1. Samle kritiske hendelser

2. Skalering av hendelsene

3. Konstruerer sjekkliste skalaen

Trinn ett er det som gjør denne metoden unik. Begrepet kritisk hendelse refererer til alle de på-jobb-oppførselen til personer som veilederen anser å være "bemerkelsesverdig." Merkelig, kan i sin tur referere til forekomster av enten utrolige "gode" eller "dårlige" on-the- jobbadferd. Hver veileder, med andre ord, blir bedt om å gi så mange forekomster av enestående faktisk jobbadferd som han kan huske. Disse jobbhendelsene blir deretter presentert (trinn to) til en gruppe eksperter som tildeler skalaverdier med hensyn til graden av ønskelighet av denne hendelsen.

I trinn tre er det konstruert en sjekkliste som bare inneholder de utsagnene eller hendelsene som var relevante for å definere "gode" og "dårlige" arbeidere. Disse sjekklistene kan da brukes av en veileder til å rangere sine arbeidere. Ved vurdering av en arbeidstaker legger han rett og slett et merke sammen med hver hendelse at han har observert at arbeideren "begår" eller utstiller. Resultatet for en arbeidstaker er vanligvis tatt som middelverdien eller median skala verdien av alle hendelser sjekket for ham (total score kan også brukes).

Den kritiske hendelses sjekklisten har den store fordelen at den er basert på faktiske arbeidspraksis eller hendelser. En veileder er ikke satt i stand til å være tvunget til å dømme egenskaper eller å rangere sine arbeidere, etc. Han må bare reagere med hensyn til om han har eller ikke har observert en bestemt hendelse fra hver enkelt arbeiders side. Kirchner og Dunnette (1957) har rapportert gunstige resultater i en studie etter noe som følge av prosedyren beskrevet ovenfor.

Før du forlater den kritiske hendelsesmetoden, bør det påpekes at den har mer generellitet og applikasjon enn bare å være en kilde for ytelsesvurderings sjekkliste. Arbeidsbaserte atferdshendelser har blitt brukt svært vellykket i forskning innen lederskap (Fleishman, 1955), organisasjonsverdier (Shartle, Brumback og Rizzo, 1964) og kreativitet (Buel, 1960).

2. Rangering Systemer:

Et karakteristikk for et rating system er at det tillater to eller flere personer å ha samme rating eller skala verdi. Et rangeringssystem av sin natur fraråder dette. Enkel rangering krever at dommeren bestiller individene fra høyeste til laveste.

En bestemt gruppe veiledere kan således rangere ti ansatte som vist nedenfor:

Ranking systemer har den iboende fordelen ved at de er svært enkle å forklare og er vanligvis lett akseptert av de som er tildelt som dommere. Prosedyren "gir mening" til dem. Det har også fordelen av at en rater kan rangere ganske stort antall individer uten store vanskeligheter. En tommelfingerregel gjenkjenner at tilfredsstillende og pålitelige resultater med et rangeringssystem kan oppnås med Ns så stor som 50 til 60.

Guilford (1954) har påpekt en annen fordel med rangering. Siden dommeren er tvunget til å gjøre sammenligninger mellom mann og mann og ikke absolutt sammenligninger, må han sammenligne enkeltpersoner når de bestemmer seg for å plassere den ene over den andre.

Metoden tvinger dommeren til å diskriminere mellom individene som blir rangert uansett om han føler at de er helt forskjellige! Anta at de ti mennene som er gitt i vårt tidligere eksempel, var ganske like i deres evne. Dommerne vil da antagelig ha en svært vanskelig tid å prøve å rangere mennene, og en dommeres rangering ville være svært villedende om de relative fordelene til de ti mennene i spørsmålet.

En måte å sjekke på denne muligheten er selvfølgelig å bruke flere dommere. Hvis dommerne er enige om deres rangeringer, kan muligheten for at det ikke er "ekte" eller sanne forskjeller blant mennene, bli diskontert. I det tidligere eksemplet synes dommerne å være rimelig konsistente når det gjelder å bedømme hvem som er god og hvem som er en dårlig arbeidstaker. Dermed må deres valg legges til grunn for noen virkelige snarere enn tilfeldige grunner for å bestille de aktuelle mennene. Dette er en utmerket grunn til å bruke flere dommere når det er mulig og for å beregne avtale blant dommere med noen indekser, for eksempel en korrelasjonskoeffisient.

3. Parede Sammenligninger:

Selv om rangordningssystemene implisitt krever at man sammenlignes med andre på listen under rangeringsprosessen, er dette ikke systematisk bygget inn i metoden. En prosedyre som systematisk tvinger rateren til å sammenligne hver mann med hverandre er kjent som metoden for parret sammenligning. For eksempel vurdere situasjonen der fire ansatte blir evaluert av en veileder. Hvis vi danner alle mulige par av menn, skal vi ha N (N- l) / 2 slike par dannet; i vårt tilfelle 4 (3/2) = 6 par.

Den vanlige prosedyren er da å presentere hver av parene (en om gangen) til veilederen. Veilederen indikerer (vanligvis med et merke) hvilken av de to mennene han føler seg best. En parret sammenligningsmatrise kan da konstrueres som vist nedenfor, der følgende regel brukes: Når en veileder foretrekker en kolonne i en rad, plasserer du et merke i den cellen.

Anta at veileder X gjør følgende vurderinger om seks par arbeidere:

Hvis vi plasserer talsmerker i matrisen vår ved hjelp av regelen ovenfor, har vi følgende:

Dermed vurderer denne veilederen B som den beste arbeideren, etterfulgt av C, A og D. I praksis er dommer av en rekke dommere tatt med i matrisen for å gi et mer stabilt estimat av verdien av verdien av Mennene blir vurdert. I tillegg er det vanlig å konvertere proporsjonene i hver celle til standardpoeng (Z score) og deretter finne en gjennomsnittlig Z-poengsum for hver kolonne.

Denne gjennomsnittlige Z-poengsummen er da skaleringsverdien for personen som er representert ved den kolonnen i matrisen. Fordelen ved denne sistnevnte prosedyre ii at disse skaleringsverdiene kan tas som ikke bare rangordre av arbeiders evne, men også som en indikasjon på graden til hvilke to arbeidere er forskjellige i evnen.

En enkel illustrasjon basert på svarene fra ti hypotetiske veiledere til de fire mennene som er vurdert ovenfor, kan være nyttig. La oss først vurdere følgende tallymatrise

La oss nå konvertere tallymatrisen til en proporsjonsmatrise, hvor vi definerer en andel som ⁿ / _N, hvor n er det samme som antall tellekarakterer i en celle og N er antall dommere eller antall mulige talemerker. Det er vanlig å angi proporsjoner på 0, 50 i alle diagonale celler, selv om vi faktisk ikke noen gang presenterer en person som er parret med seg selv til dommerne.

Det neste trinnet er å konvertere proporsjoner til Z-poeng. (En tabell for å gjøre dette finnes i en hvilken som helst elementær bok om statistikk.)

Hvis vi legger til en konstant på 0, 78 til alle skalaverdier for å fjerne negative tegn, kan individene da bli representert langs et fortjeneste av fortjeneste

Legg merke til at avstanden mellom C og A er betydelig større enn avstanden mellom D og A eller B og C. Hvis antagelsene til denne metoden er oppfylt, kan disse relative avstandene antas å være indikativ for de relative forskjellene i fortjeneste blant enkeltpersoner blir vurdert - en tiltalende egenskap ved denne ytelsesvurderingsmetoden. For en mer detaljert dekning av sammenkoblet sammenligning, se Edwards (1957) eller Guilford (1954).

En av ulempene med metoden for sammenkoblede sammenligninger er at den ikke er spesielt nyttig når antall individer som skal bli vurdert blir store. Tidligere ble det påpekt at en veileder kunne sannsynligvis rangere rekkefølge 50 eller 60 arbeidere. Hvis vi prøvde å bruke parringsprosedyren, ville vi ha

50 (49) 72 = 1225 par

Selv om en veileder kunne jobbe med en hastighet på seks par hvert minutt, ville det kreve mer enn tre timer å oppnå karakteren. Jo større antall personer som skal vurderes, desto mer astronomiske blir tidsbehovet.