Problemer og prosedyrer involvert i jobbvalg

Før du går videre til en undersøkelse av de grunnleggende utvalgsmodellene som er tilgjengelige for psykologen, er det nødvendig å bekymre oss om et kort blikk på den generelle flervalgsmodellen. Denne modellen kalles vanligvis den multiple regresjonsmodellen. I det generelle prediksjonsparadigmet utvikler vi en regresjonslinje som passer til settet av datapunkter som er definert av folks score på en prediktor (x-aksen eller abscissen) og på kriteriet ( y-akse eller ordinat).

Figur 3.1 viser en slik situasjon. Regresjonslinjen i figur 3.1 er en rett linje og er lokalisert slik at summen av de avvikede avstandene fra hvert punkt til linjen (løpende parallelt med y-aksen) er så liten som mulig. Vi bruker en best passende rettlinje siden vi har antatt et lineært forhold mellom x og y.

Den grunnleggende formelen for en rett linje er

y = a + bx

Hvor y = forventet score på kriterium

a = en konstant som angir punktet der regresjonslinjen krysser y-aksen

b = helling av linjen, representert av Δy / x, eller endringen i y observert for en tilsvarende endring i x

x = observert score på prediktor

Dermed vises den grunnleggende regresjonslinjemodellen som vist i figur 3.2.

Merk at i figur 3.2 krysser regresjonslinjen y-aksen til en verdi på 2. Således a = 2. Merk også at for hver 2-enhets økning i x er det en tilsvarende 1-enhetsøkning i y. Således Δy / Δx = 1/2 = 0.5 = b. Regresjonsligningen blir da

y = 2 + 0, 5x

Gitt noen x-verdi, har vi en regresjonslinje som gjør at vi kan forutsi ay-score, som svarer til den. For eksempel, hvis x var 8, da

y = 2 + 0, 5 (8)

= 2 + 4

= 6

For å oppsummere: I det enkle prediksjonsfallet beregner man en best passende rett linje til de observerte punktene, hvor begrepet "best fit" betyr summen av kvadratiske avvik for de observerte verdiene rundt linjen vil være et minimum.

Formlene som er nødvendige for å beregne konstantene a og b som definerer denne bestilte linjen, kalles "minste kvadrater" formler og er som følger:

Formelen for b er et forhold mellom kovariansen mellom prediktoren og kriteriet og den totale variasjonen i prediktoren. Når kriterievarianansen og prediktorvariansen er like, er b = r eller hellingen til regresjonslinjen lik korrelasjonskoeffisienten.

To Prediktorer:

Det er logisk å anta at hvis prediktor X 1 kan bidra til vellykket prediksjon av kriteriepoeng, og hvis prediktor X 2 også kan bidra til vellykket prediksjon av kriteriescore, bør bruk av begge prediktorer sammen tillate bedre samlet prediksjon enn å bruke enten prediktor hver for seg. Imidlertid er graden som de to prediktorer (når kombinert) vil forbedre forutsigbarheten, avhengig av flere faktorer, hvorav viktigste er korrelasjonen mellom de to prediktorer selv.

Tenk for eksempel situasjonen der to prediktorer hver korrelerer vesentlig med et kriterium, men ikke korrelerer med hverandre, som følger:

Det er klart at en stor del av tilleggskriteriumvarianen kan forklares ved hjelp av prediktor 2 sammen med prediktor 1. Det kombinerte forholdet mellom to eller flere prediktorer og et kriterium kalles en multiple korrelasjon og har symbolet R. Som det var tilfellet med r 2, verdien av R "representerer den totale mengden av kriterievariananse som kan forklares ved å bruke flere prediktorer. Når prediktorer 1 og 2 ikke er korrelert med hverandre, kan den kvadratiske multiple korrelasjonskoeffisienten bli vist å være en additiv funksjon av de individuelle kvadratiske korrelasjonskoeffisientene, eller

R 2 c . 12 = r 2 1c + r 2 2c (3.1)

Når når (interkorrelasjonen til prediktorer) er null, er den kvadratiske multiple validiteten summen av de kvadratiske individuelle validitetene.

Når to prediktorer er korrelert med hverandre, blir tingene noe mer komplekse. Tenk på en situasjon (som i det følgende diagrammet) der hver prediktor har betydelig individuell validitet, men hvor r 12 også er ganske stor.

På grunn av interkorrelasjonen mellom disse prediktorene viser diagrammet at mengden overlapping mellom prediktor 2 og kriteriet kan deles i to deler: det området som er unikt for prediktor 2 og det området som er delt med prediktor 1. Dermed er bruken av en annen prediktor i denne situasjonen gjør at vi kan regne med mer kriterievariasjon enn det som kan gjøres ved hjelp av prediktor 1 alene, men alle kriterjonsvarianene spådd av 2 er ikke ny varians. En generell regel kan derfor angis angående flere prediktorer.

Alt annet, jo større korrelasjonen mellom prediktorer, desto mindre vil den generelle prediksjonen bli bedre ved å bruke begge prediktorer sammen. Det ekstreme tilfellet ville selvsagt være situasjonen der prediktorene var perfekt korrelert, og vi ville ikke ha noen ekstra kriterievariasjon som ble forklart ved tillegg av prediktor 2 til vårt utvalgsbatteri.

Når det gjelder to prediktorer som er korrelert med hverandre, kan vi uttrykke R2 som en funksjon av de separate validitetene og størrelsen på interkorrelasjonen mellom prediktorer med formelen 2

R 2 c . 12 = r 2 1c + r 2 2c - 2r 12 r 1c r 2c / 1 - r2 12 (3.2)

Merk at hvis r 12 = 0, så reduserer formel 3.2 til

R 2 c . 12 = r 2 1c + r 2 2c

som er formel 3.1.

En mer eksplisitt illustrasjon av påvirkning av predikorinterkorrelasjon på størrelsen av de multiple korrelasjonskoeffisientene kan fås fra tabell 3.1, hvor eksempler på R og R2-verdier er gitt for par av prediktorer som har validiteter på 0, 30, 0, 50 og 0, 70 under hypotetiske forhold på 0, 00, 0, 30 og 0, 60 interkorrelasjon. Figur 3.3 viser den generelle trenden ved hjelp av dataene gitt i tabell 3.1. Den moralske til psykologen er ganske tydelig - unngå å bruke prediktorer som er tilbøyelige til å være svært knyttet til hverandre.

Prediksjonsligninger:

Forutsigelsesligningen i en to-spådomsituasjon er en forlengelse av enprediktormodellen. Den generelle formen for ligningen er

y = a + b 1 x 1 + b 2 x 2 (3, 3)

Dette er ligningen for et fly i stedet for en rett linje. For leseren kjent med geometri, viser figur 3.4 en tredimensjonal tegning av forholdet mellom variablene x 1, x 2 og y som tilsvarer ligning 3.3. Formler er tilgjengelige som tillater beregning av konstanter a, b, og som vil resultere i det best passende regresjonsplanet. Når disse konstantene er bestemt, kan den resulterende ligningen bli brukt til å gjøre kriterieprestasjoner for nye jobbsøkere, gitt sine score på de separate prediktorer.

For å illustrere, anta at data er tilgjengelige på 100 menn som er ansatt for jobb X i en bestemt måned, som inkluderer score i to tester samt kriteriedata etter en seks måneders periode. Disse dataene kan analyseres for å bestemme verdiene for a, b 1 og bi som best beskrev forholdene mellom variablene.

Anta at følgende ligning var sluttresultatet:

y = 2 + 0, 5x 1 + 0, 9x 2 (3, 4)

Denne ligningen sier at den mest sannsynlige kriteriepoengsummen for enhver ny utleie vil være lik halvtallet hans på prøve 1 pluss ni tiendedeler hans poengsum på test 2 pluss to. Dermed hvis en ny søker søker 20 på prøve 1 og 30 på prøve 2, vil hans forutsagte kriterieprestasjon ved slutten av seks måneder fra ansettelsestidspunktet være

= 2 + 0, 5 (20) + 0, 9 (30)

= 2-t-10 + 27

= 39

Utvidelsen av to-spådomsmodellen til en k-prediktormodell, hvor k er et stort antall potensielle pre-dikter av jobbsuccess, er ikke for vanskelig konseptuelt. Vår modell utvider seg til skjemaet

y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 + ... + b k x k (3, 5)

Beregningsprosedyrene for å løse minst kvadratverdiene av alle konstantene i en slik ligning blir imidlertid ganske komplekse dersom man ikke har datatilbehør tilgjengelig. Leseren blir også advart om å huske at i den foregående diskusjonen har det vært en implisitt antagelse om en lineær verden, dvs. alle forhold mellom variabler er lineære. Det er mulig å modifisere flere regresjonsmodeller for å unngå denne antagelsen, men det ligger utenfor rammen av denne boken.

moderatorer:

Et av de viktigste konseptene i valg og plasseringsteori er konseptet av moderatorvariabelen. Noen ganger referert til som en populasjonsstyringsvariabel, kan en moderatorvariabel bli sett på som en hvilken som helst variabel som, når den varieres systematisk, har en effekt på størrelsen på forholdet mellom to eller flere andre variabler.

Kanskje et hypotetisk eksempel (Figur 3.15) av hvordan en moderator kan fungere vil tjene til å illustrere sin innflytelse på utvelgelsesprosessen. Det øverste spredningsdiagrammet illustrerer en generell gyldighet på 0, 50 mellom prediktoren og et kriterium. Imidlertid er "befolkningen" representert i spredningen en som inkluderer begge kjønn, nemlig at både menn og kvinner er gruppert sammen for å bestemme gyldigheten. Selv en uformell inspeksjon av toppdisplayet indikerer (hvis menn og kvinner er kodet annerledes som det har blitt gjort her) at mønsteret av score observert for menn, er forskjellig fra det som observeres for kvinner.

For å få et tydeligere bilde av nøyaktig hvordan de er forskjellig, viser de to nedre punktene i figur 3.15 forholdet mellom prediktor og kriterium separat for menn og kvinner. Nå er forskjellen slående. For mennene ser vi et høyt positivt forhold - en som gir en gyldighet på 0, 80. For kvinnene ser vi på den annen side at det er nesten ingen sammenheng mellom prediktoren og kriteriet. Gyldigheten for kvinner er 0, 05.

Moderatorvariabelen i eksemplet ovenfor er selvsagt variabelen av kjønn. Forholdet mellom prediktor og kriterium påvirkes drastisk av å variere moderatoren. Spørsmålet "hva er validiteten til min prediktor" blir tydeligvis mer kompleks. Det som i utgangspunktet syntes å være en moderat respektabel gyldighet, har nå blitt til to ganske forskjellige og separate gyldigheter, en veldig høy og en veldig lav.

Et navn på disse sistnevnte validitetene kan være betingede validiteter, det vil si prediktorens gyldighet gitt at befolkningen består av kvinner eller gitt at befolkningen består av menn. En interessant egenskap for moderatorvariabler er at en moderator ikke trenger noen direkte sammenheng med enten prediktor eller kriteriumvariabel (det vil si rm og rm = 0).

Eksempler på moderatorer:

Faktiske eksempler på moderatorer har blitt funnet i en rekke forskningsundersøkelser. Vroom (1960) fant for eksempel ganske markerte moderatoreffekter ved hjelp av grad av motivasjon av ledere og førstegangsveiledere som modereringsvariabelen. Alle menn studerte var ansatte i enten Chicago eller New York-anlegget i et nasjonalt leverandørfirma som spesialiserte seg på levering av små pakker og pakker fra avdelinger og andre butikker til private boliger. Data fra studien som best illustrerer moderatorkonseptet er gitt i Tabell 3.4.

Alle veiledere ble delt inn i tre grupper basert på deres vurderte grad av motivasjon ved å bruke en sammensetning av flere motivasjonsindekser oppnådd i forskningen. Valider for en test av ikke-verbal resonnasjonsevne ble deretter oppnådd for hver av fire forskjellige typer tilsynsverdier av disse mennene.

Dette ble gjort separat på hvert motivasjonsnivå. Som tabell 3.4 viser, var testen tilsynelatende en ganske gyldig forutsetning for hvor høy en mann ville bli vurdert av sin veileder hvis bare menn med høy motivasjon ble vurdert. Hvis vi systematisk varierer motivasjon ved å gå ned til gruppene som kun har moderate eller lave motivasjonsnivåer, ser vi en tilsvarende systematisk endring i forholdet mellom testen og kriteriet. Jo lavere motivasjonen til medarbeideren er, desto mindre er validiteten av prediktoren faktisk gyldighetene også blitt negative for de lave motivasjonsgruppene.

Andre eksempler på moderatorer finnes i studier av Dunnette og Kirchner (1960) og Ghiselli og hans medarbeidere (1956, 1960). Arbeidet til Dunnette og Kirchner har hovedsakelig vært rettet mot å identifisere arbeidsrelaterte moderatorer som grupperer folk inn i jobber som ligner på sitt ansvar for å få maksimal prediksjon innen hver arbeidsgruppe.

Ghisellis metode kan kalles et "variable-free" moderatorsystem. Folk grupperes enkelt på grunnlag av hvor godt deres suksess kan forventes uten direkte referanse til en ekstern variabel. Fredericksen og Gilbert (I960) har også gjort undersøkelser på moderatorer for å avgjøre i hvilken grad moderatorens effekt er trolig konsistent over tid. De oppdaget at en moderator identifisert i en studie fra 1954 (Fredericksen og Melville, 1954) fortsatt opererte i en I960 oppfølging.

Moderne versus tradisjonell utvalgsteori:

Konseptet med moderatorvariabelen illustrerer kanskje modemets trend i utvalgs- og plasseringsvekt. Tradisjonelt har valg og validering vært problemer som ble sett på som best løst ved ganske enkelt å etablere et kriterium som syntes å være pålitelig og en prediktor som best kunne forutsi dette kriteriet.

Hovedvekten var nesten fullstendig ved etablering av høy validitet med liten eller ingen tanke på å utforske de mange andre variablene som, når de varierte, kan legge til eller trekke fra den oppnådde korrelasjonen. Det generelle mottoet som altfor ofte syntes å karakterisere utvalgsmetodikk var slagordet "Hvis det virker, bruk det!"

Uten tvil var denne politikken ansvarlig for helt forskjellige utviklinger innen industriell psykologi. For det første bidro det sannsynligvis til i hvilken grad psykologer ble akseptert i industrien. Ledelsen er generelt orientert mot positive resultater som representert ved forbedret utvalg, og er ikke altfor opptatt av hvordan det oppnås.

Dessverre er denne retningen imidlertid også sannsynligvis ansvarlig for at validitetene i prediksjon ikke har steget vesentlig (om i det hele tatt) de siste 50 årene - en ganske forstyrrende kommentar til innsatsen fra psykologer som er involvert i denne type arbeid.

I en gjennomgang fra 1955 av et stort antall gyldighetsstudier indikerte Ghiselli (1955) at det faktisk er en uvanlig hendelse å oppnå en validitetskoeffisient på 0, 50 eller bedre. Figur 3.16 presenterer frekvensfordeler som Ghiselli presenterer av validitetskoeffisienter av varierende størrelser for ulike typer jobber. Merk at bare i distribusjonen av validiteter for kontorarbeidere som bruker intelligens tester som prediktorer og ferdighetsmål som kriterier er det et stort antall validiteter over 0, 50.

Nåværende interesse for moderatorer er representativ for en bredere og noe mer sofistikert tilnærming til utvalg. Det kan spores om når Toops (1948) appellerte til psykologer om å vurdere muligheten for at ved å stratifisere folk (for eksempel arbeidere) systematisk i henhold til personlige variabler, bør man kunne forbedre prediksjonen. Hans metode for klassifisering, som han refererte til som addend-prosedyren, er forløperen til moderatorer.

Dunnettes utvalgsmodell:

Kanskje dagens visning mot utvalgsmetodikk kan best representeres av utvalgsmodellen foreslått av Dunnette (1963). Denne modellen er vist i diagrammet som er presentert i figur 3.17 og er utformet for å peke ut labyrinten om kompleksitet og sammenhenger som eksisterer i utvalgssituasjonen. Modellen kan betraktes som mer enn et forsøk på å bare peke ut den dynamiske naturen av utvalget - det representerer også et krav for psykologer å utnytte disse dynamikkene og bruke dem til beste for å forbedre forutsigbarheten.

Man kan sikkert forstå synspunktet representert av modellen i form av den nøyaktige beskrivelsen brukt av Dunnette (1963, s. 318):

Legg merke til at den modifiserte prediksjonsmodellen tar hensyn til de komplekse samspill som kan oppstå mellom prediktorer og ulike prediksjonskombinasjoner, forskjellige grupper (eller typer) av individer, ulike oppføringer på jobben og konsekvensene av disse atferdene i forhold til organisasjonens mål . Modellen tillater muligheten for at prediktorer er forskjellig anvendelige for å forutsi atferdene hos ulike undergrupper av enkeltpersoner.

Videre viser det at lignende arbeidsoppføringer kan være forutsigbare ved ganske forskjellige mønstre av samspill mellom grupperinger av prediktorer og individer, eller at samme prestasjonsnivå på prediktorer kan føre til vesentlig forskjellige mønstre av jobbadferd for ulike individer. Endelig gjenkjenner modellen den irriterende virkeligheten at samme eller lignende jobbferdigheter, etter at de har passert gjennom situasjonsfilteret, kan føre til ganske forskjellige organisatoriske konsekvenser.

Den nåværende trenden i utvalg som er representert av moderatørens oppmerksomhet og av Dunnettes utvalgsmodell, bør resultere i fremgang både i økt effektivitet i utvalg og graden av forståelse av dynamikken i nøyaktig prediksjon.

Suppressorvariabler:

Ingen diskusjon om valg ville være komplett uten noen omtale av suppressor-variabler. På en måte er en suppressorvariabel likt en moderatorvariabel ved at den er definert som "en variabel som kan ha effekt på størrelsen av et gitt prediktor-kriterieforhold, selv om det har liten eller ingen sammenheng med selve kriterjonsvariabelen. ”

Dynamikken til en suppressorvariabel i prediksjon kan best forstås ved å gjennomgå igjen begrepet delvis korrelasjon og tilhørende mål, den halvpartielle korrelasjonen. Hvis man hadde to prediktorer og et kriterium som var interkorrelert som vist her, så delvis korrelasjon mellom kriteriet og prediktor x, som er r 1c. 2, ble definert som korrelasjonen mellom x 1 og C etter at effektene av x 2 er blitt delt ut av begge, så

Anta at vi bare vil fjerne effektene av X2 fra kriteriet før du beregner korrelasjonen. En slik korrelasjon kalles en delvis eller delvis korrelasjon. For eksempel kan vi være interessert i sammenhengen mellom intelligens testresultater (vår prediktor x 1 ) og slutt ferdighetsnivå ved slutten av et skrive treningsprogram (kriteriet) x 2 kan representere det opprinnelige ferdighetsnivået for alle ansatte når det gjelder deres skrivehastighet før du tar kurset. Dermed vil vi fjerne effektene av innledende ferdighetsnivå ved endelig ytelse før du beregner gyldigheten av vår etterretningstest.

Vår halvpartielle korrelasjon blir nå:

Mekanismen for en suppressor-variabel er identisk med den som er vist ovenfor, bortsett fra (1) generelt, variabel x 2 har bare en liten (hvis noe) forhold til kriteriet og (2) man er interessert i å fjerne dens effekter fra prediktor x 1 .

Den generelle situasjonen kan derfor skildres som:

Man kan ikke forutsi med full sikkerhet om partielle eller halvpartielle korrelasjoner vil være større eller mindre enn den enkle korrelasjonen som eksisterer mellom variablene, siden størrelsen på både telleren og nevneren påvirkes av partiallingsprosessen. Den eneste gangen dette ikke er slik er at variabelen som deles ut, er bare relatert til en av de to andre variablene, som i tilfelle av suppressoren. I en slik situasjon blir bare nevneren påvirket (variansen fjernes) og den resulterende halvpartielle korrelasjonen er større enn den enkle, ikke-partielle korrelasjonen mellom variabler.

Kryssvalidering:

En funksjon i de fleste multiple prediksjonsvalgssystemer er at i utviklingen har man en tendens til å kapitalisere på sjansevarianten som eksisterer i prøven av ansatte som blir brukt til validering. Dette gjelder spesielt med den multiple regresjonsmodellen, men gjelder også for flere avskjæringsprosedyrer. Fordi flere regresjonsmodeller har minst kvadratiske egenskaper, dvs. vi minimerer med vilje feilene ved å forutsi vår spesielle prøve, er det sannsynlig at hvis vi nå bruker vår ligning til en ny prøve (fra samme populasjon), finner vi ikke vår prediksjon så effektiv som før.

Således er vår beregnede R 2 en overskatt av hva fremtidig gyldighet av vårt prediksjonssystem er egnet til å være, siden bruk av vår ligning med hensyn til prediksjon automatisk innebærer at den skal brukes til nye prøver av arbeidere. Dette forventede fallet i R2 er kjent i statistikk som krympeproblemet og kan best illustreres ved å se Figur 3.18.

På figur 3.18 har vi to prøver av enkeltpersoner. Hver representerer en tilfeldig prøve hentet fra eller tilhørende samme populasjon. Eksempel A kan eksempel A representere alle jobbsøkere for jobb X i utallige måneder, og prøve B kan representere alle jobbsøkere i løpet av likeverdige måneder for et bestemt år.

Det ville være svært uvanlig, selv med svært mange søkere i hver prøve, for de to prøvene å være identiske i forhold til deres spredninger. Siden deres spredningsdiagrammer kan forventes å variere på grunn av prøvetakingsfeil, kan korrelasjonen mellom prediktor og kriterium (validitet) også forventes å variere noe, slik kan regresjonsligningen beregnes på hver prøve.

Anta at vi tok regresjonsligningen beregnet på prøve A og brukte den til å forutsi score fra prøve B. Vi kunne tydeligvis ikke gjøre så god en jobb for å minimere ved hjelp av A-linjen med prøve B som vi kunne bruke B-regresjonslinjen - B-linjen per definisjon minimerer Σd 2 for den prøven. Enhver annen linje vil derfor ha en større feil knyttet til den. Således må R2 reduseres tilsvarende.

Det finnes formler tilgjengelig for å anslå hvor mye krymping man kan forvente når man bruker denne ligningen på en ny prøve. En slik formel er

R2 = 1 - [(1 - R2) n-1 / n-k-1]

Hvor

R 2 = krympet flere korrelasjonskvadrat

R 2 = multiple korrelasjonskvadrat oppnådd fra valideringsprøve

n = antall personer i valideringsprøven

k = antall prediktorer i regresjonsligningen

Det er imidlertid best å krysse-validere ligningen ved å skaffe en andre prøve og prøve den ut for å se hvor godt den forutsier. Hvis det ser ut til å være en veldig stor dråpe, kan det være lurt å revidere ligningen (kanskje ved å kombinere begge prøvene i en gruppe). Stor krymping er oftest funnet når prøvestørrelsene er små og / eller antall prediktorer er store i forhold til prøvestørrelsen.

Mosier (1951) har diskutert en rekke typer kryssvalidering som kan utføres avhengig av utformingen av studien, og om man er opptatt av å generalisere bare til en ny prøve eller hvis bredere generaliseringer samordner dødsprediksjonsligning er ønsket (for eksempel, til forskjellige kjønn, forskjellige kriterier, etc.). Den førstnevnte kalles et tilfelle av validitetsgeneralisering; sistnevnte er et tilfelle av gyldighetsutvidelse. Selvfølgelig vil større krymping forventes i sistnevnte tilfelle, og formel 3.9 på% gjelder for tilfeller av validitetsgeneralisering.