Gyldighet av en test: 5 Faktorer

Denne artikkelen kaster lys over de fem hovedfaktorene som påvirker gyldigheten av en test. Faktorene er: 1. Faktorer i selve testen 2. Fungerende innhold og undervisningsprosedyre 3. Faktorer i testadministrasjon og scoring 4. Faktorer i elevers respons 5. Gruppens natur og kriteriet.

1. Faktorer i testen selv:

Hver test inneholder elementer og en nøye undersøkelse av testelementer vil indikere om testen ser ut til å måle innholdsinnholdet og de mentale funksjonene til læreren ønsker å teste.

Følgende faktorer i selve testen kan forhindre at testelementene fungerer som ønsket og dermed redusere gyldigheten:

(a) Testets lengde:

En test representerer vanligvis et utvalg av mange spørsmål. Hvis testen er for kort til å bli en representant, vil gyldigheten bli påvirket tilsvarende. Homogen forlengelse av en test øker både gyldighet og pålitelighet.

Formelen som bestemmer hvor lenge en test kan økes er:

I hvilken:

n = antall ganger en test skal forlenges

r t = pålitelighet av testen

r tc = korrelasjon av testen med kriteriet

r tx = gyldighet utenfor testen

For eksempel er pålitelighetskoeffisienten til en test 0, 57 og den korrelerer .65 med lærerens vurdering. Hvor mange ganger må det forlenges hvis man søker etter en validitetskoeffisient på .80.

(b) Uklar retning:

Hvis instruksjoner om hvordan du svarer på elementene, om det er lov å gjette og hvordan du tar opp svarene, er ikke klart for eleven, så vil gyldigheten være tilbøyelig til å redusere.

(c) Lesing av ordforråd og setningsstrukturer som er for vanskelige:

Det kompliserte ordforrådet og setningstrukturen som er ment for elever som tar testen, kan mislykkes i å måle aspektene av elevprestasjon; og dermed redusere gyldigheten.

(d) Uegnet vanskelighetsgrad av testelementene:

Når testelementene har et upassende vanskelighetsgrad, vil det påvirke verktøyets gyldighet. For eksempel, i kriterium-refererte tester, vil manglende samsvar med vanskeligheten spesifisert av læringsutfallet senke gyldigheten.

(e) dårlig konstruerte testelementer:

Testelementene som gir utilsiktede ledetråder til svaret vil ha en tendens til å måle elevens oppmerksomhet når det gjelder å oppdage ledetråder, samt aspektene av elevprestasjon som i siste instans påvirker gyldigheten.

(f) Flertydighet:

Tvetydighet i uttalelser i testelementene fører til feilfortolkning, ulik tolkning og forvirring. Noen ganger kan det forvirre de bedre studentene enn de fattigste som resulterer i diskriminering av ting i en negativ retning. Konsekvensen av testen er derfor redusert.

(g) Test elementer som er upassende for resultatene som måles:

Mange ganger skjer det at vi prøver å måle bestemte komplekse typer prestasjoner, forståelse, tenkning, ferdigheter etc. med testformer som bare passer for måling av fakta. Dette påvirker resultatene og fører til en forvrengning av gyldigheten.

(h) Feil arrangement av elementer:

Elementer i testen er vanligvis ordnet i vanskelighetsgrader med de enkleste elementene først. Hvis de vanskelige elementene blir plassert tidlig i testen, kan det føre til at studentene bruker for mye av sin tid på disse og ikke klarer å nå andre gjenstander som de kunne svare på enkelt.

Et slikt upassende arrangement kan også påvirke gyldigheten ved å ha en negativ effekt på elev motivasjon.

(i) Identifiserbart mønster av svar:

Når studentene identifiserer det systematiske mønsteret av riktig svar (f.eks. TTFF eller ABCD, ABCD), kan de gjerne gjette svarene, og dette vil påvirke gyldigheten.

2. Fungerende innhold og læringsprosedyre:

Ved prestasjonstesting kan det fungerende innholdet av testelementer ikke bare bestemmes ved å undersøke form og innhold av testen. Læreren må lære fullt ut hvordan man skal løse et bestemt problem før det inkluderes i testen.

Test av komplekse læringsresultater ser ut til å være gyldig dersom testelementene fungerer som beregnet. Hvis studentene har tidligere erfaring med løsningen av problemet som er inkludert i testen, er slike tester ikke mer et gyldig instrument for å måle de mer komplekse mentale prosessene, og de påvirker dermed gyldigheten.

3. Faktorer i testadministrasjon og scoring:

Testadministrasjonen og scoringprosedyren kan også påvirke tolkets gyldighet fra resultatene. For eksempel, i lærerutførte tester kan faktorer som utilstrekkelig tid til å fullføre testen, urettferdig hjelpe til enkelte studenter, snyte under eksamen, og upålitelig scoring av essay svar kan føre til lavere validitet.

På samme måte i standardiserte tester vil mangel på å følge standard retninger og tidsgrenser, uautorisert hjelp til studenter og feil i scoring, ha en tendens til å senke gyldigheten.

Uansett om det er en lærer gjort test eller standardisert test, kan uønskede fysiske og psykiske forhold under testtiden påvirke gyldigheten.

4. Faktorer i elevers respons:

Det er visse personlige forhold som påvirker elevenes respons på testsituasjonen og ugyldiggjør testtolkningen. De følelsesmessig forstyrrede elevene, mangel på studenters motivasjon og at studentene er redde for testsituasjonen, kan ikke svare normalt, og dette kan i siste instans påvirke gyldigheten.

Respons-settet påvirker også testresultatene. Det er prøven som tar vane som påvirker elevernes poengsum. Hvis en test brukes igjen og igjen, kan gyldigheten reduseres.

5. Gruppens art og kriteriet:

Det har allerede blitt forklart at gyldigheten alltid er spesifikk for en bestemt gruppe. For eksempel kan en aritmetisk test basert på historieproblemer hjelpe oss med å måle resonnementsevne i en langsom gruppe og en kombinasjon av enkel tilbakekalling av informasjon og beregningsferdigheter i en mer avansert gruppe.

Det er visse faktorer som alder, kjønn, evnenivå, utdanningsbakgrunn og kulturell bakgrunn som påvirker testmålene. Derfor bør valideringsgruppenes karakter finne en omtale i testhåndbøkene.

Kriteriet som brukes er et annet viktig hensyn når man vurderer validitetskoeffisienten. For eksempel vil poeng på en vitenskapelig egnethetstest sannsynligvis gi en mer nøyaktig prediksjon av prestasjon i et miljøstudiekurs.

Andre ting som er like, desto større er likheten mellom ytelsen målt ved testen og ytelsen som er representert i kriteriet, jo større er validitetskoeffisienten.