8 Viktige typer sannsynlighetsprøving

Denne artikkelen kaster lys over de åtte viktige typene sannsynlighetsprøvetaking som brukes til å utføre sosial forskning. Typene er: 1. Enkelt tilfeldig prøvetaking 2. Systematisk prøvetaking 3. Stratifisert tilfeldig prøvetaking 4. Proportional Stratified Sampling 5. Disproportionell Stratified Sampling 6. Optimal Allokeringsprøve 7. Klustersampling 8. Flerfasetaking.

Type # 1. Enkel tilfeldig prøvetaking:

Enkel tilfeldig prøvetaking er på en måte grunnleggende tema for alle vitenskapelige prøvetaking. Det er den primære sannsynligheten prøvetaking design. Faktisk er alle andre metoder for vitenskapelig prøvetaking variasjoner i den enkle tilfeldige prøvetaking. En forståelse av noe av det raffinerte eller komplekse utvalg av prøvetakingsprosedyre forutsetter forståelse for enkel tilfeldig prøvetaking.

En enkel tilfeldig prøve velges ved en prosess som ikke bare gir hvert element i befolkningen en like sjanse for å bli inkludert i prøven, men gjør også valget av alle mulige kombinasjoner av tilfeller i den ønskede prøvestørrelse, like sannsynlig. Anta for eksempel at man har en befolkning på seks barn, nemlig A, B, C, D, E og F.

Det vil bli følgende mulige kombinasjoner av tilfeller, som hver har to elementer fra denne populasjonen, nemlig AB, AC, AD, AE, AF, BC, BD, BE, BF, CD, CE, EF, DE, DF og EF, dvs. i alle 15 kombinasjoner.

Hvis vi skriver hver kombinasjon på like store kort, legg kortene i en kurv, bland dem grundig og la en blindfoldet person velge en, vil hver av kortene få samme sjanse til å bli valgt / inkludert i prøven.

De to sakene (paret) skrevet på kortet hentet av den blindfoldede personen, vil således utgjøre den ønskede enkle tilfeldige prøven. Hvis man ønsker å velge enkle tilfeldige prøver av tre tilfeller fra seks personer ovenfor, vil de mulige prøvene, hver av de tre tilfellene, være ABC, ABD, ABE, ABF, ACD, ACE, ACF, ADE, ADF, BCD, BCE, BCF, BDE, BDF, BEF, CDE, CDF, CEF og DEF, det vil si 20 kombinasjoner i det hele tatt.

Hver av disse kombinasjonene vil ha en like sjanse for valg i prøven. Ved hjelp av samme metode kan man velge en enkel tilfeldig prøve av fire tilfeller fra denne populasjonen.

I prinsippet kan man bruke denne metoden for å velge tilfeldige prøver av hvilken som helst størrelse fra en befolkning. Men i praksis vil det bli en veldig tungvint og i visse tilfeller en umulig oppgave å liste ut alle mulige kombinasjoner av ønsket antall tilfeller. Det samme resultatet kan oppnås ved å velge individuelle elementer, en etter en, ved hjelp av den ovennevnte metoden (lotteri) eller ved å bruke en bok med tilfeldige tall.

Boken med tabeller som inneholder liste over tilfeldige tall, er oppkalt etter Tippet som først var å oversette begrepet tilfeldighet til en bok med tilfeldige tall.

Denne boken er utarbeidet av en svært komplisert prosedyre på en slik måte at tallene ikke viser noen bevis på systematisk rekkefølge, det vil si at ingen kan anslå tallet som følger, på grunnlag av foregående nummer og omvendt. La oss diskutere de to metodene for å tegne en enkel tilfeldig prøve.

Lotteri Metode:

Denne metoden innebærer følgende trinn:

(a) Hvert medlem eller element i "befolkningen" er tildelt et unikt nummer. Det vil si at ingen to medlemmer har samme nummer,

(b) Hvert nummer er notert på et separat kort eller en brikke. Hver brikke eller kort skal være lik alle de andre med hensyn til vekt, størrelse og form, etc.,

(c) Kortene eller sjetongene plasseres i en bolle og blandes grundig,

(d) En blindfoldet person blir bedt om å plukke opp en brikke eller et kort fra bollen.

Under disse omstendighetene kan sannsynligheten for å tegne et kort forventes å være det samme som sannsynligheten for å tegne et annet kort. Siden hvert kort representerer et medlem av befolkningen, vil sannsynligheten for å velge hver være nøyaktig det samme.

Hvis etter at du har valgt et kort (chip), ble det erstattet i bollen og innholdet igjen grundig blandet, ville hver brikke ha en like sannsynlighet for å bli valgt på den andre, fjerde eller nste tegningen. En slik prosedyre vil til slutt gi en enkel tilfeldig prøve.

Velge prøve med hjelp av tilfeldige tall :

Vi har allerede sagt hva tilfeldige tall er. Disse tallene bidrar til å unngå eventuelle forstyrrelser (ujevne sjanser) til elementer som består av en befolkning, å være med i prøven ved å velge prøven.

Disse tilfeldige tallene er så forberedt at de oppfyller det matematiske kriteriet for fullstendig tilfeldighet. En hvilken som helst standardbok om statistikk inneholder noen få sider med tilfeldige tall. Disse tallene er vanligvis oppført i kolonner på påfølgende sider.

Følgende er en del av et sett av tilfeldige tall:

Bruken av tabellene med tilfeldige tall innebærer følgende trinn:

(a) Hvert medlem av befolkningen er tildelt et unikt nummer. For eksempel kan et medlem ha nummer 77 og en annen 83, etc.

(b) Tabellen med tilfeldige tall er oppgitt i et tilfeldig punkt (med et blindmerke på en hvilken som helst side i tabellens tabell), og tilfellene hvis tallene kommer opp når man beveger seg fra dette punktet ned i kolonnen, er inkludert i prøven inntil Det ønskede antall tilfeller er oppnådd.

Anta at vår befolkning består av fem hundre elementer, og vi ønsker å tegne femti saker som en prøve. Anta at vi bruker de tre siste sifrene i hvert antall fem sifre (siden universets størrelse er 500, dvs. tre-digital).

Vi går nedover kolonnen som starter med 42827; men siden vi har bestemt oss for å bruke bare tre siffer (si de siste tre), starter vi med 827 (ignorerer de to første sifrene). Vi merker nå hvert tall mindre enn 501 (siden befolkningen er på 500).

Prøven vil bli tatt for å bestå av elementene i befolkningen som bærer tallene som svarer til de som er valgt. Vi stopper etter at vi har valgt 50 (størrelsen bestemt av oss). På grunnlag av ovenstående del av tabellen skal vi velge 12 tall tilsvarende de som er valgt. Vi skal velge 12 saker som svarer til tallene 237, 225, 280, 184, 203, 190, 213, 027, 336, 281, 288, 251.

Kjennetegn ved enkel tilfeldig prøve:

Vi skal begynne med å vurdere en svært viktig egenskap av de enkle tilfeldige prøvene; Dette vesen, jo større størrelse av prøven, jo mer sannsynlig er det at dets gjennomsnittlige (gjennomsnittsverdi) vil være nær populasjonsmiddelet, dvs. den sanne verdien. La oss illustrere denne egenskapen ved å anta at en befolkning bestående av seks medlemmer (barn).

La alderen av disse barna være henholdsvis: A = 2 år, B = 3 år, C = 4 år, D = 6 år, E = 9 år og F = 12 år. La oss tegne tilfeldige prøver av en, to, tre fire og fem medlemmer hver fra denne befolkningen og se hvordan i hvert tilfelle opptrer middelmidlene (gjennomsnitt) med henvisning til den sanne "befolkning" -metoden (dvs. 2 + 3 + 4 + 6 + 9 + 12 = 36/6 = 6). Tabellen nedenfor illustrerer oppførselen til prøveinnretningen som assosiert med størrelsen på prøven.

Tabell som viser de mulige prøvene av ett, to, tre, fire og fem elementer (barn, fra befolkningen på seks barn i henholdsvis 2, 3, 4, 6, 9 og 12 år):

I det oppgitte tabellen vises alle mulige tilfeldige prøver av forskjellige størrelser (dvs. 1, 2, 3, 4 og 5) og deres tilsvarende midler. Den sanne (befolkning) gjennomsnitt er 6 år. Dette kan selvsagt beregnes ved å legge opp gjennomsnittverdiene av de totale kombinasjonene av elementene i befolkningen for en gitt prøvestørrelse.

I tabellen ser vi for eksempel at for utvalgsstørrelsen på tre elementer er det 20 mulige kombinasjoner av elementer, hver kombinasjon har like stor sjanse for å bli valgt som en prøve i henhold til sannsynlighetsprinsippet.

Ved å legge opp gjennomsnittverdiene for disse mulige kombinasjonene som vises i tabellen, får vi totalpoengsummen på 120. Gjennomsnittet vil være 120 ÷ 20 = 6, hvilket også er selvsagt populasjonsmidlet. Dette holder også bra for andre kolonner.

La oss nå undersøke bordet nøye. Vi vil oppdage at for prøver av ett element hver (kolonne A) er det bare en gjennomsnittlig verdi som ikke avviger mer enn 1 enhet fra det sanne populasjonsmiddelet på 6 år. Det vil si at alle andre, nemlig 2, 3, 4, 9 og 12, avviker med mer enn en enhet fra populasjonsmiddelet, dvs. 6. Når vi øker prøveens størrelse, f.eks. I kolonne B, hvor prøvestørrelsen er 2, vi finner en større andel av midler (gjennomsnitt) som ikke avviger fra populasjonsmiddelet med mer enn 1 enhet.

Tabellen over viser at for to eksemplarer er det 15 mulige kombinasjoner og dermed 15 mulige midler. Av disse 15 betyr det at det er 5 midler som ikke avviger fra populasjonen, med mer enn 1 enhet.

Det vil si at det er 33% av prøveinnretningene som ligger nær populasjonsmiddelet innen +1 og -1 enheter. I kolonne C i tabellen ser vi at det er 20 mulige kombinasjoner av elementer for prøven på tre elementer, hver.

Fra ut av de 20 mulige prøvemidlene finner vi at 10, dvs. 50% avviger ikke fra populasjonsmiddelet med mer enn 1 enhet. For utvalgsstørrelsen på fire elementer er det 67% av midler som ligger innenfor området +1 og -1 enhet fra det sanne (populasjons) gjennomsnittet.

Til slutt, for utvalgsstørrelsen på fem elementer, er det mye mer, det vil si 83% av slike midler eller estimater. Leksjonen som strekker seg ut av våre observasjoner er ganske tydelig, nemlig, jo større prøve, jo mer sannsynlig er det at dets gjennomsnitt vil være nær populasjonsmiddelet.

Dette er det samme som å si at spredningen av estimater (midler) reduseres etter hvert som prøvestørrelsen øker. Vi kan tydelig se dette i tabellen over. For utvalgsstørrelsen på en (kolonne A) er måleområdet det største, dvs. mellom 2 og 12 = 10. For utvalgets størrelse på to er intervallet mellom 2, 5 og 10, 5 = 8.

For utvalgsstørrelsen på tre, fire og fem er variabiliteten av middelene henholdsvis 3 til 9 = 6, 3, 8 til 7, 8 = 4 og 4, 8 til 6, 8 = 2. Det vil også sees fra bordet at jo mer en prøve betyr forskjellig fra populasjon, betyr jo sjeldnere det er sannsynlig at det oppstår.

Vi kan representere dette fenomenet knyttet til enkel tilfeldig prøvetaking tydelig ved hjelp av en serie kurver som viser forholdet mellom variabilitet av estimater og størrelsen på prøven. La oss betrakte en stor befolkning av innbyggere. Man kan forestille seg at deres aldre vil variere mellom under 1 år (i det minste) og over 80 år (maksimalt).

Den normale og fornuftige forventningen ville være at det er mindre tilfeller når man nærmer seg ytterdommene, og at antall saker fortsetter å øke gradvis og symmetrisk når vi beveger oss bort fra disse ytterpunktene.

Gjennomsnittsalderen til befolkningen er, la oss si, 40 år. En slik fordeling av beboere kan representeres av en kurve kjent som den normale eller klokkeformede kurven (A i diagrammet som følger). La oss nå anta at vi fra denne populasjonen tar forskjellige tilfeldige prøver av forskjellige størrelser, for eksempel 10 100 og 10 000. For noen av prøvestørrelsene får vi et veldig stort antall prøver fra befolkningen.

Hver av disse prøvene vil gi oss et bestemt estimat av populasjonsmiddelet. Noen av disse midlene vil være overestimater og noen underestimater av populasjonskarakteristikken (middel- eller gjennomsnittsalder). Noen midler vil være svært nær det, ganske mange ganske langt.

Hvis vi plotter slike prøveinnretninger for en bestemt prøvestørrelse og går med i disse punktene, skal vi i hvert tilfelle få en normal kurve. Ulike normale kurver vil således representere verdiene av prøveinnretninger for prøver av forskjellige størrelser.

Ovennevnte diagram tilnærmer et bilde av hvordan prøvemidlene ville oppføre seg i forhold til størrelsen på prøven. Kurven A representerer plasseringene av enkeltpersoners alder. Den estimerte måleprøven på 10 individer, hver fra kurven B som viser en ganske bred spredning fra sann befolkning, betyr 40 år).

Midlene til prøver på 100 individer hver danner en normal kurve C som viser mye mindre avvik fra populasjonsmiddelet. Endelig betyr middelene til prøvene på 10.000 fra en kurve som nesten nærmer seg den vertikale linjen som svarer til populasjonsmiddelet. Avviket fra verdiene som representerer kurve D fra populasjonsmiddelet vil være ubetydelig, som det fremgår av diagrammet.

Det kan også skelnes veldig enkelt fra ovenstående figur, at for prøver av en gitt størrelse er det mest sannsynlige prøvemiddelet populasjonsmiddelet. Den neste mest sannsynlige er middelverdiene nær populasjonsmiddelet.

Dermed kan vi konkludere med at jo mer en prøve mener avviker fra befolkningen, jo mindre er det sannsynlig at det oppstår. Og til slutt ser vi også hva vi allerede har sagt om oppførselen til prøvene, jo større er prøven, desto mer sannsynlig er det at dets gjennomsnitt vil være nær populasjonsmiddelet.

Det er denne typen oppførsel på den delen av de enkle tilfeldige (sannsynlighets) prøvene med hensyn til middelverdien så vel som proporsjoner og andre typer statistikk, som gjør det mulig for oss å estimere ikke bare populasjonskarakteristikken (f.eks. gjennomsnittet), men også sannsynligheten for at prøven vil avvike fra den sanne befolkningsverdien med et gitt beløp.

En typisk egenskap ved den enkle tilfeldige prøvetakingen er at når populasjonen er stor sammenlignet med prøvestørrelsen (f.eks. Mer enn si ti ganger så stor), påvirkes variablene av prøvetakingsfordelinger mer av det absolutte antall tilfeller i prøve enn av andelen av befolkningen som prøven inkluderer.

Med andre ord, størrelsen på feilene som sannsynligvis vil oppstå som følge av prøvetaking, avhenger mer av prøvenes absolutte størrelse enn den proporsjonen den bærer med befolkningen, det vil si på hvor stor eller hvor liten en del det er av befolkning.

Jo større størrelsen på tilfeldig prøven er, desto større er sannsynligheten for at den vil gi et rimelig godt estimat av populasjonskarakteristikken uavhengig av andel i forhold til befolkningen.

Således ville estimeringen av en populær stemme ved en nasjonal meningsmåling, innenfor rammen av en tolerabel feilmargin, ikke kreve en vesentlig større prøve enn den som ville være nødvendig for en estimering av befolkningsstemme i en bestemt provins hvor avstemningsresultatet er i tvil.

For å utdype punktet, vil et utvalg på 500 (100% prøve) gi perfekt nøyaktighet dersom et fellesskap hadde bare 500 innbyggere. En prøve på 500 vil gi litt større nøyaktighet for et byområde på 1000 innbyggere enn for en by på 10 000 innbyggere. Men utover det punktet hvor prøven er en stor del av "universet", er det ingen merkbar forskjell i nøyaktighet med økningen i størrelsen på "universet".

For et gitt nøyaktighetsnivå vil identiske utvalgsstørrelser gi samme nivå av nøyaktighet for lokalsamfunn med forskjellig befolkning, f.eks. Fra 10.000 til 10 millioner. Forholdet mellom prøvestørrelsen og befolkningen i disse fellesskapene betyr ingenting, selv om dette synes å være viktig hvis vi fortsetter med intuisjon.

Type # 2. Systematisk prøvetaking:

Denne typen prøvetaking er for alle praktiske formål, en tilnærming av enkel tilfeldig prøvetaking. Det krever at befolkningen kan identifiseres unikt ved sin bestilling. For eksempel kan innbyggerne i et fellesskap bli oppført og deres navn omorganisert alfabetisk. Hvert av disse navnene kan gis et unikt nummer. En slik indeks er kjent som "rammen" av den aktuelle befolkningen.

Anta at denne rammen består av 1000 medlemmer hver med et unikt nummer, dvs. fra 1 til 1000. La oss si, vi vil velge et utvalg på 100. Vi kan starte med å velge et tall mellom 1 til 10 (begge inkludert). Anta at vi lager et tilfeldig utvalg ved å skrive inn listen og få 7.

Vi fortsetter deretter til å velge medlemmer; fra og med 7, med et regelmessig intervall på 10. Den valgte for å velge medlemmer: Begynnende fra med regelmessig intervall på 10. Det valgte utvalg vil således bestå av elementer som bærer nr. 7, 17, 27, 37, 47, ... 977, 987, 997. Disse elementene sammen vil utgjøre en systematisk prøve.

Det skal huskes at en systematisk prøve kan regnes som en sannsynlighetsprøve bare hvis det første tilfellet (f.eks. 7) er valgt tilfeldig, og deretter ble det tiende tilfelle valgt fra rammen deretter.

Hvis det første tilfellet ikke er valgt tilfeldig, vil den resulterende prøven ikke være en sannsynlighetsprøve, da de fleste tilfeller som ikke er i en avstand på ti fra det opprinnelige valgte nummeret, vil ha en null (0 ) Sannsynlighet for å bli inkludert i prøven.

Det skal bemerkes at i systematisk prøvetaking når det første tilfellet trekkes tilfeldig, er det på forhånd ingen begrensning på sjansene for et gitt tilfelle som skal inkluderes i prøven. Men når det første tilfellet er valgt, blir sjansene for påfølgende saker avgjørende påvirket eller endret. I eksemplet ovenfor har tilfellene andre enn 17, 27, 37, 47 ... osv. Ikke mulighet for å bli med i prøven.

Dette betyr at systematisk prøvetakingsplan ikke har råd til alle mulige kombinasjoner av tilfeller, samme sjanse for å bli med i prøven.

Resultatene kan således være ganske villedende dersom tilfellene i listen er ordnet i en eller annen syklisk rekkefølge, eller hvis befolkningen ikke blandes grundig med hensyn til karakteristikkene under studien (si, inntekt eller studieperiode), det vil si på en måte at hver av de ti medlemmene hadde like stor sjanse til å bli valgt.

Type # 3. Stratified Random Sampling:

I stratifisert tilfeldig prøvetaking blir befolkningen først delt inn i en rekke lag. Slike lag kan være basert på et enkelt kriterium, f.eks. Utdanningsnivå, gi et antall lag tilsvarende de ulike utdanningsnivåene) eller ved kombinasjon av to eller flere kriterier (f.eks. Alder og kjønn), som gir strata som menn under 30 år og menn over 30 år, kvinner under 30 år og kvinner over 30 år.

I stratifisert tilfeldig prøvetaking tas en enkel tilfeldig prøve fra hver av lagene, og slike delprøver blir samlet sammen for å danne den totale prøven.

Generelt lagrer stratifisering av universet med det formål å prøve å samplere til effektiviteten av prøvetaking hvis den etablerer klasser, det vil si om den kan dele befolkningen i klasser av medlemmer eller elementer som er internt forholdsvis homogene og relativt til heterogene, med hensyn til egenskapene som studeres. La oss anta at alder og kjønn er to potensielle grunnlag for lagdeling.

Nå skal vi oppdage at stratifisering på grunnlag av kjønn (mann / kvinne) gir to lag som avviger vesentlig fra hverandre med hensyn til poeng på andre relevante karakteristikker under studiet mens på den annen side, alder som grunnlag for lagdeling ikke gi lag som er vesentlig forskjellige fra hverandre når det gjelder resultatene på de andre signifikante egenskapene, vil det være tilrådelig å stratifisere befolkningen på grunnlag av kjønn i stedet for alder.

Kriteriet om sex vil med andre ord være et mer effektivt grunnlag for stratifisering i dette tilfellet. Det er ganske mulig at prosessen med å bryte befolkningen ned i lag som er internt homogene og relativt heterogene med hensyn til visse relevante egenskaper, er uforholdsmessig kostbar.

I en slik situasjon kan forskeren velge å velge en stor enkel tilfeldig prøve og kompensere for den høye prisen ved å øke (gjennom en stor størrelse enkel tilfeldig prøve) den totale størrelsen på prøven og unngå farer som følge av lagdeling.

Det skal klart forstås at stratifisering har knapt noe å gjøre med å gjøre prøven til en kopi av befolkningen.

Faktisk er problemene som er involvert i avgjørelsen om stratifisering skal utføres, hovedsakelig knyttet til den forventede homogeniteten til de definerte lagene med hensyn til de karakteristika som er studert, og de komparative kostnadene ved forskjellige metoder for å oppnå presisjon. Stratifisert tilfeldig prøvetaking som den enkle tilfeldige prøvetaking innebærer representative prøvetakingsplaner.

Vi snakker nå for å diskutere de store skjemaene eller lagdelt prøvetaking. Antallet tilfeller valgt i hvert lag kan være proporsjonalt med stratumets styrke eller uforholdsmessig til dette.

Antallet tilfeller kan være det samme fra stratum til stratum eller variere fra ett lag til et annet, avhengig av prøvetakingsplanen. Vi skal nå vurdere disse to formene, kort sagt, forholdsmessige og uforholdsmessige stratifiserte prøver.

Type nr. 4. Proportional Stratified Sampling :

I forholdsmessig prøvetaking trekkes saken fra hvert lag i samme forhold som de forekommer i universet. Anta at vi vet at 60% av "befolkningen" er mann og 40% av den er kvinne. Proportional stratifisert prøvetaking med referanse til denne "befolkningen" vil innebære å tegne en prøve på en slik måte at den samme avdelingen blant kjønnene blir reflektert, dvs. 60:40 i prøven.

Hvis den systematiske prøvetakingsprosedyren er ansatt i en undersøkelse, legges det grunnlag for hvilken listen er laget, av om den resulterende prøven er en proporsjonal stratifisert prøve. For eksempel, hvis hvert 7. navn er valgt i en vanlig rekkefølge fra en liste over alfabetisk ordnede navn, skal den resulterende prøven inneholde omtrent 1/7 av navnene som begynner med hvert bokstav i alfabetet.

Den resulterende prøven i dette tilfellet ville være en proporsjonal stratifisert alfabetisk prøve. Selvfølgelig, hvis det alfabetiske arrangementet er helt uforholdsmessig og irrelevant for problemet som studeres, kan prøven betraktes som en tilfeldig prøve med visse begrensninger som er typiske for de systematiske prøver som er diskutert ovenfor.

Det kan oppstå ulike grunner for prøvetaking av de ulike lagene i ulik eller ulik proporsjoner. Noen ganger er det nødvendig å øke andelen som er samplet fra lag som har et lite antall tilfeller for å få en garanti for at disse lagene kommer til å bli samplet i det hele tatt.

For eksempel, hvis man planla en studie av detaljhandel med klær i en bestemt by på et gitt tidspunkt, kan en enkel tilfeldig prøve av butikkbutikker ikke gi oss et nøyaktig estimat av totalvolumet av salg, siden en liten Antall bedrifter med en meget stor andel av det totale salget kan skje for å bli ekskludert fra prøven.

I dette tilfellet ville man være klok i å lagre befolkningen av klutbutikker når det gjelder noen få klutbutikker som har et meget stort volum av salg, vil utgjøre det øverste lag. Forskeren ville gjøre det bra å inkludere dem alle i sin prøve.

Det vil si at han kan gjøre det bra til tider å ta en 100% prøve fra dette stratumet og en mye mindre prosentandel av tilfeller fra de andre lagene som representerer et stort antall butikker (med lavt eller moderat volum av omslag). En slik uforholdsmessig prøvetaking alene vil mest sannsynlig gi pålitelige estimater for befolkningen.

En annen grunn til å ta en større andel tilfeller fra ett lag snarere enn fra andre er at forskeren kanskje vil dele opp saker i hvert lag for videre analyse.

Underlaget som således er avledet, kan ikke alle inneholde nok antall tilfeller som skal prøves fra og i samme forhold som de andre delstratene, og vil derfor ikke ha nok saker til å tjene som et tilstrekkelig grunnlag for videre analyse. Dette er tilfellet, man må prøve ut en høyere andel tilfeller fra underlaget.

Generelt kan det sies at størst presisjon og representasjon kan oppnås dersom prøver fra de forskjellige lagene på en hensiktsmessig måte reflekterer deres relative variabler med hensyn til karakteristikker under studie snarere enn å presentere deres relative størrelser i "befolkningen".

Det er tilrådelig å prøve tyngre i lag hvor forskeren har grunn til å tro at variasjonen om en gitt karakteristikk, for eksempel holdninger eller deltakelse, ville være større.

Derfor, i en undersøkelse som ble foretatt for å forutsi utfallet av nasjonale valg som benytter metoden for lagdelt prøvetaking, med stater som grunnlag for lagdeling, bør det tas en tyngre prøve fra de områdene eller områdene hvor utfallet er alvorlig overskyet og i stor grad tviler .

Type # 5. Uforholdsmessig Stratified Sampling :

Vi har allerede foreslått egenskapene til uforholdsmessig prøvetaking og også noen av de største fordelene med denne prøvetakingsprosedyren. Det er klart at en stratifisert prøve hvor antall elementer trukket fra forskjellige lag er uavhengig av størrelsen på disse lagene, kan kalles en uforholdsmessig stratifisert prøve.

Den samme effekten kan vel oppnås alternativt ved å tegne et like antall tilfeller fra hvert lag, uansett hvor sterkt eller svakt stratumet er representert i befolkningen.

Som en følge av måten den er valgt, er en fordel av uforholdsmessig stratifisert prøvetaking knyttet til det faktum at alle lagene er like pålitelige ut fra prøveens størrelse. En enda viktigere fordel er økonomi.

Denne typen prøve er økonomisk fordi forskerne sparer problemene med å sikre et unødvendig stort volum av informasjon fra de mest utbredte gruppene i befolkningen.

En slik prøve kan imidlertid også forråde de kombinerte ulempene med ulik antall tilfeller, dvs. litenhet og ikke-representativitet. Dessuten krever en uforholdsmessig prøve dyp kunnskap om relevante karakteristika av de ulike lagene.

Type nr. 6. Optimal allokeringsprøve :

I denne prøvetakingsprosessen er størrelsen på prøven trukket fra hvert stratum proporsjonal med både størrelsen og spredningen av verdier innenfor et gitt stratum. En nøyaktig bruk av denne prøvetakingsprosedyren innebærer bruk av visse statistiske begreper som ennå ikke er tilstrekkelig eller overbevisende innført.

Vi vet nå noe om stratifisert tilfeldig prøvetaking og dens forskjellige manifestasjoner. La oss nå se hvordan variablene eller kriteriene for stratifisering skal planlegges.

Følgende hensyn legger ideelt inn i valg av kontroller for stratifisering:

(a) Opplysningene til stratainstitusjonen skal være oppdaterte, nøyaktige, komplette, gjeldende for befolkningen og tilgjengelig for forskeren.

Mange egenskaper hos befolkningen kan ikke brukes som kontroller siden ingen tilfredsstillende statistikk om dem er tilgjengelig. I et svært dynamisk samfunn preget av store forstyrrelser i befolkningen, går forskeren som bruker stratifiseringsstrategien, vanligvis risikoen for å gå ganske galt i sine estimater om størrelsen på lagene han påvirker i prøven.

(b) Forskeren bør ha grunner til å tro at de faktorer eller kriterier som brukes til stratifisering er signifikante i lys av problemet under studien.

(c) Med mindre stratumet er stort nok, og sampler og feltarbeidere ikke har noen store vanskeligheter med å finne kandidater for det, bør det ikke brukes.

(d) Ved valg av tilfeller for stratifisering skal forskeren forsøke å velge de som er homogene med hensyn til egenskapene som er viktige for problemet under studien. Som tidligere sagt, er stratifisering effektiv i den grad at elementene i stratumet er som hverandre og samtidig forskjellige i forhold til elementene i andre lag.

La oss nå vurdere fordelene og begrensningene for stratifisert tilfeldig prøvetaking på en generell måte:

(1) Ved bruk av stratifisert tilfeldig prøvetakingsprosedyre kan forskeren forbli forsikret om at ingen viktige grupper eller kategorier vil bli utelatt fra prøven. Større representativitet av prøven er således sikret, og de unike uhellene som oppstår i enkel tilfeldig prøveuttagning unngås dermed.

(2) Ved mer homogene populasjoner kan større presisjon oppnås med færre tilfeller.

(3) Sammenlignet med de enkle tilfeldige, er stratifiserte prøver mer konsentrert geografisk, og derved reduseres kostnadene når det gjelder tid, penger og energi i intervjuer av respondenter.

(4) Prøverne som en intervjuer velger, kan være mer representativ dersom kvoten sin tildeles ved den upersonlige stratifiseringsprosedyren, enn om han skal bruke sin egen vurdering (som i kvoteprøvetaking).

Hovedbegrensningen av stratifisert tilfeldig prøvetaking er at for å sikre de maksimale fordelene av det i løpet av en studie, må forskeren vite mye om forskningens problem og dets forhold til andre faktorer. En slik kunnskap er ikke alltid kommende, og ganske så ofte venter er lang.

Det skal huskes at synspunktet med teorien om sannsynlighetstesting er det i det vesentlige irrelevant om stratifisering blir introdusert under prøvetakingsprosedyren eller under analyse av data, bortsett fra i den grad det tidligere gjør det mulig å kontrollere størrelsen på prøve oppnådd fra hvert lag og dermed øke effektiviteten av prøvetakingsdesignet.

Med andre ord, prosedyren for å tegne en enkel tilfeldig prøve og deretter dele den i strata, er ekvivalent i virkeligheten for å tegne en stratifisert tilfeldig prøve ved å bruke som samplingsramme innenfor hvert lag, populasjonen av det stratum som er inkludert i den givne enkle tilfeldig utvalg.

Type # 7. Cluster Sampling :

Vanligvis medfører enkelt tilfeldig prøvetaking og stratifisert tilfeldig prøvetaking enorme utgifter når det gjelder store og romlige eller geografisk spredte befolkninger.

I de ovennevnte typene prøvetaking kan elementene som er valgt i prøven, bli så vidt spredt at intervjuer dem kan medføre store utgifter, en større andel ikke-produktiv tid (brukt under reiser), større sannsynlighet for mangel på ensartethet blant intervjuere spørringer, opptak og til slutt, en tung utgift på å overvåke feltpersonalet.

Det er også andre praktiske faktorer for prøvetaking. For eksempel kan det anses å være mindre anstrengende og dermed tillatelig å administrere et spørreskjema til tre eller fire avdelinger på en fabrikk eller et kontor i stedet for å administrere det på en prøve trukket fra alle avdelinger på en enkel eller stratifisert tilfeldig basis, siden sistnevnte prosedyre kan være mye mer forstyrrende av fabrikkrutinene.

Det er for noen av disse grunnene at store undersøkelsesstudier sjelden bruker enkle eller stratifiserte tilfeldige prøver; I stedet bruker de metoden for klyngeprøvetaking.

I klyngeprøvetaking prøver sampler først fra befolkningen, visse store grupperinger, dvs. "klynger". Disse klyngene kan være byavdelinger, husholdninger eller flere geografiske eller sosiale enheter. Prøvetaking av klynger fra befolkningen gjøres ved enkle eller stratifiserte tilfeldige prøvetakingsmetoder. Fra disse utvalgte klyngene samles de bestanddelene ut ved bruk av prosedyrer som sikrer tilfeldighet.

Anta for eksempel at en forsker ønsker å gjennomføre en prøveundersøkelse på problemene med grunnskole studenter på høyskoler i Maharashtra.

Han kan fortsette som følger:

(a) Først utarbeider han en liste over alle universiteter i staten og velger et utvalg av universitetene på en "tilfeldig" basis.

(b) For hver av statens universiteter som inkluderer prøven, lager han en liste over høgskoler under sin jurisdiksjon og tar et utvalg av høgskoler på en "tilfeldig" basis.

(c) For hver av de høgskolene som skjer med å bli med i prøven, lager han en liste over alle studenter som er påmeldt det. Fra ut av disse studentene velger han et utvalg av ønsket størrelse på en "tilfeldig" basis (enkelt eller stratifisert).

På denne måten får forskeren en sannsynlighet eller tilfeldig utvalg av elementer, mer eller mindre konsentrert, geografisk. På denne måten er han i stand til å unngå store utgifter som ellers ville ha vært pådratt hvis han hadde tatt til enkel eller stratifisert tilfeldig prøvetaking, og likevel trenger han ikke å ofre prinsippene og fordelene med sannsynlighetstesting.

Karakteristisk går denne prøvetakingsprosessen gjennom en rekke faser. Derfor er det på en måte en "flertrinns" prøvetaking og noen ganger kjent med dette navnet. Denne prøvetakingsprosedyren beveger seg gradvis fra de mer inkluderende til de mindre inkluderende prøvetakingsenhetene, som forskeren endelig kommer til de elementene av befolkningen som utgjør sin ønskede prøve.

Det skal bemerkes at med klyngeprøving er det ikke lenger sant at hver kombinasjon av ønsket antall elementer i befolkningen er like sannsynlig å bli valgt som befolkningens utvalg. Følgelig kan ikke slags effekter som vi så i vår analyse av enkle tilfeldige prøver, dvs. befolkningsverdien som er den mest sannsynlige samplingsverdien, sees her.

Men slike effekter materialiseres på en mer komplisert måte, men selvfølgelig er prøvetakningseffektiviteten i noen grad hemmet. Det har blitt funnet at klyngeprøvetaking i hvert tilfelle er mye mindre effektivt når det gjelder å få informasjon enn sammenlignbart effektiv stratifisert tilfeldig prøvetaking.

Relativt sett, i klyngeprøvingen, er feilmarginen mye større. Dette handikapet er imidlertid mer enn avbalansert av tilknyttede økonomier, noe som tillater prøvetaking av et tilstrekkelig stort antall saker til en mindre total kostnad.

Avhengig av de spesifikke egenskapene til prøvetakingsplanleggeren på objektene med undersøkelse, kan klyngeprøvetaking være mer eller mindre effektiv enn enkel tilfeldig prøvetaking. Økonomiene som er knyttet til klyngeprøvetaking, tiltrer generelt balansen til fordel for bruk av klyngeprøvetaking i storskalaundersøkelser, men i forhold til enkel tilfeldig prøvetaking er det behov for flere saker for samme nøyaktighetsnivå.

Type nr. 8. Flerfasetaking:

Det er noen ganger praktisk å begrense visse spørsmål om spesifikke aspekter av studien til en brøkdel av prøven, mens annen informasjon samles inn fra hele prøven. Denne prosedyren er kjent som "flerfasetaking".

Basisinformasjonen som er registrert fra hele prøven, gjør det mulig å sammenligne visse egenskaper av delprøven med den for hele prøven.

Et ytterligere punkt som fortjener å nevne er at flerfasetaket muliggjør stratifisering av delprøven, siden informasjonen samlet fra førstefasesamplingen noen ganger kan samles inn før delprøveprosessen finner sted. Det vil bli husket at panelstudier involverer flerfasetaking.