Analyse av data: 4 trinn

Denne artikkelen kaster lys over de fire hovedtrinnene som er involvert i analyse av data. Fremgangsmåten er: 1. Etablering av kategorier eller klassifisering av data 2. Koding 3. Tabulering 4. Statistisk analyse av data.

Trinn # 1. Etablering av kategorier eller klassifisering av data :

Samfunnsvitenskapelig forskning involverer generelt et stort utvalg av svar på ulike typer spørsmål eller stimulanser presentert til prøven eller "befolkningen" av respondentene. Disse svarene kan være verbale eller ikke-verbale.

Det er klart at hvis et stort antall forskjellige typer svar skal organiseres slik at de kan brukes til å svare på forskningsspørsmålene eller i tegning generaliseringer, må de grupperes i et begrenset antall kategorier eller klasser. For å ta et enkelt eksempel, anta at det stilles spørsmål til respondentene, "Er du i favør av objektiv eksamen for studenter?"

Svarene fra respondentene kan muligens grupperes under fire brede kategorier, som under:

(a) "Ja" svar.

(b) "Nei" svar.

(c) "Vet ikke", "Kan ikke si" etc., svar.

(d) "Svarte ikke."

Anta at et annet spørsmål som er spurt til respondentene er, "Hvilken sosial klasse vil du si at du tilhører?"

Svarene til respondentene kan grupperes i følgende kategorier:

(a) Øverste klasse.

(b) Midtklasse.

(c) Nedre klasse.

(d) "Kan ikke si."

(e) Andre svar (som "Jeg tror ikke på sosiale klasser." "Det knapt betyr noe der jeg tilhører" etc.).

En forutsetning for å ta en beslutning om kategoriene som skal innføres for gruppering av dataene er at forskeren må velge noe passende prinsipp for klassifisering. Forskningsspørsmålet eller hypotesen, hvis noen er formulert, gir et godt logisk grunnlag for å velge et klassifikasjonsprinsipp.

Anta at hypotesen i en studie er:

"Studenter som har hatt erfaring med å studere i samfunnsskoler, vil ha en mer positiv holdning til systemet med medutdanning."

Her vil selvsagt en av prinsippene for klassifisering av svar være hvorvidt respondenten har hatt tidligere erfaring med co-pedagogisk system eller ikke. Et annet grunnlag for å klassifisere svar ville være graden av favourableness eller unfavourableness uttrykt mot co-pedagogisk system. Andre klasser av klassifisering kan også påberopes, avhengig av hvilke videreforeninger som skal undersøkes.

Det første grunnlaget for klassifisering ville gi to kategorier svar:

(a) Said, de hadde tidligere erfaring med medutdanning;

(b) Said, de hadde ikke tidligere erfaring med medutdanning.

Disse to kategoriene inneholder i seg selv hele spekteret av svar (forutsatt selvfølgelig at ingen respondent nektet å svare eller ikke reagerte eller ga noe "annet svar." Ingen svar på ovennevnte antagelse er utenfor kompasset av disse to kategoriene. Disse to kategoriene danner sammen det som er kjent som et "kategori-sett".

Et "kategori-sett" må oppfylle følgende tre krav:

(1) Settet av kategorier skal utledes av et enkelt klassifiseringsprinsipp. Dette kravet er ganske forståelig fordi hvis mer enn ett prinsipp for klassifisering er ansatt, kan et enkelt svar hevdes av mer enn en kategori.

Dermed vil kategoriene ikke være uavhengige av hverandre. For eksempel, hvis vi har tre kategorier som utgjør kategorisettet, f.eks. Mann, kvinne, barn, utelukkende fra to klassifikasjonsprinsipper, nemlig kjønn og alder, så kan et enkelt tilfelle (respondent) bli dekket av mer enn en kategori i kategorisettet.

For eksempel kan et barn også være en mann, en kvinne kan også være et barn og så videre. Klassifikasjonsprinsippet kan imidlertid være en sammensatt en, dvs. bestående av to eller flere kriterier, dvs. mannlig barn, kvinnelig barn osv.

(2) Det andre kravet er at kategorisettet skal være uttømmende, det vil si at det skal være mulig å plassere alle svar i en av kategoriene i settet. 'No response' bør utelukkes for å ha en passende kategori i settet som vil inkludere det.

Uansett hva som er svarene, må det dekkes av en kategori i settet. For eksempel, hvis verdens befolkning skulle klassifiseres på grunnlag av deres rasemateriale, ville kategorien sett ut fra tre kategorier, nemlig a) kaukasoid, b) negroid og c) mongoloid, klart ikke være en uttømmende kategori sett i samsvar med kravet som er skissert ovenfor, siden det ikke inneholder en enkelt kategori der mange indianere (og noen andre) kan finne et sted.

(3) Det siste kravet er en følge av den første, nemlig at kategoriene i settet bør utelukke hverandre; det vil si at kategoriene ikke skal overlappe. Dermed vil det ikke bli gjort krav på noe svar av mer enn en kategori innenfor settet.

Etablering av kategorier for data karakteristisk for samfunnsvitenskap er ikke alltid en enkel oppgave. Klassifikasjonsprinsippet kan ofte være en sammensatt en (i motsetning til enkel, enhetlig). Oppgaven med å tegne ut alle de gjensidig eksklusive kategoriene som sammen ville utlede det totale universet av svar på grunnlag av et sammensatt klassifiseringsprinsipp, er faktisk en krevende, krevende fantasi.

Det er en stor hjelp i slike tilfeller å redusere attributter som utgjør sammensatte prinsipp for klassifisering til symboler eller koder og tegne ut ved hjelp av teknikken med boolsk utvidelse, hele spekteret av mulige kategorier som omfatter kategorisettet.

La oss ta et veldig enkelt eksempel. Anta at forskeren vurderer tre attributter, f.eks. Kjønn (mannlig kvinne), alder (under 21 år eller over 21 år) og sivilstatus (gift eller enslig) som bestanddel i sitt enkelt (men sammensatte) prinsipp for klassifisering og reduserer disse til symboler som under:

Mann = S, Kvinne = S Tj

Under 21 år = A, Over 21 år = A.

Gift = M, Singel = M.

Det resulterende kategorisettet vil være uttømmende totalitet bestående av alle mulige kombinasjoner av disse tre attributter som omfatter sammensatt klassifiseringsprinsipp. De mulige kombinasjonene, dvs. kategorier, vil være 2 3 = 2 x 2 x 2 = 8 i antall.

Disse er som under:

(1) SAM

(2) S AM

(3) S Aj M

(4) SA M Tj

(5) S A A M M

(6) S A A M.

(7) S A M M.

(8) S A A M M.

Dekoding, dvs. å erstatte de ekte konnotasjonene for symbolene, får vi åtte gjensidig eksklusive kategorier som leser som under:

(1) Mann under 21 år og gift.

(2) Hunn under 21 år og gift.

(3) Mann over 21 år og gift.

(4) Mann under 21 år og ugift.

(5) Hunn over 21 år og gift.

(6) Hunn under 21 år og ugift.

(7) Mann over 21 år og ugift.

(8) Hunn over 21 år og ugift.

På samme måte, hvis sammensatt klassifiseringsprinsippet består av fire attributter, skal vi ha 2 4 = 2 x 2 x 2 x 2, dvs. 16 gjensidig eksklusive kategorier. Det burde være klart nå hvordan denne metoden for å etablere kategorier, snarere enn intuisjon, gjør klassifiseringsoppgaven enklere og dumt.

Det er åpenbart at etableringen av et sett av kategorier er relativt enkelt hvis svarene fra respondentene i løpet av studien er ganske enkle og klare, og kategoriene kan derfor enkelt defineres på en entydig måte. Selv om dette er måten kategoriene alltid skal defineres, er oppgaven mye vanskeligere med visse typer innhold.

Anta at i en studie spurte forskeren de mannlige studentene: "Hvordan vil du si at de kvinnelige studentene føler om å studere i samme høyskole med mannlige studenter som deg?" Svarene vil sannsynligvis variere fra indikasjoner på høye holdninger (tilskudd til kvinnelige studenter ) til imputasjoner av svært ugunstige holdninger. Anta at dette er noen av svarene mottatt fra respondentene.

(1) De liker ideen. '

(2) Jeg tror ikke de har noe imot.

(3) "De tror det senker dem."

(4) Jeg kommer ikke i kontakt med dem, så jeg ville ikke vite det. '

(5) "De hater det."

(6) Noen av dem liker det, noen gjør det ikke.

(7) 'De vil studere her, så de kan si at de er ikke mindre enn mennene.'

(8) "I en rent damekollege ville de savne mye, så de synes å like det her."

I forhold til de ovennevnte svarene ville det ikke være vanskelig å utvikle et enkelt sett av kategorier basert på klassifiseringsprinsippet av gunstige mot ugunstige holdninger tilskudd til jenter. Men vi finner at både gunstige og ugunstige svar formidler forskjellige nyanser av betydninger.

Den mannlige studenten som sier: "De (jentestudentene) vil studere her slik at de kan si at de ikke er mindre enn menn" formidler noe annet enn en som sier: "De liker ideen." På samme måte er den mannlige studenten som sier, "De tror det senker dem" sier igjen noe annet enn den som sier, "De hater det."

Dermed ser vi at to attributter, det vil si:

(1) Påvisning av gunstige eller ugunstige holdninger til jenter, og

(2) Eksplisitt referanse eller fravær av henvisning til fordeler eller skade som støtter gunstige eller ugunstige holdninger, er to viktige bestanddeler i et sammensatt klassifiseringsprinsipp.

Kategoriene i kategorien sett i samsvar med de ideelle kravene til et kategorisett som er diskutert tidligere, kan settes ned som under:

(1) Gunstig holdning tilskudd til jente studenter, forklart i form av fordeler de kommer fra å studere i samme høyskole med mannlige studenter (for eksempel 7. og 8. svar).

(2) Gunstig holdning til jenter uten eksplisitt referanse til fordelene som er oppnådd ved å studere i samme høyskole med menn (f.eks. Erklæring nr. 1).

(3) Nøytral eller imøtekommende holdning tilskrevet jenter (f.eks. Erklæring nr. 1).

(4) Ufordelaktig holdning tilskrevet jenter, forklart når det gjelder ulemper (negative fordeler) de kommer fra å studere i samme høyskole med mannlige studenter.

(5) Ufordelaktig holdning tilskrevet jenter uten eksplisitt henvisning til ulemper eller tap som følge av medutdanning (f.eks. Erklæring nr. 5).

(6) Andre svar, kan ikke si, ikke svar, vet ikke (f.eks. Erklæring nr. 4).

Illustrasjonen ovenfor gir en ide om hvordan svært komplisert en klassifisering i samfunnsvitenskap kan få. Arbeid med slike komplekse kategorier krever betydelig omsorg og innsats ved klassifisering. Selv når kategorier har blitt utarbeidet nøye, vil bruken av dem gi større problemer enn bruken av kategorier mer smalt og nøyaktig definert.

Hvis en mannlig student i eksemplet ovenfor sier, "de liker det bra her, de vet hvorfor" det er et morsomt spørsmål om denne setningen innebærer en fordel. Dermed vil det bli etablert ytterligere regler for å håndtere slike svar.

Det må sies selv på bekostning av noen repetisjon at selv om det i prinsippet er mulig å bruke mange attributter av svar på formulering av kategorisett, er det i praksis ofte unødvendig, uøkonomisk og unrewarding siden ikke alle disse klassifiseringsprinsippene bære på målet med studien.

La oss nå slå på å vurdere problemet med å velge et klassifiseringsprinsipp for kategorisering av ustrukturert materiale (dvs. informasjon samlet inn av ustrukturerte verktøy).

I studier som bruker strukturerte instrumenter for å samle data som er relevante for tydeligformulerte forskningsspørsmål eller hypoteser, er det riktige prinsippet for klassifisering av svar ganske tydelig foreskrevet av arten av spørsmålene og de sikrede svarene.

I arbeid med ustrukturert materiale eller data er det første problemet imidlertid å komme til beslutninger om hvilke aspekter av materialet som skal kategoriseres, det vil si hvilke klassifikasjonsprinsipper som skal brukes til å etablere kategorier.

I forsøksstudier som definert ikke starter med et godt formulert problem eller eksplisitt hypotes, er beslutningen om klassifiseringsprinsippene vanskelig å komme fram til. På tidspunktet for datainnsamling vet ikke etterforskeren hvilke aspekter som kan vise seg å være viktigst.

Han må derfor samle en stor mengde data av ustrukturert type. I løpet av analysen står forskeren overfor problemet med å håndtere ikke bare med ustrukturerte materialer, men også med et stort volum av dem.

Det anbefales å analysere data fra en undersøkende studie for å utvikle arbeidshypotesen som vil gi praktiske tilfredsstillende klassifiseringsprinsipper. Forskeren må lese nøye gjennom alt sitt materiale, idet han hele tiden varsler om latent ledetråder i data. Slike ledetråd sikres ofte ved å studere materialer på emner eller situasjoner som står i kontrast til de han studerer.

En slik studie hjelper etterforskeren til å se de viktige forskjellene mellom de to situasjonene. En annen prosedyre for å komme til slike ledetråder er å sette sammen saken til grupper som ser ut til å ha et nært slektskap eller ser ut til å høre sammen og deretter spørre seg selv som førte til at han følte at saken han lagde i en enkelt gruppe, var like.

Enda en annen tilnærming som kan stimulere ledetråder til formulering av arbeidshypotesen er å legge merke til saker som virker overraskende i forhold til visse teoretiske forventninger eller sunn fornuft og deretter å søke etter mulig forklaring på de overraskende eller uventede fenomenene.

Det skal imidlertid huskes at analysen av ustrukturert materiale, selv med klar hypotese, gir spesielle problemer. For det første er det alltid mulighet for at informasjon på et gitt punkt mangler fra noen av dokumentene.

Det er også sannsynlighet for at mye materiale ikke har direkte betydning for hypotesen. Dessuten er det et problem å bestemme størrelsen på enheter av materialet som kategoriene skal brukes på.

For eksempel, hvis en forsker brukte case-records holdt av velferdsorganisasjoner, må han bestemme hvilken enhet (f.eks. Klienter, uttalelser, handlinger, sosialarbeidere, økter med klienten eller hele platen) er mest hensiktsmessig i å gi svar på hans spesifikke forskningsspørsmål.

Trinn # 2. Koding:

Koding består i å tildele symboler, vanligvis tall til hvert svar som faller i en forhåndsbestemt klasse. Med andre ord kan koding betraktes som klassifiseringsprosessen som er nødvendig for etterfølgende tabulering. Gjennom koding blir de rade dataene omformet til symboler som kan tabelliseres og telles.

Denne transformasjonen er imidlertid ikke automatisk, det innebærer mye dømmekraft fra koden. 'Coder' er den offisielle tittelen for en person som har tildelt ansvaret for å gi spesielle koder til svar etter at de noterte notatene er hentet til kontoret.

Det skal imidlertid huskes at dommen om hvilken respons som skal tildeles en bestemt kode, ofte gjøres av en annen person enn den som går ved den offisielle betegnelsen "koder".

Koding kan foregå på tre forskjellige punkter i en studie hvor hver av dem, ulike typer personer kan være ansvarlige for å tilordne koder til rådataene. I mange studier kan respondenten selv bli bedt om å tildele koder til sin egen reaksjon eller situasjon.

Dette gjelder for mange meningsmålinger og flere valgmuligheter. For eksempel, når respondenten blir bedt om å indikere hvilken av klassene (f.eks. Inntektsgrupper) han tilhører, f.eks. (A) under 3000 rupees pm, (b) Rs. 3001 / - til rs. 6000 / - pm, (c) Rs. 6001 / - til rs. 9000 / - pm, (d) Rs. 9001 / - og over, svarer respondenten sitt svar ganske enkelt ved å krysse av sin posisjon blant de givne alternativene.

Det andre punktet som kodingen kan finne sted er når i løpet av datainnsamlingen kategoriserer intervjueren eller observatøren fagets svar. Dette er det som gjøres når en intervjuer eller observatør anvender en vurderingskala for å beskrive en persons respons eller oppførsel.

Det endelige punktet ved hvilken koding kan finne sted, er selvfølgelig når de rå usorterte dataene (samlet spesielt gjennom ustrukturerte datainnsamlingsinstrumenter) blir deponert i prosjektkontoret og de offisielle kodene her utøver sin dom for å tilordne bestemte koder til bestemt svar eller data.

La oss kort sammenligne og kontrast fordeler og ulemper ved koding av de offisielle kodene på kontoret og koding av intervjuerne eller observatørene gjort i løpet av datainnsamling i feltet.

Intervjuerne eller observatørene er i stand til å legge merke til situasjonen så vel som individets oppførsel. Dermed har de mer informasjon som de skal basere sine vurderinger på med hensyn til riktig kategorisering av svar sammenlignet med kodene som arbeider på grunnlag av skriftlige poster som kanskje ikke gir en fullstendig ide om reell betydning av svaret.

En annen fordel ved koding av datasamlere selv er at både tid og arbeid kan reddes.

Tvert imot har koding på kontoret av kodere visse signalfordeler. Koding av komplekse data som krever tid for refleksjon, bør anbefales av kontor-koderne. På stedet kan det ikke være så kresne som dommer laget med mer tid til overveielse.

Dommen til datainnsamlere kan bli farget av mange faktorer, dvs. respondentens fremtoninger, aksenter og svar på tidligere spørsmål, mannerisms osv. For det andre er det fare for at datasamlere mangler enhetlighet når kodingsresponsene.

Sammenligning av data oppnådd fra et stort antall respondenter hindres dermed. For det tredje kan intervjuerne eller observatørene utvikle sine egne personlige referansemål med hensyn til materialet de er kodende for. Dette ville pleie å gjøre kategoriseringer deres upålitelige, etter en tid. En felles referanseramme er lettere å oppnå og opprettholde i kontorkodingsoperasjonen enn i feltet.

La oss diskutere noen av de viktige problemene knyttet til pålitelighet ved koding. Det er mange ting som kan fungere for å gjøre dommen av kodere upålitelig. Noen av faktorene kan oppstå fra dataene som skal kategoriseres, noen av innholdet i kategoriene som skal brukes, og at andre fortsatt kan komme fra kodene selv.

Vi skal nå se nærmere på noen av disse faktorene og måten de kan bli beskyttet mot.

Mange av vanskelighetene som oppstår ved koding skyldes mangler på data. Ofte gir dataene ikke nok relevant informasjon for en pålitelig koding. Dette kan skyldes mangelfull og utilstrekkelig datainnsamling. Disse vanskelighetene kan imidlertid generelt overvinnes ved nøye redigering av data. Prosessen som består i å undersøke dataene for å forbedre kvaliteten på kodingen kjent som redigering.

Når datainnsamleren leverer sitt materiale til prosjektkontoret, eksisterer det fortsatt mulighet for å eliminere mange mulige kodingsproblemer. En nøye undersøkelse av dataene så snart de er samlet, og om nødvendig hjelper en systematisk spørreundersøkelse av intervjuerne eller observatørene å avverge mange kodingsproblemer.

Redigering bidrar ikke bare til å unngå senere kodingsproblemer, men kan også forbedre kvaliteten på datainnsamlingen vesentlig ved å peke på hvor intervjuerne eller observatørene kanskje har misforstått instruksjoner eller kanskje ikke har registrert data i tilstrekkelig detalj.

Faktisk bør redigeringen gjøres under forutprøvingen av intervjuet eller observasjonsplanen som trener intervjuerne eller observatørene, og faktisk gjennom perioden for datainnsamling. Redigering på prosjektkontoret går langt i å fjerne kodingsproblemer.

Dermed må redigeringen gjøres mens intervjuerne eller observatørene enkelt kan stilles til rådighet. Redigering innebærer en grundig gjennomgang av intervjuet eller observasjonsplanene.

Disse bør kontrolleres for:

(1) Fullstendighet: Redaktørene må se at alle elementer er fylt ut. Et tomt mellomrom ved siden av et spørsmål i en intervjuplan kan for eksempel bety enten "nei respons" eller "ikke vet" eller nekte å svar eller uanvendelighet av spørsmål, eller spørsmålet har blitt utelatt ved tilsyn, etc.

(2) Redaktøren bør undersøke intervju- eller observasjonsplanene for å finne ut om håndskriftet eller symbolene eller koder som er tildelt av intervjuer eller observatør, lett kan forstås av koderen.

Det er alltid tilrådelig å se etter lesbarhet når materialet leveres inn og om nødvendig for å få intervjueren eller observatøren til å omskrive den. Hvis dette ikke er gjort, kan kodingen bli sittende fast på et stadium når intervjuerne eller observatørene ikke lett blir tilbakekalt til spørsmål.

(3) Redigering innebærer også å undersøke tidsplanene for forståelighet. Det skjer ofte at et registrert svar er helt forståelig for intervjueren eller observatøren, men ikke forståelig for koderen fordi konteksten av atferd eller respons ikke er kjent for koderen. Systematisk spørring av datainnsamlerne vil fjerne forvirring og tvetydigheter og forbedre kvaliteten på kodingen betydelig.

(4) Dataene bør også undersøkes eller kontrolleres for å finne ut om det er visse uoverensstemmelser i forhold til svarene som er registrert i tidsplanen.

For eksempel kan en respondent ha sagt som svar på et av de tidligere spørsmålene at han aldri hadde møtt mennesker i en bestemt gruppe, og likevel, som svar på et senere spørsmål, kunne han ha sagt noe om å besøke bestemte personer i denne gruppen i løpet av hans runder. Hvis det er tilfelle, er det et åpenbart behov for å spørre om denne inkonsekvensen, og få det avklart gjennom å stille spørsmålene til datainnsamlerne.

(5) Det er også nødvendig å sjekke graden av enhetlighet som intervjuerne har fulgt instruksjonene for innsamling og registrering av data. Koding kan bli hemmet dersom et svar registreres i andre enheter enn de som er angitt i instruksjonene.

(6) Det skal bemerkes at noe svar bare kan synes å være irrelevant for formålet med undersøkelsen. Dette vil trolig skje hvis et spørsmål ikke er klart arbeidet eller ikke spurt. Dataene bør derfor undersøkes grundig med sikte på å adskille de upassende svarene fra de aktuelle.

Verdien av kategoriseringen av data avhenger naturlig av lyden av kategoriene som er ansatt. Det er nødvendig at kategoriene i tillegg til å være relevante for formålet med forskning, også er definert fra et konseptuelt synspunkt.

Koding vil være upålitelig dersom kategoriene ikke er definert tydelig når det gjelder indikatorer som gjelder for data, her og nå. I praksis defineres kategoriene ved hjelp av eksempler fra dataene i hånden. Det er svært nyttig hvis illustrasjoner fra data viser ikke bare hva slags svar typifiserer kategorien, men hjelper også å skille grenselinjen mellom tilsynelatende lignende kategorier.

Det er åpenbart at kvaliteten på kodingen påvirkes av kodens kompetanse. Opplæringen av kodere er dermed et viktig skritt i enhver studie.

Opplæringen av kodere kan fortsette med følgende faser:

For det første er de forskjellige koder forklart for tråden (kodere) og illustrert med eksempler fra dataene som skal kategoriseres.

For det andre praktiserer alle trainee-koderne seg på en prøve av dataene, og problemene som oppstår diskuteres av koderne som en gruppe med veileder for å utvikle felles prosedyrer og definisjoner.

For det tredje brukes ledetråder som følge av praksiskoding til å gjennomføre revisjoner i kategoriene for å gjøre dem bedre gjeldende for materialet og å skrive skriftlige prosedyrer og definisjoner som har utviklet seg under den foreløpige kodingen.

For det fjerde, på et tidspunkt i praksisperioden når relativt få nye problemer oppstår, fungerer kodene på en identisk del av data uten å konsultere hverandre eller veileder. Konsistensen eller påliteligheten til kodingen beregnes deretter for å avgjøre om det er mulig å begynne å kode på riktig måte.

Avhengig av resultatene av pålitelighet eller konsistenskontroll, kan det bli bestemt å eliminere kategoriene som virker for upålitelige eller å bruke mer tid på å trene kodere eller å eliminere kodere som er mest inkonsekvente og så videre.

Til slutt blir det foretatt periodiske kontroller for å sikre at kodere ikke blir uforsiktige med mer erfaring eller at de ikke utvikler personlige idiosynkratiske metoder for å håndtere nye problemer i materialet. For å sikre ensartethet, og beslutning som er gjort etter at kodingen har begynt, skal straks kommuniseres til alle kodere.

Den konsistens og hensiktsmessighet som en bestemt type svar er tildelt til en gitt kategori, vil åpenbart ha et viktig bidrag til resultatet av analysen, og det er derfor viktig å kontrollere påliteligheten av kodingen og å øke avtalen mellom kodere så mye som mulig.

Det er selvfølgelig vanskelig å angi et gitt nivå av pålitelighet som standarden som skal oppnås. Ulike typer materiale presenterer ulike vanskelighetsgrader for å oppnå pålitelighet. Som regel, jo mer strukturert materialet som skal kodes og dermed enklere kategoriene som brukes, jo høyere er påliteligheten.

Det skal bemerkes at typene koder som brukes i en undersøkelse, vil variere avhengig av om dataene skal tabelliseres av maskin eller for hånd. Hvis dataene skal sorteres manuelt, er en ordbeskrivelse av klassene tilfredsstillende.

Også forkortelser eller bokstaver av alpha-bates, f.eks. 'Y for Ja, ' N 'for Nei, etc., kan brukes. Maskintabell krever derimot at klasser uttrykkes i numeriske symboler, da maskinene kun kan mates med numeriske data.

Mekanisk tabulering krever bruk av stempelkort. Imidlertid er antall forskjellige klasser som kan vises på stempelkortet begrenset. Under alle omstendigheter kan alle koder som brukes til maskin tabulering også brukes til håndtabell.

Hvis det skal legges koder på bankkort, hvorav to størrelser er generelt, det vil si 80 kolonnekort og 54 kolonnekort, er det ønskelig å bruke ti på færre klasser / kategorier for de fleste opplysninger eller svar.

Stempelkortet inneholder 10 nummererte mellomrom og en X og Y i hver kolonne, og totalt 12 koder som kan brukes. Det er ganske komplisert prosedyre for å få mer enn en type gjenstand i en kolonne. Nativitet og alderskoder kan for eksempel ikke stanses i en enkelt kolonne med mindre bare seks aldersgrupper brukes til hver enkelt.

Trinn # 3. Tabulering:

Tabulering er en del av den tekniske prosessen i statistisk analyse av dataene. Det viktigste elementet i tabellen er oppsummeringen av resultater i form av statistiske tabeller.

Det er først når rådata er delt inn i grupper og teller av antall tilfeller som faller i disse ulike gruppene, at det er mulig for forskeren å bestemme hva hans resultater betyr og å formidle sine funn til forbrukeren i en form som kan lett forståes.

Tabulering avhenger naturligvis av å etablere kategorier for rå data, redigering og koding av respons (punching og kjøring av kortene gjennom maskiner for mekanisk tabulering og sortering og tallying for håndbinding).

Erfarne forskere utvikler generelt tabulasjonsplaner omtrent på samme tid som de utarbeider eller bygger datainnsamlingsinstrumentene og lager prøveplaner. De uerfarne forskerne berører sjelden seg selv med tabulasjonsplaner inntil dataene er samlet inn. Selvfølgelig er det umulig for forskeren å forutse hele spekteret av tabulering som vil bli ønsket senere.

Han burde være kjent nok med sitt forskningsproblem eller undersøkelsesfaget for å kunne tegne tabeller som vil gi svar på spørsmålene som førte til studien. Forskeren skal være i stand til å utarbeide tilstrekkelige tabulasjonsplaner dersom han bruker funnene fra tidligere undersøkelser som har elementer som er felles med den planene er trukket for.

I forsøksstudier er en bedre og sikrere prosedyre å forestille datainnsamlingsinstrumentet på en prøve av populasjon av typen som vil bli dekket i den endelige studien. På denne måten kan man vanligvis få noen ledetråder med hensyn til hva slags tabulering som er meningsfylt.

Tabulering, kan gjøres helt ved manuelle metoder; dette er kjent som hånd tabulering. Alternativt kan det gjøres ved mekaniske metoder ved bruk av automatiske og raske kraftmaskiner for hovedparten av data, hvor prosessen er kjent som mekanisk tabulering.

Forskeren må avgjøre før han trekker detaljerte tabuleringsplaner for studien, hvilken metode for tabulering han vil bruke. Denne beslutningen vil være basert på ulike hensyn som kostnad, tid, personell, etc.

Både håndtabell og mekaniske tabulasjonsprosedyrer har sine respektive fortrinn og begrensninger. Forskeren er oppmerksom på disse fordelene og demerittene, på en bedre måte å bestemme hvilken metode som passer for hans problem.

Vi skal kort vurdere fordelene ved disse to metodene for tabulering:

(1) Mekanisk tabulering innebærer mye kontorarbeid og spesialiserte operasjoner. Selvfølgelig letter det hastigheten, men hastigheten kan ikke alltid være en tilstrekkelig kompensasjon for ekstra kontorarbeid.

(2) Hvis antall og typer av ønskede tabeller ikke er avgjort før tabuleringen påbegynnes, maskin-tabulering kan være mer hensiktsmessig. Men hvis håndtabellen anses å være effektiv, vil rekkefølgen der forskjellige typer og teller vil bli gjort, bestemmes før tabulering.

(3) En stor fordel ved maskin tabulering er at det letter kryssklassifiseringer. I storskala studier hvor mange variabler skal korreleres eller kryssklassifiseres, er maskin tabulering rimelig å foretrekke.

Det er av denne grunn at mekanisk tabulering brukes i studier som krever mange sammenhenger mellom variabler. Men hvis det totale antall respondenter er lite, kan manuell tellering av dem i samsvar med kryssklassifiseringsprinsippet være relativt økonomisk.

(4) Når det er mye kodet informasjon og flere stempelkort som kreves for hvert tilfelle, kan handlegulering være å foretrekke.

(5) Hvis det er ønskelig å holde dataene i en form klar for ny tabulering med relativt kort varsel, er stempelkort vanligvis nyttige. Mekanisk tabulering er nyttig for periodiske studier eller undersøkelser der samme type informasjon er nødvendig for å bli samlet inn med hyppige intervaller.

(6) Prosessen med sortering og telling er mindre sannsynlig å produsere feil hvis det gjøres med maskin enn hvis det gjøres for hånd. Feil, selvfølgelig, kan og gjør oppstår i maskin tabulering, og når de gjør det, er de ofte svært vanskelig å identifisere og kontrollere.

Eventuelle feil som oppdages ved koding, redigering eller feltarbeid i undersøkelsen, kan inneholde maskinoppgavearbeid. Det er derfor ofte ønskelig å fortsette med håndtabellen sammen med feltarbeidet.

(7) Kostnaden for tabulering er en viktig bekymring for forskeren. Maskintabell innebærer ofte mye større kostnader siden det meste av stansekort, kostnader for stansing og verifisering, maskinavgifter for sorterings- og tabuleringsmaskiner og utgifter til å ansette spesialiserte tjenester av bestemte typer maskinoperatører, legger ofte opp til mye mer enn de som er involvert i hånden tabulation.

(8) Et annet viktig hensyn er tiden. I mekanisk tabulering er arbeidet med tabulering som sådan gjort på svært kort tid, men de forberedende stadiene, som også opplæring, tilsyn og mulig mangel på visse typer maskiner på utleie som medfører forstyrrelse av arbeid, kan alle uunngåelig bidra til sløsing av tiden.

(9) Overveielsen av bekvemmelighet kan knapt ignoreres. Hvis mekanisk tabulering krever sending av rådata til et kontor langt borte fra prosjektkontoret, oppstår ulemper involvert i pakking, transport, etc..

(10) Til slutt kan mengden av kommentarmateriale som registreres og analyseres også påvirke valget av tabuleringsmetoder. I noen opinionsundersøkelser er de viktige kommentarene til informantene viktige. Håndkodekortet som brukes i håndtabellen alene, kan gi plass til slike kommentarer eller kommentarer.

Maskiner som håndterer tabuleringsarbeid, er av mange slag. Utviklingen på dette feltet har vært ekstremt rask de siste årene. Noen maskiner sorterer og teller bare kort, andre sorterer, teller og skriver ut resultatene, men andre er utstyrt med å utføre mest kompliserte statistiske operasjoner eller beregninger.

Disse sistnevnte maskinene er ekstremt komplekse og de må programmeres for en gitt operasjon av en spesialist i linjen. Et bord er en utstilling av de numeriske dataene som er systematisk anordnet i merkede kolonner (vertikale) og rader (horisontal).

En enkel eller elementær tabell angir enkle teller av frekvensene som de ulike kategoriene i hvert sett forekommer i dataene, for eksempel antall personer i prøven som har gått på videregående skole, men ikke bestått, antall personer som har deltatt college men ikke uteksaminert og så videre. Tabellen nedenfor viser ganske enkelt ut frekvensene av besøk av femti respondenter til kino.

I forskning er vi ofte interessert i å finne sammenhengen mellom to eller flere variabler, for eksempel utdanning og inntekt og fruktbarhet, enkle tabeller (illustrert ovenfor) som viser frekvensfordeling av respondentene med hensyn til en enkelt karakteristikk, for eksempel utdanning eller inntekt eller fruktbarhet, ikke hjelpe oss med å se forholdet mellom to eller flere variabler.

Måten å se forholdet på er å forberede tverrbord eller sammenbruddstabeller. Slike tabeller gjør det mulig å gruppere sager som skjer i to eller flere kategorier, for eksempel tabulering av antall saker som har høy utdanning, lav inntekt og har mellom 2 og 3 barn, eller antall tilfeller som er lav utdanning, lav inntekt og har mellom 4 og 5 barn og så videre. Den mest elementære form for kryss-tabulering studentene er kjent med, er college-tabellen.

Anta at en forsker vil se forholdet mellom tre variabler, nemlig yrke, inntekt og fruktbarhet. Han må benytte en tabellordning som har råd til alle mulige kombinasjoner av de ulike kategoriene i disse tre variablene.

Krysslegging av dataene på en hypotetisk prøve på 100 personer kan presenteres som under:

I tabellen ovenfor har vi angitt antall barn i rader. Denne fruktbarhetsvariabelen er delt inn i fem kategorier, dvs. ingen problem, 1 til 2 utgaver, 3 til 4, 5 til 6, 7 og over. Så i margin til venstre har vi disse fem kategoriene av fruktbarhet. Vi har indikert inntektene på 100 respondenter i kolonner.

Inntektsvariabelen er delt inn i fem kategorier, dvs. under Rs.200, Rs.201-400, 401-600, 601-800, 801-1000. Dermed har vi fem kolonner som svarer til disse kategoriene.

Igjen siden vi har en mer variabel, dvs. yrke for å imøtekomme, har kolonnene for inntekt hver del blitt delt inn i to deler som tilsvarer de to kategoriene hvor yrkene er delt, det vil si hvite krage yrke og blåmanns yrke .

Dermed har vi ti vertikale kolonner, tilsvarende inntekt og yrke. Antallet av horisontale rader vi har for kategoriene av fruktbarhetsvariablen er fem. Dermed har vi ti kolonner krysset av fem rader som legger opp bordets kropp.

Skjæringspunktet mellom kolonnene og radene har utført 50 (femti) celler eller bokser. Hver av disse boksene eller cellene huser et bestemt antall tilfeller som er forskjellige fra de i andre celler, enten med hensyn til inntekt eller yrke, fruktbarhet eller i noen av disse eller i alle disse. La oss lese bordet for å få en ide om hva det representerer.

Av den totale prøven på 100 tilfeller er det 25 som har mellom 3 og 4 utgaver. Av disse 25, lesing fra venstre side, har 5 personer (med mellom 3 og 4 barn) inntekt under Rs.200 / - og er ansatt i hvitekravsjobb.

Two persons (with between 3 and 4 children) have income below Rs.200 and are employed in blue- collar occupations. Let us now take the second row. Of the total respondents, 38 have between 1 and 2 children. 11 (in the 7th cell) who have between 1 and 2 children are from the income group Rs.601 to Rs.800 and are employed in white-collar occupation.

This exercise should make it very clear that cross-tabulation is an essential step in the discovery of or testing of relationships among the variables contained in the data.

Tabulation is a means to present data in a summarized form in a way that facilitates the required statistical calculations. Data may, however, be presented in other ways, ie, instead of presenting them in a tabular form, the researcher may present them in the form of diagrams or graphs. Such diagrammatic or graphic representations do have the merit of being intelligible to a less knowledgeable reader.

But they suffer from the limitation that they are not so useful as a basis for statistical calculations. Let us now proceed to discuss the next operation, ie, the statistical analysis of data. Tabulation is a prerequisite or a first step in this direction.

Step # 4. Statistical Analysis of Data :

In research, we are not concerned with each individual respondent. The purpose of research is broader than this. That is, we wish to know much more than simply that a given respondent, for example, has extremely favourable attitude toward disarmament and that another respondent has moderately unfavorable attitudes toward the same issue. But this information is just not enough.

Social science researches are generally directed toward providing information about a particular population of respondents mostly via a sample. The sample of the totality might be asked certain questions related to the problem of our study, or be subjected to some form of observation.

Let us suppose that we have asked a sample of a thousand college students studying in 'post-graduate' classes a series of questions with a view to securing information about their study habits. Our research would thus be directed toward providing information about the 'population' of 'post-graduate' students of which the thousand cases is a sample.

As a necessary step to characterizing this 'population', we would have to describe or summarize the information about study habits that we have obtained on the sample thereof. Tabulation is just a part of this step. In addition, we must estimate the reliability of generalizations of the 'population' from the obtained data. Statistical methods are useful in fulfilling both these ends.