Koncept av Chi-Square-test

I denne artikkelen vil vi diskutere begrepet chi-square test.

Chi-kvadratprøven ble brukt til å teste at alleler segregerer på Mendelske prinsipper. Det kreves en sammenligning av forventede og observerte tall. Det brukes i statistikk for å bedømme betydningen av prøvetakingsdataene. Prof. Fisher utviklet chi-square test. Symbolisk skrevet som X 2 (uttalt som Ki-square).

Det er et statistisk mål som gjør det mulig å vurdere betydningen av forskjellen mellom de observerte genotypiske tallene (frekvensene) og de forventede tallene (frekvensene) oppnådd fra et hypotetisk univers.

Hvorvidt eksperimentelt og forventet forhold er i god avtale eller ikke. Dette kan bli testet av Chi Square Test. Denne testen bestemmer at i løpet av enhver eksperimentprosedyre som omhandler kvantitative data, kan en viss variasjon, kalt "eksperimentell feil", tilskrives en tilfeldighetsfeil alene.

Dette kan beregnes med følgende formel:

X 2 = Σ = (observert verdi - forventet verdi) 2 / forventet verdi

La oss ta eksemplet på forholdet mellom fenotype og genotype av eksperimenter utført av Mendel. Ved å bruke X 2, viser resultatene at de observerte frekvensene er i samsvar med de forutsagte forholdene. Dataene fra Mendels faktiske eksperimenter er gitt i følgende tabell. Variasjonene i forventet og forventet forhold skyldes en eksperimentell feil alene.

Mendel observert i sitt eksperiment, forholdet som 9: 3: 3: 1 i dihybridkors i F 2- generasjonen mens forholdet i monohybridkors i F 2- generasjonen var 1: 2: 1. Han fant 315 runder, gule frø, 101 runder, grønne frø, 108 rynke, gule frø og 32 rynke, grønne frø.

Så forventede tall for hver fenotype er 556 (9/16) = 312, 75 runde, gule frø; 556 (3/16) = 104, 25 runde. Grønne frø; 556 (3/16) = 104, 25 rynke, gule frø og 556 (1/16) = 34.75 rynke, grønne frø. Chi-kvadrat vil vise om forskjellen mellom det faktiske og forutsagte forholdet skyldes eksperimentell feil eller ikke.

Chi-kvadratverdien beregnet er 0, 470, som har fått ved å bruke med følgende formel:

X 2 = Σ = (observert verdi - forventet verdi) 2 / forventet verdi

Graden av frihet kreves for beregning av X 2, antall uavhengige begrensninger bestemte antall grader av frihet (eller df). Graden av frihet er et mål på antall uavhengige variabler som er tilstede i et gitt eksperiment.

Det er sagt at feilfeilene bare påvirker en uavhengig variabel. I Mendels-eksperimenter nevnt ovenfor er variablene bare 4 slik at frihetsgraden er 4 -1 = 3. Antallet av noen tre fenotypiske klasser er bestemt, tallet i den fjerde klassen er fikset.

For å finne ut sannsynligheten må vi konsultere Chi-kvadratbord.

Tabellen er gitt som under:

Hypotesen er aldri enig eller uenig med P-verdien. Resultatene av etterforskeren som er akseptable eller uakseptable med hensyn til hypotesen, evaluerer resultatene av Chi-kvadratobservasjonene. De 5 prosentpoengene (0-05) på bordet er vanligvis valgt som en vilkårlig standard for å bestemme betydning eller godhet av passform.

Tabellverdien av X 2 for 3 grad av frihet ved 5% nivå er 7, 82, en chi-kvadratverdi er 0, 47 som er lavere enn tabellverdien, og dermed er den riktig. Med andre ord kan det sies at en sannsynlighet ved 5% nivå av betydning er 7, 82 som er mer / større derfor er hypotesen riktig. Hvis det er mindre enn 5%, avvises det.

La oss ta et annet eksempel for å forstå bruken av chi-square tester. Genetisk teori sier at barn som har en forelder av blodtype A og den andre av blodtype B, alltid vil være av en av de tre typene A, AB, B og at andelen av de tre typene i gjennomsnitt vil være som 1: 2 :1. En prøve på 300 barn ble samlet - 30% ble funnet å være type A, 45% - type AB og resten -type B.

Tabellverdien X 2 for (3 - 1) 2d.f. ved 5% (0, 05) nivå av betydning er 5, 99. Den beregnede verdien av chi-kvadrat er 4, 5, som er mindre enn tabellverdien, og kan tilskrives å ha funnet sted på grunn av en feilfeil i eksperimentet. Dette støtter den teoretiske hypotesen om teorien om arv (segregering av alleler) at A, AB og B står i andelen 1: 2: 1.

Et annet eksempel i denne forbindelse er som følger:

Andelen av bønnen i fire grupper, nemlig A, B, C og D, skal være 9: 3: 3: 1. En bonde sådde 1600 bønner. Resultatene av hans eksperiment viser at i fire grupper er dataene 882 313 287 og 118. Støtter det eksperimentelle resultatet teorien om at de er i forholdet 9: 3: 3: 1?

Med null hypotesen om at eksperimentets resultater støtter teorien, er de forventede frekvensene:

9/10 x 1600, 3/16 x 1600, 3/16 x 1600, 1/16 x 1600 = 900 300 300 100

Og dermed:

Tabellverdien av X 2 for 3 df ved 5% nivå av betydning = 7, 815.

Siden den beregnede verdien av X 2 er mindre enn tabellverdien, kan hypotesen aksepteres og resultatene er i tråd med teorien.

Chi-square-testen brukes også til å bestemme om befolkningen er i Hardy-Weinberg Equilibrium.

En bruk av Hardy-Weinberg-metoden er å forutsi hyppigheten av individuelle homozygote for en skadelig recessiv allel. Disse forfatterne har oppdaget at en randommatingpopulasjon (panmictic) uten mutasjoner, ikke utvalgstrykk, ingen genetisk drift og ingen migrering, har de relative frekvensene til hvert gen (allel) en tendens til å forbli konstant fra generasjon til generasjon.

Loven forteller genotypefrekvenser til genfrekvenser i tilfeldig samlende populasjoner, allelenesegmentering på et gitt sted kan lett beregne de forventede genotypefrekvensene i den populasjonen. Dette kalles Hardy-Weinberg Law eller kalles ofte som lov for befolkningsvekt.

Når vi vet frekvensene av allelene i befolkningen, er det mulig å beregne frekvensene som genotypen vil være til stede i avkom fra den generasjonen. Befolkningen av seksuelt reproduserende diploide organismer på et sted med to alleler ved frekvensene p og q, etter en generasjon av tilfeldig parring, ville frekvensene av genotypen være AA, Aa og aa vil være p 2, 2pq, q 2 .

La oss ta et eksempel på at to alleler av genet AA dominerer mens aa dvs. allelene er recessive gen. Ifølge Mendels arveavtaler vil genotypeforholdet være 25% AA (homozygot dominant), 50 ville være Aa (heterozygot) og 25% ville være aa (homozygot recessiv).

Den statistiske formelen for denne loven er p 2 + 2pq + q 2 . Ifølge Mendels lover bør følgende være genetisk kombinasjon.

Dette viser at alleler forblir konstant fra generasjon til generasjon.

Bruken av chi-square test er litt annerledes når du søker om Hardy-Weinberg lov fordi den omhandler frekvenser av forventet genotype i stedet for tall. Graden av frihet er tatt n-2 i stedet for n-1.