5 Metoder for å avdekke frekvensfordeling

Følgende metoder brukes ofte til å skildre frekvensfordeling i grafisk form: 1. Histogram eller kolonnediagram 2. Bardiagram eller Bardiagram 3. Frekvenspolygon 4. Glatt Frekvenspolygon 5. Piediagram.

Metode # 1. Histogram eller kolonnediagram:

Det er en av de mest populære og allment brukte møtene hadde å presentere en frekvensfordeling. Et histogram er et sett med rektangler hvis områder er i forhold til klassefrekvenser. Det er en graf hvor frekvensene er representert av stolper. Histogrammet vises som en serie bardiagrammer plassert en ved siden av den andre vertikalt.

Legg merke til følgende egenskaper i histogrammet:

(i) Frekvenser er langs den vertikale akse og scoreene (CI) er langs den horisontale akse.

(ii) En antar at poengsumene er jevnt fordelt i klasseintervallet, og gir oss rektangulære stenger.

(iii) Frekvensene innenfor hvert intervall av et histogram er representert ved et rektangel, størrelsen på intervallet er basen og frekvensen av dette intervallet høyden.

(iv) Arealet av hvert rektangel i et histogram tilsvarer frekvensen innenfor et gitt intervall, mens det totale arealet av et histogram tilsvarer totalfrekvensen (N) for fordelingen.

(v) Et histogram kan best konstrueres på et grafpapir, som styres med like mellomrom horisontale og vertikale linjer.

La oss se hvordan histogrammet for frekvensfordelingen kan bygges i to situasjoner, dvs. når klassenes intervaller er like og når klasseintervallene er ulige.

Histogram (lik klasseintervall):

Trinn 1:

I tabell 2.12 er inkluderende klasser gitt, og som et første skritt bør disse omregnes til klasser med ekte eller virkelige klassegrenser som angitt i den andre kolonnen i samme tabell.

Steg 2:

Generelt er en ledig klasse også tillatt i hver ende av klassene og reflekteres i to ekstreme ender av horisontal skala, dvs. 9, 5 og 99, 5 (se figur 2.1). Dette forbedrer lesbarheten av grafen og er også nyttig ved konstruksjon av en frekvenspolygon.

Step-3:

Da blir disse sanne klassegrenser plottet sammen med den horisontale akse (X-akse) ved hjelp av en passende målestokk. For å gi symmetri og balanse til histogram eller grafisk representasjon, må man være forsiktig når man velger avstandsavstander for å representere klassegrense på X-aksen og frekvensene på Y-aksen.

For å representere disse avstandene, måles skalaene på to akser slik at høyden på histogrammet eller annen grafisk presentasjon er omtrent 75 prosent av bredden.

Step-4:

Når den nedre grensen skjer for å være en fjern score fra opprinnelsen, gi en pause i X-aksen (∫∫) for å indikere at den vertikale aksen har blitt flyttet inn for enkelhets skyld. Start deretter X-aksen med den nedre grensen for det laveste klasseintervallet.

Et histogram som representerer frekvensfordelingen av score i tabell 2.12 er vist i figur 2.1. I denne figuren er høyden av rektangelet dannet over klasse 19.5-29.5 4 enheter langs den vertikale skalaen og som sådan blir området 4 x 1 = 4 kvadrat enheter, som er lik frekvensen til klassen. Tilsvarende blir høyden av andre rektangler dannet over påfølgende klasser tatt som henholdsvis 6, 8, 12, 9, 7 og 4.

Histogram (Ulike klasseintervall):

For å ta et eksempel, la oss tilfeldig gruppere 150 - 154 og 155-159 i en klasse som 150 - 159 * og 185 - 189 og 190 - 194 i en klasse som 185 - 194 ** i tabell 2.13.

Klasseintervallet i fjerde og tiende klasse er to ganger det andre av klassene. Dermed er frekvensene i disse to klassene ikke sammenlignbare med andre klasser. For å oppnå denne sammenligneligheten, bør frekvensene i de større klassene halveres eller deles med to.

Således, før de danner histogram for frekvensfordeling med ulik klasseintervall, skal alle større klasser uttrykkes som multipler av mindre klasser; og delte deretter de tilsvarende klassefrekvensene av disse multiplene.

Denne delen gir da høyden på rektangler som vist i tabell 2.14. Imidlertid vil høyder av andre rektangler dannet over klasser av enhetslengder forblir lik tilsvarende klassefrekvenser. Frekvensfordelingen av score i tabell 2.14 er reflektert i figur 2.3.

Fordeler:

1. Det er enkelt og enkelt laget.

2. Alle fordelene ved den grafiske representasjonen som vist tidligere gjelder her.

begrensninger:

1. Det er vanskelig å overlegge mer enn ett histogram på samme graf.

2. Sammenligninger av flere frekvensfordeler kan ikke lett gjøres via histogrammer. Frekvenspolygoner er mye bedre egnet til det formålet.

3. Forutsetningen om at poengene er jevnt fordelt innenfor CI, gir en større feil når N er liten enn når N er stor.

4. Det kan ikke glattes ut.

Metode nr. 2. Bardiagram eller Bardiagram:

Bardiagram er en av de enkleste og mest brukte enhetene til å presentere diskrete seriedata. Disse er spesielt tilfredsstillende for kategoriske data eller serier. De består av en gruppe av likevektige rektangler, en for hver gruppe eller kategori av dataene der verdiene eller størrelsene er representert av lengden eller høyden av rektanglene, rektanglernes bredde er vilkårlig og uvæsentlig.

Disse diagrammene kalles endimensjonal fordi i slike diagrammer bare er det tatt hensyn til en dimensjon, høyden (eller lengden) av rektanglene for å presentere de angitte verdiene.

Følgende punkter kan bli tatt i betraktning for å tegne strekkdiagrammer:

(i) Alle stengene som er tegnet i en enkelt undersøkelse, skal være av ensartet (men vilkårlig) bredde avhengig av antall stenger som skal trekkes og plass tilgjengelig.

(ii) Riktig, men jevn avstand bør gis mellom forskjellige stenger for å gjøre diagrammet mer attraktivt og elegant.

(iii) Høyden (lengden) av rektanglene eller stolpene er tatt proporsjonal med observasjonsstørrelsen, idet skalaen velges, med sikte på størrelsen på den største observasjonen.

(iv) Alle stolper skal bygges på samme basislinje.

(v) Det er ønskelig å skrive tallene (størrelser) representert av stolpene på toppen av stolpene for å gjøre det mulig for leseren å ha en presis ide om verdien uten å se på skalaen.

(vi) Stenger kan trekkes vertikalt eller horisontalt. I praksis brukes imidlertid vertikale stenger vanligvis fordi de gir en attraktiv og tiltalende oppstigning.

(vii) Barene skal så langt som mulig være ordnet fra venstre til høyre (fra topp til bunn ved horisontale stenger) i størrelsesorden for å gi en behagelig effekt.

I en bestemt by er totalt antall skoler 24 og ledelsesmessige fordeling av skoler som vist i tabell 2.15.

For en diskret variabel er måleenheten på den horisontale akse ikke viktig. Hverken er klassene knyttet til hverandre. Så stengene er like fordelt og har like bredde på den horisontale aksen.

Imidlertid er høyden på stolpene forholdsmessige til de respektive frekvensene. Bardiagrammer brukes ofte til bildefremvisning av diskrete data. Hvis to variabler blir brukt samtidig, kan også bardiagrammer være ganske effektive.

For eksempel, hvis sammen med det totale antall skoler (ledelsesmessige) antall gutteskoler, jenterskoler og samordnede skoler også skal angis, kan dette gjøres på samme grafpapir ved å bruke forskjellige farger, hver som indikerer den seksuelle kategorien. For hver ledelse vil det være 4 barer med forskjellige farger som indikerer forskjellige kategorier.

Metode # 3. Frekvenspolygon:

En polygon er en mangevinklet nær figur. Frekvenspolygonen er en grafisk fremstilling av frekvensfordeling der midtpunktene til CI er plottet mot frekvensene.

La oss diskutere hvordan du tegner en frekvenspolygon:

Trinn 1:

Tegn to rette linjer vinkelrett på hverandre, den vertikale linjen nær venstre side av papiret, den horisontale linjen nær bunnen. Merk den vertikale linjen (Y-aksen) OY, og den horisontale linjen (X-aksen) OX. Sett O hvor de to linjene krysser. Dette punktet er opprinnelsen.

For å gi symmetri og balanse til polygonen, må det utvises forsiktighet ved valg av enhetavstander på begge aksene. En god generell regel er å velge X- og Y-enheter som vil gjøre tallene i figuren omtrent 75% av bredden.

Steg 2:

Neste må indikere midtpunktene til CI på den horisontale aksen, i stedet for å angi grensen til integralet. Her skal midtpunktet for intervaller like før det laveste intervallet og like etter det høyeste intervallet også angis (midtpunktene 137 og 202 i tabell 2.16). Langs den vertikale linjen merker du av enhetene for å representere frekvensene av klasseintervallene.

Step-3:

På midtpunktet av hvert intervall på X-aksen går opp i Y-retningen en avstand som er lik antall poeng på intervallet. Plasser poeng på disse stedene.

Step-4:

Etter å ha plottet alle punktene på graffogen, peker disse på en rekke korte rette linjer for å danne frekvenspolygonen.

Metode # 4. Glatt Frekvens Polygon:

En frekvenspolygon bør glattes:

Jeg. Å stryke ut uregelmessigheter;

ii. For å få bedre forståelse av hvordan figuren kan se ut om dataene var flere tallrike;

iii. Å vite hvordan et polygon ville se ut hvis gruppering feil og prøvetakingsfeil blir fjernet fra det, og

iv. For å fastslå hvilken form det ville ta hvis det representerer forhold frilagt fra mindre uhellssvingninger.

Ved utjevning av en frekvenspolygon tas en rekke bevegelige eller løpende gjennomsnitt, hvorfra nye eller justerte frekvenser bestemmes. For å finne en justert eller jevnlig f, legg til f i det angitte intervallet og f s på de to tilstøtende intervaller (intervallet bare under og intervallet over) og del dem med 3.

For eksempel er den glattede f for intervall 170-174 i 2, 17 Tabell (8 + 10 + 6) / 3 eller 8, 00. For å finne den glattede f s for de to intervaller i ytterkantene av fordelingen, nemlig 140-144 og 195-199, er det en litt annen prosedyre som er nødvendig. Først legger vi til 0, f på trinnintervallet under eller over, til f i det angitte intervallet og til f i det tilstøtende intervallet, og dividerer med 3. Den glatte f for 140-144 er (0 + 1 + 3) / 3 er eller 1, 33; og den glatte f for 195-199 er (2 + 1 + 0) / 3 eller 1, 00.

Vi må ta to CI på 135-139 og den andre 200-204, for hvilken f er tatt som 0. Deres glatte f i hvert tilfelle er (0 + 0 + 1) / 3 eller .33 og (0 + 0 + 1) / 3 eller .33. Inkluderingen av disse to siste intervaller gjør N = 50, 00 for glatt distribusjon.

Hvis N er stor, kan utjevning ikke i stor grad endre formen på en graf, og er derfor ofte unødvendig.

Fordeler:

(i) Det er enkelt og enkelt laget.

(Ii) Det er mulig å overordne mer enn en frekvenspolygon på samme graf ved å bruke fargede linjer, ødelagte linjer, stiplede linjer etc.

(iii) Sammenligninger av flere frekvensfordeler kan lett gjøres via frekvenspolygoner.

(iv) Alle fordelene med den grafiske representasjonen som diskutert tidligere gjelder her.

(v) Det kan glattes. Begrensninger.

begrensning:

(ii) Den delen av området som ligger over et gitt intervall kan ikke tas som proporsjonal med frekvensen av det CI på grunn av uregelmessigheter i frekvensoverflaten.

(Ii) Forutsetningen om at alle scoreene innenfor et CI faller midt på det intervallet, gir en større feil når N er større enn når N er liten.

(Iii) Det er mindre presist enn histogrammet ved at det ikke representerer nøyaktig, dvs. i forhold til område, frekvensen på hvert intervall.

Den kumulative frekvensgrafen:

Den kumulative frekvensgrafen er en annen måte å representere en frekvensfordeling ved hjelp av et diagram. Før vi kan plotte en kumulativ frekvensgraf, må delene av fordelingen legges til serielt eller kumulert, som vist i tabell 2.18.

For å bestemme Cum.f for hver rad må vi fortsette å legge fs gradvis fra bunnen. For å illustrere, i fordelingen av score er den første kumulative frekvensen 1; 1 + 3, fra den nedre delen av fordelingen, gir 4 som neste oppføring; 4 + 2 = 6; 6 + 4 = 10, etc. Den siste kumulative / er likevel, selvfølgelig, til 50 eller N, den totale frekvensen.

Ved plotting av frekvenspolygonen blir frekvensen på hvert intervall tatt midt på klassens intervall. Men ved konstruksjon av en kumulativ frekvenskurve er hver kumulativ frekvens plottet ved den eksakte øvre grensen for intervallet som den faller på.

Dette skyldes at man gradvis legger fra hver bunn opp hver kumulative frekvensbærer gjennom til den eksakte øvre grensen for klasseintervallet. Med en valgt skala, hvis vi tar de øvre grensene til ci langs X-aksen og tar Cumf s langs Y-aksen, kan vi tegne en graf for kumulativ frekvensfordeling.

I en kumulativ frekvenskurve er hver kumulativ frekvens plottet i øvre grense av intervallet. For å få kurven til å begynne på X-aksen begynner den på 139, 5 (eksakt øvre grense på 134, 5-139, 5), hvis kumulative frekvens er 0.

Den kumulative prosentkurven eller Ogive:

Ved å tegne en 'Ogive' må vi beregne de kumulative prosentfrekvensene i øvre grense for hver ci 'Kumulativ prosentfrekvens', hvilken prosent av N er Cum- f . Den kumulative prosentandelen kurve eller ogiv er forskjellig fra den kumulative frekvensgrafen i at frekvensene uttrykkes som kumulative prosent av N på Y-aksen i stedet for som kumulative frekvenser. Tabell 2.19 viser hvordan kumulative frekvenser kan omdannes til prosent av N.

I kolonnene (1), (2) og (3) klasseintervaller er øvre grenser for ci og frekvenser oppført; og i kolonne (4) har f s blitt kumulert fra den nedre delen av fordeling oppover. Disse Cum- f er uttrykt som prosentandel av N i kolonne (5). Konvertering av Cumf s til kumulative prosent kan utføres ved å dividere hver kumulativ / ved N; f.eks. 2 + 40 = .05, 6 + 40 = .15, og så videre.

En bedre metode - spesielt når en beregningsmaskin er tilgjengelig - for å bestemme først gjensidig. 1 / N, kalt hastigheten, og formere hver kumulativ f i rekkefølge av denne brøkdelen. Som vist i tabell 2.19 er frekvensen 1/40 eller .025. Dermed multipliserer 2 med .025, får vi .05 eller 5%; 6 X. 025 =. 15 eller 15%, etc.

Kurven i figur 2.8 representerer en ogiv avbildet fra dataene i kolonne (5), tabell 2.19. De eksakte intervallgrensene er lagt av på X-aksen, og en skala som består av 10 like avstander, som hver representerer 10% av fordelingen, er merket av på Y-aksen. Det første punktet på ogiven er plassert 5 Y-enheter like over 35, 5. Det siste punktet er 100 Y enheter over 56, 5 eksakt øvre grense for høyeste klasseintervall.

Fra ogiv kan vi lese PR. av forskjellige poeng og også prosentene:

(a) Lesing av prosentiler fra den ogive:

Anta at vi vil finne ut P 2 5- Som vi vet, er P 25 et punkt under hvilke 25% av tilfellene ligger. La oss finne 25 på Y-aksen og deretter tegne en horisontal linje fra dette punktet. Det vil møte ogive på et tidspunkt.

Fra dette punkt tegne en vinkelrett på X-aksen. Fra X-aksen kan vi lese poengsummen. Fra ogiv kan vi lese at P 2 5 = 41, 5. På samme måte kan vi lese at P 50 = 46.7 og P 75 = 49. Vi kan lese andre prosentiler på samme måte fra ogive.

(b) Lesing av prosentvis rangering av score:

Anta at vi vil vite at PR på en score på 53, 5. Vi må finne denne poengsummen på X-aksen og tegne en vertikal linje fra dette punktet. Linjen vil møte ogive på et tidspunkt hvorfra vi kan tegne en horisontal linje til venstre, og denne linjen vil møte Y-aksen på et punkt. Vi kan lese cum% f på dette punktet. Denne cum% / verdien er PR. av poengsummen.

Dermed kan vi lese at:

PR av en poengsum, 40 = 20

PR av en poengsum, 53 = 90.

Vi kan lese PRs av en hvilken som helst annen score fra den ogive på samme måte.

Metode nr. 5. Pie diagram:

Pie diagrammer er svært populært brukt til å indikere prosentvis sammenbrudd. Den er såkalt fordi hele grafen ser ut som en kake, og kakens komponenter ligner skiver kuttet fra kaken. Den presenterer prosentandeler og ikke absolutte tall.

Pie diagrammer er svært nyttig i å vise utgifter til en Govt, eller av et selskap etc. fordelt over ulike hoder. Det brukes også i undervisning i geografi, vitenskap, etc.

Følgende trinn kan følges ved konstruksjon av et diagram:

1. Tegn en sirkel av passende størrelse med et kompass. Størrelsen på radius avhenger av ledig plass og andre faktorer.

2. Forbered dataene i form av% under forskjellige hoder. Disse% for ulike sektorer skal gjennomføres i tilsvarende grader i sirkelen.

Til dette formål må vinkelenes verdi for hver underdel finne ut. Vi vet at verdien av alle vinklene på et hvilket som helst punkt er lik 360 °, dvs. hele sirkelen er 360 ° som representerer 100%. Således betyr en% 360 ° / 100 = 3, 6 °.

Følgende formel vil derfor gjelde for å finne vinkelverdien for hver undergruppe:

3. Anta at det er 3 komponenter med verdien 60% som høypresterende, 25% som midtprester og 15% som lavpresterende. Derfor bør de representere 216 ° (60 x 3.6 °), 90 ° (25 x 3.6 °) og 54 ° (15 x 3.6 °).

4. Når verdiene av alle vinklene er blitt bestemt, kan deres totale ikke være nøyaktig 360 ° på grunn av tilnærming. Hvis dette er tilfelle, må noen av vinkelverdien bli litt justert for å gjøre summen tilsvarer 360 °.

5. Mål punktene på sirkelen for å representere størrelsen på hver sektor ved hjelp av en grader. Det er vanlig å ordne sektorene etter størrelse, med den største sektoren øverst og andre i

sekvens kjører med klokken. Sektorene kan merkes. Etikettene kan plasseres innenfor sektoren eller utenfor sirkelen.