Sturgregel

Sturgregel

Vi förklarar vad Sturges -regeln är, dess tillämpning och ger flera exempel

Vad är Sturges -regeln?

De Sturgregel Det är ett kriterium som används för att bestämma antalet klasser eller intervaller som är nödvändiga för att grafera en uppsättning statistiska data grafiskt. Denna regel anges 1926 av den tyska matematikern Herbert Sturges.

Sturges föreslog en enkel metod, baserad på antalet X -prover som tillät att hitta antalet klasser och deras räckvidd. Sturges -regel används allmänt framför allt inom statistikområdet, särskilt för att bygga frekvenshistogram.

Förklaring

Sturges -regeln är en empirisk metod som är allmänt använt i beskrivande statistik för att bestämma antalet klasser som måste existera i ett frekvenshistogram för att klassificera en uppsättning data som representerar ett prov eller en population.

I grund och botten bestämmer denna regel bredden på grafiska behållare, frekvenshistogram.

För att fastställa sin regel betraktas Herbert Sturges ett idealiskt frekvensdiagram, som består av K -intervaller, där i -detta intervall innehåller ett visst antal prover (i = 0, ... K - 1), representerad som:

Detta antal prover ges på antalet sätt på vilka en delmängd av en uppsättning kan extraheras; Det vill säga med binomialkoefficienten uttryckt på följande sätt:

Sedan relaterade Sturges att frekvenshistogrammet kommer att ungefärliga en normalfördelning när antalet intervaller (k) ökar enligt gränsens centrala teorem. På ett sådant sätt att antalet prover av vart och ett av intervallerna kan beräknas:

Det kan tjäna dig: ENEGON: Egenskaper, hur man gör en ENEGON, exempel

För att förenkla uttrycket använde han egenskaperna hos logaritmer i båda delarna av ekvationen:

Således konstaterade Sturges att det optimala antalet K -intervaller ges av uttrycket:

Det kan också uttryckas som:

I detta uttryck:

  • K är antalet klasser.
  • N är det totala antalet observationer i provet.
  • Log är den vanliga baslogaritmen 10.

För att utarbeta ett frekvenshistogram som uttrycker ett slumpmässigt prov av statusen på 142 barn är antalet intervall eller klasser som distributionen kommer att ha:

K = 1 + 3 322 * logga10 (N)

K = 1+3 322* Log (142)

K = 1+3 322* 2 1523

K = 8,14 ≈ 8

Således kommer distributionen att vara i 8 intervall.

Antalet intervall måste alltid representeras av hela siffror. I fall där värdet är decimal måste en tillnärmning göras till närmaste hela antalet.

Sturges regelapplikationer

Sturges -regeln tillämpas huvudsakligen i statistik, eftersom den möjliggör en frekvensfördelning genom beräkningen av antalet klasser (k), liksom längden på var och en av dessa, även känd som amplitud.

Amplituden är skillnaden i klassens övre och nedre gräns, dividerat med antalet klasser, och uttrycks:

Det finns många empiriska regler som tillåter en frekvensfördelning. Sturges -regeln används emellertid ofta eftersom den gör en tillnärmning av antalet klasser, som vanligtvis går från 5 till 15.

På detta sätt betraktar det ett värde som korrekt representerar ett prov eller befolkning; Det vill säga, tillvägagångssättet representerar inte extrema grupper, och det fungerar inte heller med ett överdrivet antal klasser som inte tillåter att sammanfatta provet.

Det kan tjäna dig: motsatta vinklar av toppunktet (med en löst övning)

Exempel

Ett frekvenshistogram måste genomföras enligt de givna uppgifterna, som motsvarar åldrar som erhållits i en undersökning av män som tränar i ett lokalt gymnastiksal.

För att bestämma intervallen bör provstorleken eller antalet observationer vara kända; I det här fallet finns det 30.

Då gäller Sturges -regeln:

K = 1 + 3 322 * logga10 (N)

K = 1+3 322* Log (30)

K = 1+3 322* 1 4771

K = 5,90 ≈ 6 intervall.

Från antalet intervaller kan du beräkna den amplitud som de kommer att ha; Det vill säga bredden på varje stapel representerad i frekvenshistogrammet:

Den nedre gränsen betraktas som det lägre värdet på data, och det övre är det högsta värdet. Skillnaden mellan den övre och nedre gränsen kallas variabeln eller rutten för variabeln (R).

Tabellen har att den övre gränsen är 46 och de nedre 13; På det sättet kommer amplituden för varje klass att vara:

Intervallen kommer att bestå av en övre och nedre gräns. För att bestämma dessa intervall börjar det med att räkna från den nedre gränsen, vilket lägger till detta amplituden bestäms av regel (6), enligt följande:

Sedan beräknas den absoluta frekvensen för att bestämma antalet män som motsvarar varje intervall; I det här fallet är det:

  • Intervall 1: 13 - 18 = 9
  • Intervall 2: 19 - 24 = 9
  • Intervall 3: 25 - 30 = 5
  • Intervall 4: 31 - 36 = 2
  • Intervall 5: 37 - 42 = 2
  • Intervall 6: 43 - 48 = 3

Genom att lägga till den absoluta frekvensen för varje klass måste detta vara lika med det totala antalet prov; I detta fall 30.

Kan tjäna dig: negativ homotecia

Därefter beräknas den relativa frekvensen för varje intervall, vilket delar upp den absoluta frekvensen för detta med det totala antalet observationer:

  • Intervall 1: FI = 9 ÷ 30 = 0,30
  • Intervall 2: FI = 9 ÷ 30 = 0,30
  • Intervall 3: FI = 5 ÷ 30 = 0,1666
  • Intervall 4: FI = 2 ÷ 30 = 0,0666
  • Intervall 5: FI = 2 ÷ 30 = 0,0666
  • Intervall 4: FI = 3 ÷ 30 = 0,10

Då kan du skapa en tabell som återspeglar data och även diagrammet från den relativa frekvensen i förhållande till de erhållna intervallerna, vilket kan ses i följande bilder:

På detta sätt tillåter Sturges -regeln att bestämma antalet klasser eller intervaller där ett prov kan delas för att sammanfatta ett dataprov genom utarbetande av tabeller och grafik.