Ang panuntunan Sturges ay isang criterion na ginamit upang matukoy ang bilang ng mga klase o saklaw na kinakailangan para sa pag-plot ng isang hanay ng data ng istatistika. Ang panuntunang ito ay binigkas noong 1926 ng German matematika na si Herbert Sturges.
Ang mga sturge ay nagmungkahi ng isang simpleng pamamaraan, batay sa bilang ng mga sample x na magpapahintulot sa amin na mahanap ang bilang ng mga klase at ang kanilang lapad ng saklaw. Ang panuntunan ng Sturges ay malawakang ginagamit, lalo na sa lugar ng mga istatistika, partikular na bumuo ng mga histograms ng dalas.

Pagpapaliwanag
Ang panuntunan ng mga sturges ay isang pamamaraan ng empirikal na malawakang ginagamit sa mga istatistika na naglalarawan upang matukoy ang bilang ng mga klase na dapat na umiiral sa isang dalas na histogram, upang maiuri ang isang hanay ng data na kumakatawan sa isang sample o populasyon.
Karaniwan, ang patakaran na ito ay tumutukoy sa lapad ng mga lalagyan ng graphic, ng mga dalas na histograms.
Upang maitaguyod ang kanyang panuntunan Herbert Sturges na itinuturing na isang mainam na diagram ng dalas, na binubuo ng mga agwat ng K, kung saan ang agwat ng i-ika ay naglalaman ng isang tiyak na bilang ng mga sample (i = 0, … k - 1), na kinakatawan bilang:

Ang bilang ng mga sample ay ibinibigay ng bilang ng mga paraan kung saan maaaring makuha ang isang subset ng isang set; iyon ay, sa pamamagitan ng koepisyent ng binomial, na ipinahayag bilang mga sumusunod:


Upang gawing simple ang expression, inilapat niya ang mga katangian ng logarithms sa parehong mga bahagi ng equation:

Kaya, itinatag ng Sturges na ang pinakamainam na bilang ng mga agwat k ay ibinibigay ng expression:

Maaari rin itong maipahayag bilang:

Sa expression na ito:
- k ang bilang ng mga klase.
- N ang kabuuang bilang ng mga obserbasyon sa halimbawang.
- Ang log ay ang karaniwang logarithm ng base 10.
Halimbawa, upang bumuo ng isang dalas na histogram na nagpapahiwatig ng isang random na sample ng 142 na taas ng mga bata, ang bilang ng mga agwat o mga klase na magkakaroon ng pamamahagi ay:
k = 1 + 3.322 * mag- log 10 (N)
k = 1 + 3,322 * mag- log (142)
k = 1 + 3.322 * 2.1523
k = 8.14 ≈ 8
Kaya, ang pamamahagi ay nasa 8 agwat.
Ang bilang ng mga agwat ay dapat palaging kinakatawan ng buong mga numero. Sa mga kaso kung saan ang halaga ay perpekto, isang pagtatantya ay dapat gawin sa pinakamalapit na buong numero.
Aplikasyon
Ang panuntunan ng mga sturges ay inilalapat lalo na sa mga istatistika, dahil pinapayagan nito ang isang pamamahagi ng dalas na gawin sa pamamagitan ng pagkalkula ng bilang ng mga klase (k), pati na rin ang haba ng bawat isa sa mga ito, na kilala rin bilang malawak.
Ang amplitude ay ang pagkakaiba-iba ng itaas at mas mababang limitasyon ng klase, na hinati sa bilang ng mga klase, at ipinahayag:

Maraming mga patakaran ng hinlalaki na nagbibigay-daan sa paggawa ng isang pamamahagi ng dalas. Gayunpaman, ang panuntunan ng Sturges ay karaniwang ginagamit sapagkat tinataya nito ang bilang ng mga klase, na sa pangkalahatan ay saklaw mula 5 hanggang 15.
Kaya, isinasaalang-alang ang isang halaga na sapat na kumakatawan sa isang sample o populasyon; iyon ay, ang pagtatantya ay hindi kumakatawan sa matinding pagsasama, at hindi rin ito gumagana sa isang labis na bilang ng mga klase na hindi pinapayagan ang buod na buod.
Halimbawa
Ang isang dalas na histogram ay kailangang gawin ayon sa data na ibinigay, na nauugnay sa mga edad na nakuha sa isang survey ng mga kalalakihan na nag-eehersisyo sa isang lokal na gym.

Upang matukoy ang mga agwat, dapat malaman ng isang tao ang laki ng sample o ang bilang ng mga obserbasyon; sa kasong ito, mayroong 30.
Kung gayon ang panuntunan ni Sturges ay nalalapat:
k = 1 + 3.322 * mag- log 10 (N)
k = 1 + 3,322 * log (30)
k = 1 + 3.322 * 1.4771
k = 5.90 ≈ 6 na agwat.
Mula sa bilang ng mga agwat, ang laki ng mga ito ay maaaring kalkulahin; iyon ay, ang lapad ng bawat bar na kinakatawan sa dalas na histogram:

Ang mas mababang limitasyon ay itinuturing na pinakamaliit na halaga ng data, at ang itaas na limitasyon ay ang pinakamalaking halaga. Ang pagkakaiba sa pagitan ng itaas at mas mababang mga limitasyon ay tinatawag na saklaw o saklaw ng variable (R).
Mula sa talahanayan mayroon kaming na ang itaas na limitasyon ay 46 at ang mas mababang limitasyon ay 13; sa gayon, ang tindi ng bawat klase ay:

Ang mga agwat ay binubuo ng isang itaas at isang mas mababang limitasyon. Upang matukoy ang mga agwat na ito, nagsisimula kami sa pamamagitan ng pagbibilang mula sa mas mababang limitasyon, pagdaragdag sa ito ng malawak na tinutukoy ng panuntunan (6), sa sumusunod na paraan:

Pagkatapos ang ganap na dalas ay kinakalkula upang matukoy ang bilang ng mga kalalakihan na naaayon sa bawat agwat; sa kasong ito ito ay:
- Interval 1: 13 - 18 = 9
- Interval 2: 19 - 24 = 9
- Interval 3: 25 - 30 = 5
- Interval 4: 31 - 36 = 2
- Interval 5: 37 - 42 = 2
- Interval 6: 43 - 48 = 3
Kapag nagdaragdag ng ganap na dalas ng bawat klase, dapat itong maging katumbas sa kabuuang bilang ng mga sample; sa kasong ito, 30.
Kasunod nito, ang kamag-anak na dalas ng bawat pagitan ay kinakalkula, na naghahati sa ganap na dalas nito sa pamamagitan ng kabuuang bilang ng mga obserbasyon:

- Interval 1: fi = 9 ÷ 30 = 0.30
- Interval 2: fi = 9 ÷ 30 = 0.30
- Interval 3: fi = 5 ÷ 30 = 0.1666
- Interval 4: fi = 2 ÷ 30 = 0.0666
- Interval 5: fi = 2 ÷ 30 = 0.0666
- Interval 4: fi = 3 ÷ 30 = 0.10
Pagkatapos ay maaari kang gumawa ng isang talahanayan na sumasalamin sa data, at din ang diagram mula sa kamag-anak na dalas na nauugnay sa mga agwat na nakuha, tulad ng makikita sa mga sumusunod na larawan:


Sa ganitong paraan, pinapayagan ng panuntunan ng Sturges na matukoy ang bilang ng mga klase o agwat kung saan ang isang sample ay maaaring mahati, upang mabuo ang isang sample ng data sa pamamagitan ng pagpaliwanag ng mga talahanayan at grap.
Mga Sanggunian
- Alfonso Urquía, MV (2013). Pagmomodelo At Simulation Ng Mga Kaganapan sa Diskrin. UNED ,.
- Altman Naomi, MK (2015). "Simpleng Linear Regression." Mga Paraan ng Kalikasan.
- Antúnez, RJ (2014). Mga istatistika sa edukasyon. Digital UNIT.
- Fox, J. (1997.). Inilapat na Regression Analysis, Linear Models, at Mga Kaugnay na Pamamaraan. Mga Lathalain sa SAGE.
- Humberto Llinás Solano, CR (2005). Mga istatistika ng paglalarawan at pagbabahagi ng posibilidad. Northern University.
- Panteleeva, OV (2005). Mga Batayan ng Posible at Statistics.
- O. Kuehl, MO (2001). Disenyo ng mga Eksperimento: Mga Prinsipyo ng Estatistika ng Disenyo ng Pananaliksik at Pagsusuri. Mga Editors ng Thomson.
