Regra de Sturges Explicação, Aplicações e Exemplos



O Regra de Sturges é um critério usado para determinar o número de classes ou intervalos que são necessários para representar graficamente um conjunto de dados estatísticos. Esta regra foi enunciada em 1926 pelo matemático alemão Herbert Sturges.

Sturges propôs um método simples, baseado no número de amostras x que permitiria encontrar o número de classes e sua amplitude de amplitude. A regra de Sturges é amplamente usada especialmente na área de estatística, especificamente para construir histogramas de frequência.

Índice

  • 1 Explicação
  • 2 aplicações
  • 3 Exemplo
  • 4 referências

Explicação

A regra de Sturges é um método empírico amplamente utilizado em estatística descritiva para determinar o número de classes que devem existir em um histograma de frequência, para classificar um conjunto de dados que representam uma amostra ou população.

Basicamente, essa regra determina a largura dos contêineres gráficos, dos histogramas de frequência.

Para estabelecer sua regra, Herbert Sturges considerou um diagrama de freqüência ideal, que consiste em intervalos K, onde o intervalo i contém um certo número de amostras (i = 0, ... k - 1), representado como:

Esse número de amostras é dado pelo número de maneiras em que um subconjunto de um conjunto pode ser extraído; isto é, pelo coeficiente binomial, expresso da seguinte forma:

Então, Sturges relatou que o histograma de freqüência se aproximará de uma distribuição normal quando o número de intervalos (k) aumenta de acordo com o teorema do limite central. De tal forma que o número de amostras de cada um dos intervalos pode ser calculado:

Para simplificar a expressão, ele aplicou as propriedades dos logaritmos em ambas as partes da equação:

Assim, Sturges estabeleceu que o número ótimo de intervalos k é dado pela expressão:

Também pode ser expresso como:

Nesta expressão:

- k é o número de classes.

- N é o número total de observações na amostra.

- Log é o logaritmo da base comum 10.

Por exemplo, para produzir um histograma de frequência que expresse uma amostra aleatória da altura de 142 filhos, o número de intervalos ou classes que a distribuição terá é:

k = 1 + 3,322 * log10 (N)

k = 1 + 3,322* log (142)

k = 1 + 3,322* 2,1523

k = 8,14 ≈ 8

Assim, a distribuição será em 8 intervalos.

O número de intervalos deve sempre ser representado por inteiros. Nos casos em que o valor é decimal, uma aproximação deve ser feita para o número inteiro mais próximo.

Aplicações

A regra de Sturges é aplicada principalmente em estatística, pois permite realizar uma distribuição de freqüência através do cálculo do número de classes (k), bem como o comprimento de cada uma delas, também conhecida como amplitude.

A amplitude é a diferença do limite superior e inferior da classe, dividida pelo número de classes, e é expressa:

Existem muitas regras empíricas que permitem uma distribuição de frequência. No entanto, a regra Sturges é comumente usada porque aproxima o número de classes, que geralmente varia de 5 a 15.

Desta forma, considere um valor que represente adequadamente uma amostra ou população; isto é, a aproximação não representa agrupamentos extremos, nem trabalha com um número excessivo de classes que não permitem resumir a amostra.

Exemplo

É necessário realizar um histograma de frequência de acordo com os dados fornecidos, que correspondem às idades obtidas em uma pesquisa com homens que fazem exercícios em uma academia local.

Para determinar os intervalos, você deve saber qual é o tamanho da amostra ou o número de observações; Neste caso, você tem 30.

Então a regra Sturges se aplica:

k = 1 + 3,322 * log10 (N)

k = 1 + 3,322* log (30)

k = 1 + 3,322* 1,4771

k = 5,90 ≈ 6 intervalos.

A partir do número de intervalos, você pode calcular a amplitude que eles terão; isto é, a largura de cada barra representada no histograma de frequência:

O limite inferior é considerado o valor mais baixo dos dados e o limite superior é o valor mais alto. A diferença entre o limite superior e inferior é chamada de intervalo ou caminho da variável (R).

Da tabela, temos que o limite superior é 46 e o ​​limite inferior 13; Dessa forma, a amplitude de cada classe será:

Os intervalos serão compostos de um limite superior e inferior. Para determinar esses intervalos, comece a contar a partir do limite inferior, adicionando a amplitude determinada pela regra (6), como segue:

Então a freqüência absoluta é calculada para determinar o número de homens correspondentes a cada intervalo; neste caso é:

- Intervalo 1: 13 - 18 = 9

- Intervalo 2: 19 - 24 = 9

- Intervalo 3: 25 - 30 = 5

- Intervalo 4: 31 - 36 = 2

- Intervalo 5: 37 - 42 = 2

- Intervalo 6: 43 - 48 = 3

Ao adicionar a frequência absoluta de cada classe, ela deve ser igual ao número total da amostra; neste caso, 30.

Subsequentemente, calcula-se a frequência relativa de cada intervalo, dividindo a frequência absoluta desse intervalo pelo número total de observações:

- Intervalo 1: fi = 9 ÷ 30 = 0,30

- Intervalo 2: fi = 9 ÷ 30 = 0,30

- Intervalo 3: fi = 5 ÷ 30 = 0,1666

- Intervalo 4: fi = 2 ÷ 30 = 0,0666

- Intervalo 5: fi = 2 ÷ 30 = 0,0666

- Intervalo 4: fi = 3 ÷ 30 = 0,10

Então você pode fazer uma tabela que reflete os dados, e também o diagrama da frequência relativa em relação aos intervalos obtidos, como pode ser visto nas seguintes imagens:

Desta forma, a regra Sturges permite determinar o número de classes ou intervalos em que uma amostra pode ser dividida, a fim de resumir uma amostra de dados através da preparação de tabelas e gráficos.

Referências

  1. Alfonso Urquía, M. V. (2013). Modelagem e Simulação de Eventos Discretos. UNED,.
  2. Altman Naomi, M. K. (2015). "Regressão Linear Simples." Métodos da Natureza.
  3. Antúnez, R. J. (2014). Estatísticas em educação. UNID Digital.
  4. Fox, J. (1997). Análise de Regressão Aplicada, Modelos Lineares e Métodos Relacionados. Publicações SAGE.
  5. Humberto Llinás Solano, C. R. (2005). Estatísticas descritivas e distribuições de probabilidade. Universidade do Norte.
  6. Panteleeva, O. V. (2005). Fundamentos de Probabilidade e Estatística.
  7. O. Kuehl, M. O. (2001). Desenho de Experimentos: Princípios Estatísticos de Projeto e Análise de Pesquisa. Thomson Publishers.