Medidas de tendência central para dados agrupados



O medidas de tendência central de dados agrupados Eles são usados ​​em estatísticas para descrever certos comportamentos de um grupo de dados fornecidos, tais como o valor que estão perto, que é a média dos dados coletados, entre outros.

Quando uma grande quantidade de dados é obtida, é útil agrupá-los para ter uma ordem melhor deles e, assim, ser capaz de calcular certas medidas de tendência central.

Entre as medidas de tendência central mais utilizadas estão a média aritmética, a mediana e o modo. Esses números dizem certas qualidades sobre os dados coletados em um determinado experimento.

Para usar essas medidas, é necessário primeiro saber como agrupar um conjunto de dados.

Dados agrupados

Para agrupar os dados primeiro, você deve calcular o intervalo dos dados, que é obtido subtraindo o valor mais alto menos o valor mais baixo dos dados.

Em seguida, escolha um número "k", que é o número de classes nas quais você deseja agrupar os dados.

Continuamos dividindo o intervalo entre "k" para obter a amplitude das classes a serem agrupadas. Esse número é C = R / k.

Finalmente, o agrupamento é iniciado, para o qual é escolhido um número menor do que o menor valor dos dados obtidos.

Este número será o limite inferior da primeira classe. Para isso é adicionado C. O valor obtido será o limite superior da primeira classe.

Então, C é adicionado a este valor e o limite superior da segunda classe é obtido. Desta forma, prosseguimos até obtermos o limite superior da última classe.

Depois que os dados forem agrupados, você poderá calcular a média, a mediana e o modo.

Para ilustrar como a média aritmética, a mediana e o modo são calculados, procederemos com um exemplo.

Exemplo

Agrupe os seguintes dados em 4 classes.Ao calcular o intervalo, você percebe que isso é R = 9-1 = 8. A amplitude das classes é C = R / k = 8/4 = 2.

Portanto, ao agrupar os dados, você obterá uma tabela como a seguinte:

As 3 principais medidas de tendência central

Agora vamos continuar a calcular a média aritmética, a mediana e o modo. O exemplo anterior será usado para ilustrar esse procedimento.

1- Média aritmética

A média aritmética consiste em multiplicar cada frequência pela média do intervalo. Em seguida, todos esses resultados são adicionados e, finalmente, ele é dividido entre os dados totais.

Usando o exemplo anterior, seria obtido que a média aritmética é igual a:

(4*2 + 4*4 + 6*6 + 4*8) / 18 = (8+16+36+32)/18 = 5,11111

Isso indica que o valor médio dos dados na tabela é 5.11111.

2- Médio

Para calcular a mediana de um conjunto de dados, todos os dados são ordenados primeiro do menor para o maior. Dois casos podem ser apresentados:

- Se o número de dados for ímpar, a mediana é os dados que estão no centro.

- Se o número de dados for par, a mediana é a média dos dois dados que permanecem no centro.

Quando se trata de dados agrupados, o cálculo da mediana é feito da seguinte maneira:

- N / 2 é calculado, onde N é o total de dados.

- o primeiro intervalo em que a frequência cumulativa (frequência de soma) é maior do que N / 2 é procurada, e o limite inferior da referida gama é seleccionado, chamado Li.

A mediana é dada pela seguinte fórmula:

Eu = Li + (Ls-Li) * (N / 2 - Frequência acumulada antes de Li) / Frequência de [Li, Ls)

Ls é o limite superior do intervalo mencionado acima.

Se a tabela de dados acima for usado, ele tem a N / 2 = 18/2 = 9. frequências cumulativas são 4, 8, 14 e 18 (um para cada linha da tabela).

Portanto, o terceiro intervalo deve ser selecionado, uma vez que a freqüência acumulada é maior que N / 2 = 9.

Então Li = 5 e Ls = 7. Aplicando a fórmula descrita acima, você precisa:

Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 �5,3333.

3- moda

Moda é o valor que tem mais frequência entre todos os dados agrupados; ou seja, é o valor que é repetido na maioria das vezes no conjunto de dados inicial.

Quando você tem uma quantidade muito grande de dados, a fórmula a seguir é usada para calcular o modo dos dados agrupados:

Mo = Li + (LS-Li) * (frequência Li - Frequência G (i-1)) / ((frequência Li - Frequência G (i-1)) + (frequência Li - Frequência G ( i + 1)))

O intervalo [Li, Ls) é o intervalo em que a frequência mais alta é encontrada. Para o exemplo feito neste artigo, temos que a moda é dada por:

Mo = + 5 (7-5) * (6-4) / ((4/6) + (4/6)) = 5 + 2 * 2/4 = 5 + 1 = 6.

Outra fórmula que é usada para obter um valor aproximado para moda é o seguinte:

Mo = Li + (Li-ls) * (L frequência (i + 1)) / (frequência de G (i-1) G frequência (i + 1)).

Com esta fórmula, as contas são as seguintes:

Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.

Referências

  1. Bellhouse, D. R. (2011). Abraham De Moivre: preparando o cenário para a probabilidade clássica e suas aplicações. CRC Press.
  2. Cifuentes, J. F. (2002). Introdução à teoria da probabilidade. Univ. Nacional da Colômbia.
  3. Daston, L. (1995). Probabilidade Clássica no Iluminismo. Princeton University Press.
  4. Larson, H. J. (1978). Introdução à teoria das probabilidades e inferência estatística. Editorial Limusa.
  5. Martel, P.J., & Vegas, F. J. (1996). Probabilidade e estatística matemática: aplicações na prática clínica e na gestão em saúde. Ediciones Díaz de Santos.
  6. Vázquez, A. L., & Ortiz, F. J. (2005). Métodos estatísticos para medir, descrever e controlar a variabilidade. Ed. Universidade da Cantábria.
  7. Vázquez, S. G. (2009). Manual de Matemática para acesso à Universidade. Centro Editorial de Estudos Ramon Areces SA.