Medidas de tendência central para dados agrupados
O medidas de tendência central de dados agrupados Eles são usados em estatísticas para descrever certos comportamentos de um grupo de dados fornecidos, tais como o valor que estão perto, que é a média dos dados coletados, entre outros.
Quando uma grande quantidade de dados é obtida, é útil agrupá-los para ter uma ordem melhor deles e, assim, ser capaz de calcular certas medidas de tendência central.
Entre as medidas de tendência central mais utilizadas estão a média aritmética, a mediana e o modo. Esses números dizem certas qualidades sobre os dados coletados em um determinado experimento.
Para usar essas medidas, é necessário primeiro saber como agrupar um conjunto de dados.
Dados agrupados
Para agrupar os dados primeiro, você deve calcular o intervalo dos dados, que é obtido subtraindo o valor mais alto menos o valor mais baixo dos dados.
Em seguida, escolha um número "k", que é o número de classes nas quais você deseja agrupar os dados.
Continuamos dividindo o intervalo entre "k" para obter a amplitude das classes a serem agrupadas. Esse número é C = R / k.
Finalmente, o agrupamento é iniciado, para o qual é escolhido um número menor do que o menor valor dos dados obtidos.
Este número será o limite inferior da primeira classe. Para isso é adicionado C. O valor obtido será o limite superior da primeira classe.
Então, C é adicionado a este valor e o limite superior da segunda classe é obtido. Desta forma, prosseguimos até obtermos o limite superior da última classe.
Depois que os dados forem agrupados, você poderá calcular a média, a mediana e o modo.
Para ilustrar como a média aritmética, a mediana e o modo são calculados, procederemos com um exemplo.
Exemplo
Agrupe os seguintes dados em 4 classes.Ao calcular o intervalo, você percebe que isso é R = 9-1 = 8. A amplitude das classes é C = R / k = 8/4 = 2.
Portanto, ao agrupar os dados, você obterá uma tabela como a seguinte:
As 3 principais medidas de tendência central
Agora vamos continuar a calcular a média aritmética, a mediana e o modo. O exemplo anterior será usado para ilustrar esse procedimento.
1- Média aritmética
A média aritmética consiste em multiplicar cada frequência pela média do intervalo. Em seguida, todos esses resultados são adicionados e, finalmente, ele é dividido entre os dados totais.
Usando o exemplo anterior, seria obtido que a média aritmética é igual a:
(4*2 + 4*4 + 6*6 + 4*8) / 18 = (8+16+36+32)/18 = 5,11111
Isso indica que o valor médio dos dados na tabela é 5.11111.
2- Médio
Para calcular a mediana de um conjunto de dados, todos os dados são ordenados primeiro do menor para o maior. Dois casos podem ser apresentados:
- Se o número de dados for ímpar, a mediana é os dados que estão no centro.
- Se o número de dados for par, a mediana é a média dos dois dados que permanecem no centro.
Quando se trata de dados agrupados, o cálculo da mediana é feito da seguinte maneira:
- N / 2 é calculado, onde N é o total de dados.
- o primeiro intervalo em que a frequência cumulativa (frequência de soma) é maior do que N / 2 é procurada, e o limite inferior da referida gama é seleccionado, chamado Li.
A mediana é dada pela seguinte fórmula:
Eu = Li + (Ls-Li) * (N / 2 - Frequência acumulada antes de Li) / Frequência de [Li, Ls)
Ls é o limite superior do intervalo mencionado acima.
Se a tabela de dados acima for usado, ele tem a N / 2 = 18/2 = 9. frequências cumulativas são 4, 8, 14 e 18 (um para cada linha da tabela).
Portanto, o terceiro intervalo deve ser selecionado, uma vez que a freqüência acumulada é maior que N / 2 = 9.
Então Li = 5 e Ls = 7. Aplicando a fórmula descrita acima, você precisa:
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 �5,3333.
3- moda
Moda é o valor que tem mais frequência entre todos os dados agrupados; ou seja, é o valor que é repetido na maioria das vezes no conjunto de dados inicial.
Quando você tem uma quantidade muito grande de dados, a fórmula a seguir é usada para calcular o modo dos dados agrupados:
Mo = Li + (LS-Li) * (frequência Li - Frequência G (i-1)) / ((frequência Li - Frequência G (i-1)) + (frequência Li - Frequência G ( i + 1)))
O intervalo [Li, Ls) é o intervalo em que a frequência mais alta é encontrada. Para o exemplo feito neste artigo, temos que a moda é dada por:
Mo = + 5 (7-5) * (6-4) / ((4/6) + (4/6)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Outra fórmula que é usada para obter um valor aproximado para moda é o seguinte:
Mo = Li + (Li-ls) * (L frequência (i + 1)) / (frequência de G (i-1) G frequência (i + 1)).
Com esta fórmula, as contas são as seguintes:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Referências
- Bellhouse, D. R. (2011). Abraham De Moivre: preparando o cenário para a probabilidade clássica e suas aplicações. CRC Press.
- Cifuentes, J. F. (2002). Introdução à teoria da probabilidade. Univ. Nacional da Colômbia.
- Daston, L. (1995). Probabilidade Clássica no Iluminismo. Princeton University Press.
- Larson, H. J. (1978). Introdução à teoria das probabilidades e inferência estatística. Editorial Limusa.
- Martel, P.J., & Vegas, F. J. (1996). Probabilidade e estatística matemática: aplicações na prática clínica e na gestão em saúde. Ediciones Díaz de Santos.
- Vázquez, A. L., & Ortiz, F. J. (2005). Métodos estatísticos para medir, descrever e controlar a variabilidade. Ed. Universidade da Cantábria.
- Vázquez, S. G. (2009). Manual de Matemática para acesso à Universidade. Centro Editorial de Estudos Ramon Areces SA.