Fundamentos de Estatística
Para determinar quais termos são confiáveis na amostra, podemos usar o conceito de variância e desvio padrão para identificar possíveis outliers. Em estatística, um termo é geralmente considerado um outlier se está mais do que 1,5 vezes o intervalo interquartil (IQR) abaixo do primeiro quartil (Q1) ou acima do terceiro quartil (Q3). Outra abordagem comum é considerar termos confiáveis aqueles que estão dentro de 2 desvios padrão da média. Portanto temos que a média (μ) é calculada somando todos os valores e dividindo pelo número de valores.
Assim temos:
Média =
A variância (σ²) é calculada encontrando a média dos quadrados das diferenças de cada valor da média, ou seja:
Calculando a
diferença ao quadrado temos os seguintes termos:
(12-14)² = 4 | (8-14)² = 36 | (17-14)²
= 9 | (13-14)² = 1 | (11-14)² = 9 | (9-14)²
= 25 | (15-14)² = 1 | (20-14)² = 36 | (21-14)² = 49
Somando os
valores e dividindo pela quantidade de termos termos: 4+36+9+1+9+25+1+36+49=170
Canculando o desvio padrão (σ) como
sendo a raiz quadrada da variância temos:
Um
termo é considerado confiável se está dentro de 2 desvios padrão da média.
Calculando
os limites:
·
Limite inferior=𝜇−2𝜎=14−2×4,35≈5,3
·
Limite superior=𝜇+2𝜎=14+2×4,35≈22,7
Portanto,
qualquer termo que esteja no intervalo [5,3,22,7][5,3,22,7] é considerado
confiável. Todos os termos da amostra (12, 8, 17, 13, 11, 9, 15, 20, 21) estão
dentro do intervalo [5,3 e 22,7], portanto, todos os termos são confiáveis
levando em consideração o limite inferior e superior.
Por outro lado
efetuando o calculo considerando o critério de Chebyshev
temos que:
Para calcular da variância e
o desvio padrão, por média amostral (x̄), somamos todos os valores da amostra e
dividimos pelo número de elementos (n) temos que:
A confiabilidade de um termo na amostra depende da sua
distância da média em relação ao desvio padrão. Assim temos:
·
95,45% dos dados
caem no intervalo [x̄ - 2σ, x̄ + 2σ].
·
82,13% dos dados
caem no intervalo [x̄ - 1σ, x̄ + 1σ].
·
68,27% dos dados
caem no intervalo [x̄ - σ, x̄ + σ].
No nosso caso, com σ ≈ 5.3, os intervalos de
confiabilidade ficam:
·
95,45%: [1.2, 26.8]
·
82,13%: [8.1, 19.9]
·
68,27%: [2.2, 24.8]
Portanto, com base nos intervalos de confiabilidade,
podemos concluir que os seguintes termos são considerados confiáveis:
[13, 15, 17, 20, 21]
Esses termos estão dentro do intervalo de 95,45% de
confiabilidade, o que significa que há uma alta probabilidade de representarem
valores próximos à média real. Os termos 8, 9, 11 e 12 estão fora do intervalo de 95,45% de confiabilidade. Isso
significa que há uma menor probabilidade de representarem valores próximos à
média real da população.
·
O 8 está muito
abaixo da média, podendo ser um valor atípico (outlier).
·
Já o 9 um pouco
abaixo da média, mas ainda dentro do intervalo de 82,13% de confiabilidade.
·
O 11 um pouco
abaixo da média, mas ainda dentro do intervalo de 82,13% de confiabilidade.
·
E o 12 um pouco
abaixo da média, mas ainda dentro do intervalo de 82,13% de confiabilidade.
A análise da confiabilidade dos termos é importante
para garantir a qualidade da amostra e a precisão das conclusões que serão
tiradas a partir dela. Os termos 13,
15, 17, 20 e 21 são considerados confiáveis na amostra, enquanto os termos 8,
9, 11 e 12 apresentam menor confiabilidade.
Após a análise dos dados da amostra, podemos concluir
que os termos 13, 15, 17, 20 e 21
apresentam maior confiabilidade.
Estes se encontram dentro do intervalo de 95,45% de confiabilidade, segundo o critério de Chebyshev, indicando alta probabilidade de
representarem valores próximos à média real. Em contrapartida, os termos 8, 9, 11 e 12 se posicionam fora do
intervalo de 95,45%, demonstrando menor confiabilidade. O valor 8, em especial, se destaca por estar consideravelmente
abaixo da média, sugerindo a possibilidade de um valor atípico (outlier). É importante ressaltar que a análise se
baseia no critério de Chebyshev,
uma regra geral que não considera a distribuição específica dos dados. Em
alguns casos, técnicas mais avançadas, como testes de hipóteses, podem ser
necessárias para avaliar a confiabilidade com maior precisão.
A análise da confiabilidade dos termos é importante
para garantir a qualidade da amostra e a robustez das conclusões extraídas da
pesquisa. No presente caso, os termos 13,
15, 17, 20 e 21 se apresentam como mais confiáveis para representar a
população, enquanto os termos 8, 9, 11
e 12 exigem cautela na interpretação.
Referencias
DE ASSIS, JANILSON PINHEIRO et al. Elementos De Probabilidade I. 2023.
Disponível em: https://www.editorapantanal.com.br/ebooks/2023/elementos-de-probabilidade-i/ebook.pdf. Acesso em: 21mai. 2024.
PRATES, Wecsley Otero. Estatísticas para ciências sociais aplicadas I. 2017. Disponível
em: https://repositorio.ufba.br/handle/ri/24557. Acesso em: 21mai. 2024.
MORAIS, Carlos. Escalas de medida, estatística descritiva e inferência estatística.
2005. Disponível em: https://bibliotecadigital.ipb.pt/handle/10198/7325. Acesso em: 21mai. 2024.
Comentários
Enviar um comentário