Fundamentos de Estatística

 Para determinar quais termos são confiáveis na amostra, podemos usar o conceito de variância e desvio padrão para identificar possíveis outliers. Em estatística, um termo é geralmente considerado um outlier se está mais do que 1,5 vezes o intervalo interquartil (IQR) abaixo do primeiro quartil (Q1) ou acima do terceiro quartil (Q3). Outra abordagem comum é considerar termos confiáveis aqueles que estão dentro de 2 desvios padrão da média. Portanto temos que a média (μ) é calculada somando todos os valores e dividindo pelo número de valores.

Assim temos:

Média = 


A variância (σ²) é calculada encontrando a média dos quadrados das diferenças de cada valor da média, ou seja:   


Calculando a diferença ao quadrado temos os seguintes termos:


(12-14)² = 4 | (8-14)² = 36 | (17-14)² = 9 | (13-14)² = 1   | (11-14)² = 9 | (9-14)² = 25 | (15-14)² = 1 | (20-14)² = 36 | (21-14)² = 49


Somando os valores e dividindo pela quantidade de termos termos: 4+36+9+1+9+25+1+36+49=170



Canculando o desvio padrão (σ) como sendo a raiz quadrada da variância temos:



Um termo é considerado confiável se está dentro de 2 desvios padrão da média.

Calculando os limites:

·         Limite inferior=𝜇−2𝜎=14−2×4,35≈5,3

·         Limite superior=𝜇+2𝜎=14+2×4,35≈22,7

Portanto, qualquer termo que esteja no intervalo [5,3,22,7][5,3,22,7] é considerado confiável. Todos os termos da amostra (12, 8, 17, 13, 11, 9, 15, 20, 21) estão dentro do intervalo [5,3 e 22,7], portanto, todos os termos são confiáveis levando em consideração o limite inferior e superior.

Por outro lado efetuando o calculo considerando o critério de Chebyshev temos que:

Para calcular da variância e o desvio padrão, por média amostral (x̄), somamos todos os valores da amostra e dividimos pelo número de elementos (n) temos que:

A confiabilidade de um termo na amostra depende da sua distância da média em relação ao desvio padrão. Assim temos:

·         95,45% dos dados caem no intervalo [x̄ - 2σ, x̄ + 2σ].

·         82,13% dos dados caem no intervalo [x̄ - 1σ, x̄ + 1σ].

·         68,27% dos dados caem no intervalo [x̄ - σ, x̄ + σ].

No nosso caso, com σ ≈ 5.3, os intervalos de confiabilidade ficam:

·         95,45%: [1.2, 26.8]

·         82,13%: [8.1, 19.9]

·         68,27%: [2.2, 24.8]

Portanto, com base nos intervalos de confiabilidade, podemos concluir que os seguintes termos são considerados confiáveis:

[13, 15, 17, 20, 21]

Esses termos estão dentro do intervalo de 95,45% de confiabilidade, o que significa que há uma alta probabilidade de representarem valores próximos à média real. Os termos 8, 9, 11 e 12 estão fora do intervalo de 95,45% de confiabilidade. Isso significa que há uma menor probabilidade de representarem valores próximos à média real da população.

·         O 8 está muito abaixo da média, podendo ser um valor atípico (outlier).

·         Já o 9 um pouco abaixo da média, mas ainda dentro do intervalo de 82,13% de confiabilidade.

·         O 11 um pouco abaixo da média, mas ainda dentro do intervalo de 82,13% de confiabilidade.

·         E o 12 um pouco abaixo da média, mas ainda dentro do intervalo de 82,13% de confiabilidade.

A análise da confiabilidade dos termos é importante para garantir a qualidade da amostra e a precisão das conclusões que serão tiradas a partir dela. Os termos 13, 15, 17, 20 e 21 são considerados confiáveis na amostra, enquanto os termos 8, 9, 11 e 12 apresentam menor confiabilidade.

Após a análise dos dados da amostra, podemos concluir que os termos 13, 15, 17, 20 e 21 apresentam maior confiabilidade. Estes se encontram dentro do intervalo de 95,45% de confiabilidade, segundo o critério de Chebyshev, indicando alta probabilidade de representarem valores próximos à média real. Em contrapartida, os termos 8, 9, 11 e 12 se posicionam fora do intervalo de 95,45%, demonstrando menor confiabilidade. O valor 8, em especial, se destaca por estar consideravelmente abaixo da média, sugerindo a possibilidade de um valor atípico (outlier). É importante ressaltar que a análise se baseia no critério de Chebyshev, uma regra geral que não considera a distribuição específica dos dados. Em alguns casos, técnicas mais avançadas, como testes de hipóteses, podem ser necessárias para avaliar a confiabilidade com maior precisão.

A análise da confiabilidade dos termos é importante para garantir a qualidade da amostra e a robustez das conclusões extraídas da pesquisa. No presente caso, os termos 13, 15, 17, 20 e 21 se apresentam como mais confiáveis para representar a população, enquanto os termos 8, 9, 11 e 12 exigem cautela na interpretação.

 

Referencias

DE ASSIS, JANILSON PINHEIRO et al. Elementos De Probabilidade I. 2023. Disponível em: https://www.editorapantanal.com.br/ebooks/2023/elementos-de-probabilidade-i/ebook.pdf. Acesso em: 21mai. 2024.

PRATES, Wecsley Otero. Estatísticas para ciências sociais aplicadas I. 2017. Disponível em: https://repositorio.ufba.br/handle/ri/24557. Acesso em: 21mai. 2024.

MORAIS, Carlos. Escalas de medida, estatística descritiva e inferência estatística. 2005. Disponível em: https://bibliotecadigital.ipb.pt/handle/10198/7325. Acesso em: 21mai. 2024.

Comentários

Mensagens populares deste blogue

PSICOLOGIA, LIDERANÇA E COMPORTAMENTO NAS ORGANIZAÇÕES - COMPREENDENDO AS DIFERENÇAS

GESTÃO DE ANALISES E CUSTOS

GESTÃO DE CUSTOS, RISCOS E PERDAS