Como determinar se uma distribuição é normal no Excel

Como saber se a distribuição é normal no Excel?
O quantile plot (qq-plot) simplesmente irá dispor em um gráfico uma comparação dois a dois dos quantis teóricos de uma Normal e os quantis de seus dados. Se os pontos se concentrarem em torno de uma reta, então temos indícios de que a distribuição é Normal.
Aprender mais sobre sosestatistica.com.br

Em estatística, a distribuição normal é uma distribuição de probabilidade comum que é frequentemente utilizada para descrever fenómenos do mundo real. Também é conhecida como distribuição gaussiana ou curva de sino porque tem uma curva em forma de sino quando traçada num gráfico. Muitos testes e métodos estatísticos baseiam-se no pressuposto de que os dados seguem uma distribuição normal. Por conseguinte, é importante saber se os seus dados têm uma distribuição normal ou não. Neste artigo, discutiremos como determinar se uma distribuição é normal no Excel.

Como calcular a distribuição normal no Excel

O Excel tem funções internas que podem ser usadas para calcular a distribuição normal. As duas principais funções são NORM.DIST e NORM.INV. NORM.DIST calcula a probabilidade de um valor ocorrer dentro de um determinado intervalo em uma distribuição normal. NORM.INV calcula o inverso da distribuição cumulativa normal para uma probabilidade especificada.

Para utilizar estas funções, é necessário fornecer a média e o desvio padrão do conjunto de dados. Por exemplo, se o seu conjunto de dados tiver uma média de 50 e um desvio padrão de 10, pode utilizar a seguinte fórmula para calcular a probabilidade de um valor entre 40 e 60:

=NORM.DIST(60,50,10,TRUE)-NORM.DIST(40,50,10,TRUE)

Esta fórmula devolverá a probabilidade de um valor entre 40 e 60 numa distribuição normal com uma média de 50 e um desvio padrão de 10.

Como fazer um gráfico de distribuição de frequência no Excel Um gráfico de distribuição de frequência é uma representação gráfica da frequência de cada valor em um conjunto de dados. Pode ser utilizado para visualizar a distribuição dos dados e identificar quaisquer padrões ou valores atípicos. O Excel tem uma ferramenta incorporada chamada gráfico de histograma que pode ser utilizada para criar um gráfico de distribuição de frequências.

Para criar um gráfico de histograma, é necessário seleccionar o intervalo de dados, ir ao separador Inserir e clicar no botão Histograma. O Excel criará automaticamente um gráfico de distribuição de frequência com base no intervalo de dados seleccionado. É possível personalizar o gráfico alterando o tamanho do compartimento ou adicionando etiquetas e títulos.

Como encontrar o valor Z no Excel O valor z, também conhecido como pontuação padrão, é uma medida de quantos desvios padrão um valor está da média. É frequentemente utilizado em análises estatísticas para comparar valores de diferentes conjuntos de dados. O Excel tem uma função incorporada chamada NORM.S.INV que pode ser utilizada para encontrar o valor z para uma determinada probabilidade.

Para utilizar esta função, é necessário fornecer a probabilidade, a média e o desvio padrão do conjunto de dados. Por exemplo, se quiser encontrar o valor z para uma probabilidade de 0,95 num conjunto de dados com uma média de 50 e um desvio padrão de 10, pode utilizar a seguinte fórmula:

=NORM.S.INV(0,95)*10+50

Esta fórmula devolverá o valor z para uma probabilidade de 0,95 num conjunto de dados com uma média de 50 e um desvio padrão de 10.

Como testar a normalidade dos dados Existem vários testes estatísticos que podem ser usados para testar a normalidade dos dados. Um dos testes mais usados é o teste de Shapiro-Wilk, que testa se os dados seguem uma distribuição normal. O Excel tem uma função incorporada chamada SHAPIRO.TEST que pode ser utilizada para efectuar este teste.

Para utilizar esta função, é necessário seleccionar o intervalo de dados e introduzir a seguinte fórmula:

=SHAPIRO.TEST(data)

Em que data é o intervalo de dados que pretende testar. Se o valor p retornado pela função for maior que o nível de significância (geralmente 0,05), então os dados são considerados normalmente distribuídos.

Quando é que uma distribuição é normal?

Uma distribuição é considerada normal se seguir a forma da curva de sino e satisfizer as seguintes propriedades:

– A média, a mediana e a moda são iguais

– A distribuição é simétrica em torno da média

– O desvio padrão determina a largura da curva

No entanto, é importante notar que nem todos os conjuntos de dados seguem uma distribuição normal. Alguns conjuntos de dados podem ter uma distribuição enviesada ou vários picos, o que pode afectar os resultados dos testes estatísticos. Portanto, é importante verificar a normalidade antes de usar métodos estatísticos que assumem uma distribuição normal.

FAQ
Como é que se define a distribuição normal?

A distribuição normal é uma distribuição de probabilidade que é simétrica em torno da média, com a maioria dos valores caindo dentro de um desvio padrão da média. Também é conhecida como distribuição gaussiana e é normalmente utilizada em estatística para modelar fenómenos do mundo real, como altura, peso e resultados de testes. A distribuição normal tem uma curva em forma de sino e é caracterizada pela sua média e desvio padrão.