Em estatística, a distribuição normal é uma distribuição de probabilidade comum que é frequentemente utilizada para descrever fenómenos do mundo real. Também é conhecida como distribuição gaussiana ou curva de sino porque tem uma curva em forma de sino quando traçada num gráfico. Muitos testes e métodos estatísticos baseiam-se no pressuposto de que os dados seguem uma distribuição normal. Por conseguinte, é importante saber se os seus dados têm uma distribuição normal ou não. Neste artigo, discutiremos como determinar se uma distribuição é normal no Excel.
Como calcular a distribuição normal no Excel
O Excel tem funções internas que podem ser usadas para calcular a distribuição normal. As duas principais funções são NORM.DIST e NORM.INV. NORM.DIST calcula a probabilidade de um valor ocorrer dentro de um determinado intervalo em uma distribuição normal. NORM.INV calcula o inverso da distribuição cumulativa normal para uma probabilidade especificada.
Para utilizar estas funções, é necessário fornecer a média e o desvio padrão do conjunto de dados. Por exemplo, se o seu conjunto de dados tiver uma média de 50 e um desvio padrão de 10, pode utilizar a seguinte fórmula para calcular a probabilidade de um valor entre 40 e 60:
Esta fórmula devolverá a probabilidade de um valor entre 40 e 60 numa distribuição normal com uma média de 50 e um desvio padrão de 10.
Como fazer um gráfico de distribuição de frequência no Excel Um gráfico de distribuição de frequência é uma representação gráfica da frequência de cada valor em um conjunto de dados. Pode ser utilizado para visualizar a distribuição dos dados e identificar quaisquer padrões ou valores atípicos. O Excel tem uma ferramenta incorporada chamada gráfico de histograma que pode ser utilizada para criar um gráfico de distribuição de frequências.
Para criar um gráfico de histograma, é necessário seleccionar o intervalo de dados, ir ao separador Inserir e clicar no botão Histograma. O Excel criará automaticamente um gráfico de distribuição de frequência com base no intervalo de dados seleccionado. É possível personalizar o gráfico alterando o tamanho do compartimento ou adicionando etiquetas e títulos.
Como encontrar o valor Z no Excel O valor z, também conhecido como pontuação padrão, é uma medida de quantos desvios padrão um valor está da média. É frequentemente utilizado em análises estatísticas para comparar valores de diferentes conjuntos de dados. O Excel tem uma função incorporada chamada NORM.S.INV que pode ser utilizada para encontrar o valor z para uma determinada probabilidade.
Para utilizar esta função, é necessário fornecer a probabilidade, a média e o desvio padrão do conjunto de dados. Por exemplo, se quiser encontrar o valor z para uma probabilidade de 0,95 num conjunto de dados com uma média de 50 e um desvio padrão de 10, pode utilizar a seguinte fórmula:
=NORM.S.INV(0,95)*10+50
Esta fórmula devolverá o valor z para uma probabilidade de 0,95 num conjunto de dados com uma média de 50 e um desvio padrão de 10.
Como testar a normalidade dos dados Existem vários testes estatísticos que podem ser usados para testar a normalidade dos dados. Um dos testes mais usados é o teste de Shapiro-Wilk, que testa se os dados seguem uma distribuição normal. O Excel tem uma função incorporada chamada SHAPIRO.TEST que pode ser utilizada para efectuar este teste.
Para utilizar esta função, é necessário seleccionar o intervalo de dados e introduzir a seguinte fórmula:
Em que data é o intervalo de dados que pretende testar. Se o valor p retornado pela função for maior que o nível de significância (geralmente 0,05), então os dados são considerados normalmente distribuídos.
Quando é que uma distribuição é normal?
– A média, a mediana e a moda são iguais
– O desvio padrão determina a largura da curva
No entanto, é importante notar que nem todos os conjuntos de dados seguem uma distribuição normal. Alguns conjuntos de dados podem ter uma distribuição enviesada ou vários picos, o que pode afectar os resultados dos testes estatísticos. Portanto, é importante verificar a normalidade antes de usar métodos estatísticos que assumem uma distribuição normal.
A distribuição normal é uma distribuição de probabilidade que é simétrica em torno da média, com a maioria dos valores caindo dentro de um desvio padrão da média. Também é conhecida como distribuição gaussiana e é normalmente utilizada em estatística para modelar fenómenos do mundo real, como altura, peso e resultados de testes. A distribuição normal tem uma curva em forma de sino e é caracterizada pela sua média e desvio padrão.