Calculadora de Teste Z
Índice
O que é um teste Z?Quando devo usar os testes Z?Fórmula do teste Zvalor p do teste ZTeste Z bicaudal e teste Z unicaudalValores críticos e regiões críticas do teste ZComo usar a calculadora de teste Z para uma amostra?Exemplos de teste ZPerguntas frequentesA calculadora de teste Z da Omni é uma ferramenta que ajuda você a realizar um teste Z de uma amostra na média da população. Existem duas formas de fazer esse teste: o teste Z bicaudal e o teste Z unicaudal. Ambos podem ser usados de acordo com suas necessidades. Você também pode escolher se a calculadora deve determinar o valor p (também conhecido como p-valor) do teste Z ou se prefere usar a abordagem do valor crítico!
Continue lendo para saber mais sobre o teste Z em estatística e, em particular, quando usar o teste Z, qual é a fórmula do teste Z e se você deve usar o teste Z ou o teste t. Como bônus, damos alguns exemplos passo a passo de como realizar testes Z!
Ou você também pode consultar outras ferramentas Omni, como a calculadora de valor T, onde poderá aprender o conceito de outro teste estatístico essencial. Ou ainda, se você também tiver interesse no teste F, consulte a calculadora de teste F 🇺🇸.
O que é um teste Z?
O teste Z de uma amostra é um dos testes estatísticos mais populares. A hipótese nula é que o valor médio da população é igual a um determinado número, :
Realizamos um teste Z de duas caudas se quisermos testar se a média da população não é :
e um teste Z unicaudal se quisermos testar se a média da população é menor/maior que :
Vamos agora discutir as premissas de um teste Z para uma amostra.
Quando devo usar os testes Z?
Você pode usar um teste Z se sua amostra consistir em pontos de dados independentes e:
-
os dados forem normalmente distribuídos, e você conhecer a variância da população;
ou
-
a amostra for grande e os dados seguirem uma distribuição que tenha uma média e uma variância finitas. Você não precisa conhecer a variância da população nesse caso.
O motivo pelo qual essas duas possibilidades existem é que queremos que as estatísticas de teste sigam a distribuição normal padrão . No primeiro caso, é uma distribuição normal padrão exata, enquanto no segundo, é aproximada, e pode ser usada pelo príncipio do teorema do limite central.
A pergunta que fica é: "Quando minha amostra é considerada grande o suficiente? " Bem, não há um critério universal. Em geral, quanto mais dados você tiver, melhor será o resultado da aproximação. Os livros didáticos de estatística recomendam que você tenha não menos que 50 dados, no entanto, 30 é considerado o menor valor possível.
Fórmula do teste Z
Seja uma amostra independente que segue a distribuição normal , ou seja, com uma média igual a e uma variação igual a .
Colocamos a hipótese nula, .
Definimos a estatística de teste, Z, como:
onde:
-
é a média da amostra, ou seja, ;
-
é a média da população em ;
-
é o tamanho da amostra; e
-
é o desvio padrão da população.
A seguir, a letra maiúscula representa a estatística de teste (tratada como uma variável aleatória), enquanto a letra minúscula denota um valor real de , calculado para uma determinada amostra extraída de N(μ,σ²).
Se for válida, então a soma segue a distribuição normal, com média e variância . Como é a padronização (escore z) de , podemos concluir que a estatística de teste segue a distribuição normal padrão , desde que seja verdadeira. A propósito, temos a calculadora de escore padrão Z se você quiser se concentrar somente nesse valor.
Se nossos dados não seguirem uma distribuição normal ou se o desvio padrão da população for desconhecido (e, portanto, na fórmula para , substituímos o desvio padrão da população pelo desvio padrão da amostra), então a estatística de teste não segue necessariamente uma distribuição normal. Entretanto, se a amostra for suficientemente grande, o teorema do limite central garante que é aproximadamente .
Nas seções abaixo, explicaremos a você como usar o valor da estatística de teste, , para tomar uma decisão, ou seja, se você deve ou não rejeitar a hipótese nula. Duas abordagens podem ser usadas para que você chegue a essa decisão: a abordagem do valor p e a abordagem do valor crítico (abordaremos as duas!) Qual delas você deve usar? No passado, a abordagem do valor crítico era mais popular porque era difícil calcular o valor p do teste Z. Entretanto, com a ajuda dos computadores modernos, podemos fazer isso com bastante facilidade e com uma precisão decente. Em geral, é altamente recomendável que você informe o valor p dos seus testes!
valor p do teste Z
Formalmente, o valor p é o menor nível de significância em que a hipótese nula pode ser rejeitada. Mais intuitivamente, o valor p responde às perguntas:
desde que eu viva em um mundo em que a hipótese nula seja válida, qual é a probabilidade de que o valor da estatística de teste seja pelo menos tão extremo quanto o , valor que obtive para minha amostra? Portanto, um valor p pequeno significa que seu resultado é muito improvável sob a hipótese nula e, portanto, há fortes evidências contra a hipótese nula, quanto menor o valor p, mais forte é a evidência.
Para encontrar o valor p, você precisa calcular a probabilidade de que a estatística de teste, , seja pelo menos tão extrema quanto o valor que realmente observamos, , desde que a hipótese nula seja verdadeira. (A probabilidade de um evento calculada sob a premissa de que seja verdadeira será denotada como ). É a hipótese alternativa que determina o que significa mais extremo:
- Teste Z bicaudal: valores extremos são aqueles cujo valor absoluto excede , portanto, menores que ou maiores que . Portanto, temos:
A simetria da distribuição normal fornece:
- Teste Z de cauda esquerda: valores extremos são aqueles menores que , portanto:
- Teste Z de cauda direita: valores extremos são aqueles maiores que , portanto:
Para calcular essas probabilidades, podemos usar a Função de Distribuição Acumulada (fda) de , que, para um número real, , é definida como:
Além disso, os valores de p podem ser bem representados como a área sob a função de densidade de probabilidade de , devido a:
Teste Z bicaudal e teste Z unicaudal
Com todo o conhecimento obtido na seção anterior, você está pronto para aprender sobre os testes Z.
- Teste Z bicaudal:
Do fato de que , deduzimos que:
O valor p é a área sob a função de distribuição de probabilidade à esquerda de e à direita de :
- Teste Z de cauda esquerda:
O valor p é a área sob a função de densidade de probabilidade à esquerda de nosso :
- Teste Z de cauda direita:
O valor p é a área sob a função de densidade de probabilidade à direita de :
A decisão de rejeitar ou não a hipótese nula pode ser tomada agora em qualquer nível de significância, , que você desejar!
-
se o valor p for menor ou igual a , a hipótese nula será rejeitada nesse nível de significância; e
-
se o valor p for maior que , então não há evidência suficiente para rejeitar a hipótese nula nesse nível de significância.
Valores críticos e regiões críticas do teste Z
A abordagem do valor crítico envolve a comparação do valor da estatística de teste obtida para nossa amostra, , com os chamados valores críticos. Esses valores constituem os limites das regiões em que é altamente improvável que a estatística de teste se encontre. Essas regiões são frequentemente chamadas de regiões críticas ou regiões de rejeição. A decisão de se você deve ou não rejeitar a hipótese nula é baseada no fato de o nosso pertencer ou não à região crítica.
As regiões críticas dependem de um nível de significância, , do teste e da hipótese alternativa. A escolha de é arbitrária; na prática, os valores de 0,1, 0,05 ou 0,01 são mais comumente usados como .
Quando concordamos com o valor de , podemos determinar facilmente as regiões críticas do teste Z:
- Teste Z bicaudal:
- Teste Z de cauda esquerda:
- Teste Z de cauda direita:
Para decidir o destino de , verifique se o seu está ou não na região crítica:
-
Em caso afirmativo, rejeite e aceite ; e
-
Se não, então não há evidência suficiente para rejeitar
Como você pode ver, as fórmulas para os valores críticos dos testes Z envolvem o inverso, , da função de distribuição acumulada (fda) de .
Como usar a calculadora de teste Z para uma amostra?
Nossa calculadora reduz todas as etapas complicadas:
-
Escolha a hipótese alternativa: bicaudal ou de cauda esquerda/direita.
-
Em nossa calculadora de teste Z, você pode decidir se quer usar o valor p ou a abordagem de regiões críticas. No último caso, defina o nível de significância, .
-
Digite o valor da estatística de teste, . Se não souber, você pode inserir alguns dados que nos permitirão calcular o para você:
- média da amostra (se você tiver dados brutos, use a calculadora de média da Omni para determinar a média);
- média testada ;
- tamanho da amostra ; e
- desvio padrão da população (ou desvio padrão da amostra se a amostra for grande).
-
Os resultados são exibidos imediatamente abaixo da calculadora.
Se você quiser encontrar com base no valor p, lembre-se de que, no caso de testes bicaudais, há dois valores possíveis de : um positivo e um negativo, e eles são números opostos. Nesse caso, essa calculadora de teste Z retorna o valor positivo. Para que você encontre o outro valor possível de para um determinado valor p, basta pegar o número oposto ao valor de exibido pela calculadora.
Exemplos de teste Z
Para ter certeza de que você entendeu completamente a essência do teste Z, vamos analisar alguns exemplos:
- Uma máquina de enchimento de garrafas segue uma distribuição normal. Seu desvio padrão, conforme declarado pelo fabricante, é igual a 30 ml. Um vendedor de sucos afirma que o volume despejado em cada garrafa é, em média, de um litro, ou seja, 1.000 ml, mas suspeitamos que, na verdade, o volume médio seja menor do que isso...
Formalmente, as hipóteses que definimos são as seguintes:
Fomos a uma loja e compramos uma amostra de 9 garrafas. Depois de medir cuidadosamente o volume de suco em cada garrafa, obtivemos a seguinte amostra (em mililitros):
.
-
Tamanho da amostra: ;
-
Média da amostra: ;
-
Desvio padrão da população: ;
-
Logo,
-
E, portanto, .
Como , concluímos que nossas suspeitas são reais; no nível de significância mais comum, 0,05, rejeitaríamos a alegação do produtor, , e aceitaríamos a hipótese alternativa, .
-
Jogamos uma moeda 50 vezes. Obtivemos 20 coroas e 30 caras. Há evidências suficientes para afirmar que a moeda é tendenciosa?
Claramente, nossos dados seguem a distribuição de Bernoulli, com alguma probabilidade de sucesso e variância . No entanto, a amostra é grande, portanto, podemos realizar um teste Z com segurança. Adotamos a convenção de que obter a coroa é um sucesso.
Vamos declarar as hipóteses nula e alternativa:
-
(a moeda é justa: a probabilidade de coroa é );
-
(a moeda é tendenciosa: a probabilidade de coroa é diferente de ).
-
Em nossa amostra, temos 20 sucessos (indicados por 1) e 30 fracassos (indicados por 0), portanto:
-
Tamanho da amostra ;
-
Média da amostra ;
-
O desvio padrão da população é dado por (porque é a proporção hipotetizada em ). Portanto, ;
-
Logo,
- E, portanto:
Como não temos evidência suficiente para rejeitar a afirmação de que a moeda é justa, mesmo em um nível de significância tão grande como . Nesse caso, você pode jogá-la com segurança ou usar a nossa calculadora de probabilidade no lançamento de moedas para descobrir suas chances de obter, por exemplo, 10 caras seguidas (que são extremamente baixas!).
Qual é a diferença entre o teste Z e o teste t?
Usamos um teste t para testar a média populacional de um conjunto de dados normalmente distribuído que tinha um desvio padrão populacional desconhecido. Isso é obtido substituindo o desvio padrão da população na fórmula da estatística do teste Z pelo desvio padrão da amostra, o que significa que essa nova estatística de teste segue (desde que H₀ seja válido) a distribuição t de Student com n-1 graus de liberdade em vez de N(0,1).
Quando devo usar o teste t em vez do teste Z?
Para amostras grandes, a distribuição t de Student com n graus de liberdade se aproxima de N(0,1). Portanto, desde que haja um número suficiente de pontos de dados (pelo menos 30), não importa realmente se você usa o teste Z ou o teste t, pois os resultados serão quase idênticos. Entretanto, para amostras pequenas com variância desconhecida, lembre-se de usar o teste t em vez do teste Z, pois, nesse caso, o teste t de Student é mais adequado.
Como calcular a estatística do teste Z?
Para calcular a estatística do teste Z:
- Calcule a média aritmética de sua amostra.
- Dessa média, subtraia a média postulada na hipótese nula.
- Multiplique o resultado pela raiz quadrada do tamanho da amostra.
- Divida pelo desvio padrão da população.
- É isso, você acabou de calcular a estatística do teste Z!