Calculadora de Valor-p

Q: Como calcular o valor-p a partir do teste estatístico?

Para determinar o valor-p, você precisa conhecer a distribuição do seu teste estatístico sob a suposição de que a hipótese nula seja verdadeira . Em seguida, com a ajuda da Função de Distribuição Acumulada ( FDA ) dessa distribuição, podemos expressar a probabilidade do teste estatístico ser pelo menos tão extremo quanto seu valor x para a amostra: Teste de cauda esquerda: valor-p = fda(x) . Teste de cauda direita: valor-p = 1 - fda(x) . Teste bicaudal: valor-p = 2 × min{fda(x) , 1 - fda(x)} . Se a distribuição do teste estatístico em H 0 for simétrica em relação a 0 , então um valor-p bicaudal pode ser simplificado para valor-p = 2 × fda(-|x|) ou, de forma equivalente, como valor-p = 2 - 2 × fda(|x|) .

Q: Como faço para encontrar o valor-p a partir do valor-t?

O valor-p do valor-t é dado pelas seguintes fórmulas, nas quais fda t,d representa a função de distribuição acumulada da distribuição t de Student com d graus de liberdade: Teste t de cauda esquerda: valor-p = fda t,d (valor-t) Teste t de cauda direita: valor-p = 1 - fda t,d (valor-t) Teste t bicaudal: valor-p = 2 × fda t,d (-|valor-t|) ou valor-p = 2 - 2 × fda t,d (|valor-t|)

Criadores

Bogna Szyk e Dr.(a) Anna Szczepanek

Anna Szczepanek

PhD, Jagiellonian University in Kraków, Poland

Website

Anna Szczepanek, PhD is a mathematician at the Faculty of Mathematics and Computer Science of the Jagiellonian University in Kraków, where she researches mathematical physics and applied mathematics. At Omni, Anna uses her knowledge and programming skills to create math and statistics calculators. In her free time, she enjoys hiking and reading. See full profile

Check our editorial policy

Tradutores

Doutorando(a), Marinara Andrade do Nascimento Moura

Marinara Andrade do Nascimento Moura

PhD candidate

Website

Research Gate

Marinara Moura, MSc, is a Civil Engineer passionate about learning. She believes that knowledge is only acquired when you share it, and she does that by not only writing articles and calculators at Omni but also as a PhD student. Marinara knows the importance of disseminating science, so she worked hard to have her papers published in influential journals in her field. Apart from her professional side, she is a dedicated mother who loves to spend time with her family. Whenever she has some free time, she enjoys cooking and baking. See full profile

Check our editorial policy

e Dr.(a) João Rafael Lucio dos Santos

João Rafael Lucio dos Santos

PhD, Federal University of Campina Grande

Website

Research Gate

João Rafael Lucio dos Santos, PhD, is a physicist, a researcher, and a professor at the Federal University of Campina Grande, Brazil. He earned his Ph.D. in Physics at the University of Rochester, NY in 2013. He has written several papers in international journals, mainly in field theory and cosmology. João is also a member of the BINGO telescope collaboration, which is building a state-of-the-art radio telescope that will operate in the Northeast of Brazil. He believes in the importance of spreading knowledge and high-quality information among society and the public in general. In his free time, he enjoys running, playing tennis, cooking, traveling, and having pleasant moments with his relatives and friends. See full profile

Check our editorial policy

Revisores

Jack Bowater

Novo

Esta é a calculadora de valor-p da Omni! Com essa ferramente, você não precisará mais se perguntar como encontrar o valor-p, pois aqui você pode determinar os valor-p unilateral e bilateral de testes estatísticos, seguindo as distribuições mais populares: normal, t-Student, qui-quadrado e F de Snedecor.

O valor-p é comum em toda a ciência, mas muitas pessoas acham o seu conceito um pouco difícil. Mas, aqui você não precisa se preocupar! Neste artigo, explicaremos não apenas o que é o valor-p, mas também como interpretá-lo corretamente. Você já teve curiosidade de saber como calcular o valor-p manualmente? Também fornecemos a você todas as fórmulas necessárias!

🙋 Se você quiser revisar algumas noções básicas de estatística, a calculadora de distribuição normal da Omni é um excelente ponto de partida.

O que é o valor-p?

Formalmente, o valor-p é a probabilidade de que o teste estatístico produza valores pelo menos tão extremos quanto o valor que ela produziu para sua amostra. É fundamental lembrar que essa probabilidade é calculada sob a suposição de que a hipótese nula H₀ seja verdadeira!

De forma mais intuitiva, o valor-p responde à pergunta:

Supondo que eu viva em um mundo em que a hipótese nula seja verdadeira, qual é a probabilidade de que, para outra amostra, o teste que estou realizando gere um valor pelo menos tão extremo quanto o que observei para a amostra que já tenho?

É a hipótese alternativa que determina o que "extremo" realmente significa, portanto, o valor-p depende da hipótese alternativa que você declara: de cauda esquerda, de cauda direita ou bicaudal. Nas fórmulas abaixo, S representa um teste estatístico, x o valor que ele produziu para uma determinada amostra e Pr(evento | H₀) é a probabilidade de um evento, calculada sob a suposição de que H₀ é verdadeira:

Teste de cauda esquerda: valor-p = Pr(S ≤ x | H₀)
Teste de cauda direita: valor-p = Pr(S ≥ x | H₀)
Teste bicaudal:

valor-p = 2 × min{Pr(S ≤ x | H₀), Pr(S ≥ x | H₀)}

(Por min{a,b}, denotamos o menor número entre a e b)

Se a distribuição da estatística de teste em H₀ for simétrica em relação a 0, então:
valor-p = 2 × Pr(S ≥ |x| | H₀)

ou, de forma equivalente:
valor-p = 2 × Pr(S ≤ -|x| | H₀)

Como uma imagem vale mais que mil palavras, vamos ilustrar essas definições. Aqui, usamos que a probabilidade pode ser perfeitamente representada como a área sob a curva de densidade de uma determinada distribuição. Apresentamos dois conjuntos de imagens: um para uma distribuição simétrica e outro para uma distribuição enviesada (não simétrica).

Caso simétrico: distribuição normal:

valores de p para distribuição simétrica - testes de cauda esquerda, cauda direita e bicaudais.

Caso não simétrico: distribuição qui-quadrado:

valores de p para distribuição não simétrica - testes de cauda esquerda, cauda direita e bicaudal.

Na última figura (valor-p bicaudal para distribuição não simétrica), a área do lado esquerdo é igual à área do lado direito.

Como calcular o valor-p a partir do teste estatístico?

Para determinar o valor-p, você precisa conhecer a distribuição do seu teste estatístico sob a suposição de que a hipótese nula seja verdadeira. Em seguida, com a ajuda da Função de Distribuição Acumulada (FDA) dessa distribuição, podemos expressar a probabilidade do teste estatístico ser pelo menos tão extremo quanto seu valor x para a amostra:

Teste de cauda esquerda:

valor-p = fda(x).
Teste de cauda direita:

valor-p = 1 - fda(x).
Teste bicaudal:

valor-p = 2 × min{fda(x) , 1 - fda(x)}.

Se a distribuição do teste estatístico em H₀ for simétrica em relação a 0, então um valor-p bicaudal pode ser simplificado para valor-p = 2 × fda(-|x|) ou, de forma equivalente, como valor-p = 2 - 2 × fda(|x|).

As distribuições de probabilidade mais comuns nos testes de hipóteses tendem a ter fórmulas de FDA complicadas, e talvez não seja possível encontrar o valor-p manualmente. Você provavelmente precisará recorrer a um computador ou a uma tabela estatística, que contém os valores aproximados de FDA.

Agora você já sabe como calcular o valor-p, mas, por que você precisa calculá-lo em primeiro lugar? No teste de hipóteses, a abordagem do valor-p é uma alternativa à abordagem do valor crítico. Lembre-se de que a última exige que os pesquisadores pré-definam o nível de significância, α, que é a probabilidade de rejeitar a hipótese nula quando ela é verdadeira (portanto, erro tipo I). Após obter o valor-p, você só precisa compará-lo com um determinado α para decidir rapidamente se deve ou não rejeitar a hipótese nula nesse nível de significância, α. Para obter detalhes, consulte a próxima seção, onde explicamos como interpretar os valores p.

Como interpretar o valor-p

Como mencionamos acima, o valor-p é a resposta para a seguinte pergunta:

Supondo que eu viva em um mundo em que a hipótese nula seja válida, qual é a probabilidade de que, para outra amostra, o teste que estou realizando gere um valor pelo menos tão extremo quanto o que observei para a amostra que já tenho?

O que isso significa para você? Bem, você tem duas opções:

Um valor-p alto significa que seus dados são altamente compatíveis com a hipótese nula; e
Um valor-p baixo fornece evidência contra a hipótese nula, pois significa que seu resultado seria muito improvável se a hipótese nula fosse verdadeira.

Entretanto, pode acontecer de a hipótese nula ser verdadeira, mas sua amostra ser altamente incomum! Por exemplo, imagine que estudamos o efeito de um novo medicamento e obtivemos um valor-p de 0,03. Isso significa que em 3% de estudos semelhantes, o acaso sozinho ainda seria capaz de produzir o valor do teste estatístico que obtivemos, ou um valor ainda mais extremo, mesmo que o medicamento não tivesse efeito algum!

A pergunta "o que é valor-p" também pode ser respondida da seguinte forma: valor-p é o menor nível de significância no qual a hipótese nula seria rejeitada. Portanto, se você quiser tomar uma decisão sobre a hipótese nula em algum nível de significância α, basta comparar seu valor-p com α:

Se valor-p ≤ α, então você rejeita a hipótese nula e aceita a hipótese alternativa; e
Se valor-p ≥ α, então você não tem evidência suficiente para rejeitar a hipótese nula.

Obviamente, o destino da hipótese nula depende de α. Por exemplo, se o valor-p fosse 0,03, rejeitaríamos a hipótese nula em um nível de significância de 0,05, mas não em um nível de 0,01. É por isso que o nível de significância deve ser declarado com antecedência e não adaptado convenientemente após o valor-p ter sido estabelecido! Um nível de significância de 0,05 é o valor mais comum, mas não há nada de mágico nele. Aqui, você pode encontrar o porquê um nível de significância de 0,05 é confiável. No entanto, é sempre melhor informar o valor-p e permitir que o leitor tire suas próprias conclusões.

Além disso, lembre-se de que a experiência no assunto (e o bom senso) são fundamentais para interpretar os resultados de um teste estatístico. Caso contrário, aplicando princípios estatísticos sem pensar, você pode facilmente chegar a um resultado estatisticamente significativo, apesar de a conclusão ser 100% falsa.

Como usar a calculadora de valor-p para encontrar o valor-p do teste estatístico

Como a nossa calculadora de valor-p está aqui à sua disposição, você não precisa mais se perguntar como encontrar o valor-p de todas aquelas testes estatísticos complicados! Aqui estão as etapas que você precisa seguir:

Escolha a hipótese alternativa: bicaudal, de cauda direita ou de cauda esquerda.
Diga-nos qual é a distribuição do teste estatístico sob a hipótese nula: é N(0,1), t-Student, qui-quadrado ou F de Snedecor? Se você não tiver certeza, consulte as seções abaixo, pois elas são dedicadas a essas distribuições.
Se necessário, especifique os graus de liberdade da distribuição do teste estatístico.
Digite o valor do teste estatístico calculado para sua amostra de dados.
Por padrão, o nível de significância que a calculadora utiliza é 0,05.

Nossa calculadora determina o valor-p do teste estatístico e fornece a decisão a ser tomada sobre a hipótese nula.

Como encontrar o valor-p a partir do escore padrão?

Em termos da Função de Distribuição Acumulada (FDA) da distribuição normal padrão, que é tradicionalmente denotada por Φ, é possível encontrar o valor-p a partir do escore padrão (valor-z) da seguinte forma:

Teste z de cauda esquerda:

valor-p = Φ(valor-z)
Teste z de cauda direita:

valor-p = 1 - Φ(valor-z)
Teste z bicaudal:

valor-p = 2 × Φ(-|valor-z|)

ou

valor-p = 2 - 2 × Φ(|valor-z|)

🙋 Para saber mais sobre os testes Z, acesse a calculadora de teste z da Omni.

Usamos o escore padrão ou escore-z se o teste estatístico seguir aproximadamente a distribuição normal padrão N(0,1). Graças ao teorema do limite central, você pode contar com a aproximação se tiver uma amostra grande (digamos, pelo menos 50 dados) e tratar sua distribuição como normal.

Um teste z geralmente se refere ao teste da média da população ou à diferença entre duas médias da população, em particular entre duas proporções. Você também pode encontrar testes z em estimativas de máxima verossimilhança.

Densidade de distribuição normal N(0,1) com valor de expectativa zero e desvio padrão de um. — Densidade da distribuição normal padrão. StefanPohl / CC0 wikimedia.org

Como faço para encontrar o valor-p a partir do valor-t?

O valor-p do valor-t é dado pelas seguintes fórmulas, nas quais fda_t,d representa a função de distribuição acumulada da distribuição t de Student com d graus de liberdade:

Teste t de cauda esquerda:

valor-p = fda_t,d(valor-t)
Teste t de cauda direita:

valor-p = 1 - fda_t,d(valor-t)
Teste t bicaudal:

valor-p = 2 × fda_t,d(-|valor-t|)

ou

valor-p = 2 - 2 × fda_t,d(|valor-t|)

Use a opção do valor-t se o teste estatístico seguir a distribuição t de Student. Essa distribuição tem uma forma semelhante à N(0,1) (em forma de sino e simétrica), mas tem caudas mais pesadas. A forma exata depende do parâmetro chamado graus de liberdade. Se o número de graus de liberdade for grande (>30), o que geralmente ocorre em amostras grandes, a distribuição t de Student é praticamente indistinguível da distribuição normal N(0,1).

densidades de distribuição de t de Student para 1, 2, 5 e um número infinito de graus de liberdade. — Densidade da distribuição t com ν graus de liberdade. Skbkekas / CC BY, wikimedia.org

Os testes t mais comuns são aqueles para médias populacionais com um desvio padrão populacional desconhecido ou para a diferença entre médias de duas populações, com desvios padrões populacionais iguais ou desiguais, porém desconhecidos. Há também um teste t para amostras pareadas (dependentes).

🙋 Para obter mais informações sobre o teste t de Student, recomendamos que você use nossa calculadora de teste t.

Valor-p a partir da distribuição qui-quadrado (χ²)

Use a opção do valor-χ² ao realizar um teste no qual o teste estatístico segue a distribuição χ².

Essa distribuição surge se, por exemplo, você pegar a soma de variáveis quadradas, cada uma seguindo a distribuição normal N(0,1). Lembre-se de verificar o número de graus de liberdade da distribuição χ² do seu teste!

Densidades de distribuição do qui-quadrado para 1, 2, 3, 4, 6 e 9 graus de liberdade. — Densidade da distribuição χ² com k graus de liberdade. Geek3 / CC BY wikimedia.org

Como encontrar o valor-p da distribuição qui-quadrado? Você pode fazer isso com a ajuda das seguintes fórmulas, nas quais fda_χ²,d denota a função de distribuição acumulada da distribuição χ² com d graus de liberdade:

Teste de χ² de cauda esquerda:

valor-p = fda_χ²,d(valor-χ²)
Teste do χ² de cauda direita:

valor-p = 1 - fda_χ²,d(valor-χ²)

Lembre-se de que os testes de χ² para adequação e independência são testes de cauda direita! (veja abaixo)
Teste χ² bicaudal:

valor-p = 2 × min{fda_χ²,d(valor-χ²), 1 - fda_χ²,d(valor-χ²)}

(Por min{a,b}, denotamos o menor dos números a e b)

Os testes mais populares que levam a um escore χ² são os seguintes:

Testar se a variância de dados normalmente distribuídos tem algum valor predeterminado. Nesse caso, o teste estatístico tem a distribuição χ² com n - 1 graus de liberdade, em que n é o tamanho da amostra. Esse pode ser um teste unicaudal ou bicaudal.
O teste de bondade de ajuste verifica se a distribuição empírica (da amostra) está de acordo com alguma distribuição de probabilidade esperada. Nesse caso, o teste estatístico segue a distribuição χ² com k - 1 graus de liberdade, em que k é o número de classes em que a amostra está dividida. Esse é um teste de cauda direita.
o teste de independência é usado para determinar se há uma relação estatisticamente significativa entre duas variáveis. Nesse caso, seu teste estatístico baseia-se na tabela de contingência e segue a distribuição χ² com (r - 1)(c - 1) graus de liberdade, em que r é o número de linhas e c é o número de colunas nessa tabela de contingência. Esse também é um teste de cauda direita.

Valor-p a partir da distribuição F

Por fim, a opção do valor-F deve ser usada quando você realiza um teste no qual o teste estatístico segue a distribuição F, também conhecida como distribuição Fisher-Snedecor. A forma exata de uma distribuição F depende de dois graus de liberdade.

Densidades de distribuição F com pares de graus de liberdade: (1, 1), (2, 1), (5, 2), (10, 1), (100, 100). — Densidade da distribuição F com (d₁,d₂)-graus de liberdade. IkamusumeFan / CC BY-SA wikimedia.org

Para ver de onde vêm esses graus de liberdade, considere as variáveis aleatórias independentes X e Y, que seguem as distribuições χ² com d₁ e d₂ graus de liberdade, respectivamente. Nesse caso, a razão (X/d₁)/(Y/d₂) segue a distribuição F, com (d₁, d₂) graus de liberdade. Por esse motivo, os dois parâmetros d₁ e d₂ também são chamados de graus de liberdade do numerador e do denominador.

O valor-p do valor-F é dado pelas fórmulas a seguir, em que fda_F,d1,d2 denota a função de distribuição acumulada da distribuição F, com (d₁, d₂) graus de liberdade:

Teste F de cauda esquerda:

valor-p = fda_F,d1,d2(valor-F)
Teste F de cauda direita:

valor-p = 1 - fda_F,d1,d2(valor-F)
Teste F bicaudal:

valor-p = 2 × min{fda_F,d1,d2(valor-F), 1 - fda_F,d1,d2(valor-F)}

(Por min{a,b}, denotamos o menor dos números a e b)

Abaixo, listamos os testes mais importantes que seguem a distribuição F. Todos eles são testes de cauda direita.

Um teste para a igualdade de variâncias em duas populações normalmente distribuídas. Seu teste estatístico segue a distribuição F com (n - 1, m - 1) graus de liberdade, em que n e m são os respectivos tamanhos de amostra.
a ANOVA é usada para testar a igualdade de médias em três ou mais grupos provenientes de populações normalmente distribuídas com variâncias iguais. Chegamos à distribuição F com (k - 1, n - k) graus de liberdade, em que k é o número de grupos e n é o tamanho total da amostra (em todos os grupos juntos).
Um teste para significância geral da análise de regressão. O teste estatístico tem uma distribuição F com (k - 1, n - k) graus de liberdade, em que n é o tamanho da amostra e k é o número de variáveis (incluindo a interceptação).

Com a presença da relação linear estabelecida em sua amostra de dados com o teste acima, você pode calcular o coeficiente de determinação, R², que indica a força dessa relação. Você pode fazer isso manualmente ou usar a calculadora do coeficiente de determinação (R²) 🇺🇸 da Omni.
Um teste para comparar dois modelos de regressão aninhados. O teste estatístico segue a distribuição F com (k₂ - k₁, n - k₂) graus de liberdade, em que k₁ e k₂ são os números de variáveis nos modelos menor e maior, respectivamente, e n é o tamanho da amostra.

Você pode notar que o teste F de uma significância geral é uma forma particular do teste F para comparar dois modelos agrupados: ele testa se o nosso modelo é significativamente melhor do que o modelo sem preditores (ou seja, o modelo somente de interceptação).

Perguntas frequentes

O valor-p pode ser negativo?

Não, o valor-p não pode ser negativo. Isso ocorre porque as probabilidades não podem ser negativas, e o valor-p é a probabilidade da estatística de teste atender a determinadas condições.

O que significa um valor-p alto?

Um valor-p alto significa que, sob a hipótese nula, há uma grande probabilidade de que, para outra amostra, o teste estatístico gere um valor pelo menos tão extremo quanto o observado na amostra que você já tem. Um valor-p alto não permite que você rejeite a hipótese nula.

O que significa um valor-p baixo?

Um valor-p baixo significa que, sob a hipótese nula, há pouca probabilidade de que, para outra amostra, o teste estatístico gere um valor pelo menos tão extremo quanto o observado para a amostra que você já tem. Um valor-p baixo é uma evidência a favor da hipótese alternativa, ou seja, ele permite que você rejeite a hipótese nula.