Calculadora de prueba Z
Índice general
¿Qué es una prueba Z?¿Cuándo se utiliza una prueba Z?Fórmula de la prueba zValor p de la prueba ZPrueba Z de dos colas y prueba Z de una colaValores críticos de la prueba Z y regiones críticas¿Cómo utilizo la calculadora de prueba Z de una muestra?Ejemplos de prueba ZPreguntas frecuentesEsta calculadora de prueba Z es una herramienta que te ayuda a realizar una prueba Z de una muestra sobre la media de la población. Existen dos formas en las que puedes realizar esta prueba en función de tus necesidades: la prueba Z de dos colas y la prueba Z de una cola. También puedes elegir si la calculadora debe determinar el valor p de la prueba Z o si prefieres utilizar el método del valor crítico.
Sigue leyendo para saber más sobre la prueba Z en estadística y, en particular, cuándo utilizar la prueba Z, cuál es la fórmula de la prueba Z y si debes utilizar la prueba Z o la prueba t. Además, te ofrecemos algunos ejemplos paso a paso de cómo se realiza una prueba Z.
O también puedes consultar nuestra calculadora del estadístico t, donde podrás aprender el concepto de otro estadístico esencial. Si también te interesa la prueba F, consulta nuestra calculadora del estadístico F 🇺🇸.
¿Qué es una prueba Z?
La prueba Z de una muestra es una de las pruebas paramétricas más populares. La hipótesis nula es que el valor medio de la población es igual a un número dado, :
Realizamos una prueba Z de dos colas si queremos comprobar si la media de la población no es :
y una prueba Z de una cola si queremos comprobar si la media de la población es menor/mayor que :
Analicemos ahora las suposiciones de una prueba Z de una muestra.
¿Cuándo se utiliza una prueba Z?
Puedes utilizar una prueba Z si tu muestra consta de puntos de datos independientes y:
-
los datos están distribuidos normalmente, y conoces la varianza de la población;
o
-
la muestra es grande, y los datos siguen una distribución que tiene una media y una varianza finitas. No necesitas conocer la varianza poblacional.
La razón de que existan estas dos posibilidades es que queremos que el estadístico de contraste siga la distribución normal estándar . En el primer caso, se trata de una distribución normal estándar exacta, mientras que en el segundo, lo es aproximadamente, gracias al teorema del límite central.
La pregunta sigue siendo: "¿Cuándo se considera que mi muestra es grande? Pues bien, no existe un criterio universal. En general, cuantos más puntos de datos tengas, mejor funcionará la aproximación. Los libros de estadística recomiendan no tener menos de 50 puntos de datos, mientras que 30 se considera el mínimo indispensable.
Fórmula de la prueba z
Sea una muestra independiente que sigue la distribución normal , es decir, con una media igual a , y una varianza igual a .
Planteamos la hipótesis nula, .
Definimos el estadístico de contraste, Z, como:
donde:
-
es la media de la muestra, es decir, ;
-
es la media propuesta en ;
-
es el tamaño de muestra;
-
es la desviación estándar de la población.
En lo que sigue, la mayúscula significa el estadístico de contraste (tratado como una variable aleatoria), mientras que la minúscula denotará un valor real de , calculado para una muestra dada extraída de N(μ,σ²).
Si se cumple , entonces la suma sigue la distribución normal, con media y varianza . Como es la normalización (puntuación Z) de , podemos concluir que el estadístico de contraste sigue la distribución normal estándar , siempre que sea cierta. Por cierto, tenemos la calculadora de puntuación Z por si quieres centrarte solo en este valor.
Si nuestros datos no siguen una distribución normal, o si se desconoce la desviación estándar de la población (y, por tanto, en la fórmula para sustituimos la desviación estándar de la población por la desviación estándar de la muestra), entonces el estadístico de contraste no es necesariamente normal. Sin embargo, si la muestra es suficientemente grande, entonces el teorema del límite central garantiza que es aproximadamente .
En los apartados siguientes, te explicaremos cómo utilizar el valor del estadístico de contraste, , para saber si debes o no rechazar la hipótesis nula. Se pueden utilizar dos métodos para ello: el método del valor p y el método del valor crítico, ¡y cubrimos ambos! ¿Cuál debes utilizar? En el pasado, el enfoque del valor crítico era más popular porque resultaba difícil calcular el valor p a partir de la prueba Z. Sin embargo, con la ayuda de las computadoras modernas, podemos hacerlo con bastante facilidad y con una precisión decente. En general, ¡te recomendamos encarecidamente que indiques el valor p de tus pruebas!
Valor p de la prueba Z
Formalmente, el valor p es el nivel de significación más pequeño con el que podría rechazarse la hipótesis nula. De forma más intuitiva, el valor p responde a las preguntas:
Suponiendo que vivo en un mundo en el que se cumple la hipótesis nula, ¿cuán probable es que el valor del estadístico de contraste sea al menos tan extremo como el valor que tengo para mi muestra?
Por lo tanto, un valor p pequeño significa que tu resultado es muy improbable según la hipótesis nula, y que hay pruebas sólidas contra la hipótesis nula: cuanto más pequeño es el valor p, más sólidas son las pruebas.
Para hallar el valor p, tienes que calcular la probabilidad de que el estadístico de contraste, , sea al menos tan extremo como el valor que hemos observado realmente, , siempre que la hipótesis nula sea cierta. (La probabilidad de un suceso calculada bajo la hipótesis de que es cierta se denotará como ) Es la hipótesis alternativa la que determina qué significa más extremo:
- Prueba z de dos colas: los valores extremos son aquellos cuyo valor absoluto es superior a , es decir, los menores que o mayores que . Por tanto, tenemos:
La simetría de la distribución normal da:
- Prueba z de cola izquierda: los valores extremos son los menores que , entonces
- Prueba z de cola derecha: los valores extremos son los mayores que , por lo que
Para calcular estas probabilidades, podemos utilizar la función de distribución acumulada, (FDA) de , que para un número real, , se define como:
Además, los valores p pueden representarse como el área bajo la función de densidad de probabilidad (FDP) de , debido a:
Prueba Z de dos colas y prueba Z de una cola
Con todos los conocimientos que has adquirido en la sección anterior, estás preparado para aprender sobre las pruebas z.
- Prueba Z de dos colas:
Del hecho de que , deducimos que
El valor p es el área bajo la función de distribución de probabilidad (FDP) tanto a la izquierda de , como a la derecha de :
- Prueba Z de cola izquierda:
El valor p es el área bajo la FDP a la izquierda de nuestro :
- Prueba z de cola derecha:
El valor p es el área bajo la FDP a la derecha de :
¡La decisión de rechazar o no la hipótesis nula puede tomarse ahora a cualquier nivel de significación, , que desees!
-
si el valor p es menor o igual que , se rechaza la hipótesis nula a este nivel de significación;
-
si el valor p es mayor que , entonces no hay pruebas suficientes para rechazar la hipótesis nula en este nivel de significación.
Valores críticos de la prueba Z y regiones críticas
El método del valor crítico consiste en comparar el valor del estadístico de contraste obtenido para nuestra muestra, , con los llamados valores críticos. Estos valores constituyen los límites de las regiones en las que es muy improbable que se encuentre el estadístico de contraste. Esas regiones suelen denominarse regiones críticas, o regiones de rechazo. La decisión de rechazar o no la hipótesis nula se basa entonces en si nuestro pertenece o no a la región crítica.
Las regiones críticas dependen de un nivel de significación, , de la prueba, y de la hipótesis alternativa. La elección de es arbitraria; en la práctica, los valores 0.1, 0.05 o 0.01 son los más utilizados como .
Una vez acordado el valor de , podemos determinar fácilmente las regiones críticas de la prueba Z:
- Prueba Z de dos colas:
Para decidir que pasa con , comprueba si tu cae o no en la región crítica:
-
en caso afirmativo, rechaza y acepta ;
-
si la respuesta es negativa, entonces no hay pruebas suficientes para rechazar .
Como ves, las fórmulas para los valores críticos de las pruebas Z implican la inversa, , de la función de distribución acumulada (FDA) de .
¿Cómo utilizo la calculadora de prueba Z de una muestra?
Nuestra calculadora simplifica los pasos:
-
Elige la hipótesis alternativa: de dos colas o de cola izquierda/derecha.
-
En nuestra calculadora de prueba Z, puedes decidir si utilizas el método del valor p o el de las regiones críticas. En este último caso, establece el nivel de significación, .
-
Introduce el valor del estadístico de contraste, . Si no lo sabes, puedes introducir algunos datos que nos permitan calcular tu por ti:
- media muestral (Si tienes los datos sin procesar, ve a la calculadora de medias para determinar la media);
- media propuesta ;
- tamaño de muestra ;
- desviación estándar poblacional (o desviación estándar muestral si tu muestra es grande).
-
Los resultados aparecen inmediatamente debajo de la calculadora.
Si quieres encontrar basándote en el valor p, recuerda que en el caso de las pruebas de dos colas hay dos valores posibles de : uno positivo y otro negativo, y son números opuestos. Esta calculadora de prueba Z devuelve el valor positivo en tal caso. Para encontrar el otro valor posible de para un valor p dado, solo tienes que tomar el número opuesto al valor de que muestra la calculadora.
Ejemplos de prueba Z
Para asegurarnos de que has comprendido bien la esencia de la prueba Z, veamos algunos ejemplos:
- Una máquina llenadora de botellas sigue una distribución normal. Su desviación típica, declarada por el fabricante, es igual a 30 ml. Un vendedor de zumos afirma que el volumen vertido en cada botella es, en promedio, de un litro, es decir, 1000 ml, pero sospechamos que, en realidad, el promedio es menor que ese...
Formalmente, las hipótesis que establecemos son las siguientes:
Hemos ido a una tienda y hemos comprado una muestra de 9 botellas. Tras medir cuidadosamente el volumen del contenido de cada botella, hemos obtenido la siguiente muestra (en mililitros):
.
-
Tamaño de muestra: ;
-
Media de la muestra: ;
-
Desviación estándar de la población: ;
-
Por lo que
-
Y, por tanto, .
Como , concluimos que nuestras sospechas no son infundadas; al nivel de significación más común, 0.05, rechazaríamos la afirmación del productor, , y aceptaríamos la hipótesis alternativa, .
-
Lanzamos una moneda 50 veces. Obtenemos cruz 20 veces y cara 30. ¿Hay pruebas suficientes para afirmar que la moneda está sesgada?
Está claro que nuestros datos siguen la distribución de Bernoulli, con una probabilidad de acierto y una varianza . Sin embargo, la muestra es grande, por lo que podemos realizar con seguridad una prueba Z. Adoptamos la convención de que obtener cruz es un éxito.
Formulemos las hipótesis nula y alternativa:
-
(la moneda es justa, la probabilidad de salir cruz es )
-
(la moneda está sesgada, la probabilidad de cruz difiere de )
-
En nuestra muestra tenemos 20 aciertos (representados por unos) y 30 fallos (representados por ceros), por lo que:
-
Tamaño de muestra ;
-
Media de la muestra ;
-
La desviación estándar de la población viene dada por (porque es la proporción hipotetizada en ). Por lo tanto, ;
-
Así que
- Y, por lo tanto,
Desde no tenemos pruebas suficientes para rechazar la afirmación de que la moneda es justa, ni siquiera a un nivel de significación tan grande como . En ese caso, puedes utilizar la calculadora de probabilidad de lanzar una moneda para averiguar tus probabilidades de obtener, por ejemplo, 10 caras seguidas (¡que son extremadamente bajas!).
¿Cuál es la diferencia entre la prueba Z y la prueba t?
Utilizamos una prueba t de Student para comprobar la media poblacional de un conjunto de datos con distribución normal que tiene una desviación estándar poblacional desconocida. Esto se consigue sustituyendo la desviación estándar de la población en la fórmula del estadístico de la prueba Z por la desviación estándar de la muestra, lo que significa que este nuevo estadístico de contraste sigue (siempre que se cumpla H₀) la Distribución t de Student con n-1 grados de libertad en lugar de N(0,1).
¿Cuándo debo utilizar la prueba t en lugar de la prueba Z?
Para muestras grandes, la Distribución t de Student con n grados de libertad se aproxima a la N(0,1). Por tanto, mientras haya un número suficiente de puntos de datos (al menos 30), no importa realmente si utilizas la prueba Z o la prueba t, ya que los resultados serán casi idénticos. Sin embargo, para muestras pequeñas con varianza desconocida, recuerda utilizar la prueba t en lugar de la prueba Z.
¿Cómo calculo el estadístico de contraste Z?
Para calcular el estadístico de contraste Z:
- Calcula la media aritmética de tu muestra.
- A esta media, réstale la media propuesta en la hipótesis nula.
- Multiplica por la raíz cuadrada del tamaño de muestra.
- Divide por la desviación estándar de la población.
- Y listo, ¡acabas de calcular el estadístico de contraste Z!