Omni calculator
Dernière mise à jour le:

Calculateur de test Z

Sommaire

Qu'est-ce qu'un test Z ?Quand doit-on utiliser les tests Z ?Formule du test ZValeur p du test ZTest Z bilatéral et test Z unilatéralValeurs critiques et régions critiques du test ZComment utiliser le calculateur du test Z à un échantillon ?Exemples du test ZFAQ

Ce calculateur de test Z vous aide à effectuer un test Z à un échantillon sur la moyenne de la population. Il existe deux formes de ce test (le test Z bilatéral et le test Z unilatéral) qui peuvent être utilisées en fonction de vos objectifs. Vous pouvez également choisir si le calculateur doit déterminer la valeur p du test Z ou si vous préférez utiliser l'approche de la valeur critique !

Poursuivez votre lecture pour en savoir plus sur le test Z en statistique et, en particulier, pour savoir quand utiliser les tests Z, quelle est la formule du test Z et s'il convient d'utiliser le test Z plutôt que le test de Student. En prime, nous vous proposons quelques exemples pour apprendre à effectuer des tests Z pas à pas !

Vous pouvez également consulter notre calculateur de statistiques du test de Student, qui vous permettra d'apprendre le concept d'une autre statistique essentielle. Si vous êtes par ailleurs intéressé·e par le test F, consultez notre calculateur de statistiques du test F 🇺🇸.

Qu'est-ce qu'un test Z ?

Le test Z à un échantillon est l'un des tests de position les plus populaires. L'hypothèse nulle est que la valeur moyenne de la population est égale à un nombre donné, μ0\mu_0 :

H0:μ=μ0\footnotesize \mathrm H_0 \!\!:\!\! \mu = \mu_0

Nous effectuons un test Z bilatéral pour tester si la moyenne de la population n'est pas μ0\mu_0 :

H1:μμ0\footnotesize \mathrm H_1 \!\!:\!\! \mu \ne \mu_0

Nous effectuons un test Z unilatéral pour tester si la moyenne de la population est inférieure ou supérieure à μ0\mu_0 :

H1:μ<μ0 (test unilateˊral aˋ gauche)\footnotesize \mathrm H_1 \!\!:\!\! \mu \lt \mu_0 \ (\text{test unilatéral à gauche)}
H1:μ>μ0 (test unilateˊral aˋ droite)\footnotesize \mathrm H_1 \!\!:\!\! \mu \gt \mu_0 \ (\text{test unilatéral à droite)}

Examinons maintenant les hypothèses d'un test Z à un échantillon.

Quand doit-on utiliser les tests Z ?

Vous pouvez utiliser un test Z si votre échantillon est constitué de points de données indépendants et :

  • les données sont normalement distribuées, et vous connaissez la variance de la population ; ou

  • l'échantillon est grand et les données suivent une distribution dont la moyenne et la variance sont finies. Vous n'avez pas besoin de connaître la variance de la population.

La raison pour laquelle ces deux possibilités existent est que nous voulons que les statistiques de test suivent la loi normale centrée réduite N(0,1)\mathrm N(0, 1). Dans le premier cas, il s'agit d'une loi normale centrée réduite exacte, tandis que dans le second, elle l'est approximativement, grâce au théorème de la limite centrale.

Une question demeure : quand mon échantillon est-il considéré comme grand ? Il n'y a pas de critère universel. En général, plus vous avez de points de données, mieux l'approximation fonctionne. Les manuels de statistique recommandent de disposer d'au moins 50 points de données, tandis que 30 est considéré comme le strict minimum.

Formule du test Z

Soit x1,...,xnx_1, ..., x_n un échantillon indépendant suivant la loi normale N(μ,σ2)\mathrm N(\mu, \sigma^2), c'est-à-dire avec une moyenne égale à μ\mu, et une variance égale à σ2\sigma ^2.

Nous prenons l'hypothèse nulle :

H0 ⁣: ⁣ ⁣μ=μ0\mathrm H_0 \!:\!\! \mu = \mu_0

Nous définissons la statistique de test, Z, comme suit :

Z=(xˉμ0)nσZ = (\bar x - \mu _0 ) \frac{\sqrt n}{\sigma}

où :

  • xˉ\bar x – la moyenne de l'échantillon, soit xˉ=(x1+...+xn)/n\bar x = (x_1 + ... + x_n) / n

  • μ0\mu_0 – la moyenne établie dans H0\mathrm H_0

  • nn – la taille d'échantillon

  • σ\sigma – l'écart type de la population

Dans ce qui suit, ZZ majuscule représente la statistique du test (traitée comme une variable aléatoire), tandis que zz minuscule désigne une valeur réelle de ZZ, calculée pour un échantillon donné tiré de N(μ,σ²).

Si H0\mathrm H_0 est valable, la somme Sn=x1+...+xnS_n = x_1 + ... + x_n suit la distribution normale, avec une moyenne nμ0n \mu_0 et une variance n2σn^2 \sigma. Comme ZZ est la normalisation (score Z) de Sn/nS_n/n, nous pouvons conclure que la statistique du test ZZ suit la loi normale centrée réduite N(0,1)\mathrm N(0, 1), à condition que H0\mathrm H_0 soit vrai. D'ailleurs, nous avons le calculateur de score Z si vous voulez vous concentrer sur ce seul score.

Si nos données ne suivent pas une loi normale, ou si l'écart type de la population est inconnu (et donc dans la formule pour ZZ nous remplaçons l'écart type de la population σ\sigma par l'écart type de l'échantillon), alors la statistique du test ZZ ne suit pas nécessairement une loi normale. Cependant, si l'échantillon est suffisamment grand, le théorème de la limite centrale garantit que ZZ suit approximativement N(0,1)\mathrm N(0, 1).

Dans les sections suivantes, nous vous expliquerons comment utiliser la valeur de la statistique de test, zz, pour prendre une décision, et s'il faut ou non rejeter l'hypothèse nulle. Deux approches peuvent être utilisées pour parvenir à cette décision : l'approche de la valeur p et l'approche de la valeur critique ; et nous expliquons les deux approches ! Laquelle devriez-vous utiliser ? Dans le passé, l'approche de la valeur critique était plus populaire parce qu'il était difficile de calculer la valeur p à partir d'un test Z. Cependant, grâce aux ordinateurs modernes, nous pouvons le faire assez facilement, et avec une bonne précision. En général, il est fortement conseillé de donner la valeur p de vos tests !

Valeur p du test Z

Formellement, la valeur p est le plus petit seuil de signification auquel l'hypothèse nulle peut être rejetée. Plus intuitivement, la valeur p répond aux questions suivantes.
À condition que l'on vive dans un monde où l'hypothèse nulle se vérifie, quelle est la probabilité que la valeur de la statistique du test soit au moins aussi extrême que la valeur zz que l'on a obtenue pour notre échantillon ? Par conséquent, une petite valeur p signifie que votre résultat est très improbable sous l'hypothèse nulle, et qu'il y a donc une forte probabilité que l'hypothèse nulle soit rejetée (plus la valeur p est petite, plus la probabilité que l'hypothèse soit rejetée est forte).

Pour trouver la valeur p, vous devez calculer la probabilité que la statistique du test, ZZ, soit au moins aussi extrême que la valeur observée, zz, si l'hypothèse nulle est vraie (la probabilité d'un événement calculée en supposant que H0\mathrm H_0 est vraie sera notée P(eˊveˋnementH0)\small \mathrm{P}(\text{évènement} | \mathrm{H_0}).) C'est l'hypothèse alternative qui détermine ce que signifie plus extrême :

  1. Test Z bilatéral : les valeurs extrêmes sont celles dont la valeur absolue dépasse z|z|, c'est-à-dire celles qui sont inférieures à z-|z| ou supérieures à z|z|. Par conséquent, nous avons :
valeur p= P(Z ⁣ ⁣z  H0)+ P(Z ⁣ ⁣z  H0)\begin{split} \quad \text{valeur p} &= \ \mathrm{P} (Z \! \leq \! - |z| \ | \ \mathrm{H_0}) \\[0.5em] &+ \ \mathrm{P} (Z \! \geq \! |z| \ | \ \mathrm{H_0}) \end{split}

La symétrie de la loi normale donne :

valeur p=2P(Z ⁣ ⁣z H0)\quad \text{valeur p} = 2 \mathrm{P} (Z \! \leq \! - |z| \ | \mathrm{H_0})
  1. Test Z unilatéral à gauche : les valeurs extrêmes sont celles qui sont inférieures à zz, ce qui nous donne :
valeur p=P(ZzH0)\quad \text{valeur p} = \mathrm{P} (Z \leq z | \mathrm{H_0})
  1. Test Z unilatéral à droite : les valeurs extrêmes sont celles qui sont supérieures à zz, nous avons donc :
valeur p=P(ZzH0)\quad \text{valeur p} = \mathrm{P} (Z \geq z | \mathrm{H_0})

Pour calculer ces probabilités, nous pouvons utiliser la fonction de répartition (angl. cumulative distribution function, cdf) de N(0,1)\mathrm N(0, 1), qui, pour un nombre réel, xx, est définie comme suit :

Φ(x)=P(ZxH0)= 12πxet22dt\begin{split} \Phi (x) &= \mathrm{P}(Z \leq x | \mathrm{H_0}) \\[1em] &= \ \frac{1}{\sqrt{2\pi}} \int_{-\infty}^x \mathrm{e}^{-\frac{t^2}{2}}dt \end{split}

En outre, les valeurs p peuvent être représentées comme l'aire sous la fonction de densité (angl. probability density function, pdf) de N(0,1)\mathrm N(0, 1), en raison de :

P(ZxH0)=Φ(x)=l’aire aˋ gauche de x\mathrm{P}(Z \leq x | \mathrm{H_0}) = \Phi(x) \\[0.5em] = \text{l'aire à gauche de } x
P(ZxH0)=1Φ(x)=l’aire aˋ droite de x\mathrm{P}(Z \geq x | \mathrm{H_0}) = 1 - \Phi(x) \\[0.5em] = \text{l'aire à droite de } x

Test Z bilatéral et test Z unilatéral

Avec tout ce que vous avez appris dans la section précédente, vous êtes prêt·e à vous familiariser avec les tests Z.

  1. Test Z bilatéral :
valeur p=Φ(z)+(1Φ(z))\small \text{valeur p} = \Phi(-|z|) + (1 - \Phi(|z|))

Du fait que Φ(z)=1Φ(z)\Phi(-z) = 1 - \Phi(z), on en déduit que :

valeur p=2Φ(z)=2(1Φ(z))\small \text{valeur p} = 2 \Phi(-|z|) = 2(1 - \Phi(|z|))

La valeur p est l'aire sous la fonction de densité (pdf) à la fois à gauche de z-|z|, et à droite de z|z|:

Valeur p bilatérale.
  1. Test Z unilatéral à gauche :
valeur p=Φ(z)\small \quad \text{valeur p} = \Phi(z)

La valeur p est l'aire sous la courbe de la fonction de densité à gauche de notre zz :

Valeur p à gauche.
  1. Test Z unilatéral à droite :
p-valeur=1Φ(z)\small \quad \text{p-valeur} = 1 - \Phi(z)

La valeur p est l'aire sous la courbe de la fonction de densité à droite de zz :

Valeur p à droite.

La décision de rejeter ou non l'hypothèse nulle peut maintenant être prise à n'importe quel seuil de signification, α\alpha, que vous souhaitez !

  • Si la valeur p est inférieure ou égale à α\alpha, l'hypothèse nulle est rejetée à ce seuil de signification.

  • Si la valeur p est supérieure à α\alpha, il n'y a pas suffisamment de preuves pour rejeter l'hypothèse nulle à ce seuil de signification.

Valeurs critiques et régions critiques du test Z

L'approche des valeurs critiques consiste à comparer la valeur de la statistique de test obtenue pour notre échantillon, zz, aux valeurs dites critiques. Ces valeurs constituent les limites des régions où il est très improbable que la statistique du test se trouve. Ces régions sont souvent appelées régions critiques ou régions de rejet. La décision de rejeter ou non l'hypothèse nulle repose alors sur l'appartenance ou non de notre zz à la région critique.

Les régions critiques dépendent du seuil de signification, α\alpha, du test et de l'hypothèse alternative. Le choix de α\alpha est arbitraire ; dans la pratique, les valeurs de 0,1, 0,05 ou 0,01 sont le plus souvent utilisées pour α\alpha.

Une fois que nous nous sommes mis d'accord sur la valeur de α\alpha, nous pouvons facilement déterminer les régions critiques du test Z :

  1. Test Z bilatéral :
 (,Φ1 ⁣ ⁣(α2) ⁣][Φ1 ⁣ ⁣(α2),)\small \ \left(-\infty, \Phi^{-1} \!\! \left( \frac{\alpha}{2} \right) \! \right] \cup \left[ \Phi^{-1} \!\! \left( \frac{\alpha}{2} \right), \infty \right)
  1. Test Z unilatéral à gauche :
(,Φ1 ⁣(α)]\small \quad \left(-\infty, \Phi^{-1} \! \left(\alpha \right) \right]
  1. Test Z unilatéral à droite :
[Φ1 ⁣(1α),)\small \quad \left[ \Phi^{-1} \! \left( 1 - \alpha \right), \infty \right)

Pour décider du sort de H0\mathrm H_0, vérifiez si votre zz se trouve ou non dans la région critique.

  • Si oui, rejetez H0\mathrm H_0 et acceptez H1\mathrm H_1.

  • Si non, il n'y a pas suffisamment de preuves pour rejeter H0\mathrm H_0.

Comme vous le voyez, les formules pour les valeurs critiques des tests Z impliquent l'inverse, Φ1\Phi^{-1}, de la fonction de répartition (cdf) de N(0,1)\mathrm N(0, 1).

Comment utiliser le calculateur du test Z à un échantillon ?

Notre calculateur vous simplifie la vie !

  1. Choisissez l'hypothèse alternative : bilatérale ou unilatérale à gauche/à droite.

  2. Dans notre calculateur de test Z, vous pouvez décider d'utiliser la valeur p ou l'approche des régions critiques. Dans ce dernier cas, définissez le seuil de signification, α\alpha.

  3. Saisissez la valeur de la statistique de test, zz. Si vous ne la connaissez pas, vous pouvez entrer certaines données qui nous permettront de calculer votre zz.

    • Moyenne de l'échantillon xˉ\bar x (si vous disposez de données brutes, consultez le calculateur de moyenne arithmétique pour déterminer la moyenne).
    • Moyenne testée μ0\mu_0.
    • Taille de l'échantillon nn.
    • L'écart type de la population σ\sigma (ou l'écart type de l'échantillon si votre échantillon est grand).
  4. Les résultats apparaissent immédiatement au bas du calculateur.

Si vous souhaitez trouver zz sur la base de la valeur p, n'oubliez pas que dans le cas de tests bilatéraux, il existe deux valeurs possibles de zz : une positive et une négative, et qu'il s'agit de nombres opposés. Dans ce cas, le calculateur de test Z renvoie la valeur positive. Pour trouver l'autre valeur possible de zz pour une valeur p donnée, il suffit de prendre le nombre opposé à la valeur de zz affichée par le calculateur.

Exemples du test Z

Pour s'assurer que vous avez bien compris l'essence du test Z, passons en revue quelques exemples :

  1. Une machine pour remplir des bouteilles suit une loi normale. Son écart type, tel que déclaré par le fabricant, est égal à 30 mL. Un vendeur de jus de fruits affirme que le volume versé dans chaque bouteille est, en moyenne, d'un litre, soit 1 000 mL, mais nous soupçonnons qu'en fait le volume moyen est plus petit que cela…

    Formellement, les hypothèses que nous posons sont les suivantes :

    • H0 ⁣:μ=1000 mL\mathrm H_0 \! : \mu = 1\,000 \text{ mL}

    • H1 ⁣:μ<1000 mL\mathrm H_1 \! : \mu \lt 1\,000 \text{ mL}

    Nous sommes allés dans un magasin et avons acheté un échantillon de 9 bouteilles. Après avoir mesuré prudemment le volume de jus de chaque bouteille, nous avons obtenu l'échantillon suivant (en millilitres).

    1020,970,1000,980,1010,930,950,980,980\footnotesize 1\,020, 970, 1\,000, 980, 1\,010, 930, 950, 980, 980

    • Taille de l'échantillon : n=9n = 9.

    • Moyenne de l'échantillon : xˉ=980 mL\bar x = 980 \ \mathrm{mL}.

    • Écart type de la population : σ=30 mL\sigma = 30 \ \mathrm{mL}.

    • Ainsi, nous obtenons :

Z=(9801000)/309=2\small\quad Z = (980 - 1\,000) / \frac{30}{\sqrt 9} = -2
  • Par conséquent, valeur p=Φ(2)0, ⁣0228\text{valeur p} = \Phi(-2) \approx 0,\!022\,8.

    Comme 0, ⁣0228<0, ⁣050,\!022\,8 \lt 0,\!05, nous concluons que nos soupçons ne sont pas infondés ; au seuil de signification le plus courant, 0,05, nous rejetterions l'affirmation du producteur, H0\mathrm H_0, et accepterions l'hypothèse alternative, H1\mathrm H_1.

  1. Nous avons lancé une pièce de monnaie 50 fois. Nous avons obtenu 20 fois pile et 30 fois face. Les preuves sont-elles suffisantes pour affirmer que la pièce est pipée ?

    Il est clair que nos données suivent une loi de Bernoulli, avec une probabilité de succès pp et une variance σ2=p(1p)\sigma^2 = p (1-p). Cependant, l'échantillon étant grand, nous pouvons effectuer un test Z en toute sécurité. Nous adoptons la convention selon laquelle le fait d'obtenir pile est un succès.

    Énonçons l'hypothèse nulle et l'hypothèse alternative.

    • H0 ⁣:p=0, ⁣5\mathrm H_0 \! : p = 0,\!5 (la pièce est équilibrée: la probabilité d'obtenir pile est de 0, ⁣50,\!5).

    • H1 ⁣:p0, ⁣5\mathrm H_1 \! : p \ne 0,\!5 (la pièce est pipée : la probabilité d'obtenir pile diffère de 0, ⁣50,\!5).

    Dans notre échantillon, nous avons 20 succès (notés par des 1) et 30 échecs (notés par des 0).

    • Taille de l'échantillon n=50n = 50.

    • Moyenne de l'échantillon xˉ=20/50=0, ⁣4\bar x = 20/50 = 0,\!4.

    • L'écart type de la population est donné par σ=0, ⁣5×0, ⁣5\sigma = \sqrt{0,\!5 \times 0,\!5} (car 0, ⁣50,\!5 est la proportion pp supposée dans H0\mathrm H_0). Par conséquent, σ=0, ⁣5\sigma = 0,\!5.

  • Nous avons :
Z=(0, ⁣40, ⁣5)/0, ⁣550=21, ⁣4142\begin{split} \quad Z &= (0,\!4 - 0,\!5)/ \frac{0,\!5}{\sqrt{50}} \\[0.5em] &= -\sqrt 2 \approx -1,\!414\,2 \end{split}
  • Et, nous obtenons :
valeur p2 Φ(1, ⁣4142)0, ⁣1573\begin{split} \quad \text{valeur p} &\approx 2 \ \Phi(-1,\!4142) \\[0.5em] &\approx 0,\!1573 \end{split}

Parce que 0, ⁣1573>0, ⁣10,\!1573 \gt 0,\!1 nous n'avons pas assez de preuves pour rejeter l'affirmation selon laquelle la pièce est juste, même à un seuil de signification aussi élevé que 0, ⁣10,\!1. Dans ce cas, vous pouvez lancer votre pièce sans crainte ou utiliser le calculateur de pile ou face pour connaître vos chances d'obtenir, par exemple, 10 face d'affilée (ces chances sont extrêmement faibles !).

FAQ

Quelle est la différence entre le test Z et le test de Student ?

Nous utilisons le test de Student pour tester la moyenne de la population d'un ensemble de données normalement distribuées dont l'écart type de la population est inconnu. Nous obtenons cela en remplaçant l'écart type de la population dans la formule de la statistique du test Z par l'écart type de l'échantillon. Cela signifie que cette nouvelle statistique de test suit (à condition que H₀ soit valable) la loi de Student à n-1 degrés de liberté au lieu de N(0,1).

Quand doit-on utiliser le test de Student plutôt que le test Z ?

Pour les grands échantillons, la loi de Student avec n degrés de liberté se rapproche de la loi N(0,1). Par conséquent, tant qu'il y a un nombre suffisant de points de données (au moins 30), il importe peu que vous utilisiez le test Z ou le test de Student, puisque les résultats seront presque identiques. Toutefois, pour les petits échantillons dont la variance est inconnue, pensez à utiliser le test de Student à la place du test Z.

Comment calculer la statistique du test Z ?

Pour calculer la statistique du test Z :

  1. Calculez la moyenne arithmétique de votre échantillon.
  2. Soustrayez de cette moyenne la moyenne établie dans l'hypothèse nulle.
  3. Multipliez par la racine carrée de la taille de l'échantillon.
  4. Divisez par l'écart type de la population.
  5. Voilà, vous venez de calculer la statistique du test Z !

Ici, nous effectuons un test Z pour la moyenne de la population μ.

Hypothèse nulle H₀ : μ = μ₀.

Check out 26 similar inference, regression, and statistical tests calculators 📉
Absolute uncertaintyAB testCoefficient of determination...23 more