Calcolatore per il Test Z
Indice
Che cos'è il test Z?Quando si utilizza il test Z?Formula del test ZValore p ottenuto dal test ZTest Z bilaterale e test Z unilateraleValori critici e regioni di rifiuto del test ZCome usare il calcolatore per il test Z su un campione?Esempi di test ZFAQQuesto calcolatore per il test Z è uno strumento che ti aiuta a eseguire un test Z sulla media di una popolazione. Esistono due forme di questo test, il test Z bilaterale e il test Z unilaterale, che possono essere utilizzati a seconda delle tue esigenze. Puoi anche scegliere se il calcolatore deve determinare il valore p dal test Z o se preferisci utilizzare l'approccio del valore critico!
Continua a leggere per saperne di più sui test Z in statistica e, in particolar modo, quando ricorrere al test Z, qual è la formula del test Z e se dovresti usare il test Z o il test t. Come bonus, ti forniamo alcuni esempi con spiegazioni passo a passo su come eseguire il test Z!
In alternativa, puoi anche consultare il nostro calcolatore per la statistica t, dove potrai imparare il concetto di un altro test statistico essenziale. Se ti interessa anche il test F, consulta il nostro calcolatore per il test F 🇺🇸.
Che cos'è il test Z?
Il test Z fatto su un campione è uno dei test di localizzazione più diffusi. L'ipotesi nulla è che il valore medio della popolazione sia uguale a un dato numero, :
Eseguiamo un test Z bilaterale se vogliamo verificare se la media della popolazione non è :
E un test Z unilaterale se vogliamo verificare se la media della popolazione è minore o maggiore di :
Discutiamo ora i presupposti di un test Z su un campione.
Quando si utilizza il test Z?
Puoi utilizzare il test Z se il tuo campione è composto da punti di dati indipendenti e se:
-
I dati sono distribuiti normalmente e conosci la variazione della popolazione;
oppure se
-
Il campione è ampio e i dati seguono una distribuzione che ha una media e una variazione finite. In questo caso, non è necessario conoscere la variazione della popolazione.
Il motivo per cui esistono queste due possibilità è che vogliamo che le statistiche del test seguano la distribuzione normale standard . Nel primo caso, si tratta di una distribuzione normale standardizzata esatta, mentre nel secondo caso lo è approssimativamente, grazie al teorema del limite centrale.
Rimane la domanda: "Quando il mio campione può essere considerato grande?" Beh, non esiste un criterio universale. In generale, più punti dati si hanno, meglio funziona l'approssimazione. I libri di statistica consigliano di avere non meno di 50 punti dati, mentre 30 sono considerati il minimo indispensabile.
Formula del test Z
Sia un campione indipendente che segue la distribuzione normale , cioè con una media pari a e una variazione pari a .
Poniamo l'ipotesi nulla, .
Definiamo il test Z:
dove:
- — Media del campione, cioè ;
- — Media postulata in ;
- — Dimensione del campione; e
- — Deviazione standard della popolazione.
Nel seguito, il carattere maiuscolo significa (trattato come una variabile aleatoria), mentre il carattere minuscolo indicherà il valore effettivo di , calcolato per un dato campione estratto da N(μ,σ²).
Se è valido, allora la somma segue la distribuzione normale, con media e variazione . Poiché è la standardizzazione (test Z) di , possiamo concludere che il test segue la distribuzione normale standard , a condizione che l'ipotesi sia vera. A proposito, abbiamo il calcolatore per il punteggio Z se vuoi concentrarti solo su questo valore.
Se i dati non seguono una distribuzione normale o se la deviazione standard della popolazione non è nota (e quindi nella formula per sostituiamo la deviazione standard della popolazione con la deviazione standard del campione), allora il test statistico non è necessariamente normale. Tuttavia, se il campione è sufficientemente grande, il teorema del limite centrale garantisce che è approssimativamente .
Nelle sezioni seguenti, ti spiegheremo come utilizzare il valore del test statistico, , per decidere se rifiutare o meno l'ipotesi nulla. Per arrivare a questa decisione si possono utilizzare due approcci: l'approccio del valore p e l'approccio del valore critico — e noi li trattiamo entrambi! Quale dei due dovresti usare? In passato, l'approccio del valore critico era più popolare perché era difficile calcolare il valore p dal test Z. Tuttavia, con l'aiuto dei computer moderni, possiamo farlo abbastanza facilmente e con una discreta precisione. In generale, ti consigliamo di riportare il valore p dei tuoi test!
Valore p ottenuto dal test Z
Formalmente, il valore p è il più piccolo livello di significatività al quale l'ipotesi nulla può essere rifiutata. Più intuitivamente, il valore p risponde alla domanda:
Ammesso che io viva in un mondo in cui l'ipotesi nulla è valida, quanto è probabile che il valore del test statistico sia almeno altrettanto estremo del valore che ho ottenuto per il mio campione? Quindi, un valore p piccolo significa che il tuo risultato è molto improbabile in base all'ipotesi nulla e quindi c'è una forte prova contro l'ipotesi nulla — più piccolo è il valore p, più forte è la prova.
Per trovare il valore p, devi calcolare la probabilità che il test statistico, , sia almeno altrettanto estremo che il valore effettivamente osservato, , a condizione che l'ipotesi nulla sia vera (la probabilità di un evento calcolata sotto l'ipotesi che sia vera sarà indicata come ). È l'ipotesi alternativa a determinare il significato di "più estremo":
- Test Z bilaterale — I valori estremi sono quelli il cui valore assoluto supera , quindi quelli inferiori a o superiori a . Pertanto, abbiamo:
La simmetria della distribuzione normale dà:
- Test Z unilaterale sinistro — I valori estremi sono quelli più piccoli di , quindi
- Test Z unilaterale destro — I valori estremi sono quelli maggiori di , quindi
Per calcolare queste probabilità, possiamo utilizzare la funzione di ripartizione, chiamata anche funzione cumulativa (CDF, dall'inglese cumulative distribution function, di , che per un numero reale, , è definita come:
Inoltre, i valori p possono essere rappresentati come l'area sotto la funzione di densità di probabilità (PDF, dall'inglese probability density function) di perché:
Test Z bilaterale e test Z unilaterale
Con tutte le conoscenze acquisite nella sezione precedente, è ora di imparare tutto sui test Z.
- Test Z bilaterale:
Dal fatto che , deduciamo che
Il valore p è l'area sotto la funzione di distribuzione di probabilità sia a sinistra di , sia a destra di :
- Test Z unilaterale sinistro:
Il valore p è l'area sotto la funzione di distribuzione di probabilità a sinistra del nostro valore :
- Test z unilaterale destro:
Il valore p è l'area sotto la funzione di distribuzione di probabilità a destra di :
La decisione se rifiutare o meno l'ipotesi nulla può essere presa a qualunque livello di significatività, , tu desideri!
-
Se il valore p è minore o uguale a , l'ipotesi nulla viene rifiutata a questo livello di significatività; e
-
Se il valore p è maggiore di , allora non ci sono prove sufficienti per rifiutare l'ipotesi nulla a questo livello di significatività.
Valori critici e regioni di rifiuto del test Z
L'approccio del valore critico prevede il confronto del valore del test statistico ottenuto per il nostro campione, , con i cosiddetti valori critici. Questi valori costituiscono i confini delle regioni in cui è altamente improbabile che il test statistico si trovi. Queste regioni vengono spesso chiamate regioni di rifiuto o regioni critiche. La decisione di rifiutare o meno l'ipotesi nulla si basa sul fatto che il nostro appartenga o meno alla regione critica.
Le regioni critiche dipendono dal livello di significatività, , del test e dall'ipotesi alternativa. La scelta di è arbitraria; in pratica, i valori di , o sono più comunemente utilizzati come .
Una volta concordato il valore di , possiamo facilmente determinare le regioni critiche del test Z:
- Test Z bilaterale:
- Test Z unilaterale sinistro:
- Test Z unilaterale destro:
Per decidere il destino di , controlla se il tuo cade o meno nella regione di rifiuto:
-
Se sì, allora rifiuta e accetta ; e
-
Se no, allora non ci sono prove sufficienti per rifiutare .
Come vedi, le formule per i valori critici di test Z coinvolgono l'inverso, , della funzione di ripartizione (CDF) di .
Come usare il calcolatore per il test Z su un campione?
Il nostro calcolatore riduce tutti i passaggi complicati:
-
Scegli l'ipotesi alternativa (bilaterale, o unilaterale destro o sinistro);
-
Nel nostro calcolatore per il test Z, puoi decidere se utilizzare il valore p o l'approccio delle regioni di rifiuto. In quest'ultimo caso, imposta il livello di significatività, ;
-
Inserisci il valore del test statistico, . Se non lo conosci, puoi inserire alcuni dati che ci permetteranno di calcolare il valore di per te:
- La media del campione (se hai dei dati grezzi, vai al calcolatore per la media per determinare la media),
- La media testata ,
- La dimensione del campione , e
- La deviazione standard della popolazione (o deviazione standard del campione se il campione è ampio); e infine
-
I risultati verranno visualizzati immediatamente sotto il calcolatore.
Se vuoi trovare in base al valore p, ricorda che nel caso del test bilaterale ci sono due possibili valori di — uno positivo e uno negativo, e sono numeri opposti. In questo caso, il calcolatore per il test Z restituisce il valore positivo. Per trovare l'altro possibile valore di per un dato valore p, basta prendere il numero opposto al valore di visualizzato dal calcolatore.
Esempi di test Z
Per assicurarci che tu abbia compreso appieno l'essenza del test Z, vediamo alcuni esempi:
- Una macchina per il riempimento di bottiglie segue una distribuzione normale. La sua deviazione standard, come dichiarato dal produttore, è pari a 30 mL. Un venditore di succhi di frutta afferma che il volume versato in ogni bottiglia è in media di un litro, cioè 1000 mL, ma sospettiamo che in realtà il volume medio sia inferiore al volume dato.
Formalmente, le ipotesi che abbiamo posto sono le seguenti:
Siamo andati in un negozio e abbiamo acquistato un campione di 9 bottiglie. Dopo aver misurato attentamente il volume di succo in ogni bottiglia, abbiamo ottenuto il seguente campione (in millilitri):
-
Dimensione del campione: ;
-
Media del campione: ; e
-
Deviazione standard della popolazione: .
-
Quindi
-
E dunque .
Come , concludiamo che i nostri sospetti non sono infondati; al livello di significatività più comune, , rifiutiamo l'affermazione del produttore, , e accettiamo l'ipotesi alternativa, .
-
Abbiamo lanciato una moneta 50 volte. Abbiamo ottenuto croce 20 volte e testa 30 volte. Ci sono prove sufficienti per affermare che la probabilità di ottenere croce o testa è distorta?
Chiaramente i nostri dati seguono la distribuzione di Bernoulli, con una certa probabilità di successo e una variazione . Tuttavia, il campione è ampio, quindi possiamo tranquillamente eseguire un test Z. Adottiamo la convenzione secondo cui otteniamo croce.
Formuliamo l'ipotesi nulla e l'ipotesi alternativa:
-
. (La moneta è equa — la probabilità di ottenere croce è di ); e
-
. (La moneta è distorta — la probabilità di ottenere croce è diversa da ).
Nel nostro campione abbiamo 20 successi (indicati con ) e 30 fallimenti (indicati con ), quindi:
-
-
Dimensione del campione ;
-
Media del campione ; e
-
La deviazione standard della popolazione è data da (perché è la proporzione ipotizzata in ). Quindi, ;
-
Dunque:
- E pertanto:
Dal momento che , non abbiamo prove sufficienti per rifiutare l'affermazione che la probabilità di ottenere testa o croce è regolare, anche a un livello di significatività così alto — . In questo caso, puoi tranquillamente donare un soldo al tuo Witcher o utilizzare il calcolatore per il lancio della moneta per trovare le probabilità di ottenere, ad esempio, 10 teste di fila (che sono estremamente basse!).
Qual è la differenza tra il test Z e il test t?
Utilizziamo il test t per testare la media della popolazione di un insieme di dati normalmente distribuiti con una deviazione standard della popolazione sconosciuta. Per ottenere ciò, si sostituisce la deviazione standard della popolazione nella formula del test t a un campione con la deviazione standard del campione, il che significa che questo nuovo test statistico segue (a condizione che H₀ sia valido) la distribuzione di Student (o t di Student) con n-1 gradi di libertà invece di N(0,1).
Quando è meglio usare il test t rispetto al test Z?
Per campioni di grandi dimensioni, la distribuzione t di Student con n gradi di libertà si avvicina a N(0,1). Quindi, se il numero di punti dati è sufficiente (almeno 30), non importa se si utilizza il test Z o il test t, poiché i risultati saranno quasi identici. Tuttavia, per campioni piccoli con variazione sconosciuta, ricorda di utilizzare il test t invece del test Z.
Come si calcola il test Z?
Per calcolare il test Z:
- Calcola la media aritmetica del tuo campione;
- Da questa media sottrai la media postulata nell'ipotesi nulla;
- Moltiplica per la radice quadrata della dimensione del campione;
- Dividi per la deviazione standard della popolazione; ed
- Ecco fatto, hai appena calcolato il test Z!