Chyba beta analýzy napájania (chyba 2

Pri vystúpení Testy hypotéz jeden si dal Nulová hypotéza a otestujte ich na určitú úroveň významnosti α, zvyčajne 5%. Pravdepodobnosť odmietnutia vašej nulovej hypotézy, aj keď platí, je teda nastavená na maximálne 5%.

chyba

Okrem chyby alfa existujú aj ďalšie ovplyvňujúce premenné, ktoré určujú „kvalitu“ vášho testu:

  • Chyba typu 2 alebo beta
  • Veľkosť efektu
  • Veľkosť vzorky

Skúmate objem pľúc študentov. Viete, že ich priemerný objem pľúc μ pre výšku 170 cm sú štyri litre a má známu odchýlku. Aby ste vyskúšali, či konkurenčný šport zvyšuje objem pľúc na 4,5 litra, najskôr ste odobrali vzorku 120. Potom ste určili priemer 4,4 litra. S týmto môžete predpokladať normálne rozdelenie pre stred nad centrálnou limitnou vetou.

Vaše hypotézy sú:

Distribúcia priemernej hodnoty je v grafe hnedá a kritická oblasť, v ktorej sa dopustíte chyby typu 1, je zvýraznená červenou farbou. Modrá čiara zobrazuje kritickú hodnotu vášho testu.

Rozhodnutie o teste môžete urobiť pomocou svojej testovacej premennej na obrázku: Ak nie je zamietnutá nulová hypotéza, je zamietnutá.

Zelená krivka je distribúcia uvedená nižšie. Ak je to pravda, zvýšený priemer sa zahrnie a realizácie vzorového priemerného prerozdelenia. Aj tu sú možné extrémne hodnoty na koncoch distribúcie. Obrázok ukazuje ďalšiu možnosť chyby vo forme chyby beta: de facto zväčšený objem pľúc ako taký nemožno rozpoznať.

Chyba verzie beta

S vašimi určite kritická hodnota veľkosť chyby beta sa určuje ako plocha pod zelenou distribučnou funkciou vľavo od. Kritická hodnota, a teda oddelenie medzi kritickou oblasťou a oblasťou prijatia, je na obrázku znázornená modrou čiarou.

Na obrázku je vidieť, že zníženie hodnoty Alfa chyba posun kritickej hodnoty doprava. To priamo zvyšuje chybu verzie beta. Naopak, zvýšenie chyby alfa spôsobí posun kritickej hodnoty doľava a chyba beta sa zníži.

Sila štatistického testu

Pod Sila alebo sila testu človek chápe pravdepodobnosť skutočného odmietnutia de facto falošnej nulovej hypotézy, teda neurobenia chyby beta. V príklade to znamená stanovenie skutočného zvýšeného objemu pľúc v teste. Samozrejme, test na úrovni α je výkonnejší a kvalitnejší, čím menšia je s tým spojená chyba.

Aj keď chybu alfa testu môžete ľubovoľne nastaviť, chybu beta nie je možné priamo ovládať. Ale okrem veľkosti α závisí priamo od účinku, ktorý sa má skontrolovať, a od veľkosti vzorky.

Efekt

Pod účinok pochopíme rozdiel medzi dvoma možnými strednými hodnotami. Čím väčší je účinok, ktorý sa má testovať, tým ľahšie sa od seba odlišujú hypotézy. Čím ďalej od seba sú vrcholy distribúcií a tým menej oblastí prekrytia je. Graficky, ako sa efekt zväčšuje, sa zelená funkcia posúva doprava. Pretože kritická hodnota zostáva na svojom mieste, plocha pod zelenou funkciou naľavo od kritickej hodnoty sa zmenší.

Vplyv veľkosti vzorky

Absolútna veľkosť efektu vášho testu je zvyčajne uvedená z hľadiska obsahu a metodicky nie variabilná. Pretože sa však rozhodnete pre test pomocou štandardizovaných hodnôt, štandardizovaný efekt sa dá určiť pomocou Veľkosť vzorky líšiť sa. Čím väčšia vzorka je vybratá, tým menšia je odchýlka priemeru, tým väčší je štandardizovaný efekt a tým viac doprava sa zelená funkcia posúva:

Pre vyššie uvedený prípad ste uviedli efekt aj varianciu s .

V tabuľke je uvedený vplyv veľkosti vzorky na štandardizovaný efekt:

Veľkosť vzorky Rozptyl priemeru: štandardizovaný efekt:
n = 120 0,183 2,732
n = 500 0,089 5,618
n = 1 000 0,063 7 937

Na druhej grafike vidíte, ako sa sila testu zvyšuje so zvyšujúcim sa n, pretože krivka dole sa posúva doprava: pre n = 120 je chyba beta, keďže plocha pod žltou krivkou až po priesečník s, je pomerne veľká; pre n = 1000 ako plocha pod modrou krivkou až po priesečník s zreteľne menším a pre n = 5000 zanedbateľne malý.

Pre danú alfa a daný efekt môžete ovplyvniť chybu beta výberom veľkosti vzorky, aby nepresiahla požadovanú úroveň chyby. Vo všeobecnosti platí toto: čím väčší je efekt, ktorý chcete testovať, tým ľahšie ho rozpoznáte a tým menšiu veľkosť vzorky si môžete zvoliť.

Inými slovami: čím väčšia je vzorka, tým menšia je odchýlka priemeru vzorky a tým väčší je štandardizovaný efekt. Zväčšenie vzorky je však vždy spojené s ďalším úsilím a zvýšenými nákladmi.

Analýza výkonu

The Analýza výkonu skúma interakciu chýb alfa a beta, účinok a veľkosť vzorky. Je obvyklé zvoliť chybu beta štyrikrát väčšiu ako chybu alfa, takže napríklad jedna z 20% je zameraná na.

Pred odobratím vzorky by ste mali určiť požadovanú alebo optimálnu veľkosť vzorky, ak je to možné. Z týchto dôvodov existujú výkonné programové nástroje, pomocou ktorých môžete vykonávať analýzu napájania. Napríklad bezplatný nástroj je GPower.