Plánovanie veľkosti vzorky pre nezávislé vzorky - PDF na stiahnutie zadarmo

Plánovanie veľkosti vzorky pre nezávislé vzorky Seminár Aktuálne biometrické problémy Benjamin Hofner [email protected] 12. januára 2005

veľkosti

Prehľad 1. Úvod a základy plánovania veľkosti vzorky 2. Plánovanie veľkosti vzorky s pripojeným t-testom 3. Plánovanie veľkosti vzorky s nepripojeným t-testom 4. Zhrnutie/Outlook 1

1. Úvod a základy plánovania veľkosti vzorky Požiadavka: Dôkaz rozdielu medzi typmi terapie Pravdepodobnosť detekcie (Power 1 β) v závislosti od: skutočného rozdielu µ 1 µ 2 medzi prípadmi terapie číslo N 1. Úvod a základy plánovania veľkosti vzorky 2

Vzťah medzi silou - rozdiel/počet prípadov Obrázok 1: Vzťah medzi číslom prípadu N a silou 1 β (α a daný) Obrázok 2: Vzťah medzi rozdielom a silou 1 β (α a N uvedený) 1. Úvod a základy plánovania veľkosti vzorky 3

Prečo plánovanie veľkosti vzorky? Veľkosť skupiny sa nenecháva na náhodu, pretože: Etická zložka (zbytočné zaťaženie testovaných osôb) Ekonomická zložka (zbytočné zaťaženie finančníkov) Plánovanie veľkosti vzorky samozrejme pred uskutočnením štúdie Zahrnutie do protokolu o štúdii (pripravené pred štúdiou, upravuje všetky podrobnosti) 1. Úvod a základy Plánovanie veľkosti vzorky 4

Úroveň významnosti α Výkon 1 β Požiadavky na výpočet počtu prípadov klinicky relevantný rozdiel Problém testu Rozdelenie veľkosti testu (napr. Normálne rozdelenie, σ neznáme = t-test) jednostranný test/obojstranný test pripojená/nepripojená vzorka (pridelenie do skupín) = (približný) výpočet požadovanej veľkosti vzorky 1 Úvod a základy plánovania veľkosti vzorky 5

2. Plánovanie veľkosti vzorky s pripojeným t-testom (približne) normálne rozdelená vzorka Veľkosť záujmu: Rozdiel µ d = µ 1 µ 2, ktorý sa má odhadnúť: Rozptyl rozdielu σ d (jednotlivý prípad vzorky: Zaujímavá premenná: µ 0 sa odhaduje: σ d: = σ (Štandardná odchýlka rozdielov (tu) = = Podobný ďalší postup) Štandardná odchýlka vzorky) 2. Plánovanie veľkosti vzorky s pripojeným t-testom 6

Veľkosť testu s pripojeným t-testom T = X µ 0 S n v prípade jednej vzorky T = D δ 0 S n (D = Y1 Y 2) v prípade dvoch vzoriek d Distribúcia podľa nulovej hypotézy H 0: T tn 1 Distribúcia podľa alternatívy H 1: T tn 1, nct (necentralizovaný t-distribuovaný, s parametrom necentrality nct) 2. Plánovanie veľkosti vzorky s pripojeným t-testom 7

Exkurz: Non-centrálne t-rozdelenie t β, n 1, nct sa všeobecne výslovne nevypočítava = približné, pomocou t β, n 1, nct t β, n 1 + nct (t-distribúcia, ktorá je posunutá doprava o nct) Ďalej platí: Centrálne t-rozdelenie je symetrické okolo nuly, t. J. T β, n 1 = t 1 β, n 1 2. Plánovanie veľkosti vzorky s pripojeným t-testom 8

Obrázok 3: Centrálna t-distribúcia s df = 10 Obrázok 4: Non-centrálna t-distribúcia s df = 10 a nct = 5 2. Plánovanie veľkosti vzorky s pripojeným t-testom 9

Odvodenie vzorca podľa veľkosti vzorky Prípravy: Všeobecne: nct = µ d σ n (pozri vyššie) d Plánovanie veľkosti vzorky: µ d = (skutočná chyba = rozdiel, ktorý sa má zistiť) = nct = σ n = c = d σ d číslo vzorky N: Jednostranný test: N [t 1 α, df + t 1 β, df] 2 c 2 Obojstranný test: N [t 1 α/2, df + t 1 β, df] 2 c 2 Pozor: df = N 1 = počet prípadov na oboch stranách Rovnica = žiadne explicitné riešenie 2. Plánovanie veľkosti vzorky s pripojeným t-testom 10

Riešenie pomocou rekurzie 1. df: = = vložením do vzorca: N 1 2. df: = N 1 1 = vložením do vzorca: N 2 3. Opakujte 4. až do N i N i 1 (potom 5.) 4. Nastavte df: = N i 1 1 = vypočítajte N i 5. Hotovo a N i je počet hľadaných prípadov

Príklad 1 Úloha: 1 Testuje sa liek na zníženie krvného tlaku. Z tohto dôvodu by sa mal u mnohých pacientov najskôr zmerať krvný tlak. Potom sa podáva liek. O hodinu bude opäť zmeraný krvný tlak. Podľa doterajších skúseností je štandardná odchýlka rozdielu pri takýchto meraniach približne σ d = 15 mmhg. Koľko pacientov má byť zahrnutých do experimentu, aby bolo možné zistiť rozdiel = 15 mmhg v obojstrannom teste pri a = 0,05 so stanoveným výkonom = 0,80? 1 Zdroj: [JUMBO] 2. Plánovanie veľkosti vzorky s pripojeným t-testom 12

Riešenie: c = σ d = 15 15 = 1 = c2 = 1 2 = 1 t 1 α/2, = t 0,975, = 1,96 t 1 β, = t 0,8, = 0,8416 (obojstranný test) N 1 [1,96 + 0,8416 ] 2 1 = 7,849 8 N 1 vložka na pravej strane: t 0,975, N1 1 = t 0,975,7 = 2,3646 t 0,8, N1 1 = t 0,8,7 = 0,8960 N 2 [2,3646 + 0,8960] 2 1 = 10,632 11 2 Plánovanie veľkosti vzorky s pripojeným t-testom 13

N 2> N 1 = N 2 vložka na pravej strane: t 0,975, N2 1 = t 0,975,10 = 2,2281 t 0,8, N2 1 = t 0,8,10 = 0,8791 N 3 [2,2281 + 0,8791] 2 1 = 9,654 10 N 3 N 1 = N 2 vložka na pravej strane: t 0,975, N2 2 = t 0,975,283 = 1,9684 t 0,8, N2 2 = t 0,8,283 = 0,8429 N 3 [1,9684 + 0,8429] 2 1 36 N 3 N 2 = N 3 2 n 1 = n 2 = 143 = 284 523 285 3. plánovanie veľkosti vzorky s nepripojeným t-testom 25

Pokračovanie: Ako sa zmenia veľkosti skupín, ak zvolíme pomer verum: placebo = 2: 1? Riešenie: k = 1 2 = c = σ k 1 + k = 5 15 analogický výpočet ako vyššie 0,5 1 + 0,5 0,1571 = c2 = 0,0247 N 1 318 N 2 320 (N 2> N 1 = N 2 vložka na pravej strane) N 3 320 N 3 N 2 = N 3 3 n 2 = 107 = n 1 = 2 n 2 = 214 Plánovanie 3. veľkosti vzorky s nepripojeným t-testom 26

4. Zhrnutie/výhľad Vzorec veľkosti vzorky s homogénnosťou odchýlky (porovnaj k tomuto [Bock] s. 65ff) Je nevyhnutná spolupráca medzi štatistikmi a odbornými vedcami Veľkosť vzorky A (spodná) hranica pre požadovanú veľkosť vzorky, pretože predpoklady sú čiastočne idealizované (normálne rozdelenie, homogenita odchýlky atď.) Vypadnutia 4. Zhrnutie/Outlook 27