Štatistika lekárskej dizertačnej práce, časť 1
Presná formulácia otázky
Pred začatím zhromažďovania údajov pre svoju dizertačnú prácu by ste si mali starostlivo naplánovať štúdium. Za týmto účelom formulujte otázku čo najpresnejšie. Položte si otázku: Na ktorú otázku by mala vaša štúdia odpovedať?
Potom premyslite, aké údaje potrebujete, aby ste mohli odpovedať na túto otázku. Týmto si uvedomíte,
- ktoré namerané hodnoty musíte zbierať (napr. diagnostická klasifikácia, pohlavie, závažnosť príznakov),
- V akých časových okamihoch zbierate namerané hodnoty (napr. Pred a po liečbe, rôzne fázy kurzu, iba jeden časový bod) a
- od ktorej populácie by sa mali údaje zbierať (napr. pacienti s určitou diagnózou, určité rizikové skupiny).
Koľko prípadov potrebujete?
Môžete si naplánovať počet prípadov, aby ste mohli odhadnúť, koľko prípadov je potrebných na zodpovedanie vašej otázky skôr, ako začnete zhromažďovať údaje. Tu sa určí počet (-y) prípadov, ktoré potrebujete aspoň na preukázanie dôležitosti očakávaného/požadovaného výsledku.
Plánovanie veľkosti vzorky vopred má zmysel:
- Vyhýba sa zisteniu, že po analýze bola vzorka príliš malá na preukázanie požadovaného rozdielu/spojenia.
- V opačnom prípade vám to ušetrí investovanie príliš veľa času, úsilia a peňazí do zhromažďovania údajov zo zbytočne veľkej vzorky.
Bezplatným programom, ktorý podporuje výpočet veľkosti vzorky pre rôzne dizajny štúdií a analytické metódy, je G * power 3 (Heinrich-Heine-Universität Düsseldorf, 2013, http://www.gpower.hhu.de/)
Štruktúra analýzy údajov

Obrázok 1: Štruktúra analýzy údajov, od J. Webingera, D. Kellera, B. Budricha: Ako napíšem dizertačnú prácu? Sprievodca pre lekárov a zubárov. Springer 2014.
Štatistická analýza údajov sa skladá z dvoch zložiek: popisnej štatistiky a štatistiky na nej založenej (pozri obr. 1).
The deskriptívna štatistika popisuje údaje výpočtom vhodných opatrení. Popisná štatistika obsahuje aj obrázky, ktoré môžete použiť na znázornenie údajov a vizualizáciu možných rozdielov/vzťahov.
V záverečná štatistika vypočítajú sa štatistické testy, ktoré kontrolujú významnosť rozdielov/vzťahov popísaných v popisnej časti. Pozorovaný rozdiel alebo asociácia sa považuje za štatisticky významnú, iba ak by pravdepodobnosť (p) takéhoto pozorovania v náhodne odobratej vzorke bola veľmi nízka, ak v skutočnosti nebol rozdiel/asociácia v celkovej populácii. Takže iba s preukázanou významnosťou môžete dôverovať s nízkou pravdepodobnosťou chyby (úroveň významnosti, často stanovená na 5%), že pozorovaný efekt vo vašej štúdii nevznikol náhodou, ale že odráža skutočný rozdiel/vzťah v celkovej populácii. Výpočet veľkostí efektov (napr. Pomer šancí, r, d, η2) tiež umožňuje hodnotenie rozsahu pozorovaného účinku.
Výber správnej metódy
Deskriptívna štatistika
Výber správnej metódy na popis údajov závisí vo veľkej miere od typu premennej. Ďalej sú stručne spomenuté niektoré často používané popisné metódy na popis kategorických údajov (napr. Pohlavie, fajčiar/nefajčiar, diagnostická klasifikácia) a metrické údaje (napr. Závažnosť symptómov, hodnoty škály dotazníka).
Kategorické znaky skúmanej vzorky sú popisné Frekvenčné tabuľky a - keď kombinujeme niekoľko kategorických premenných - s Krížové tabuľky zobrazené. Ako obrázok sa k tomu hodí stĺpcový graf alebo a zoskupený stĺpcový graf (pozri obr. 2).
Obrázok 2: Zoskupený stĺpcový graf na zobrazenie kategorických údajov. Kategorické premenné: fajčenie (nie/áno), choroba (nie/áno). Výška pruhov zobrazuje počet ľudí v každej kategórii.
Na popis metrických charakteristík vzorky sa používajú miery pre centrálnu tendenciu, napr. B. Priemerná a Medián, a na rozptyl, napr. B. Štandardná odchýlka, IQR, minimum a maximálne, vypočítané. Okrem toho možno použiť stredné hodnoty a štandardné odchýlky Intervaly spoľahlivosti kalkulovať. Tieto opisujú rozsah hodnôt, v ktorých je priemer z celkovej populácie z. B. je s 95% pravdepodobnosťou.
Na jednej strane sú dobré na mapovanie metrických údajov Škatuľkové pozemky, ktoré ukazujú ako centrálnu tendenciu (medián), tak aj rozptyl (IQR, minimum, maximum), identifikujú odľahlé hodnoty a ilustrujú skupinové porovnania, teda porovnania medzi úrovňami kategorickej premennej (pozri obr. 3). Na druhej strane s Stĺpcové grafy (pozri obr. 4) alebo - najmä na znázornenie chronologickej postupnosti - pomocou Čiarové grafy (pozri obr. 5) znázorňujú stredné hodnoty. Štandardné odchýlky alebo intervaly spoľahlivosti vo forme Chybové pruhy je možné vizualizovať. Pre spoločné mapovanie dvoch metrických premenných je vhodné Bodové grafy (pozri obr. 6).
Obrázok 3: Krabičkové grafy na zobrazenie metrických údajov. Závislá metrická premenná: sila symptómov (škála od 0 do 50), nezávislá kategorická premenná: fajčenie (nie/áno). Deliaca čiara v rámčekoch zobrazuje medián, dĺžka rámčekov ukazuje IQR, koncové body antén („fúzy“) ukazujú minimum a maximum, kruh ukazuje odľahlú hodnotu.
Obrázok 4: Stĺpcové grafy na zobrazenie metrických údajov. Závislá metrická premenná: sila symptómov (škála od 0 do 50), nezávislá kategorická premenná: fajčenie (nie/áno). Výška stĺpcov zobrazuje stredné hodnoty dvoch skupín vzoriek, chybové pruhy ukazujú štandardné odchýlky.
Obrázok 5: Čiastkové schémy na zobrazenie metrických údajov. Závislá metrická premenná: sila symptómov (škála od 0 do 50), nezávislé kategorické premenné: liečba (placebo/liek), časový bod (pred liečbou/po liečbe/následnom meraní). Body ukazujú priemerné hodnoty týchto dvoch skupín trikrát, chybové pruhy ukazujú štandardné odchýlky.
Obrázok 6: Schéma rozptylu na zobrazenie metrických údajov. Metrické premenné: sila symptómov (stupnica od 0 do 50), počet cigariet za deň (stupnica od 0 do 40). Každý bod zodpovedá jednotlivému subjektu a zobrazuje ich hodnoty na dvoch metrických škálach.