Aký štatistický test by som si mal zvoliť Crash Course Statistics
Jednoduché vysvetlenia, príklady a úlohy zo skúšok
Tento článok je založený na všeobecnom článku o tom, ako otestovať hypotézu. Odporúčam prečítať si tento článok vopred a porozumieť mu; vďaka tomu je čítanie a porozumenie tomuto článku oveľa jednoduchšie.
Tabuľka pre výber testu
Nasledujúca tabuľka (kliknutím na ňu zobrazíte väčší obrázok) vám ukáže, ktorý test je najvhodnejší pre určitú úroveň stupnice cieľa a ovplyvňujúce premenné. ->
Vysvetlenie nájdete v ďalšej časti tohto článku. Na samom konci je niekoľko ukážkových cvičení, ktoré ukazujú, ako sa táto tabuľka používa.

Najskôr určte typ cieľovej premennej a potom typ svojej ovplyvňujúcej premennej. V tejto tabuľke potom nájdete vhodný spôsob analýzy vašich údajov.
Rýchle varovanie: V mnohých situáciách je výber správneho testu veľmi ľahký a existuje prakticky iba jedna možnosť. V niektorých prípadoch však existuje niekoľko vhodných testov, ktoré by sa dali použiť. Napríklad, ak existujú dva možné testy, potom má jeden výhodu v tom, že musí robiť menej predpokladov o údajoch (napr. Normálne rozdelenie), a druhý by mal výhodu v tom, že dokáže lepšie rozpoznať skutočný efekt.
V tejto tabuľke som zhromaždil testy, ktoré sú podľa môjho názoru buď najjednoduchším, alebo najlepším riešením pre konkrétny súbor údajov - je potrebné mať na pamäti, že to neznamená, že ďalšie testy sú automaticky nesprávne alebo horšie.
Vysvetlenie tabuľky
Existuje celý rad testovacích postupov, ktoré sa na prvý pohľad môžu zdať ohromujúce. Presný test, ktorý je potrebné zvoliť v konkrétnej situácii, závisí od množstva otázok, na ktoré je potrebné v každej situácii znova odpovedať.
Vyhľadávanie obrázkov Google s dotazom „ktorý štatistický test“ alebo „ktorý štatistický test“ poskytuje mnoho rôznych diagramov, ktoré sú podrobnejšie a začínajú inak. Niektoré sú zamerané na cieľ, to znamená, že prvá otázka je „Čo chcem dosiahnuť?“ A možné ciele sú napríklad „Porovnať strednú hodnotu s hypotetickou hodnotou“. Ostatné diagramy sú založené na vlastnostiach údajov. Tu sa začína otázkou „Čo je cieľová premenná?“, Či už je to napríklad nominálna alebo spojitá. Podľa môjho názoru je to spočiatku jednoduchšie, a preto si kladieme tieto dve otázky:
1.) Aká je cieľová veľkosť? -->
Cieľová premenná je charakteristika, ktorá sa zmení v dôsledku vplyvu ovplyvňujúcich premenných. Závisí to od ovplyvňujúcich faktorov. Napríklad, ak chcem dokázať antihypertenzný účinok nového lieku, potom mojou cieľovou premennou je krvný tlak a ovplyvňujúcou premennou je liek (napríklad by ste mali dve skupiny, jednu osobu bez liekov a jednu osobu s liekmi).
Teraz určite, ktorý typ (na ktorej úrovni mierky) je vaša cieľová veľkosť:
2.) Aké sú ovplyvňujúce faktory?
--> Po druhé, musíme zistiť, či vôbec máme ovplyvňujúcu premennú, a ak áno, aký typ stupnice má.
Dôležité: Pri ovplyvňujúcich premenných nezáleží na tom, aké rozdelenie majú. To, či je ovplyvňujúca premenná normálne rozdelená alebo nie, je teda pre postup skúšky irelevantné.
úlohy
Pre každý z nasledujúcich prípadov určite, ktorá skúška je vhodná pre každý prípad. Najskôr identifikujte veľkosť cieľa a určte jeho typ (nominálny, ordinálny atď.). Potom určite, či existuje jedna alebo viac ovplyvňujúcich premenných a o aký typ ide. Potom pomocou tabuľky nájdite vhodný test.
(Pokiaľ to nie je výslovne uvedené v cvičení, nemôžete predpokladať normálne rozdelenie premenných.)
- 1a) Cieľová hodnota je tu počet cigariet za deň. Jedná sa o počítanie údajov, takže veľkosť cieľa je ordinálne zmenšená (môžete ju tiež považovať za intervalovo zmenšenú). Ovplyvňujúcim faktorom je časový bod (pred/po), t. J. Nominálna premenná s dvoma skupinami. Tieto dve skupiny sú spárované, pretože merania sú prepojené: s rovnakými ľuďmi sa uskutočnili rozhovory pred a po liečbe. Podľa tabuľky je tu príslušný test Wilcoxon podpísal skúšku hodnosti.
- 1b) V porovnaní s 1a) sa tu mení iba skutočnosť, že ovplyvňujúca premenná už nemá iba dve, ale niekoľko skupín. Podľa tabuľky teda teraz používame Friedmanov test.
- 2a) Tu chcete vyskúšať jednoduchú súčasť. Existuje nominálny výsledok dvoch skupín a žiadny prediktor. Tu je Binomický test to pravé.
- 2b) Teraz stále neexistuje ovplyvňujúca premenná, ale cieľová premenná má teraz niekoľko skupín. Tu použijete jeden Test kvadratickej nezávadnosti.
- 3a) Tu máte nominálnu cieľovú premennú s dvoma kategóriami a niekoľkými ovplyvňujúcimi premennými, spojitou a kategorickou. A logistická regresia je tu vhodné.
- 3b) Výsledok je nepretržitý, ale nie bežne distribuovaný. Ovplyvňujúci faktor je kategorický s dvoma skupinami. Pretože tieto dve skupiny (muži a ženy) nie sú spárované (ako by to bolo napríklad v prípade skupín pred/po), je najlepšie vziať si jednu sem Wilcoxon-Mann-Whitneyov U test.
- 3c) Ak existujú viac ako dve skupiny, použite namiesto Wilcoxon-Mann-Whitney U testu Kruskal-Wallisov test.
- 4) S dvoma spojitými alebo normálne distribuovanými premennými možno vypočítať koreláciu medzi nimi a Pearsonov korelačný test vykonať. Prípadne by to bolo tiež možné lineárny model (t.j. lineárna regresia).
- 5) Výsledok je normálne rozdelený a ovplyvňujúci faktor je kategorický s dvoma skupinami. Zmestí sa sem Dvojvýberový t-test.
- 6) Cieľová premenná je zvolená strana, t. J. Kategorická premenná s niekoľkými skupinami. Vplyvný faktor, vzdelanostná kvalifikácia, je tiež kategorický. Preto sem zapadá Chí-kvadrát test. The Fisherov test je tiež alternatívou. Používa sa v prípadoch s menším počtom údajov, napr. S menej ako 1 000 pozorovaniami alebo ak aspoň jedna z buniek v krížovej tabuľke má menej ako 5 pozorovaní.
- 7a) Tu sa skúma vplyv kategorickej ovplyvňujúcej premennej na normálne rozdelenú cieľovú premennú. A ANOVA je správnym nástrojom, bola by možná aj alternatíva lineárny regresný model.
- 7b) Ak existuje niekoľko ovplyvňujúcich faktorov, jeden sa obráti na viacnásobná lineárna regresia von.
- 8a) Tu sa testuje ordinálna cieľová premenná (bez ovplyvňovania premenných) na mediáne. A Znakový test môže to otestovať.
- 8b) Cieľová premenná je stále ordinálna, teraz však existuje konštantná ovplyvňujúca premenná. Dá sa vypočítať Spearmanova poradová korelácia týchto dvoch premenných a potom Spearmanov test spustiť a otestovať koreláciu.
- 9a) Je to kategorická cieľová premenná s dvoma skupinami (vysoký krvný tlak áno/nie). Ovplyvňujúca premenná má tiež dve skupiny a je spárovaná, pretože rovnakí ľudia sa v skupine merajú „pred“ a „po“. Takže existuje McNemarov test o.
- 9b) Ak je cieľová veľkosť normálne rozdelená namiesto kategorickej, vediete jednu párový t test von.
3 myšlienky na tému „ktorý štatistický test by som si mal zvoliť? „
Som zmätený z vášho príkladu neustáleho ovplyvňovania premenných alebo úlohy 1: „Počet hovorov v ústredni“ a „cigarety za deň“ sú diskrétne hodnoty, prečo sa tu javia ako spojité alebo poradové?