AntConc LinguTools

Bežné nástroje anotácie a analýzy korpusu v lingvistike

antconc

Čo je AntConc?

AntConc je nástroj na zhodu písomných korpusov, pomocou ktorého je možné pomerne ľahko vykonávať štandardné vyhľadávacie dotazy pre počítačovú analýzu korpusu. Softvér automaticky vytvára zoznamy slov (frekvencia slov) a štatistické údaje, napríklad o vzťahu medzi „tokenmi“ a „typmi“, pomocou ktorých je možné okrem iného preskúmať aj bohatosť slovnej zásoby textu. Tento nástroj podporuje bežný formát UTF-8 a umožňuje vyhľadávať dotazy s regulárnymi výrazmi. AntConc je súčasťou mnohých ďalších nástrojov na analýzu textov (napr. AntWordProfiler, AntGram, AntPConc alebo FireAnt).

Výhody:

  • jednoduché, intuitívne ovládanie
  • jasné zoznamy zhody
  • Triediteľné zobrazenie prístupov
  • Možné výpočty klastrov a n-gramov
  • Možné sú vyhodnotenia s textami označenými POS a anotovanými textami
  • Kontrastívne analýzy
  • k dispozícii pre PC a Mac
  • Videonávody a pomoc

Nevýhoda:

  • manuálna anotácia/prepis nie sú možné
  • žiadna analýza textu a obrazu
  • iba pre korpusy do cca 1,5 milióna žetónov

Začíname/scenár použitia:

Často sú to náhodné pozorovania v každodennom živote, ktoré vedú k jazykovo zaujímavej otázke. Môžu to byť nápadné formulácie, móda a tabuizované slová, ale aj prípady jazykových pochybností. Na príklade relatívne novej kategórie potravín superpotraviny zo súčasného nutričného diskurzu ukazuje nasledovné možnosti lingvistickej analýzy korpusu pomocou programu AntConc.

Hodnotenie:

Ak do vyhľadávacieho riadku zadáte slovo superpotravina, najskôr získate všetky prístupy v zhodnom zobrazení. Veľké a malé písmená sa zohľadňujú, iba ak je začiarknutie označené ako „Veľké“. Ak chcete získať prvý dojem z jazykového spolutextu, môžete tiež triediť prístupy pomocou tlačidla „Zoradiť“ (snímka obrazovky 1). Ak nie je začiarknuté políčko vedľa položky „Slová“, vyhľadávací dopyt nezohľadňuje hranice slov, a preto sú v zozname uvedené aj množné číslo a rôzne zlúčeniny, napríklad prášok superpotraviny. Diskurzívne debaty s pojmom superpotravina (7) a trendom superpotravín (14) sú teraz uvedené v prehľade zhody. Zdá sa, že s týmto kľúčovým slovom sú spojené aj rôzne potraviny, ako napríklad brokolica (8) alebo goji (11).

Screenshot 1: Centrované zhody pre hľadaný výraz „superfood“

Atribúty skutočná a exotická tiež poukazujú na tieto dve oblasti: po prvé, diskurzívne vyjednávaná otázka, čo v zásade robia superpotraviny, a po druhé, ktoré potraviny sú do nej zahrnuté. Pre systematický zoznam atribútov adjektív je potrebné najskôr vytvoriť korpus označený podľa slovných druhov. Nástroj AntTag to umožňuje jednoduchým spôsobom. Pri konverzii je potrebné zvoliť nastavenie jazyka „nemčina“ a variant označovania „horizontálny“ (nie „vertikálny“). Označený dokument sa automaticky uloží pod pôvodný dokument txt. Ak teraz naložíte všetky takto vytvorené súbory označené POS do AntConcu, získate prehľad všetkých atribútov adjektív, ktoré nasledujú za kľúčovým slovom vľavo pomocou vyhľadávacieho dotazu „ADJA superfood“ (screenshot 2). Jazykovo viditeľným diskurzom sú odkazy na spornú oblasť predmetu, v ktorej sa verejne diskutuje o tom, čo sú skutočné alebo čo sú skutočné superpotraviny. Rieši sa aj samotná diskurzívna aktualizácia, napríklad dôkazom o medializovaných, nových a moderných superpotravinách. Buzz slovo zjavne opisuje rôzne výrobky v rámci súčasného spôsobu výživy.

Screenshot 2: Centrované zhody pre hľadaný výraz „superfood“ s korpusom označeným POS

Prehľad frekvencií slov je možné pomerne ľahko vytvoriť na karte „Zoznam slov“ (snímka obrazovky 3). Tam sú prvé slová obsahu jednotného čísla superpotravina (37), slovné tvary jesť (34) a zdravé (40). Ako sa dalo očakávať, na vrchu je množstvo vysokofrekvenčných menších slov od determinatív po pomocné slovesá, zatiaľ čo predložky v a so sú na vrchu.

Screenshot 3: Zoznam slov

Ďalšou perspektívou hodnotenia metódy riadenej korpusom je výpočet N gramov, ktorý je možné vykonať so značkovaným aj neoznačeným korpusom. Vstupné pole zostáva prázdne, vpravo je potrebné zaškrtnúť „N-gramy“. Prehľad bigramov (snímka obrazovky 4) naznačuje kľúčový anglicizmus čistého stravovania a spoločné slovné spojenie tiež ukazuje, že texty majú tendenciu byť prispôsobené tak, aby definovali, ktoré druhy superpotravín sa kde a ako konzumujú (screenshot 5). . Ak pôjdete po ceste fráz zavedených, môžete nájsť prepozičné vloženie špecifické pre diskurz (snímka obrazovky 6), v ktorom príslušné podstatné meno vyjadruje to, čo sa považuje za superpotravinu:

Zo sémantického hľadiska predstavujú superpotraviny obohatenie. Tento výživovo-fyziologický prebytok sa realizuje morfologicky prostredníctvom zlúčenín (chia puding) a syntakticky okrem iného aj v spoločnej konštrukcii. Tieto konštrukcie sa používajú na kombináciu známych jedál a jedál - zo zdravotných dôvodov - so zdravými potravinami (šalát s kapustou, smoothie misky s chia semiačkami).

Screenshot 4: Bigrams

Screenshot 5: Dôkazy pre frázu „tam“ v zhodnom zobrazení

Screenshot 6: Prehľad bigramu pre predložku „with“

Screenshot 7: Súbežné výskyty hľadaného výrazu „superpotravina“ (kolokáty) v päťslovnom prostredí vľavo a vpravo.

Pre hodnotenie podľa „Collocates“ je potrebné zvoliť zdrojové slovo alebo frázu, s ktorou sa ďalšie slová vyskytujú v predchádzajúcom vybranom prostredí (prednastavené je prostredie päť slov naľavo a napravo od hľadaného výrazu). V prípade superpotravín dochádza k hromadeniu jednotných a množných tvarov seinu (je a je) (snímka obrazovky 7), čo naznačuje predpoklad, že anglicizmus sa pravidelne vyskytuje v predikciách, v ktorých sa vytvárajú definitívne príkazy, ako v nasledujúcich predikatívnych konštrukciách:

Dôkazy o liečivej sile superpotravín sú zriedkavé. (Focus online 7.6.2018)

Ovos je skutočná „superpotravina“. (Spiegel online 19. apríla 2018)

Zoznam kľúčových slov je možné vytvoriť, iba ak bol na stránku AntConc vopred nahraný porovnávací korpus v časti „Predvoľby nástroja“. Napríklad pre superpotravinový korpus by došlo k tematickému kontrastu s globálnejšími výrobkami výživy, ktoré pravdepodobne vykazujú menej metadiskurzívnych stôp, pretože definície sú menej kontroverzné. Dá sa tiež predpokladať, že existuje menej konštrukcií definície a priradenia.

Záver:

Táto korpusovo-lingvistická miništúdia identifikovala pojem superpotravina ako módne slovo, ktorého vplyv na zdravie zodpovedá jednotlivým potravinám a prísadám a o ktorých účinkoch na zdravie sa (kriticky) diskutuje vo verejnej diskusii.