O reprezentatívnosti kolokácií vo svete
Seminárna práca (seminár pre pokročilých) 2015 23 strán

Ukážka čítania
štruktúra
1. Úvod - O reprezentatívnosti kolokácií na webe
1.1. Čo sú to kolokácie?
1.2. Otázka
1.3. Web ako korpus
a) Korpusová lingvistika ako empirická metóda výskumu
b) Výhody a nevýhody webu ako korpusu
c) Preskúmať umiestnenia na webe
2. Vlastné korpusové lingvistické skúmanie vybraných kolokácií na webe
2.1. „Slovník kolokácií v nemčine“ - výber kolokácií, ktoré sa majú preskúmať
2.2. Korpusová analýza pomocou WebCorp
2.3. Výsledky a porovnanie s kolokačným slovníkom
3. Výklad a diskusia o výsledkoch
3.1. výhľad
1. Úvod - O reprezentatívnosti kolokácií na webe
1.1. Čo sú to kolokácie?
Vo výskume frazeológie sa termín kolokácia používa „na označenie pevných neidiomatických slovných spojení“ (porovnaj Reder 2006: 160). Umiestnenia sú tak konvencionalizované v jednotlivých jazykoch, určité slovné spojenia sú pevne zakotvené v jednom jazyku a predstavujú tak fixné „jednotky jazykového systému“ (porovnaj Lehr 1996: 1). V lingvistickom výskume sa s kolokáciami často zaobchádza ako s binárnymi lexikálnymi jednotkami, ako je to uvedené v príkladoch uvedených vyššie. Existujú však aj „viac ako dvojslovné spojenia“ (porov. Hollós 2010: 85), ako je to v príklade, ktorý je veľmi kritizovaný (porov. Hausmann 2004: 316). To by sa tu však nemalo zaoberať, pretože by išli nad rámec tejto práce.
V súhrne vychádzam pri korpusovo-lingvistickom výskume z nasledujúceho chápania kolokácií: Klokácie sú štatisticky časté kombinácie slov binárnej povahy, ktoré sa vyznačujú syntagmatickými a sémantickými závislosťami kolokátora na báze (por. Hausmann 2001: 316, Reder) 2006: 158). Predkladaná práca sa zameria na verbálne a vecné kolokácie, pretože sa dajú ľahko identifikovať z lingvistického hľadiska korpusu, a preto sú vhodné na hodnotenie reprezentatívnosti kolokácií v webovom korpuse (pozri Breidt 1995: 5). Rôznorodosť možných kombinovaných slovných spojení môže viesť k nejasnostiam pri hľadaní a analýze korpusov, a preto je potrebné jasné vymedzenie predmetu, ktorý sa má preskúmať.
1.2. Otázka
Predtým, ako sa v nasledujúcej kapitole pozriem na šance a riziká webu ako korpusu pre kolokačnú analýzu, rád by som uviedol cieľovo zameranú otázku tohto vyšetrovania. Cieľom je preskúmať, či „World Wide Web“ predstavuje použitie slovných a podstatných slovných spojení. Výsledky vlastnej korpusovej analýzy webu je potrebné porovnať s položkami v „slovníku kolokácií v nemčine“ (Quasthoff 2011), aby bolo možné posúdiť reprezentatívnosť skutočného používania jazyka na webe. Položky v slovníku už naznačujú príslušne vysokú frekvenciu príslušných kolokácií v nemeckom jazyku (porovnaj Quasthoff 2011: XII). Pretože kvantitatívna analýza je vo webovom korpuse 1 možná iba v obmedzenej miere, mala by sa pri hodnotení korpusových údajov vykonať aj kvalitatívna analýza výsledkov.
1.3. Web ako korpus
V nasledujúcej kapitole budú urobené predbežné úvahy o vhodnosti webu ako lingvistického korpusu, ktoré vyplynú z diskusie o neskorších výsledkoch kolokačnej analýzy.
a) Korpusová lingvistika ako empirická metóda výskumu
Pomocou korpusovej lingvistiky je možné empiricky preskúmať využitie rôznych jazykových javov v jednom jazyku. Použitím autentického jazykového materiálu možno napríklad poskytnúť dôkazy o význame a použití konkrétnych kolokácií a určiť ich frekvenciu výskytu. Dajú sa preto analyzovať kvalitatívne a kvantitatívne (porovnaj Scherer 2006: 35f.). To potom môže byť základom pre tvorbu slovníkov, ako je to v prípade „slovníka kolokácií v nemčine“. Väčšina korpusov - inými slovami „zbierky textov alebo častí textov, ktoré (...) sa vyberajú a klasifikujú podľa určitých jazykových kritérií“ (2006: 3) - sú dnes digitalizované a dajú sa analyzovať pomocou počítačov. „World Wide Web“ poskytuje mimoriadne veľkú zbierku údajov z písaného (a čiastočne hovoreného) jazyka a rozširuje možnosti jazykovej analýzy korpusu. Existujú však určité nevýhody alebo obmedzenia. Ďalej budú podrobnejšie preskúmané rôzne charakteristiky takzvaných „webových korpusov“ 2.
b) Výhody a nevýhody webu ako korpusu
c) Preskúmať umiestnenia na webe
Napriek obmedzeniam diskutovaným vyššie možno web použiť na lexikografické a jazykové štatistické štúdie (Scherer 2006: 75, Diemer 2008: 36). Bickelove lingvistické štúdie z korpusu 3 objasňujú, že aj napriek veľkému rastu a neustálemu ďalšiemu vývoju webového korpusu sú výsledky vyhľadávania „neodmysliteľne konzistentné“ a „reprodukovateľné“ v určitých obdobiach (Bickel 2006: 80). Veľmi podobné výsledky bolo možné dosiahnuť v rôznych časoch, čo naznačuje určitú stabilitu tkaného korpusu (porovnaj 2006: 78 a nasl.).
2. Vlastné korpusové lingvistické skúmanie vybraných kolokácií na webe
Aby som mohol preskúmať, či „World Wide Web“ predstavuje použitie verbálnych a vecných kolokácií, chcel by som svoju korpusovú analýzu založiť na vybraných kolokáciách z „Slovníka kolokácií v nemčine“ na porovnanie.
2.1. „Slovník kolokácií v nemčine“ - výber kolokácií, ktoré sa majú preskúmať
„Slovník kolokácií v nemčine“ je prvý slovník kolokácií v nemeckom jazyku (porovnaj Quasthoff 2011: XII). Pretože bol koncipovaný na základe empirického korpus-lingvistického skúmania korpusu lipského jazyka, zobrazuje jazykovú realitu spoločného použitia (porov. Radzik 2013: 64, Quasthoff 2011: XII). Quasthoffov kolokačný slovník zhromažďuje najbežnejšie kolokátory pre celkovo 3253 podstatných mien, slovies a prídavných mien, ktoré sú uvedené ako základ binárnych slovných spojení (2011: X). Radzik (2013: 71) považuje korpusovú tvorbu „Slovníka pre kolokácie v nemčine“ za „veľký úspech nemeckej lexikografie“. Príslušné kolokácie kľúčového slova nie sú štruktúrované podľa ich skutočnej frekvencie výskytu v referenčnom korpuse, ale sú triedené podľa syntaktického a sémantického vzťahu v takzvaných kolokačných skupinách 4 (porovnaj Quasthoff 2011: X).
Pre samostatnú analýzu korpusu sú analyzované slovné spojenia (podstatné meno + sloveso) na základe základnej stravy. Na druhej strane sa majú skúmať podstatné mená kolokácie (prídavné meno + podstatné meno) na základe uvedenom vyššie. V kolokačnom slovníku sú najskôr uvedené nasledujúce slovesá a prídavné mená ako kolokátory podstatného mena výživa (por. 2011: 150):
1 pozri oddiel 1.3b).
2 „Webové korpusy“ sú jazykovo pripravené jazykové materiály z Internetu. Je potrebné rozlišovať medzi týmito „korpusmi dostupnými online“, ktoré sú prístupné na internete, ale nie sú jazykovo spracované (porovnaj Storrer 2011: 12).
3 Štruktúru a implementáciu tohto korpusového lingvistického skúmania pozri Bickel (porovnaj 2006: 75 a nasl.). 6.
4 Tieto kolokačné skupiny sú uvedené v zozname oddelené bodkočiarkou. Na základe tejto štruktúry som predstavil aj výsledky tejto korpusovej lingvistickej práce z bodu 2.3 (s. 10).