Dejiny syntézy reči
Hovoriaci stroj Wolfganga von Kempelena
Prvé pokusy o generovanie ľudského jazyka strojom sa uskutočnili v druhej polovici 18. storočia. vyrobené. Ch. G. Kratzenstein, profesor fyziológie v Kodani, predtým v Halle a v Petrohrade, dokázal vyrobiť samohlásky s rezonančnými trubicami pripojenými k varhanám (1773). V tomto období už Wolfgang von Kempelen začal experimentovať, čo ho viedlo k zostrojeniu hovoriaceho prístroja. Von Kempelen bol Ingenius v službách Márie Terézie vo Viedni. Narodil sa v roku 1734 v Pressburgu, vtedajšom hlavnom meste Maďarska, a zomrel vo Viedni v roku 1804. Aj keď sa viac preslávil inými činmi, jeho prvoradým záujmom bolo štúdium produkcie ľudskej reči, a to aj s ohľadom na terapeutické aplikácie. Bol nazývaný prvým experimentálnym fonetikom. Vo svojej knihe Mechanizmus ľudského jazyka a popis hovoriaceho prístroja (1791) taktiež veľmi podrobne opísal svoj jazykový stroj, aby ho ostatní mohli znovu vytvoriť a vylepšiť. Šesť kresieb zobrazených vpravo dole je prevzatých z tejto knihy. (Kliknutím zväčšíte - a späť príslušným tlačidlom prehľadávača.)

Stroj sa skladá z vlnovca ovládaného pravým predlaktím, ktoré simuluje pľúca (kresba zhora). O „inhaláciu“ sa stará protizávažie. Na dvoch obrázkoch nižšie je znázornený „veterný hrudník“ s niektorými páčkami, ktoré sa dajú ovládať prstami pravej ruky, ako aj gumené „ústa“ a „nos“ zariadenia. Ak sa nemá vytvoriť nosová dutina, obidve nozdry sa majú uzavrieť.
Prúd vzduchu nie je vedený iba do tŕstia tŕstím, ale aj do úzkeho paralelného potrubia. To umožňuje, aby tlak vzduchu v ústnej dutine stúpal, ak je otvor pripojovacej trubice úplne uzavretý, aby produkoval zvuky bez hlasu. Po uvoľnení zámku potom poskytuje malý mech vlnovec navyše.
Pomocou ľavej ruky môžu byť rezonančné vlastnosti úst ovplyvnené aj zakrytím ich otvoru rôznymi spôsobmi. Toto umožňuje dostatočnú simuláciu niektorých samohlások a spoluhlások. Nejde teda o napodobeninu prirodzeného členenia, pretože tvar rúrky na pripevnenie stroja je vo svojej podstate nezmeniteľný. Niektoré samohlásky a najmä spoluhlásky [d t g k] sa s nimi nedajú napodobniť, ale v najlepšom prípade sa dajú simulovať. [L] sa vyrába vložením palca do úst.

Dve z pák ovládaných pravou rukou sa používajú na generovanie frikatív [s] a [], ako aj [z] a [] pomocou samostatných syčiacich rúrok (obrázok vpravo). Rachot [R] je produkovaný zariadením, ktoré zhodí drôt na vibrujúci tŕstie (kreslenie v strede).
Posledná verzia stroja Kempelens sa zachovala dodnes. Bolo to do roku 1906 v k. k. Konzervatórium pre hudbu vo Viedni a potom ako základ Nemecké múzeum prírodovedných a technických diel v Mníchove, ktoré bolo založené iba o tri roky skôr. Odvtedy je vystavený v oddelení hudobných nástrojov. Toto zariadenie sa líši od verzie opísanej v knihe v tom, že dĺžka výkyvu rákosu sa dá meniť pomocou západky, ktorá sa dá ovládať z pravej dlane. To sa potom môže použiť na pokus o simuláciu prirodzeného priebehu intonácie.


Hovoriaci stroj Wolfganga von Kempelena, ktorý je viditeľný v Múzeu Deutsches v Mníchove a videný zhora, s odstráneným vekom skrinky. Pohľady na fonetický mechanizmus
8. júla 1997 som si užíval privilégium vyskúšať Kempelenov stroj. Ich mechanizmus ladenia stále fungoval a ovládanie výšky tónu malo stále efekt. Hlas bol podobný detskému a dosť hlasný. Niekoľko základných detailov zariadenia však už nebolo funkčných.
Replika stroja, ktorú demonštroval Wheatstone v Dubline v roku 1835, sa od tej, ktorá je opísaná v Kempelenovej knihe, líšila tým, že mala tvarovateľnú trysku a páčku na potlačenie hlasu, ale chýbal jej mechanizmus na zmenu výšky tónu poslednej verzie Kempelenovej.
V 19. stor Bolo skonštruovaných niekoľko ďalších strojov podobného typu, ale pre toto storočie v skutočnosti neboli zaznamenané zásadné inovácie v oblasti syntézy reči. Za zmienku však stojí zariadenie, ktoré predstavil Joseph Faber v roku 1835, ktoré v porovnaní s Kempelenovým strojom predstavovalo pokrok v tom, že malo aj jazyk a hltan meniaci tvar a bolo vhodné aj na syntézu spevu. Jeho mechy boli poháňané nožným pedálom a zvyšok činnosti sa uskutočňoval pomocou klávesnice.
„Euphonia“ od Josepha Fabera, ako bola vystavená v Londýne v roku 1846. Stroj produkoval obyčajný a šepkaný prejav a spev, vrátane hymnu „Boh ochraňuj kráľovnú“.
R. R. Riesz (USA) ešte v roku 1937 staval zariadenie s podobným konceptom ako Kempelen, ale s v podstate realistickým tvarom predlžovacej trubice.

Mechanický model generovania reči skonštruovaný Rieszom (1937).
Aj keď si Kempelen už uvedomil, že iba jeden a Ak chcete použiť predlžovaciu trubicu, ak chcete produkovať nepretržitú reč, boli zariadenia so samostatnými rezonátormi pre každú samohlásku zostrojené pre iné účely ešte o viac ako sto rokov neskôr. Sirènes a voyelles et rйsonateurs buccaux od G.R.M. Marage (Paríž, 1900).
VODER Homera Dudleyho
Rozvoj elektrotechniky na začiatku 20. storočia umožnil produkovať zvuk reči elektrickými prostriedkami. Prvý prístroj tohto druhu, ktorý spôsobil poriadny rozruch, bol ten, ktorý vyvinul Homer Dudley PRED, ktorá bola predstavená verejnosti na Svetovej výstave v roku 1939 v New Yorku. To si však vyžadovalo veľmi dlhé obdobie praxe, aby sme ho mohli úspešne využívať.
Funkčná schéma modelu VODER a predstavenie zariadenia na svetovej výstave v roku 1939.
Ručne ovládané zariadenia na syntézu reči, ako sú Kempelens a PRED Boli väčšinou pre zábavu, ale mali hlbšie pozadie. Kempelenovo zariadenie bolo vytvorené paralelne s jeho štúdiom generácie ľudskej reči a Dudleyho zariadenie vyrástlo z VOCODER (Voice Coder), ktorého účelom bolo znížiť požadovanú šírku pásma pri prenose hlasu cez telefón tak, aby bolo možné po danej telefónnej linke uskutočňovať väčší počet diaľkových hovorov.
Prehrávanie vzoru Franka Coopera

Svetelný zdroj vytvára lúč, ktorý radiálne zasahuje rotujúci disk. Disk má 50 sústredných zvukových stôp, ako vo zvukovom filme, cez ktoré je reprodukovaných 50 čiastkových tónov so základnou frekvenciou 120 Hz. Takto modulované svetlo sa premieta do spektrogramu, ktorého odrazivosť alebo v inom prevádzkovom režime, ktorého priepustnosť svetla zodpovedá úrovni zvuku čiastkových tónov, a privedie sa do fotobunky, pomocou ktorej sa fluktuácie svetla nakoniec premenia na fluktuácie akustického tlaku. Spektrogram sa pohybuje okolo svetelného lúča na valcoch. To dáva zvukový signál, ktorý je podobný pôvodnému rečovému signálu, ale je prinajmenšom monotónny. Namiesto správnych spektrogramov je možné použiť aj „spektrogramy“ maľované ručne bielou farbou. Množstvo nových poznatkov o percepčnej úlohe rôznych detailov vo zvukových spektrách bolo získaných prostredníctvom experimentov vnímania so signálmi generovanými týmto spôsobom.
Elektrické modely produkcie reči
V modeloch, ktoré vyvinuli viacerí vedci od roku 1950, sa signál z elektricky simulovaného zdroja zvuku vysiela cez filter. Zdrojovým signálom je buď periodický zvuk, ako je to v prípade zvukov znejúcej reči, alebo neperiodický šum.
Filter simuluje rezonančné vlastnosti hlasového traktu. Dá sa rozlíšiť medzi dvoma typmi. V jednom prípade je artikulácia simulovaná s veľkým počtom elektrických obvodov zapojených do série, z ktorých každý predstavuje krátky kúsok predlžovacej trubice (napr. 5 mm), pričom rozhodujúca je plocha prierezu (lineárny analógový)., analógové prenosové vedenie). Pomocou toho druhého sa formanty, t. J. Rezonancie pripojovacej trubice, simulujú priamo v kruhu (syntéza formantu)., koncový analógový).
Gunnar Fant, z Kgl. Technická univerzita v Štokholme, s jeho OVE, Formantový syntetizátor pre samohlásky, v ktorom sa frekvenčná poloha dvoch najdôležitejších formantov mohla ručne meniť pomocou vodiaceho zariadenia.
Vďaka Parametrický umelý odberateľ Walter Lawrence (1953) by sa dali vyrobiť aj plnohodnotné spoluhlásky.
Počítačová syntéza reči
Bola tiež prijatá zjavná myšlienka výroby jazyka zreťazením uložených slov alebo kratších segmentov. Jednotlivé zvuky reči však nemožno jednoducho úspešne spojiť do slov a viet, pretože akustické vlastnosti zvuku reči určuje aj príslušné zvukové prostredie. Lepšie to funguje s takzvanými difónmi, ktoré pozostávajú z druhej polovice zvukového prejavu a prvej z nasledujúcich. To však potom vedie k veľkému počtu prvkov, ktoré je potrebné uložiť. Pomocou takýchto metód vzájomného prepojenia je možné dosiahnuť vysoký stupeň prirodzenosti bez toho, aby sa vyžadoval úplný popis ich akustických základov. Týmto metódam však chýba flexibilita syntézy riadenej pravidlami.
Pri dnešnom stave techniky nie sú hranice dosiahnuteľnej zrozumiteľnosti a prirodzenosti syntetického jazyka ťažko dané faktormi technickej povahy, ale skôr našimi obmedzenými znalosťami akustiky a vnímania jazyka. Pri výskume možno na overenie týchto vedomostí použiť syntézu reči. V súčasnosti existujú automatické metódy na akustickú analýzu a opätovnú syntézu reči. Pred opätovnou syntézou je možné vykonať určité intervencie, napríklad pokúsiť sa zmeniť zdanlivý vek rečníka. Úspech závisí od toho, ako dobre poznáte kľúčové faktory. Vypočujte si také manipulácie a posúďte sami, aké úspešné sú: Manipulácie vo veku a pohlaví hovoriaceho (švédske príklady).
Tu uvádzam niekoľko ďalších tipov na túto tému
- Wolfgang von Kempelen na webe, napríklad o svojom virtuálnom šachovom stroji. Popis jeho knihy nájdete v eseji Slavomíra Ondrejoviča (slovenský a anglický jazyk).
- Vyššie uvedené príklady syntézy od VODER, Pattern Playback a OVE sú niektoré z tých, ktoré zostavil Dennis Klatt (1987). Ďalšie ukážky.
- Popis prehrávania vzorov a niektorých experimentov, ktoré sa s ním uskutočnili, je k dispozícii na internetovom serveri Haskins Labs. Tam je objasnená súvislosť medzi fonáciou, artikuláciou a akustickými vlastnosťami zvukov reči: Artikulačná syntéza.
- Môžete si tiež vyskúšať niekoľko textovo riadených systémov syntézy reči rôznych typov v sieti. Výber odkazov nájdete v časti On-line syntéza.
- Ďalšie príklady syntézy reči.
- Inštitút pre fonetiku a jazykovú komunikáciu na Mníchovskej univerzite má pre štúdium akustickej fonetiky pripravených niekoľko textov: Akustická fonetika (HG Tillmann a F. Schiel), Čítanie sonogramov (Kirsten Machelett a HG Tillmann) a úvod do syntézy reči ( Daniel Zboril).
- Viac odkazov na túto tému nájdete na SOCRATES.
Wolfgang von Kempelen (1791) Mechanizmus ľudského jazyka a popis hovoriaceho prístroja, Viedeň: J.V. Degen, tam tiež uverejnené vo francúzštine, Le Mйchanisme de la parole, suivi de la description d'une machine parlante. Faksimilná dotlač nemeckej verzie s úvodom Herberta E. Brekleho a Wolfganga Wildgrena vyšla vo vydavateľstve Frommann-Holzboog v Stuttgarte v roku 1970. K dispozícii sú aj novšie preklady do maďarčiny a slovenčiny.
James L. Flanagan (1965) Analýza reči: Syntéza a vnímanie, Berlín: Springer.
Jens-Peter Kцster (1973) Historický vývoj syntézneho aparátu na generovanie statických a samohláskových signálov spolu so štúdiami syntézy nemeckých samohlások (Dizertačná práca), Hamburg: H. Buske.
Dennis H. Klatt (1987) Recenzia prevodu textu na reč pre angličtinu, Journal of Acoustical Society of America, 82: 737-793.
Joachim Gessinger (1994) Očné ucho. Štúdie o štúdiu jazyka u ľudí 1700-1850, Berlin, NY: De Gruyter. Hartmut Traunmьller | Oddelenie fonetiky Jazykovedný ústav Štokholmská univerzita | v auguste 1997.