A fonetikai fonológiáról

A cikkben a nyelvészetnek, azon belül is a fonológiának egy mostanában egyre inkább az előtérbe kerülő elméletéről lesz szó. A fonológia és a fonetika közötti különbség tisztázása után egy rövid tudománytörténeti áttekintés következik. Ezután térek rá a fonetikai fonológia elméletének vázlatos bemutatására, néhány példával szemléltetve az alapelveket.

1. A fonológia és a fonetika

A nyelvészetnek a hagyományos felfogás szerint a hangokkal, a hangok viselkedésével kapcsolatos ága a fonológia. Ez a tudományterület egy konkrét természetes nyelvben vagy, általánosan, a természetes nyelvekben megjelenő hangok rendszerével, a hangoknak ezen átfogó rendszerben elfoglalt helyével, tulajdonságaival foglalkozik. Ez egyben azt is jelenti, hogy a fonológia elvonatkoztat az egyes hangok fizikai megvalósulásától, és pusztán elméleti konstruktumokkal dolgozik. Vagyis, némiképp talán meglepő módon, a „hangok”, amikkel a fonológia operál, valójában nem a beszédben fizikailag megvalósuló hangok, hanem egy a fizikai valóságtól meglehetősen független modell összetevői. A fonológia tehát — ahogy hagyományosan mondják — absztrakt modellt ad a nyelv akusztikusan megjelenő részére. Ezzel ellentétben a fonetika nem elméleti modellt nyújt, hanem a beszéd tényleges fizikai (artikulációs illetve akusztikai) jellemzőit írja le. Ez persze azt jelenti, hogy sok, a nyelvi rendszer szempontjából lényegtelen információ is belekerül a fonetikai leírásba: a konkrét megnyilatkozásnak a beszélő életkorából, neméből, aktuális állapotából stb. adódó véletlenszerű jellemzői mind „fonetikai adatot” képeznek. A fonetika célja tehát nem a nyelv (nyelvi rendszer) modellezése, hanem a ténylegesen elhangzó megnyilatkozások fizikai jellemzőinek pontos leírása.

2. A fonetika a fonológiában

A fentiek alapján az lenne a logikus, ha a fonológia modelljei felépítése során erősen támaszkodna a fonetikából szerzett adatokra, ismeretekre. Meglepő módon azonban ez egészen az elmúlt egy-két évtizedig nem nagyon volt jellemző a főbb fonológiai irányzatokra, és még most is több olyan iskola létezik, amely figyelmen kívül hagyja a hangok fizikai tulajdonságait (ilyen például a kormányzásfonológia, ld. Kaye et al. (1990)).

Ennek a különös helyzetnek részben technikai, részben pedig történeti okai vannak. A történeti ok az, hogy a modern nyelvészet a strukturalizmusban gyökerezik, alapvetően Saussure munkásságából épült ki. A strukturalizmus önmagában (azaz a tényleges hordozótól függetlenül is) realitással bíró rendszernek tekinti a nyelvet, s a fonológiában ennek következtében a hangok egymáshoz képesti viszonyainak rendszere helyeződött a modellképzés középpontjába. Más szóval, a (hangzó) nyelv modellezésében kizárólag a hangok rendszerbeli viselkedése (amely alatt elsősorban adott környezetben történő előfordulásukat kell érteni) játszott szerepet, fizikai tulajdonságaik pedig nem, vagy igen kevéssé. Ez a szigorúan rendszeren belüliséget feltételező strukturalista szemlélet máig is alapvető a nyelvészetben. A fonológiát hosszú évtizedekig meghatározó „SPE-modell” (Chomsky & Halle, 1968) is éppen ezt tükrözi: e modellben a fonetika csak a fonológiai reprezentáció és a konkrét fizikai hangfolyam közötti interpretációs komponensben jelenik meg (beszédprodukció illetve beszédpercepció esetében persze ellentétes irányban), a hangok fizikai viselkedését, tulajdonságait azonban lényegében nem kívánja meghatározni.

A strukturalista nézetet jól szemlélteti a Saussure által kedvelt sakkhasonlat. A nyelvnek (esetünkben szűkítsük a fonológiára) a sakkjáték, míg összetevőinek (vagyis a hangoknak) a sakkbábuk felelnek meg. A sakkbábuknak azonban nem a tényleges alakja a lényeges a játékban, mondja Saussure, hanem az, hogy milyen lépéseket lehet velük végezni, azaz hogy hogyan mozoghatnak a sakk szabályrendszere szerint. Végső soron egy bábut az összes többi bábutól abbéli különbözősége azonosítja egyértelműen, hogy a szabályok szerint milyen lépéseket tehet a sakktáblán, vagyis hogy mi a funkciója a sakktáblán. Tehát a bábukat nem a fizikai tulajdonságaik határozzák meg, hanem a különbségek alkotta rendszerben elfoglalt helyük. Ezt szemlélteti az is, hogy ha a készletből esetleg elveszik a fekete királynő, a játékosok pótolhatják azt egy kaviccsal, hiszen az is ugyanúgy be tudja tölteni a királynő szerepét; sőt, ha egy kívülálló később csatlakozik a játékosokhoz, akkor — amennyiben ismeri a sakkjáték szabályait — rá fog jönni, hogy a kavics felel meg a királynőnek. Pontosan ez történik például beszédhibák esetén: noha egy raccsoló beszélő /r/-je vagy egy pösze beszélő /sz/-je fizikailag eltér a „megszokott” /r/-től, illetve /sz/-től, ez nem zavarja a hallgatókat a megértésben, jól tudják rekonstruálni a hallottakat, sőt, egy idő után esetleg fel sem tűnik számukra a kérdéses hangok szokásostól eltérő ejtése.

A fonetikai fonológia szerint azonban igenis fontos a sakkbábuk fizikai alakja, méghozzá elsősorban azért, hogy megfelelően felismerhetők, azonosíthatók legyenek az egyes bábuk (azaz hangok). A fenti példához visszatérve, ha a királynő mellett a készletből elveszik például egy futó is, akkor nem célszerű mindkét bábut két hasonló alakú kaviccsal pótolni, hiszen ekkor a játék sokkal nagyobb erőfeszítést igényelne a játékosoktól, tekintve, hogy a két igen hasonló kavics azonosítása állandó feladat elé állítaná őket. A játékosoknak minden sakkállás felmérésekor meg kellene vizsgálniuk közelről a két kavicsot, hogy az apróbb eltérések alapján valamiképpen azonosítani tudják őket. A beszédhibások sem akármilyen hanggal helyettesítik a számukra problémás hangokat, hanem azokhoz fizikailag minél inkább hasonlóval. A raccsolók /r/-je akusztikailag jobban hasonlít /r/-re, mint például /sz/-re, szemben a pöszék által ejtett /sz/-vel. A fizikai tulajdonságok tehát igenis relevánsak a játékban, vagyis elhagyva most az analógiát: a természetes nyelvekben ők határozzák meg a hangok közötti kontrasztot (különbséget). Minél nagyobb ez a különbség, annál könnyebb azonosítani, hogy egy adott fizikailag megjelenő hang melyik (fonológiailag értett) hangot képviseli. Ha például a raccsolók /r/-je inkább hasonlítana a „szokásos” /sz/-re, mint /r/-re, a /r/ és /sz/ fonológiai hangok megvalósulása közötti különbség náluk a standard ejtéshez képest sokkal kisebb lenne, és a hallgató számára nehezítené a két hang elkülönítését a beszédben. Fontos megjegyezni persze, hogy ez csak illusztrációként szolgál; a fizikai megvalósulás milyensége nem csupán a beszédhibák esetén játszik szerepet (hiszen azok a nyelv szempontjából mellékesek), hanem a nyelv (pontosabban a fonológia) egészét befolyásolják. Így például az egyes nyelvek magánhangzó- és mássalhangzó rendszerére is hatással vannak olyan szervező elvek, amelyek megkívánják az egyes hangok közti megfelelő mértékű akusztikai különbséget.

Valójában persze már a strukturalizmusban sem tudták elkerülni a hangok fizikai tulajdonságaira való hivatkozást: implicit módon felhasználták például az ún. allofónok meghatározásánál is. Egy (fonológiai) hang allofónjai azok a (még szintén fonológiai, azaz absztrakt) hangok, amelyek bizonyos, egymással diszjunkt környezetekben „realizálhatják” az adott hangot. Így például a magyarban a /b/ hang megjelenhet [b]-ként (például a láb szóban), de a zöngésségi hasonulás miatt [p]-ként is (például a lábtól >szóban, amelynek ejtése kb. láptól). Itt nyomban megjegyzendő, hogy a „realizáció” még nem fizikai realizációt jelent, hanem azt, hogy egy adott környezetben például a /b/ (fonológiai) hang helyén [b] vagy [p] (a fonológusok által ugyan már fonetikainak nevezett, valójában azonban még mindig fonológiai) hang jelenik meg. (Több fonológiai elméletben megkülönböztetnek egy ún. „fonetikai” szintet, ez azonban általában csak egy kevésbé absztrakt fonológiai szint, minthogy csupán a „fonológiai” hangokat specifikálja pontosabban, így továbbra is erősen elméletfüggő.) Az allofónokra már a strukturalisták is kikötötték, hogy legyen köztük valamilyen szintű fizikai hasonlóság, így például a /b/ soha ne realizálódhasson egyszer [b]-ként, egyszer [i]-ként, így hallgatólagosan már „becsempészték” a fizikai tulajdonságokat az elméletbe. Azonban azzal, hogy milyen szintű és jellegű fizikai hasonlóságról van szó nyíltan nem foglalkoztak. Ennek pedig, legalábbis az egyik oka egybeeshet a fonetikai fonológia késői megjelenésének technikai okával, amely a következő.

A fonetikai adatok fonológiában való figyelembevételéhez nyilvánvalóan elengedhetetlenek a pontos fonetikai adatok. A huszadik század elején, amikor elkezdődött a nyelv mint önálló rendszer vizsgálata (szemben a korábbi nyelvtörténeti megközelítésekkel, amelyek időben vizsgálták a nyelveket, és azok változásait helyezték előtérbe), még nem álltak rendelkezésre olyan eszközök, amelyekkel pontos adatokat lehetett volna nyerni akár a hangok képzéséről, akár azok akusztikus tulajdonságairól. Először röntgen segítségével tudtak a hangok szájüregbeli képzéséről információkat szerezni. A hangok akusztikai tulajdonságait pedig csak több évtizeddel később tudták megbízható pontossággal mérni. Így, mivel nem voltak adatok arról, hogy két hang pontosan miben különbözik egymástól és milyen szintű a köztük lévő különbség (kontraszt), nem lehetett megállapítani azt sem, hogy a hangok közti kontraszt mennyiben befolyásolja azok bizonyos környezetekben való megjelenését, vagyis a hangok fonológiai viselkedését.

Amellett, hogy nemigen álltak rendelkezésre egzakt fonetikai adatok, a meglévő fonetikai adatok sem voltak igazán felhasználhatók a nyelvi leírásban. Mivel a hangok képzését jóval korábban tudták tanulmányozni, mint akusztikai jellemzőiket, a fonológiában sokáig leginkább csak artikulációs adatokat tudtak felhasználni. Azonban a képzési sajátosságok nem annyira meghatározóak a hangoknál (többek között mivel ugyanazon hangot több helyen és módon is lehet képezni), ezért az artikulációs fonetikából nyert ismeretek sokszor nem is adtak alapot megfelelő általánosításokra. Például a francia /r/ hang, ami a szájüregben hátul képződik, fonológiailag úgy viselkedik, mint egyes előrébb képzett hangok (/t/, /s/, /n/ stb.), azonban artikulációsan teljesen különbözik azoktól, és inkább közel áll a viselkedésében tőle eltérő, szintén hátul képzett /k/-hoz és /g/-hez. A fonetikai és a fonológiai ismereteknek ez a diszkrepanciája is hozzájárult tehát ahhoz, hogy több fonológiai irányzat kizárta a fonetikai adatokat a fonológiai leírásokból.

A kilencvenes évekre azonban jelentős előrelépések történtek az akusztikai fonetika terén, és emellett az is egyre világosabbá vált, hogy a strukturalista, illetve a már fentebb említett, nagy hatású „SPE”-féle szemlélet nem képes magyarázatot adni bizonyos jelenségekre és egyes tipológiailag megfigyelhető, általánosan helytállónak tűnő megfigyelésekre. Valószínűleg ennek köszönhető a fonetikai fonológia előtérbe kerülése, valamint annak a szemléletnek az elterjedése, hogy a fizikai valóság, a hangok fonetikai tulajdonságai igenis relevánsak a nyelv illetve a hangok viselkedésének leírásában.

3. A fonetikai fonológia elvei, működése

A fonetikai fonológiának az alapját Steriade (1999) a kulcs általi jogosítás elve összegzi a legjobban. Eszerint annak a valószínűsége, hogy egy adott absztrakt jegy (ld. alább) egy adott környezetben megjelenik, annak a függvénye, hogy perceptuálisan mennyire kiemelkedő az adott környezetben (vagyis „mennyire hallható”).

Ez az egyszerű elv magában foglalja ennek az irányzatnak a legfontosabb téziseit, jellemzőit. Ehhez azonban szükséges ismerni a fonológiai leírás korábbi módjait. A hangok ugyanis nem elemi összetevők, hiszen például, mint azt a strukturalisták is hallgatólagosan elismerték, a /b/ és a /p/ „hasonlóbb”, mint a /b/ és az /i/, tehát a hangok további, náluk primitívebb összetevőkre, tulajdonságokra bonthatók, amelyek meghatározzák a hangoknak mind fizikai, mind viselkedésbeli hasonlóságát. Ezeket a tulajdonságokat a fonológiában főleg jegyekkel kódolták, amelyek elmélettől függően lehettek egy-, két- vagy többértékűek (tehát például az, hogy a /b/ zöngés, míg a /p/ zöngétlen, kifejezhető úgy is, hogy (1) előbbinek van egy „zöngés” jegye, utóbbinak nincs, illetve úgy is, hogy (2) az előbbi „+” zöngés, utóbbi „-” zöngés jegyű, esetleg úgy is, hogy (3) az előbbinek például „3”-as, utóbbinak például „0”-ás zöngésségi erőssége van), rendeződhettek hierarchiába vagy rendezetlen mátrixokba (vagyis például hogy (1) a „zöngésség” jegyet más jegyekkel együtt egy nagyobb jegycsoport alá lehetne besorolni, vagy pedig (2) minden jegy egyszerűen csak fel lenne sorolva az adott hang alatt) stb. Sokszor azonban komoly problémát okoz eldönteni, hogy egy jegy releváns-e egy adott nyelvben vagy sem. Például a zöngésség a magyarban általában releváns, hiszen megkülönböztethet hangokat és ezen keresztül jelentéssel rendelkező morfémákat (mást jelent például a láb, mint a láp), ugyanakkor ez a megkülönböztető jelleg időnként semlegesítődik (szakszóval: neutralizálódik): a lábtól és a láptól ejtése ugyanaz. Ilyen és ehhez hasonló kérdések, problémák merülnek fel azzal kapcsolatban, hogy milyen jegy hol jelenhet meg, illetve, hogy megjelenése vagy hiánya fonológiailag releváns-e.

Fontos fogalom ezen kívül a fonológiában a jelöltség. Ez alatt jegyek, hangok vagy hangszekvenciák bonyolultságát értik. A „bonyolultságnak” nincs mindenki által elfogadott definíciója: érthető alatta az artikulációs nehézség, ahogy az is, hogy egy adott elméletben több elemi összetevőből áll a „jelöltebb” fonológiai entitás, mint a „jelöletlenebb”. A fonetikai fonológia meghatározása a jegyek vagy hangszekvenciák jelöltségére akusztikai oldalról a hallhatóság mértéke, artikulációs oldalról pedig a képzés bonyolultsága. Az elmúlt évtizedben a fonológusok egyre nagyobb figyelmet szenteltek a jelöltségnek, és statisztikai alapon határozták meg azt, mégpedig a jegyek vagy hangszekvenciák gyakorisága alapján.

A kulcs általi jogosítás elve magával von bizonyos elkötelezettséget a jelöltség fogalmával kapcsolatban, amennyiben ti. az elv a jelöltséget nem általános érvényűnek, hanem erősen kontextus-függőnek tekinti. Ebben jelentősen eltér a korábbi nagyobb elméletektől, amelyek a jelöltség esetében nem hivatkoztak a környezetre, így nem tudták megmagyarázni például, hogy a mássalhangzóknál zöngés környezetben miért jelöltebbek (vagyis bonyolultabbak) a zöngétlen mássalhangzók, miközben általában („univerzálisan”) a zöngétlenek a jelöletlenebbek. A fonetikai fonológia keretein belül ez megmagyarázható, mivel ahhoz, hogy a tipikusan igen rövid zöngétlen mássalhangzó zöngétlensége érzékelhető legyen, nagy artikulációs erőfeszítést kell tenni, míg a zöngés mássalhangzó zöngéjét támogatja a szomszédos hang zöngéje. Tehát például a mészből szóban, amennyiben nem lenne a magyarban zöngésségi hasonulás, nagyon pontosan kellene a /sz/ kezdetekor abbahagyni a zöngét, és utána újból elkezdeni a zöngét a /b/ elején (mivel a magánhangzók és a /b/ is zöngés). Tehát a beszéd során nagyon rövid idő alatt kellene pontosan időzítve a hangok határain zöngésíteni, zöngétleníteni, majd ismét zöngésíteni, ami nagy erőfeszítést igényel, és a nagy erőfeszítés ellenére csak egyetlen mássalhangzó alatt jelenne meg a zöngétlenség, ami a zöngés mássalhangzó előtt – különösen zajosabb beszédkörnyezetben – nem hallható megfelelően. A zöngésségi hasonulás folytán azonban a mészből szóban mind a /sz/, mind a /b/ alatt zöngésítés történik (ugyanúgy, mint a mézből szóban), amely egyrészt artikulációsan sokkal egyszerűbb, másrészt akusztikailag jól hallható a zönge, hiszen nem egy, hanem két hangnyi időegységen „terül el”, és egy ebben a helyzetben akusztikailag amúgy is nehezen hallható kontraszt (ti. a zöngésség) tűnik csupán el. Emellett persze szükséges az is, hogy a két szomszédos hang eltérő képzési helye miatt fellépő kontraszt azért még megfelelően hallható legyen, így a két hang — bár különbségük csökkent a zöngésségi különbség eltűnése miatt — még mindig eléggé elkülönüljön.

Az elmélet a korábban felfedezett általánosításokat is jól magyarázza, sőt, néha a korábban kivételként kezelt eseteket is be tudja vonni az általánosításba. Erre egy példa, hogy a szótag felépítésének magyarázatához használt szonoritás, amelyről több szempontból is folytak és folynak viták, kiváltható a jegyek kontextusbeli hallhatóságával mint szótagszervező erővel (Wright 2004). Ez megmagyarázza a sziszegő hangok (pl. s és sz) több nyelvben megjelenő különleges szótagbeli pozícióit is (pl. a magyar sport szóban is, ugyanis /p/ előtt a magyarban nem állhat más mássalhangzó szó elején csak /s/ vagy /sz/), szemben a korábbi elméletekkel, amelyek ezt a jelenséget „puszta kivételként” tartották számon.

A fenti elvből a kontextusfüggőség mellett a gradualitás tétele is következik — vagyis az az elképzelés, hogy a hangok sorozatai nem egy egyszerű dichotóm osztályozás szerint oszthatók jól és rosszul formált sorozatokra, hanem a jólformáltságnak különböző fokozatai vannak a sorozat hangjainak fent említett jelöltségétől függően. Az elmélet szerint a lehetséges hangszekvenciák így felállított skálája a sorozatok nyelvek közötti, illetve egy adott nyelven belüli gyakoriságát tükrözi. Ez a hipotézis alapvetően igaznak tűnik; és ez a fonetikai fonológia mellett szól a korábbi irányzatokkal szemben.

Végül triviálisan következik Steriade elvéből a fonotaktikai zártság elve (Rebrus―Trón 2002), miszerint egy adott nyelvben egy adott jelöltségi fokú szekvencia jelenléte implikálja a nála egyszerűbb jelöltségű szekvenciák jelenlétét ugyanabban a nyelvben.

Megjegyezzük, hogy fent említett elvek akkor indokolhatóak, ha feltételezzük, hogy a kommunikáció során az információ hatékony átadásához szükséges, hogy a nyelvbeli kontrasztok (jelentéskülönbséget okozni képes hangszekvenciák) száma minél nagyobb legyen, ugyanakkor e kontrasztok megfelelően hallhatók is legyenek, de ne járjanak túl nagy artikulációs erőfeszítéssel (Kiss―Bárkányi 2006; Flemming 2004). A fonetikai fonológia elmélete alapvetően ezen heurisztikák összeütköztetésével magyarázza a nyelvekben előforduló fonológiai jelenségeket, azt feltételezve, hogy a nyelvek a fenti megszorítások alapján a logikailag lehetséges konfigurációkból — legalábbis lokálisan — az optimálisakat fogják választani.

Természetesen e rövid ismertető keretei között nem vállalkozhattunk a témakör kimerítő leírására. Az érdeklődő olvasók azonban az irodalomjegyzék olvasmányai alapján tájékozódhatnak e megközelítés további sajátosságai felől.

Hivatkozások

Boersma, P. és Weenink, D. (2005): Praat: Doing phonetics by computer (Version 4.3.19).

Chomsky, N. és Halle, M. (1968): The Sound Pattern of English. New York, Harper & Row

Flemming, E. (2004): Contrast and perceptual distinctiveness. In: Hayes et al. (2004).

Hayes, B., Kirchner, R. és Steriade, D. (ed.) (2004): Phonetically Based Phonology. Cambridge, Cambridge University Press

Kaye, J., Lowenstamm, J. és Vergnaud, J.-R. (1990): Constituent structure and government in phonology. Phonology 7: 193–231.

Kiss, Z. és Bárkányi, Zs. (2006): A phonetically-based approach to the phonology of [v] in Hungarian. Acta Linguistica Hungarica 53: 175–226.

Rebrus, P. és Trón, V. (2002): A fonotaktikai általánosításokról (kísérlet a magyar mássalhangzó-kapcsolatok nem-reprezentációs leírására). In: Maleczki, M. (szerk.) A mai magyar nyelv leírásának újabb módszerei V. Szeged, 2001. szeptember 27–29. Szeged, Szegedi Tudományegyetem, 17–63.

Steriade, D. (1999): Alternatives to the syllabic interpretation of consonantal phonotactics. In: Fujimora, O., Joseph, B. és Palek, B. (eds.) Proceeding of the 1998 Linguistics and Phonetics Conference. 205–242.

Wright, R. (2004): A review of perceptual clues and cue robustness. In: Hayes et al. (2004), 34–57.