Tudásalapú nyelvfeldolgozás

Nagy volt a lelkesedés, amikor Chomsky és Montague előálltak a nyelvtan és a jelentéstan formalizálásának nagyszabású terveivel. Végre valaki precízen megmondja, mi is van a természetes nyelvekben - gondolták a számítógépesek.

A 80-as években már a csalódás volt az uralkodó hangulati elem közöttük. A javasolt formális modellek nemcsakhogy gyakorlatilag kezelhetetlennek bizonyultak – ezen még csak-csak lehetett volna javítani, változtatni –, de egyre inadekvátabbnak is tűntek. Bárhogy fájt is a generativista szívünknek, a fő baj ezekkel a modellekkel a modularitásuk volt. A jelentést fel nem használó elemzési algoritmusok lehetetlenül bonyolultak, a pragmatikát fel nem használó jelentéstan reménytelenül használhatatlan és bonyolult, és az az elképzelés, hogy a "mechanikusan" működő elemzés után valamiféle "egyértelműsítés" majd kiegyenesíti a dolgokat, teljesen megbukott ezen, mert már maga az elemzés is kivihetetlennek látszott.

Ne becsüljük le a számítógépesek kiábrándultságát. Igaz, valóban féltik a gyorsan összeüthető és eladható bóvlijaikat, hogy nem lógathatnak a japán turisták nyakába amulett nagyságú fordítógépet. De ezek a számítógépes modellek mégiscsak emberi viselkedést szeretnének szimulálni, és ha erre nem alkalmas, amit a nyelvészek kitalálnak, az rossz jel, akkor nem sikerült megragadniuk valami lényegeset. És ezért semmilyen formális elegancia, semmilyen általánosítások megragadása stb. nem vígasztal.

Az ellenreakció sajnos csak jelszavak formájában fogalmazódott meg.[1] A tarthatatlannak látszó szekvenciális modellekkel szemben megjelent az interaktív (vagy átlapoló azaz "interleaved") architektúra, de az is reménytelenül bonyolult modellekhez vezetett. Végül megszületett az integrált architektúra igénye (De Smedt et al., 1996).

(1) Az NLP-architektúrák típusai

a.Szekvenciális: csővezeték-, futószalagszerű felépítés. Ilyen pl. a PENGUIN rendszer (Fedder, 1991).

b."Interleaved": a modulok bonyolult interakcióján, "feed-back" mechanizmusokon alapul, bonyolultabb, de ez nem feltétlenül előny. Ilyen pl. Kempen and Hoenkamp (1987) rendszere.

c.Integrált: a beleépített tudás egységesen van ábrázolva, ugyanaz az eljárás ismétlődik újra és újra, pl. GLINDA (Kantrowitz and Bates, 1992): a beleépített tudást szabályok formájában tárolja, az eljárás pedig: "válaszd ki a célpontot" – "alkalmazz egy szabályt" – "javítsd ki az eredményt". Nincs előre meghatározott sorrendje a szabályok alkalmazásának.

A másik jelszó, amely ellenreakcióként megfogalmazódott, a tudásalapú rendszerek jelszava. Ez azt jelenti, hogy eljárások programozása helyett deklaratív tudás bevitelére (vagy megtanítására) van szükség. A tudásalapú rendszerek egyben integráltak is, de nem szabályokra, hanem egy hatalmas tudásbázisra épülnek, amely a nyelv, a nyelvhasználat minden területére kiterjedő tudást tartalmaz. Ezzel a vonzó rendszer-fajtával egyetlen baj van, méghozzá az, hogy ilyen még nincs. A Mindmaker rendszere kivétel lenne, ha rajtunk kívül álló okok miatt meg nem szakad a fejlesztése.

2. A Mindmaker-féle rendszer alapelemei

Előre kell bocsátanom, hogy az a rendszer, amiről beszélni fogok, nem az én találmányom, hanem közös erőfeszítés ("csapatmunka") eredménye, amelyben legfeljebb annyi részem volt, hogy én voltam a nyelvész-szakértők vezetője.[2] Viszont úgy mondom el, ahogy én látom a dolgot, tehát lehet, hogy a munkatársaim nem értenek egyet ezzel a beállítással. Másrészt azt is tudni kell, hogy a rendszer részletei nem nyilvánosak (hogy finoman fejezzem ki magam), mert bevett szokás szerint mindaddig titkosak az ilyenek, amíg nincsenek megvalósítva. De még azt se szívesen mondom el, ami nem titok, éspedig nem üzleti szempontból, hanem mert semmi kedvem ahhoz, hogy amíg mi finanszírozás hiányában állunk és várunk, mások, akik közelebb vannak a húsosfazekakhoz, belekezdjenek ennek az elképzelésnek a megvalósításába.

Az általunk épített rendszer – amelynek még arra se volt ideje, hogy nevet kapjon – moduláris, de a modulok nem a nyelvészetből ismert rétegződésnek (fonológia, morfológia, szintaxis stb.) felelnek meg, hanem aszerint állítottuk fel őket, hogy milyen típusú eljárások működnek bennük. Tudásalapú rendszerről lévén szó, a "tudás" fogalmának, különböző értelmezéseinek felelnek meg ezek a modulok. A szó sokértelműségét könnyű belátni, elég, ha arra gondolunk, hogy az immunrendszerünkben is van "tudás", hiszen különböző fehérjetípusokat képes felismerni, elkülöníteni és reagálni rájuk, van ún. operacionális tudásunk (mint pl. a járás), amelyet nem tudunk expliciten megfogalmazni, mégis tudatosan használjuk, van olyan tudásunk, amelyeket szabályok formájában is meg tudunk fogalmazni, és így tovább.

Amikor a számítógépesek "tudásalapú" rendszerről beszélnek, akkor a sokféle tudásféle közül arra gondolnak, amely a logikából ismerős "állítások + következtetési szabályok" sémával írható le, vagyis arra a tudásra, amely logikai állítások egy halmazából áll, plusz mindazokból a potenciális állításokból, amelyeket ebből a halmazból következtetésként le lehet vonni. Kérdés azonban, hogy amikor a "tudásalapú" NLP szükségességét elismerjük, akkor nekünk is ilyen tudásra (vagy csak ilyenre) kell-e gondolnunk. Ez-e, vagy csak ez-e az a fajta tudás, amelyre a nyelvtudás és a nyelvhasználat szimulálásakor szükségünk van? Ennek megvizsgálásához tegyünk egy kis kitérőt a mentális működésekkel kapcsolatban.

Bár a nyelvészek (és általában a tudományos közvélemény) nemigen vesz erről tudomást, a XX. század egyik legnagyobbszabású tudományos programja, ti. hogy a tudásfajták és a mentális működések egész bonyodalmas rendszerét természettudományos eszközökkel vizsgáljuk – ezt a programot ma kognitív tudománynak nevezzük – Freud (1940) nevéhez fűződik:

(2) Freud (1940) programja

"(…) a másik felfogás, amely szerint a lelki tulajdonképpen tudattalan, lehetőséget teremtett arra, hogy a pszichológia átalakuljon olyan tudománnyá, mint bármely más természettudomány. A pszichológia tárgyát képező folyamatok önmagukban ugyanolyan megismerhetetlenek, mint azok, amelyeket más tudományokban, például a kémiában vagy a fizikában tanulmányoznak. Arra azonban van lehetőség, hogy feltárjuk e folyamatok törvényeit, hogy hosszú szakaszokon át hiánytalanul kövessük, milyen viszony áll fenn közöttük, hogyan függnek egymástól, vagyis, hogy eljussunk oda, amit a szóban levő területen a természeti jelenségek megértésének nevezünk. (…) Ezek után az is teljesen megfelel a várakozásunknak, hogy az új tudomány alapfogalmai és elvei (…) elég sokáig ugyanolyan határozatlanok lesznek, mint a régebbi tudományok fogalmai és elvei (pl. az erő, a tömeg, a vonzás)." (ford. V. Binét Ágnes)

Bár magát a tudattalan fogalmát már a XIX. században Theodor Lipps megalkotta, mégiscsak Freud volt az, aki a kognitív programot meghirdette (legexplicitebb formában az Abriss der Psychoanalyse című művében). A maga informális módján kísérletet tett a tudatosság lelki minőségének a körülírására is, és tőle származik a tudatelőttes fogalma is.

Freud a tudatosságot lényegében a reflexióval azonosítja, a tudatelőttes pedig szerinte az énnek az a része, amely egyáltalán ilyen reflexióban részt vehet. Nos, a logikai állítások és következtetések elsősorban a reflexió modellálására alkalmasak, márpedig, ahogy Freud fogalmaz, "ami tudatos, az is csak egy pillanatra az" (ford.: V. Binét Ágnes).

Ami tudásalapú rendszerünknek ezért olyan moduljai is vannak, amelyek tudattalan, teljesen automatikus mechanizmusokat szimulálnak, ezeket technikailag nem is nevezhetjük "tudásalapúaknak", hiszen emberi megfelelőiket okoskodás nélkül, teljesen automatikusan használjuk. Ilyen mechanizmusok például a célok kitűzése, illetve a még absztraktabb, a célok mögött meghúzódó mechanizmusok, amelyeket vágyaknak nevezhetünk. Ezek irányítják, mozgatják végső soron a beszéd és a megértés folyamatát. De ilyen tudattalan mechanizmusok például a kiejtés és a szófelismerés folyamatainak nagy része is, ezek is olyan modulok, amelyekbe a tudatos gondolkodás, érvelés nem tud igazából "beavatkozni".

A másik véglet a tudatos okoskodás szintje; a tudatos modulok a mesterséges intelligenciából jól ismert, csak apróbb újításokat tartalmazó módszerekkel elsősorban tervezést végeznek. A konkrét helyzet, a cél és általában a külvilág ismeretében terveket dolgozunk ki a célunk eléréséhez. Fontos, hogy részleges terveket is használunk (amelyeknek nincs minden részletük kidolgozva, további, de elhalasztott tervezési folyamatot tesznek még szükségessé), valamint hogy előregyártott tervek ( ún. receptek) is a rendelkezésünkre állnak, az olyan esetekre, amelyeket már egyszer megoldottunk, és emlékszünk a megoldásra. A tudatosság pillanatnyiságának megfelelően még ezeknek a tervezési folyamatoknak a nagy része is "tudattalanul" történik.

A modellünkben, tehát magában a számítógépes rendszerben is, a tudattalan és a tudatos működési mód különbsége a magas szintű okoskodás hiányának, illetve jelenlétének felel meg. A tudatosság ritka pillanataiban az észlelt dolgokat összevetjük a világról való hiedelmeinkkel, megvizsgáljuk, mennyiben felelnek meg nekik, következtetéseket vonunk le stb. Szinte mindent, amit már rendesen megtanultunk, tudattalanul használunk, a modell is ennek az elvnek kell hogy megfeleljen.

A nyelvészeti modul éppen azért érdekes, mert a tudatos működéssel kapcsolatba kerülő, tudatelőttes információn operál, sok mindent akár tudatosan, akár tudattalanul el tud végezni. Lényegében az egész nyelvtudás ide tartozik (de persze nem csak az). Erről a tudásfajtáról lesz szó a továbbiakban.

3. A nyelvi modul

A rendszer integráltsága természetesen azt is jelenti, hogy a "tudatos" és a "tudattalan" működések nincsenek egyszer s mindenkorra elszigetelve egymástól. Szinte minden, ami tudattalanul elvégezhető, az tudatosan is (legfeljebb lassabban), és fordítva. Mint mondtam, illetve mint Freud megmondta, a nyelvi tudás lényege, hogy összeköti az észleletek emléknyomait a (tudatos) hiedelmekkel. A nyelvi tudás mint modul a rendszerünkben voltaképpen ezt teszi: összekapcsolja az emlékezetben őrzött nyelvi észlelés-nyomokat a világról alkotott, tudatosan kezelt tudással.

Maguk a nyelvi szabályszerűségek, tehát ezek a kapcsolatok alapvetően nem tudatosak; a fonológia, a mondattan, a pragmatika és a szemantika sok aspektusa teljesen automatikus, ugyanígy nagyon sok aspektusuk viszont tudatos vagy alkalmanként tudatos (pontosabban: tudatosan vezérelhető). Ezért az a modul, amelyet sajátosan nyelvinek nevezhetnénk, maga nem "tud arról", hogy melyik információ honnan származik, csak végzi a dolgát. Ha plusz információra van szüksége, akkor sem választhat, hogy honnan kéri vagy kapja.

Nézzük meg egy kicsit közelebbről a dolgokat, mert most már kezd érthetetlenné válni, amit mondok. Amikor egy mondatot hallunk a beszélgetésben, akkor egészen biztos és tudatos információnk van arról, hogy milyen szavak milyen sorrendben (milyen intonációval stb.) hangzottak el, és hogy milyen kontextusban. Közvetlen célunk pedig az, hogy felfogjuk, kikövetkeztessük a beszélő (kommunikációs) szándékát (hogy ezt milyen általánosabb vágyak diktálják, az most mindegy). Öntudatlanul keressük elő az elhangzott szavakat (és egy csomó nyelvtani jegyüket) a lexikai tudásunkból, tudatosul azonban, ha köztük ismeretlen szó van. Öntudatlanul építjük fel a mondat nyelvtani vázát is, de ez persze nem elég a megértéshez. A megértéshez azt kell kisakkoznunk, hogy miért pont ezek a szavak miért pont ebbe a nyelvtani vázba illesztve hangzottak el.

Ezt a folyamatot a logikában abdukciónak nevezett okoskodási eljárással modelláljuk. Az abdukció azt jelenti, hogy egy következtetésnek a konklúzióját ismerjük, és olyan premisszákat keresünk, amelyekből következik. Persze sok premisszahalmaz eleget tehet ennek, természetesen az adott körülmények között legvalószínűbbet keressük ezek közül a halmazok közül. A jelen esetben a biztos információt, az elhangzott szavak sorát konklúziónak tekintjük, és legjobb tudásunk szerint kiegészítjük egy koherens mondat-ábrázolássá, szőröstül-bőröstül, vagyis a mondat jelentésével együtt, olyannal, amelyben a forma harmóniában van a tartalommal (vö. Hobbs et al., 1993). Ennek során a legkülönbözőbb információkra szükségünk lehet, nemcsak nyelvtaniakra, és – hacsak nem nagyon olajozott beszélgetésről, rutinszerű nyelvhasználatról van szó – nemcsak olyanokra, amelyek automatikusan, tudattalanul hozzáférhetőek.

Érdekes, hogy ebből a heurisztikából kiindulva a mondatlétrehozás mennyire hasonlít a megértésre. Itt a biztos és tudatos információ, amiből kiindulunk, a saját közlési szándékunk (akárhogy is jött az létre); a kimondás nagyon sok része automatikus (pl. a szavak előkeresése a memóriából, a hangok megformálása stb.), a sajátosan nyelvi modul feladata pedig az, hogy előbb olyan koherens mondatábrázolássá egészítse ki a biztos információt, amelyben a forma összhangban van a tartalommal. (Az előbb-később viszonnyal kicsit óvatosabban kell bánni: mivel nem szekvenciális architektúráról van szó, igazából nem tudjuk a kimondást a mondat elkészültéig halogatni, legfeljebb egy kicsit tudjuk befolyásolni, hogy mekkora késéssel hangzanak el a már elkészült részek.) Ugyanakkor mindez tudatosan is vezérelhető, sőt, ha olyan külsődleges szempontokat is figyelembe akarunk venni a mondat megalkotásakor, amelyeket nem szoktunk automatikusan alkalmazni (pl. eszperente nyelven akarunk beszélni), akkor erre szükség is van.

4. Mi érdekes ebből nyelvészetileg?

A legfontosabb következménye ennek a megközelítésnek, hogy nincs természetes határvonal a jelek grammatikailag releváns és nem releváns formai, illetve tartalmi vonásai, velejárói között. Ennek a határvonalnak a meglétét ugyanis Saussure (1966) óta közhelyszerűen adottnak vették a nyelvészetben (természetesen az ebből származó kompetencia-performancia megkülönböztetést is el kell vetnünk). Diver (1995), Flemming (2001), Bybee (2001) és mások meggyőzően érvelnek ez ellen a doktrína ellen. Másrészt például Wierzbicka (1988) szánalmasan próbálja megvédeni (az egér szó jelentésének "nyelvileg releváns részét" próbálja meghatározni). Ez a következmény nemcsak elméleti: azt is jelenti, hogy mondatok elemzésénél és előállításánál nemcsak "grammatikailag releváns" információt vehetünk számításba. A moduláris elképzelésekkel éppen az volt a baj, hogy nagyon nehézkes vagy lehetetlen volt például előbb "tisztán grammatikai" információ alapján elvégezni az elemzést (ez egy csomó bizonytalanságot eredményez), azután pedig "egyértelműsíteni" (ez nem is mindig szükséges vagy lehetséges).

A másik fontos következmény, hogy az ún. grammatikalitás fogalma, ami legalább Chomsky (1957) óta középponti szerepet játszott, mint a fő magyarázandó jelenség, igencsak háttérbe szorul:

(3) A konstrukciós nyelvtan alapelve

Az embereknek nem azt a képességét kell megmagyarázni, hogy grammatikailag helyes és helytelen között különbséget kell tenni (ha és amikor egyáltalán tud), hanem azt, hogy formákhoz jelentést, jelentésekhez pedig formát tud rendelni.

Ez nemcsak az egész nyelvtant helyezi más megvilágításba, hanem a nyelvtudás alkalmazásakor, a nyelvi tevékenységben feltételezett folyamatokat is. Nem "elemzés" és "generálás" történik, hanem megértés és megértetés. A nyelv formális modellje nem grammatikális és agrammatikus szekvenciák osztályai között tesz különbséget, hanem forma és jelentés társulásának módjait írja le. Ezt az álláspontot a nyelvészetben egyedül a konstrukciós nyelvtannak nevezett irányzat képviseli. A konstrukciós nyelvtanban egyetlen formája van a nyelvi szabályszerűségek leírásának, mégpedig a konstrukció, ami nem más, mint egy általánosítás formai és jelentéstani tulajdonságok konvencionális együttjárásáról. (Speciális konstrukciókként felvehetőek még csak formai vagy csak tartalmi általánosítások is, valamint konstrukciók egymással való asszociációjáról, konvencionális együttjárásáról is lehet nyilatkozni.)

4.1. Formai jellemzések

A formai jellemzések fonológiai és mondattani mintákról szólnak. Elég különböző, és különböző automatikus folyamatok működnek rajtuk, de nem annyira, hogy ne lehessen egyetlen leíró nyelv segítségével beszélni róluk. Mindkettőben a szemantikából ismert eseményszerkezetet írunk le, amelyben több szálon futnak az események, és az eseményfonalak egy-egy pontja egymáshoz képest időzítve (szinkronizálva) van (vö. Bird and Klein, 1989). A fonológiában jól ismertek ezek az eseményfonalak, többé-kevésbé független artikulációs-akusztikai mechanizmusoknak felelnek meg (ezek az autoszegmentális fonológia "tier"-jei, tengelyei). A mondattanban is vannak ilyen fonalak, például a predikátum–argumentum szerkezet, a diskurzusbeli szerepeknek megfelelő szerkezet stb. Automatikus moduljaink arra valók, hogy az ilyen eseményszerkezetet leíró nyelven vagy nyelveken villámgyors összegzéseket és konzisztencia-ellenőrzéseket végezzenek.

Mindebben semmi különös vagy forradalmi nincs, kivéve talán azt, hogy semmilyen formában nem következik belőle olyan kényszer, hogy a mondatszerkezetet valamiféle frázisstruktúrával ábrázoljuk (értsd: hogy két megengedett összeépítési művelet legyen, a konkatenáció és az alárendelés). Ami forradalmi, az a formai leírásoknak a rendszerbe elfoglalt helye, ti. egyáltalán nem lehetséges absztrakt, a valóságos kiejtésbe nem átültethető dolgok feltételezése. Hogy egy konkrét példát mondjak: megtehetnénk esetleg, hogy a nyíl-féle szavak formai ábrázolásába beveszünk valami absztrakt, hátulképzettséget kifejező jegyet, amely ott lebeg a semmiben (azért a semmiben, mert egyáltalán nincs benne semmi hátulképzett), aztán feltételezzük, hogy az artikulációs mechanizmus ezzel nem tud semmit se kezdeni (legalábbis reméljük). De nem sokra megyünk vele, mert visszafele nem működik, hiszen nem hallunk semmi hátulképzettet az ilyen szavakban. A nyíl szóval például nem tudunk mást tenni, mint – Rebrus Péter szíves megfogalmazása szerint – kimondjuk, hogy az alakjai engedelmeskednek a magyar nyelvről szóló egyik formai általánosításnak, ti. hogy a nyíl alakjai a csiga és a csibe típusú szavak közül az előbbinek, nem pedig az utóbbinak a mintáját követik (ezzel a mintával vannak asszociálva).

4.2. Jelentéstani jellemzések

Sokkal nagyobb gondok vannak a jelentéstani jellemzésekkel a konstrukciós nyelvtanban. Szemben a frázisstruktúra-nyelvtan rendezett, fegyelmezett eljárásával, ahol minden ponton a szánkba rágják, hogyan kell a jelentéseket összerakni, itt sok helyről, sok párhuzamosan futó szálon sokféle információ gyűlik, és ezeket kell összegezni. Ha még hozzávesszük, hogy már a "fegyelmezett" szemantikában is alapvető gondok vannak (tessék csak a Minden kutya ugat mondat mondattani szerkezetére és a neki megfelelő "x(KUTYA(x) -> UGAT(x))" formula szerkezetére gondolni!), akkor talán ráérzünk, hogy milyen hatalmas feladatról van szó.

És ez még nem is minden. Nemcsak a struktúra lazasága, pontosabban szerteágazó volta nehezíti meg a jelentéstani jellemzést, hanem az a tény is, amit már említettem, hogy a "nyelvtani szempontból fontos" jelentéstani jellemzés nem különíthető el élesen egyéb, a jelekhez kapcsolódó információktól, az utóbbiak tehát folyton "feltolulnak", ezt is menedzselni kell. És végül, habként a torta tetejére, ott van az a már-már filozófiai probléma, hogy mit is jelent egy mondatot megérteni. Felületesen "megértjük" azt a fél mondatot is, amit a buszon véletlenül meghallunk, tehát nem korlátozhatjuk a megértés fogalmát arra, amikor valóságosan felismerjük a beszélő kommunikációs szándékát. De ha csak az "igazi" kommunikációs helyzeteket nézzük, akkor is nagyon változó, hogy milyen mélyen derítjük fel, ami a kimondottak mögött van. Gondoljunk csak arra, mennyiféleképpen lehet értelmezni a Tudom, ki az az Artúr mondatot. Lakonikusan csak annyit tudok most mondani erről, hogy "megértésről" értelmesen csakúgy lehet egyáltalán beszélni, ha a hallgatóság céljaihoz képest értjük ezt, vagyis akkor értünk meg valamit, ha választ kapunk valamire, amire célunk volt választ kapni.

Nos, mindezek a bonyodalmak olyan jelentéstani ábrázolást tesznek szükségessé, ami radikálisan különbözik a szokásostól. A hagyományos formális szemantikában ugyanis minden mondattani kategóriához a megfelelő típusú jelentés tartozik, ezért tudjuk olajozottan összeépíteni őket, ha megfelelő mondattani szerkezetben találkozunk velük. Tehát a "hiányos" mondatszerkezethez (pl. alany nélküli mondat) "hiányos" jelentés (azaz funktor, operandus nélkül hiányos kifejezés) tartozik, a mondattani predikátum–vonzat viszony a jelentéstanban funktor–operandus viszonynak felel meg, és így tovább.

Mivel az általunk feltételezett mondatszerkezet nem szigorúan hierarchikus, másfajta értelmezési módszert, másfajta jelentéstani szemléletet kell választanunk. Ugyanakkor a kompozicionalitás elvét meg akarjuk tartani, tehát az értelmezésnek a mondatszerkezettel összhangban kell történnie, tehát a mondatszerkezetnek összhangban kell lennie azzal, ahogyan a részek jelentését kombináljuk. De a kombinációt nem "vezérli" a mondattan abban az értelemben, ahogy a hagyományos generatív nyelvtanban, vagyis nem áll fenn megfelelés a mondattani kategóriák és szemantikai típusok között. Sőt, az igazság az, hogy szokásos értelemben vett mondattani kategóriákról és szemantikai típusokról nem is beszélhetünk.

A mondattani kategóriák problémájáról itt nem beszélek, tanulságos velük kapcsolatban elolvasni Croft (2001) első részét. Röviden arról van szó, hogy a kategóriák disztribúcióknak az (általában hiányos, leegyszerűsített) rövidítései; akár szabályokat, akár konstrukciókat használunk a nyelvtanban, pusztán még egyszer leírjuk ezeket a disztribúciókat, tehát a kategóriáknak semmiféle önálló szerepük nincsen.

Ami a szemantikai típusokat illeti, úgy gondolom, hogy ha a mondattannak nincs rájuk szüksége, akkor nem is kellenek. Ez a gyakorlatban azt jelenti, hogy a jelentéseket típusmentes nyelven ábrázoljuk. (A típusmentes nyelv a nevével ellentétben valójában nem típusmentes, hanem csak egyetlen típusú kifejezést tartalmaz.) Emellett már külön érveltem a szigorú kompozicionalitásról szóló cikkemben (Kálmán, 1996), amiben azt fejtettem ki, hogy a kompozicionalitásnak csak akkor van értelme, ha additivitást jelent, a jelentések egyszerű összegzését, ami viszont csak akkor lehetséges, ha minden jelentés összehasonlítható egymással, tehát ugyanabba a típusba tartozik.

Még egyszer elmondom, mert fontos: a típusmentességnek egy nagyon fontos következménye van: emiatt nem követhetjük azt a Frege-féle eljárást (amelynek Frege, 1892 óta nem nagyon volt riválisa), hogy a kifejezések teljes, illetve hiányos voltát szemantikai alapon magyarázzuk. Frege szerint ugyanis (a mondattan és a jelentéstan párhuzamának megfelelően) a mondattanilag hiányos kifejezéseket szemantikailag "hiányos" típusú jelentésnek, azaz kijelölt argumentum nélküli függvénynek kell megfeleltetni, amely akkor válik teljessé, ha megkapja a várva-várt argumentumot. Ez típusmentes keretben nem megy, ami talán nem is olyan nagy baj, csak kell valamilyen más mechanizmus, amivel le tudjuk írni, hogy az úszik, az úszás és az úszni más-más struktúrákba illenek bele, és csak ennyiben különbözik a jelentésük egymást ól.

Végül a megértés mélységének filozófiai problémájáról annyit, hogy – akárhogy oldjuk is meg ezt a problémát – csak akkor tudunk megfelelni a "változó mélységű megértés" követelményének, ha az egész megértési folyamat fokozatos finomítás formáját ölti. Ez pedig azt jelenti, hogy a "megértés mint (logikai nyelvre való) fordítás" elképzelésének véglegesen búcsút mondhatunk. Inkább úgy kell felfogni a dolgot, ahogy az abdukcióval kapcsolatban is mondtam, hogy iteratív módon kell hipotéziseket megfogalmazni a hallottak elhangzásának egyre mélyebb és mélyebb lehetséges okairól, mindaddig, amíg el nem jutunk egy olyanhoz, amely választ ad arra, amit tudni akartunk (persze, csak ha van rá időnk).

5. Tanulás

Már említettem, hogy ma nem fogok a sztochasztikus módszerekről beszélni. Csak a rend kedvéért említem meg, hogy szinte minden összefüggés, amelyet tartalmi és formai jegyek társulásáról és a minták egymás közötti asszociációjáról a rendszer tárol, sztochasztikus jellegű. Ennek már csak azért is így kell lennie, mert ha valaha – mint az terveinkben szerepel – automatikusan akarjuk a rendszerrel elsajátíttatni ezeket az összefüggéseket, akkor a tudás inherens bizonytalansága és a különböző ismeretek különböző megbízhatósága miatt az feltétlenül statisztikus jellegű összefüggések elsajátítását fogja jelenteni.

6. Összefoglalás

Végül hadd emeljem ki az itt vázolt koncepció néhány vonását:

(4) a. Egyszerre vezérli a megvalósíthatóságnak, gyorsaságnak és robusztusságnak, valamint az emberi viselkedés szimulációjának a látszólag egymásnak ellentmondó igénye;

b. Alapvetően új módon közelíti meg a "tudásalapúság" jelszavának megvalósítását;

c. Számos korábbi dogmával szakít, helyettük új elméleti alapállást kínál, így elveti a következőket:

i. a mondatszerkezet szigorú hierarchiája;

ii. az absztrakt fonológiai és mondattani szegmentumok;

iii. a mondattani kategóriák és a nekik megfelelő szemantikai típusok;

iv. a megértés és a mondatlétrehozás fordításszerű elképzelése.

Hivatkozások

Bird, S. and Klein, E., 1989. Phonological Events. Edinburgh Research Papers in Cognitive Science EUCCS/RP-24, Centre for Cognitive Science, University of Edinburgh, Edinburgh, Scotland.

Bybee, J., 2001. Phonology and language use. Cambridge University Press, Cambridge.

Chomsky, N., 1957. Syntactic Structures. Mouton, The Hague.

Croft, W., 2001. Radical Construction Grammar. Oxford University Press, Oxford.

De Smedt, K., Horacek, H. and Zock, M., 1996. „Architectures for natural language generation: Problems and perspectives". In: Trends in Natural Language Generation: An Articial Intelligence Perspective, pp. 17-46. Springer-Verlag, Germany.

Diver, W., 1995. „The theory". In: E. Contini-Morava and B. Goldberg (eds.), Meaning as explanation: Advances in sign-oriented linguistic Theory, pp. 45-113. Mouton de Gruyter, Berlin/New York.

Fedder, L., 1991. Generating natural language text from the output of an application program. Ph.D. thesis, Queen's College and Computer Laboratory, Cambridge.

Flemming, E., 2001. „Scalar and categorical phenomena in a unied model of phonetics and phonology"'. Phonology 18(1), 7-44.

Frege, G., 1892. „Über Sinn und Bedeutungű". Zeitschrift fr Philosophie und philosophische Kritik C, 25-50.

Freud, S., 1940. Abriss der Psychoanalyse, vol. 17 of Gesammelte Werke. Imago Publishing, London.

Hobbs, J. R., Stickel, M., Appelt, D. and Martin, P., 1993. „Interpretation as abduction". Articial Intelligence 63, 69-142.

Kálmán, L., 1996. „Strong compositionality". In: P. Dekker and M. Stokhof (eds.), Proceedings of the 10th Amsterdam Colloquium, pp. 465-478. ITLI, University of Amsterdam, Amsterdam.

Kantrowitz, M. and Bates, J., 1992. „Integrated natural language generation systems". In: R. Dale, E. Hovy, D. Rösner and O. Stock (eds.), Aspects of Automated Natural Language Generation, no. 587 in LNAI. Springer-Verlag.

Kempen, G. and Hoenkamp, E., 1987. „An incremental procedural grammar for sentence formulation". Cognitive Science 11, 201-258.

Saussure, F. d., 1966. Course in General Linguistics. McGraw-Hill, New York.

Wierzbicka, A., 1988. The Semantics of Grammar. John Benjamins, Amsterdam.

Jegyzetek

[1]Volt egy másik típusú ellenreakció is, de erről ma nem fogok beszélni, pedig nagyon fontos: ez a sztochaisztikus eljárások használata. Ezen belül is a legjelentősebbek a nagy korpuszok alapján statisztikai módszerekkel végzett NPL-kísérletek.

[2]A résztvevők listája a teljesség igénye nélkül: Szepesvári Csaba (tudományos igazgatóhelyettes), Balázs László (a munkálat vezetője), Erdélyi-Szabó Miklós, Kálmán László, Varasdi Károly és Trón Viktor (ők ketten csak a projekt egy időszakában dolgoztak a csapatban), Varga Dániel, Bohus Géza, Kalmár Zsolt (ők hárman a munkálat második felében), valamint számos programozó.