Az érvelés alapú keresésről – jogászoknak

Az érvelés alapú keresés az informatikai szakemberek számára egy régi kutatási terület, amelyben mindig is központi jelentősége volt a jogi érvelés vizsgálatának és az ezzel kapcsolatos szellemi részfolyamatok automatizálhatóságának. A jogászok között mégis alig néhányan tudnak erről a kutatási területről.

Bevezetés

Már önmagában emiatt is érdemes volna bemutatni e területet: a jogászok számára is tanulságos, ha megértjük, mások miként látják a munkánkat. Az érvelés alapú keresést természetesen pusztán azért is érdemes megnéznünk, mert a jelenlegi keresési módszereink újabb technikai megközelítéssel fognak bővülni. Végül észre kell vennünk azt is, hogy ha az érvelés alapú keresés kellően sikeressé válik, ez vissza fog hatni arra is, hogy a jogászok miként működnek a hétköznapokban, milyen területekre kell több erőt összpontosítanunk, és mit várnak el tőlünk a szakmán kívüliek. E módszertan sikere ugyanis feltételezi, hogy az eddigiekhez képest merőben új módon fel tudják dolgozni a jogi szövegeket, és a szöveg felszíni rétegén túl egy újabb (értelmi, szemantikai) réteget tudnak automatizált módon, megbízhatóan beazonosítani. Emiatt az érvelés alapú keresés sikeressége azt is jelenti, hogy a jelenleg kizárólag emberi (szerkesztői, jogászi) értelemmel kinyerhető réteg megbízhatóan vizsgálható géppel, és ez szükségszerűen a legtöbb jogászi feladatkörre is vissza fog hatni, a szövegfeldolgozáson túl a szövegalkotásban is.

A kellő áttekintés végett nézzük meg először, hogy jelenleg milyen célokból és milyen technikákkal keresünk a gyakorló jogi munkában, ahol a feladataink határozzák meg a keresés megfelelő stratégiáját és optimális technikáit is.

Keresési célok, megközelítések

Egy tipikus jogi keresési mód az, amikor egy adott – valamennyire már absztrahált, megfogalmazott – tényállásból indulunk ki, és az erre irányadó szöveghelyekre keresünk, ahol a cél a tényállás jogi minősítése.[1] Tehát, egy már valamennyire körülírt tényállás alapján próbálunk találni arra alkalmas jogi minősítést, hogy mi lehet a leírt tényállásnak a jogkövetkezménye, várhatóan hogyan fogják értékelni, minősíteni egyes alanyi jogok vagy jogszabályi rendelkezések alapján.

A gyakorló jogászi munkában persze legalább ennyire gyakori keresési cél, amikor nem a tényállásból indulunk ki, hanem valamely normának próbáljuk egyes részleteit megérteni, ellenőrizni, hogy jól tudjuk-e, elmélyülni akár a legkisebb fordulatokban, hogy azokat mások miként értelmezték. Ilyenkor nem a tényálláson van a hangsúly, hanem azon, hogy az adott szöveghelyről ki és mit írt, mit gondolt. Ilyen normaközpontú keresés abban elengedhetetlen, ha azt szeretnénk látni, hogy egy tényállás adott értelmezésének milyen alternatívái vannak, milyen irányban lehet számítani eltérő értelmezésekre, mi a mozgásterünk és esélyünk arra, hogy egy döntéshozót meggyőzzünk valamilyen eltérő minősítésekről, jogkövetkezmények alkalmazásáról.

Látni fogjuk, hogy az érvelés alapú keresés egy sajátos keresési cél megvalósítását teszi lehetővé, amely a jogászok számára inkább ez utóbbi keresési célhoz áll közelebb. Azonban ahhoz, hogy ezt megértsük, célszerű előbb kitérni a keresési célokat megvalósító technikákra, a keresési képességeket meghatározó műszaki jellegzetességekre.

A jogi munkában használt keresési technikák egykor és ma

Kezdjük egy történeti példával. Az 1886. évi Ügyvédek Lapjának 45. számában így írtak: „A magyar bíróságok között voltaképpen csak a Curiának és a budapesti kir. táblának vannak könyvei. … De annál kevésbé van könyvük azoknak, akik nagyon rászorulnak: a törvényszékeknek és járásbíróságoknak. … A könyvet nem is szeretik s a „józan észre” szeretnek inkább támaszkodni, hogysem a betűre. Ebből azután furcsa dolgok kerülnek ki. Sok bíróság helyiségében az egyetlen könyv ama kis és hitvány hivatalos naptár, melyet a miniszter küld be az év elején, mely azután madzagra akasztva lógg le a bírói asztalról.

Egy ilyen működésű környezetben a jogi szövegek keresésének a gyakorló jogászok között nem lehetett túl nagy jelentősége. Ha maga a döntéshozó sem könyvből dolgozott, valószínűleg a döntés végett hozzá járuló felek sem voltak rákényszerítve erre. Ettől még persze komoly versenyelőnyhöz is juthatott, aki ilyen autoritásokkal tudta kiegészíteni érvelését, akár csak a birtokában lévő saját, korábbi bírósági döntésekre hivatkozva. A jogász birtokában lévő egy-két könyv és néhány tucat döntés végiglapozása túl sok technikai támogatást nem igényelt.

Ám a keresés technikai támogatásának alapvető eszközeit már ebben a korban is megtalálhatjuk.[2] A jogi munkában a keresés elsődleges technikai eszköze a különféle mutatózás volt.[3] A hazai jogi mutatózás leggyakrabban használt eszközei voltak a törvények és rendeletek „szak”-, ábécé és időrend szerinti tárgymutatói voltak.[4] A döntvényeket közel teljes terjedelemben vagy kivonatolva közzétevő döntvénytárakban találhatjuk, ezeknek is számos eltérő típusú mutatóik voltak, így a döntvények tartalmának néhány soros leírásait tartalmazó tartalom mutatók, a betűrendes mutatók (pl. „adásvétel” tárgyszó melyik döntvényben fordul elő) és a rendszeres tárgymutatók (a jogterület dogmatikai felosztásához igazított mutatózás). Már ekkor elterjedt és praktikus megközelítés volt a jogforrás szerint rendezett mutató, ahol a döntvényeket (azonosítóikat) az adott területet szabályozó törvény (magánjogi törvényjavaslat) egyes §-aihoz vagy szerkezeti egységeihez igazították.[5]

Ez a kézi mutatózás lényegében a jogi tartalmak digitális adatfeldolgozásának megkezdéséig az egyetlen megoldás volt, és egészen a kilencvenes évek elejéig domináns módszer maradt.

A kézi (analitikus) mutatózást olyan személynek kell végeznie, aki valamennyire érti a leendő felhasználó gondolkodásmódját. Tehát előnyös, hogy az egy adott szakterülethez értő személy végzi a mutatózást, mert a megfelelő mutatózáshoz ismerni kell a várható felhasználási célokat. A szakértő elemző kiszűri az azonos alakú, de eltérő jelentésű fogalmakat, de figyelembe veszi, ha a kereső felhasználó valamely szinonimán keresztül próbál meg egy-egy azonos tárgyra keresni (ilyenkor a szinonimát is el kell helyezni a mutatóban, akár kereszthivatkozással, akár ismétléssel). Észreveheti a szövegben kifejezetten nem szereplő (rejtett) fogalmakat – pl. a házastársi tartással kapcsolatos fontos rendelkezés van a döntés egy mondatában, de vonatkozó névmást használnak a mondatban a tartás vagy a házastárs kifejezés helyett. Felismerheti az adott tárgy szoros tartalmi kapcsolatát egy másik tárggyal, így kereszthivatkozást tesz a felhasználó részére stb. Végül a kézi mutatózás egyik előnye, hogy az emberi felhasználó által kezelhető méretű tud maradni – a szakértői mutatózás csak a lényeges tételeket őrzi meg.

A mutatózást végző személyek sajnos sokba kerülnek, míg a keresendő anyag köre egyre csak bővült. Így minél nagyobb lett a keresendő és feldolgozandó anyag, annál nehezebb lett ezt a kézi mutatózást következetesen ellátni. Idehaza nem volt piac, ami eltartott volna egy Shepard-höz hasonló óriási, lényegében csak mutatózásról szóló kiadvány sorozatot.

A gépi szövegfeldolgozás technikai alapja, hogy vagy maga a szöveg már közvetlenül gép által feldolgozható formában jön létre, vagy az, hogy a gépileg közvetlenül fel nem dolgozható tartalmat egyre olcsóbban lehessen gépi feldolgozható formába alakítani. Az így feldolgozható digitális anyag mennyisége a hatvanas évektől kezdődően egyre gyorsuló ütemben nőtt.

A digitálisan feldolgozható anyag keresése mind a felhasználó, mind a tartalmat szolgáltató fél számára gyorsabb keresést tett lehetővé nagyobb adathalmazon. A tisztán szabad (vagy teljes) szöveges keresés jellegzetessége, hogy az összes leírt szó szöveg szerinti alakjában lehet(ett) keresni. Ez kellően nagy adathalmaz esetén már gyakran túl sok találatot ad, így a digitális anyagoknál is értelme volt megtartani a szakértői mutatózás technikáját. Tehát géppel kinyerték az adott szöveganyag kulcsszavait, amely kulcsszavakat aztán tovább szűrték kézzel, kereszthivatkozták stb.

Később a kézi mutatózás fent leírt előnyeit próbálták minél hatékonyabban utánozni, géppel kipótolni a hiányzó szakértelmet. Ezt a fejlődést a természetes nyelvi feldolgozás eszközei tették lehetővé: egységesíteni lehetett a rokon értelmű szavak mutatóit, megkülönböztetni egymástól az azonos alakú, de eltérő értelmű szavakat (a mondatban betöltött szerepük vagy más, szövegkörnyezetbeli információk alapján) – de ez már átvezet a szemantikai keresés mezejére, amelyre néhány bekezdéssel később még visszatérünk.

A fejlődés másik iránya az volt, hogy a felhasználói felületen keresztül befolyásolhatóvá tették a keresési algoritmust: pl. csak olyan találatokat adjon ki, ahol több keresett kifejezés között adott logikai vagy formális nyelvi kapcsolat is teljesül.

A kulcsszavas kereséstől független, ma is gyakran használt keresési technika a szövegben lévő hivatkozásokra fókuszál. Ennek is láthattuk már az előképét a XIX. századi magyar döntvénytárakban is, a jogforrás szerint rendezett mutatókban, és ennek az egyre szélesebb körű használatát teszik ma lehetővé ugyanazok a természetes nyelvi szövegfeldolgozó eszközök, amelyeket a kulcsszavas keresések esetén a kézi mutatózást helyettesítik.

E módszer nagyon jól kiegészíti a kulcsszavas keresést az ítéletek és más egyedi döntések terén. A hivatkozásokat ugyanis relatíve pontosan fel lehet automatikusan ismerni, és így egy szöveghelyet konkrét jogszabályhoz vagy egyedi döntéshez kapcsolni. Néhány nagyon általános, szinte automatikusan hivatkozott jogszabályhely kivételével a kereszthivatkozásokat visszafele irányba keresve pontosan utána lehet nézni, hogy mi egy-egy normarészletnek a gyakorlata: a beadványokban ki hivatkozza és milyen sikerrel, ítéletben miket írtak róla.

A hivatkozás tipikus technikája azonban nem csak nyelv- és joghatóságfüggő kérdés, hanem egy országon belül is eltérő, mind időben, mind jogterületenként. Ezáltal a hivatkozás alapú keresések hasznossága is koronként és jogáganként eltérő. Például harminc évvel ezelőtt jóval ritkábbak volt az úgynevezett merev hivatkozások (merev utalások), amikor tételesen meghatározták azt a másik jogszabályt, ahova kihivatkozott egy szöveg.[6] Büntetőbírósági ítéletben ma kötelező a Btk. szerinti tényállásra hivatkozni a büntetőeljárásról szóló törvény szerint,[7] de polgári perrendtartásban csak az a kifejezett elvárás, hogy az érvényesíteni kívánt jogot jelöljék meg a jogalap megjelölésével – de ez utóbbi nem jelenti a paragrafus szintű meghatározás kötelezettségét.[8]

Ráadásul attól, mert a peres felek vagy az eljárás résztvevői a tárgyaláson vagy egy bírósági beadványban valamely jogszabályhelyre vagy más döntésre hivatkoznak, ez nem biztos, hogy bekerül akár a tárgyalási jegyzőkönyvbe vagy az ügydöntő határozatba – ez a bíró egyéni stílusától, a bíróság szintjétől is függő kérdés már. Ha a jogászi munkánál használt vagy a jogászok számára feldolgozható szöveganyag csak az ítéletekre terjed ki, ez jelentősen lecsökkenti a feltárható és később is beazonosítható, használható kereszthivatkozások számát.

Ezért fontos kiemelni itt az uniónak két, hivatkozással kapcsolatos, szabványosítási törekvését: az egyik a jogszabályokra vonatkozó European Legislation Identifier (ELI), a másik pedig a bírói gyakorlat, a bírói döntésekre vonatkozó European Case Law Identifier (ECLI). Láthatjuk, hogy a hivatkozási gyakorlat egy relatíve homogén országon belül is milyen eltérő tud lenni, ezért az ELI és ECLI szintű szabványosítás az uniós gyakorlatok feltárásához elengedhetetlen kezdeti lépés. Országok között hatványozottan igaz, hogy nagyon eltérőek a hivatkozások típusa, gyakorisága is. Gondoljunk arra is, hogy milyen alapvető eltérés van a common law bírósági ítéletek és a kontinentális jogi jellegű ítéleteket stílusa között, hogy melyik mennyire részletes, és milyen országban mennyire elvárás, hogy a bíróság az ítéletét jogszabályi és döntvényi hivatkozásokkal támassza alá.

A szemantikus keresés módszere, céljai

A szemantikus keresést nem nevezhetjük néhány technikai megoldás gyűjtőnevének, inkább pontosabb lenne ezt egy stratégiai iránynak tekinteni. A törekvés lényege, hogy a keresés a szöveg megjelenési (felületi) rétege helyett egyre inkább annak „értelmi”, tartalmi rétegén történjen, így a keresés eredménye (a kikeresett szöveg) is a keresett jelentéshez igazodik. A cél tehát a minél relevánsabb találat, ami feltételezi a keresés szövegkörnyezetének „megértését” és a felkínált találatok kontextusát értését is.

Ez egyrészről kevesebb irreleváns találatot eredményez, azaz kevesebb a „hamis pozitív” találat, mert pl. a „használt ingatlan” kifejezés csak a hibás teljesítés kapcsán érdekel minket, illetékjogi szempontból nem. Másrészről a találat tartalmazzon minden, adott kérdés szempontjából releváns találatot, akkor is, ha eltérő volt a szó megjelenési alakja (pl. „használt ház”).

Láthatjuk, hogy mindkét probléma feltételezi a keresési környezet, a kérdező helyzetének minél jobb megértését is, így a helyes válasz nagyon sok, ki nem mondott tényező megfelelő feltételezésén (kikövetkeztetésén) múlik.

Felhasználói oldalról nézve a szemantikus kereséseket ma kétfajta módon szokták megvalósítani. Az egyik, amikor mintaszövegeket adnak meg, és arra keresnek rá, hogy hol van hasonló tartalmú szöveg az adatbázisban. A másik fajta megközelítés, amikor egy természetes nyelvi kérdést tesznek föl, és a kérdésre a gép próbál valamilyen választ találni az adatbázisban. Ebben az esetben a szövegértési és kérdezz-felelek célra épített modellek segítségével próbálja a program a megfelelő kérdésünket értelmezni, és arra próbál megfelelő választ találni.[9]

Tehát a szemantikai keresésnél nem lehet a kérdést „általános” (személytől és kontextustól független) módon megadni, mert akkor éppen a szemantikai keresés előnye veszik el. Viszont az sem triviális, hogy milyen kontextuális információt kellene a kérdéshez hozzátenni, és minél kevesebb ilyen információ áll rendelkezésre, annál általánosabb, kevésbé releváns (és kevésbé szemantikus) lesz a válasz.

Egy lehetséges megoldás az is, ha olyan keresőmotorokat használunk, ahol a kérdezőről már rendelkezésre áll egy részletes profil, egy nagy viselkedési adatbázis, beleértve a korábbi kereséseket is. Vagy elvi megoldás lehetne az is, ha a kérdező személynek kellene saját magáról kontextuális információkat rögzítenie a kérdéskor, amelyeket így megfelelően tud értékelni a keresőmotor – de ez sem triviális vagy kényelmes megoldás.

A szemantikai keresést sok eltérő technikával próbálják megvalósítani, alapvetően mindegyik a természetes nyelvi szövegfeldolgozási eszközök kutatási területére tartozik.

Vannak egyfajta digitális tezauruszokra (szinonimaszótárakra) épülő megoldások is, akár olyan kézi szótárak, mint a WordNet[10], amelyben az egyes szavak közötti szemantikai kapcsolatokat szerkesztők gyűjtötték, de vannak a szinonimák keresésére kihegyezett gépi tanulási technikák is, amelyek segítségével betanított modelleket hoznak létre (pl. word2vec[11]). Ezek az adott szöveganyag feldolgozásával próbálják megmérni, hogy egyes szavak tipikusan milyen kontextusban fordulnak elő, mi az egymáshoz való viszonyuk, ezáltal a többi szavak közötti távolságot és más kapcsolatokat is kimérnek, ami értelmi különbségek feltárásában is hatékonynak bizonyult. Ilyen jellegű jogi felhasználás esetén persze figyelemmel kell lenni arra, hogy ha ugyanazt a nyelvet több országban is használják, akkor az egyik ország jogi szövegén tanított megoldás nem feltétlenül lesz pontos egy másik országban, illetve az azonos alakú szavak kiküszöbölésére akár jogterületenként eltérő betanítás is indokolt lehetne.

De ez csak két kiragadott példa a szemantikus keresés egyszerűbb megoldásaiból. Alkalmazási szinten nézve ilyen szemantikai célú kereséssel már a jogi adatbázisokban és az általános keresőkben is találkozhatunk, csak a használt módszer nem feltétlenül transzparens számunkra.

Miután bemutattunk néhány kortárs keresési technikát, nézzük meg, hogy miben más, miként igazodik ezekhez az érvelés alapú keresés

Az érvelésbányászat: az érvelés alapú keresés kutatási alapjai

Az érvelés alapú keresés is egyfajta szemantikus szemléletű keresés, amely az érvelésbányászatnak fordítható (argumentation mining) ősi, multidiszciplináris mesterséges intelligencia kutatási terület eredményeire épít. Nyelvészek és informatikusok már évtizedek óta dolgoznak azon, hogy általánosságban az emberi szövegekben „számíthatóvá tegyék a helyes érveléseket”.

Ez eredetileg a helyes érveléssel kapcsolatos retorikai tudomány számítógépes támogatásáról szólt. Ma pontosabb az a megfogalmazás, hogy az érvelésbányászat során az emberi természetes nyelvi szövegből próbálják felismerni az érvelési szerkezeteket, az érvelési struktúrákat, és vizualizálják az érvelés menetét. Információt gyűjtenek a szövegnek érvelési szerkezetéről, az érveléssel kapcsolatos szempontokból osztályozzák az egyes mondatokat, kifejezéseket.

Milyen területeken alkalmazzák ezt a számítógépes érvelésbányászatot? Például segíthet egy adott témával kapcsolatos érvelések összegyűjtésében, vagy akár érvekkel és ellenérvekkel támogathat bizonyos döntéshozatalokat, vagy segíti az egyes érvelésekben foglalt állításoknak az ellenőrzését.

Nézzük meg, hogy a mondatokban és a mondatokból álló dokumentumokban milyen kifejezéseket lehet az érvelések szempontjából beazonosítani, és hogyan válnak a mondatok érvekké, és az érvek érveléssé.

Ehhez elsőként az algoritmusnak fel kell ismernie a retorikai jelentését a szövegnek – több egymásra épülő szinten. Az egyes jelentéseknél először be kell azonos, hogy mely mondatrészek az állítások, majd azt, hogy mi az egyes állítások közötti kapcsolat, és miként alakítják ezek az információk a szövegrészt érvvé. Nézzünk egy angol nyelvű példát erre, ahol a mondatban érvelési szempontból a premisszákat és azt támogató kijelentéseket, valamint magát a következtetést különíti el egy meghatározott jelölés szerint:[12]

Tehát beazonosítják az érvelési egységeket, és elkülöníti őket attól a szövegrészektől, amelyek igazából függetlenek az érveléstől, amelyek nem tartalmaznak az érvelés szempontjából értékelhető rendelkezéseket (összekötő rendelkezéseket tartalmaznak). Az eszköz be tudja azonosítani azt is, hogy a mondatokban mely rész az, amelyik a premissza, az alap információ, és melyik az, amelyik a végkövetkeztetés (az érvelés eredménye), valamint azt, hogy a premissza és a következtetés között mely kifejezés jelenti a tartalmi kapcsolatot, azaz a premissza és a következtetés támogatja-e egymást, vagy éppen az egyik cáfolja a másik állítást.

Ez szintén egy több rétegre épülő, az automatizálásra és több egymásra épülő, megbízható eszközt kíván. Legmagasabb (a szöveghez legközelebbi) szinten lehet, hogy csak annyit végez az egyik eszköz, hogy különválogatja azt, ami érvelés szempontjából jelentőséggel bíró mondatrész, és azt, amelyik nem bír jelentőséggel. A következő szinten lévő eszköz már a szövegek alapján megpróbálja kitalálni, hogy melyik az az érvelési szempontból releváns kifejezés, ami következtetés, és melyik az, amelyik premissza. (Ha egy szövegben már be tudunk azonosítani logikai állításokat, már ennek önmagában is haszna lehet a jogi szöveg használhatósága és megbízhatósága szempontjából, de egyelőre nem megyünk bele a jogi felhasználás részleteibe).

Érdemes megemlíteni az IBM-nek a Debater – Vitatkozó – nevű projektjét is 2011-ből.[13] Erre a projektre az IBM azt követően állt át, hogy a Jeopardy nevű televíziós játékműsorban a jól ismert, roppant látványos eredményt értek el.[14] A Jeopardy-t megnyerő rendszer is egy kérdés-felelet jellegű eszköz volt, és utána az IBM-nél erre az érvelés alapú rendszerre álltak át (mindezidáig kevesebb sikerrel és publicitással).

Ez a projekt nem egy kifejezetten jogi témáról szólt, de a működése részeként jelentős adatbázist építettek ki azzal kapcsolatosan, hogy mely területeken milyen érvek-ellenérvek találhatóak, és azok hogy épülnek egymásra, melyik érv hogy cáfolja a másikat. A Nature-ben[15] 2021. februárjában közzétették a Project Debate-tel kapcsolatos kutatási eredményeket.

Az érvelés alapú keresés szerepe a jogi területen

A korábban nevesített, informatikus és más mesterséges intelligenciával kapcsolatos interdiszciplináris kutatók számára érvelésbányászat egyik fő kutatási területe az érvelés a jogi szövegekben. Amióta az „AI and Law” mint kutatási terület önállósult, 1987 körül,[16] számos tanulmány jelenik meg folyamatosan a jogi érvelés vizsgálatáról. Miért szeretik ezek az informatikai kutatók az érvelések jogi területét vizsgálni? Nyilvánvaló, hogy az egyik legjobb minőségű, és legnagyobb mennyiségű dokumentált érvelési szöveganyag a bírói döntésekben találhatóak.

Hogy ez a szemlélet miként próbálta meg eddig a gyakorlatba átültetni a kutatási eredményeiket, erre nézzünk egy példát Kevin Ashley egyik könyvéből, az Artificial Intelligence and Legal Analyticsből.[17]

Mr. Ashley a CATO nevű rendszerrel – mintegy húsz évvel ezelőtt – az üzleti titkok védelmével kapcsolatos egyesült államokbeli common law gyakorlatot vizsgálta. A szerző először az üzleti titokkal kapcsolatos területen a tényállások és minősítések szempontjából jelentős tényezőket, azok indokait kigyűjtötte. Talált 27 tényezőt (faktort), amit szerinte ezen jogi kérdés szempontjából indokolt megvizsgálni, és egy listát alakított ki abból, hogy melyik tényezőnek mi a jelentősége az üzleti titok minősítése kapcsán, mi az a tényező, ami az üzleti titok meglétét állító fél állításait támogatja, és mi az, ami az annak hiányát állító fél állítását támogatja. Például a fent kiemelt 16. számú tényező azzal a common law-ban az üzleti titok kapcsán kialakított releváns szabállyal kapcsolatos, hogy az üzleti titkot harmadik fél saját maga is visszafejtheti, az üzleti titok ismerete nélkül. Ez egy „gyengeséget” jelent az érvelés szempontjából: az alperes védekezhet ezzel, és ha felmerül, az ügyben meg kell vizsgálni, hogy van-e bármilyen olyan bizonyíték, ami alátámasztaná, hogy ez a tényállási elem megvalósult a konkrét ügyben.

A tényezők kapcsán egy hierarachikus viszonyt felállítottak a CATO rendszerben, hogy melyik tényező cáfolhatja (gyengítheti) vagy éppen erősítheti a másik tényezőt, és a peres feleknek ha az egyik tényezőt bizonyítják, akkor még mi mást kell bizonyítaniuk vagy kell ellenbizonyítaniuk.

Tehát a rendszer használatához részletesen megvizsgáltak egy adott common law tényállást („normabeli tényállást”), a tényállás alapján pedig a releváns jogi szempontokat (indokokat), és azt, hogy az adott jogi szempont miként, milyen irányban támogatja a döntéshozatalt, mely felek érveléseit segíti elő (miben tér el ez az ügy attól a bírósági ügytől, aminél ezt a szabályt alkalmazták, miért nem releváns ez az eltérés stb.)

Nyilván ez a fenti, húsz évvel ezelőtti példa nem gyakorlati céllal készült, hiszen egy szerző kézzel, jogászi-szerkesztői eljárással kellett, hogy kidolgozzon egy szűk területre vonatkozó érvelési rendszert (amit aztán az ottani bírói gyakorlat is azóta már átírt néhányszor). Nyilván nem lesznek jogászok, akik 16 ezer különféle tényállást részletesen kielemeznek egy ilyen sajátos szerkezet szerint. A fenti példa azért érdekes mégis, mert jól illusztrálja, hogy mire is kíváncsiak a kutatási szakemberek – az érvelés számítógépes modellezése az alkalmazott jogot, az élő jogot próbálja valamilyen – gépileg feldolgozható módon – leképezni.

A jogászi hivatások tagjai többségükben szentségtörésnek érzik, ha a jog működését automatizálni próbálják, és ilyen vizsgálatok során önkéntelenül a megvalósítási nehézségeken van a hangsúly. Informatikailag ugyanakkor ez nem szempont, és elegendő a kutatások, próbák eredményét megtekinteni, hogy eldöntsük, van-e bármi keresnivaló ezen a területen. Ennek azonban előfeltétele, hogy a jog működését informatikai eszközökkel vizsgálni lehessen, ami nem triviális feladat.

Azt bármely laikus hamar észreveszi, hogy az érvelések automatizálásához nem elegendő a leírt és kodifikált jogot vizsgálni, legyen szó akár common law-ról, akár kontinentális területről. Azonban ha kellően nagy számban áll a rendelkezésünkre bírósági döntés, a jog valódi működését ezeken a döntéseken keresztül is meg lehet közelíteni. Az elérhető döntések növekvő száma, valamint a természetes nyelvi feldolgozó eszközök fokozódó képességei tehát nem csak a jogászi keresési képességeket javíthatják, hanem egyúttal az egyre növekvő jogi szöveganyag, és rajta keresztül a társadalom jogi működésének közvetlen vizsgálatát is lehetővé teszik. Mindez kihatással lesz arra is, hogy a most jogi jellegű folyamatokat hogyan tudják a jogi működésen kívüli folyamatokra terelni, kevésbé emberigényes folyamattá változtatni, ezáltal olcsóbbá és gépesíthetőbbé tenni, illetve a jogon belül kezelt folyamatokat leegyszerűsíteni, a pereket még tovább gyorsítani stb.

Ennek a folyamatnak az egyik fontos mérföldköve az, hogy a bírói döntések folyamatában az érvelések rétegét láthatóvá tegyék. Nem csak a bírói határozatok feldolgozásáról van itt szó, hiszen az a jelenlegi szabályok szerint nem ismétli meg az érvelések teljes folyamatát. Az érvelés feldolgozhatóságához a teljes döntési folyamatot meg kell érteni, amelynek szerves részét képezik a beadványokban és a jegyzőkönyvekben vagy más hasonló periratokban szereplő érvelések is.

Milyen mondatok hivatkoznak milyen jogalapra, milyen helyzetben hivatkoznak egy-egy törvényi tényállásra? Hogyan fogalmaznak meg a beadványokban vagy ítéletekben egy-egy tényállást, és egy adott jogalaphoz és törvényi tényálláshoz milyen történeti tényeket szoktak állítani? Milyen bizonyítékokat szoktak elfogadni milyen tényállítások esetén, és mi a tapasztalat, hogy milyen gyakorisággal sikerül bizonyítaniuk az állításokat?

Ezek mind bonyolult kérdések, de nem annyira, hogy lehetetlen legyen őket többé-kevésbé egységes módon megválaszolnia néhány embernek pár tucat döntésre vonatkozóan. Megfelelően nagy terjedelmű és minőségű jogi szövegek esetén ez a felmérés, láthatóvá tétel is automatizálható lesz, így a néhány tucat döntés helyett akár több százezer döntésre vonatkozóan is használható minőségben rendelkezésünkre állhat a retorikai célú érvelési réteg, és ami még fontosabb, gép számára is láthatóvá tehető a döntési folyamat felépítése, pontos szerkezete.

Ha a jogi döntés folyamata átláthatóvá válik, akkor számos új hatékonysági szempontot vizsgálni lehet, amit jelenleg legfeljebb statisztikai eszközökkel vagy az egyes döntéshozók, kollégiumok egyéni véleményeiből leszűrve vehetünk észre. Láthatóvá válnak a bírói gyakorlatbeli eltérések, a beadványbeli következetlenségek, könnyebben észlelni lehet az olyan (implicit) bírói gyakorlatot is, amely eltér a kodifikált normától, vagy akár automatikus anyagot kaphatunk naprakész kommentárok elkészítéséhez.

Ez nem feltétlenül jelenti azt, hogy mindez kívánatos is volna, gondoljunk csak arra, hogy mindez milyen hatással lesz a bírói függetlenségre vagy a bírói gyakorlat jogfejlesztő szerepére, ami önmagában is védendő társadalmi érték. De az biztos, hogy egy ilyen automatizálás pusztán a láthatatlan jogi szerkezetek láthatóvá tételével is jelentősen átalakítaná a jogászi működési gyakorlatot, még akkor is, ha nem teszik kötelezővé – vagy egyenesen tiltják – a használatát.

Összefoglaló

A rendelkezésre álló döntések tömegének növekedésével arányosan a közvetlenül a kulcsszavakra épülő keresések jogi használhatósága tovább csökken, és ez a hivatkozásokra épülő keresések hasznosságát is megkérdőjelezi. A jogi munkához is szükség lesz egy olyan „szemantikusabb” keresésre, ami kifejezetten a meggyőzési vagy döntési jellegű jogi munkák sajátos céljához igazodik, azaz a jogi érvelésre fókuszál.

Az érvelés alapú keresés mint technikai újdonság a szövegfeldolgozó eszközök gyors fejlődése és a döntések tömegének növekedése miatt várhatóan a közeljövőben mindannyiunk számára elérhetővé válik. Számos nehézségek le kell még küzdeni, beleértve az eltérő érvelési stílusok okozta nehézséget, az adott nyelven és országban közzétett döntések számát, valamint a döntéseken túli peranyag gépi feldolgozhatóságát.

Közvetlen hatása a jogászi munkára várhatóan abban fog jelentkezni, hogy megalapozottabb, a korábbi döntésekhez jobban illeszkedő, azokra szervesebben épülő beadványokat és döntéseket lehet készíteni. De az igazi kérdés az lesz, hogy ezért a belátható mértékű előnyért hajlandóak vagyunk-e sokkal nagyobb értékeket is kockáztatni, mint a bírói döntés szabadsága. Van-e olyan szellem, amit akaratlanul kiengedünk a palackból, akarunk-e, tehetünk-e bármit ez ellen, és ha nem, miként fogja ez a szellem megváltoztatni a jogászi hivatást.

A cikk a Digitális jogalkalmazás rovat keretében jelent meg. Az eddigi írásokat itt találod.

Források:

[1] Zsolt Ződi, ‘Alkalmas-e a Google Jogi Problémák Megoldására?’ in Miklós Szabó (ed) (Bíbor Kiadó 2015) 2 <http://real.mtak.hu/36997/> accessed 30 October 2022.

[2] Az általános keresési technikák történetének fejlődéséről részletesebben lásd Charles T Meadow, Bert R Boyce and Donald H Kraft (eds), Text Information Retrieval Systems (3. ed, Elsevier 2007) 21–31., idézi Ződi (n 1).

[3] Természetesen a jogtudomány számára már ekkor is, később is elengedhetetlenek voltak a könyvtári katalógusok, a kapcsolódó osztályozási rendszerek stb., de ez a néhány vaskos könyvből és jogszabályokból dolgozó napi jogi munkában sem akkor, sem később nem volt tipikus eszköz.

[4] A rendeletek tárának voltak saját mutatói, de az országos törvénytárnak (Corpus Juris Hungarici) több évig még a kiegyezés után sem, de ezt a célt magánkiadványok pótolták.

[5] Védjegyes határozatok esetén számmutatók is készültek stb., de ez akkor is egy viszonylag szűk jogi terület volt.

[6] A megváltozott kodifikációs támogatási technikák miatt ma már a merev hivatkozás jogalkalmazási előnye meghaladja az ezzel járó kodifikációs terhet. Ahogy régebben gyakoribbak voltak az „általánosságban történő”, későbbi nevén „sommás módosítások”, ma pedig egy megye-vármegye szintű tételes átnevezés sem retten vissza a jogalkotó, lásd a 2022. évi XXII. törvény erre vonatkozó 217 tételnyi módosítását.

[7] 2017. évi XC. törvény 561. § (2) bekezdés c) pontja

[8] 2016. évi CXXX. törvény 170. § (2) bekezdés b) pont.

[9] Ilyet láthatunk például 2019. október óta, ha a Google-vel keresünk, ezek „people also ask” jellegű találatok.

[10] https://wordnet.princeton.edu/

[11] https://wikipedia2vec.github.io/demo/

[12] Henning Wachsmuth and Yamen Ajjour, ‘A Brief Introduction to Computational Argumentation’ 34 <https://www.uni-weimar.de/fileadmin/user/fak/medien/professuren/Webis/teaching/ws17/computational-argumentation-seminar/wachsmuth17-a-brief-introduction-to-computational-argumentation.pdf>.

[13] https://research.ibm.com/interactive/project-debater/

[14] https://www.ibm.com/ibm/history/ibm100/us/en/icons/watson/

[15] Noam Slonim and others, ‘An Autonomous Debating System’ (2021) 591 Nature 379 <http://www.nature.com/articles/s41586-021-03215-w> accessed 30 October 2022.

[16] The First International Conference on Artificial Intelligence and Law: Proceedings of the Conference; May 27 – 29, 1987, Boston, Massachusetts (Association for Computing Machinery 1987). Lásd még Trevor Bench-Capon and others, ‘A History of AI and Law in 50 Papers: 25 Years of the International Conference on AI and Law’ (2012) 20 Artificial Intelligence and Law 215.

[17] Kevin D Ashley, Artificial Intelligence and Legal Analytics (First, Cambridge University Press 2017) <www.cambridge.org/9781107171503>.

***

Ha nem szeretnél lemaradni a további írásainkról, kövesd az Arsbonit a Facebookon. Videós tartalmainkért pedig látogass el a Youtube csatornánkra.