Ha új ötletekre vágysz, olvass régi könyveket!

Orbán Miklós évek óta foglalkozik jogi innovációval és technológiákkal Londonban és Budapesten. Idejének felében az OPL egyik partnereként dolgozik Budapesten: “egy igazi új generációs irodát építünk” – ahogy mondja. Az ideje másik felében Londonban dolgozik a Paralaw stratégiai igazgatójaként. A Paralaw egy alternatív jogi szolgáltató, ami a rugalmas munkaerőszervezéstől a mesterséges intelligenciáig mindennel foglalkozik az angol piacon. Ezúttal az okos algoritmusokról és azoknak a jogi piacon betöltött szerepéről kérdeztük Miklóst annak kapcsán, hogy idén az OPL Future of the Law különdíjat ajánlott fel a cikkíró pályázat leginnovatívabb témát feldolgozó szerzőjének.

Mostanában rengeteget lehet hallani a mesterséges intelligenciáról, de hogy ez egészen pontosan mi, azt nem sokan tudják. Mi ennek a lényege?

A kilencvenes években voltam huszonéves, és nagyon aktív voltam az akkor alakuló internetes szubkultúrában. Emlékszem az első budapesti „First Tuesday” összejövetelekre, ahol az akkori „szekta-vezérek” azt jósolták, hogy 10-20 éven belül mindent az interneten fogunk intézni, és eltűnik majd a boltoktól az iskolákon keresztül az irodákig minden. Röhejesen hangzik mindez mostanra, de ha nem bólogattál, akkor nagyon old school-nak számítottál. A mesterséges intelligencia („artificial intelligence”, „AI”) kezd hasonló szubkultúrává válni, ahol a „hívők” most Föld 2.0-ról, meg milliárdok munkanélkülivé válásáról prédikálnak.

Keresztül kell látnunk a hype-on:

az AI egy hatalmas technológiai és üzleti lehetőség, az sem kizárt, hogy az internethez hasonló mértékű változást hoz majd az életünkben. Azonban egyelőre ez egy lehetőség, és nem valóság.

Cikkíró Pályázat

Van egy érdekes témád?

Ez most nem egy évfolyamdolgozat, hanem az Arsboni ötödik alkalommal megrendezésre kerülő Cikkíró Pályázata!

Az AI alapköve az adat. Ha van elég adatod, akkor algoritmusokkal sokkal pontosabban modellezhető a jövő. Mondok egy egyszerű példát: Netflix. Ahogy nézed a filmeket, a Netflix épít rólad egy profilt. Figyeli, hogy mikor és milyen filmeket nézel, melyik filmet nézed végig és melyiket nem, mikor hagyod abba, és persze azt is, hogy hogyan értékeled az egyes műsorokat. Ha elég sok időt töltesz a Netflixen, akkor elég pontosan fogja tudni a rendszer, hogy milyen film jön majd neked be, és ez a profil minden egyes nappal finomodik. És persze ezen a logikán alapszanak a Netflix produkciók is: sokan nem értik, hogy miért olyanok ezek a sorozatok és filmek, mint egy korábbi sikeres produkció „koppintásai”. Hát, pont ezért:

a Netflix pontosan bemérte, hogy milyen sztorikat,
karaktereket és stílusokat szeretnek az emberek.

De ez egyben a rendszer gyengesége is: ha nincs elég adat, vagy az adat nem elég pontos vagy releváns, akkor ezek a modellek sem működnek. Vannak például forgalomszimulációs algoritmusok, amik egy csomó forgalmi adat betáplálása után megmondják, hogy mikor és hol várhatók dugók, és persze azt is, hogy mit kell ahhoz változtatni, hogy ezek elkerülhetők legyenek. Híres példa, ahogyan az egyik piacvezető alkalmazás megbukott Párizsban, mert bár mindent jól csináltak, csak azt nem vették figyelembe, hogy a párizsiak másképpen vezetnek, mint a londoniak. Mondok egy példát a jog területéről is: vannak olyan államok az USA-ban, ahol algoritmus segíti a bírót olyan kérdésekben, hogy egy eljárás alá vont személy szabadlábon védekezhet-e. Ehhez betáplálták az elmúlt öt évtized valamennyi releváns bűnügyi adatát, a gép felépített egy modellt, ami sok területen jól is működik, de mondjuk az eseteket mindössze 20%-ban tudta eltalálni azt, hogy ki fog elkövetni szabadlábon erőszakos bűncselekményt.

Az algoritmus mintázatokat és összefüggéseket keres a legfelsőbb bírósági döntésekben.

Ez olyan, mint a statisztika. Mi ebben a mesterséges intelligencia?

 Őszintén? Ezekben semmi, mégis mindenki ezt a „buzzword”-öt használja mindenre. És ez nem jó, mivel ezzel lejáratjuk a kifejezést, nem is beszélve az emberi intelligenciáról. Van azonban egy olyan trend, ami hajlik már a valós mesterséges intelligenciára. Ez pedig a „machine learning”, azaz a gépi tanulás néhány új vonulata.

Amikor a bírói döntést segítő algoritmusról beszéltem, akkor abban azt kell látni, hogy a gép maga keresi a korrelációt az egyes tényezők között. Azaz betápláltak a gépbe több millió adatot azokkal az esetekkel kapcsolatban, amikor valaki szabadlábon védekezett vagy előzetesbe került: az elkövető, a bűncselekmény összes lehetséges adatát, és minden egyéb körülményt. Ezek alapján a gép maga épített fel egy modellt arra nézve, hogy a sok tényező és adat közül melyeknek milyen jelentősége van a szabadlábon védekezés sikerességében. Ezt követően pedig minden egyes sikeres vagy sikertelen eset adatait is betáplálják, így

folyamatosan tanul a gép a saját hibáiból és sikereiből.

Ez a machine learning.

Néhány éve jelent meg a reinforcement learning, amikor úgy tanul a gép, mint egy kutya: egy jutalomért végez el feladatokat.

Megerősítéses tanulás. A gép célja, hogy Mario a legtöbb pontot szerezze.

Itt tehát a gép nemcsak tanulni képes, hanem úgy dolgozik, hogy közben van egy célja, azaz egy stratégiát követ. Hasonlóan forradalminak tartom a GAN-t, azaz generative adversarial networks-t. Az AI alapproblémája az, hogy a gép nem tudja, hogy hogyan néz ki mondjuk egy macska, és ahhoz, hogy egy önműködő autó felismerjen egy utcán fekvő macskát, és ne keverje össze egy papírzacskóval, több ezer macska képet kell neki betáplálni, és még akkor is sokat fog hibázni. A GAN ezt kerüli ki: két rendszert állít egymással szembe, az egyik macska képeket generál néhány kép alapján, a másik pedig eldönti, hogy ez hasonlít-e az eredeti macskára vagy sem, és az egyes válaszok alapján a gép magát tanítja arra, hogy hogyan néz ki egy macska. Nyilván egyelőre egyik rendszer sem működik tökéletesen, de szépen alakulnak, és ez már valós artificial intelligence.

Milyen technológiák vannak mostani a jogi piacon? Melyikben van mesterséges intelligencia is?

 A nagy jogi piacokon elérhető technológiákat hat típusba sorolnám. A magyar nem nagy jogi piac, a legtöbb ezek közül természetesen nem is elérhető Magyarországon:

  1. Document proofing – ezek olyan alkalmazások, amik egy jogi dokumentum (mondjuk egy szerződés) elkészítése közben figyelik, hogy nem marad-e ki valami az anyagból, helyesek-e a hivatkozások, esetleg van-e benne valami iparági benchmarkoktól eltérő passzus, és ezekre felhívja a készítő figyelmét. Ezek általában egyszerű alkalmazások, de vannak közöttük olyanok is már, amikbe van machine learning, azaz a gép minden egyes dokumentumból tanul.
  2. Document automation – ezek elég régóta létező programok, gyakorlatilag digitális sablonok. Nem becsülném azonban le ezeket, mivel ha elterjednének, komoly kihívást jelentenének a kisvállalatokból és magánszemélyekből elő ügyvédeknek.
  3. Expert systems – ezek „decision tree” alapon működő szoftverek, amik szintén régóta vannak jelen. Egy példa: az alkalmazás feltesz 30 kérdést adatvédelemmel kapcsolatban, de úgy, hogy a következő kérdés az azelőtti kérdésre adott választól függ. A kérdés-válasz végén a szoftver megmondja, hogy a cég megfelel-e a GDPR-nak. Én egyre több ilyen alkalmazásra számítok, hiszen ezek a szoftverek fajlagos költsége alacsony, és valós igényre adnak választ.
  4. Document review – ez talán a legnagyobb csoport. Ezek olyan alkalmazások, amik nagy mennyiségű dokumentumot tudnak feldolgozni, azokat utána különböző módon rendszerbe szedik, a dokumentumokból a releváns részeket kiszedik, sőt egyszerűbb reportokat is tudnak készíteni. Ne becsülje le senki ezeket az alkalmazásokat, komoly machine learninggel vannak ezek megtámogatva, és mostanra azt csinálják, amit 20 éve az ügyvédjelöltek és gyakornokok csináltak a nagy ügyvédi irodákban.
  5. Legal research – ezek igazából ugyanazon a logikán működnek, mint a document review szoftverek, csak a dokumentumok itt jogszabályok. A legtöbb legal research szoftver mostanra úgy működik, hogy utcanyelven írod be a jogi kérdésed, a gép kidobja az összes releváns jogszabályt, sőt még összefoglalót is készít róluk.
  6. Quantitative legal prediction – ezek azok az algoritmusok, amik bírósági vagy hatósági döntéseket modelleznek historikus adatok alapján. Megmondják, hogy milyen faktorok hogyan befolyásolják a döntéseket. Szerintem ezek a legérdekesebb programok, és talán erre van a legnagyobb szükség: valahol végtelenül igazságtalan ugyanis, hogy egy ember ugyanezért a bűncselekményért öt évet kap egy nap, és egy másik bírónál másnap pedig hatot vagy négyet.

És hogy működnek ezek a gyakorlatban?

 Egy példán keresztül mutatnám be, hogy hogyan működik egy jó, mesterséges intelligenciával megtámogatott document review-szoftver. Tegyük fel, hogy azt gyanítja egy cég, hogy több, beszerzéssel foglalkozó munkatársa szervezetten csúszópénzeket fogad el beszállítóktól. Mivel ez a magyar embertől „idegen” mentalitás, ezért feltételezzük azt, hogy ez egy angol nagyvállalatnál történik. Rendelkezésre áll 10.000 szerződés, 150.000 email, 20.000 sms, 40.000 Viber-üzenet és 30.000 mindenféle, nem elektronikus formában elérhető dokumentum. A feladat az, hogy találjunk benne bármit, ami visszaélésre utalhat vagy azt bizonyítja.

Először betöltjük az elektronikus dokumentumokat a szoftverbe, és beszkenneljük maradék doksikat. Az applikáció felismeri a legkülönbözőbb formátumban lévő fájlokat, és rendszerbe rendezi. Ezt követően kiválasztunk egy megfelelő nagyságú mintát, mondjuk minden csoportból véletlenszerűen a dokumentumok 5%-át, majd azt átnézi néhány jogász, akik megmondják, hogy azokból mi lesz releváns. Ezt visszatöltjük a gépbe, majd működésbe léptetjük a machine learninget. A gép korrelációt keres a teljes minta és a kiválasztott dokumentumok között, majd egy modellt épít fel ez alapján. Az így készült modellt le kell futtatnunk egy másik kisebb mintán, és meg kell néznünk, hogy valóban megtalálta-e így a gép a releváns dokumentumokat. Ha nem, és persze ez van gyakrabban, akkor meg kell néznünk, hogy a gép mit talált relevánsnak és mi alapján. Ez a finomhangolás természetesen hosszadalmas, amit az is nehezít, hogy csak olyan ember tudja végezni, aki érti a gép működési logikáját. Ha ezen túl vagyunk, és a modell jól működik, akkor futtatjuk a programot.

Lehet, hogy ez egy hosszadalmas folyamat, de gondolom azért sokkal rövidebb, mintha emberek csinálnák. Pontosabb is a gépi dokumentum-kezelés az emberinél?

Ez a „melyik jobb: a robot vagy az ember” vita igazából fals, mert almát hasonlítunk össze körtével. Az nem kérdéses, hogy ha az a feladat, hogy találjuk meg a „B” betűket egy dokumentumban, akkor a gépek gyorsabbak és pontosabbak lesznek, mint az emberek. De nincsenek nagyon ilyen munkák, vagy ha vannak, akkor azokat kérdés nélkül gépek végzik. A feladatok oroszlánrésze ennél jóval többet igényel: általában kontextust, illetve döntéshozatalt.

És ez az a terület, ahol nagyon gyengék a gépek: bármit is kezd egy gép egy dokumentumhalmazzal, nem érti, hogy mi van benne. Egy számítógépnek nem jelent semmit az a kifejezés, hogy „nem telefontéma” vagy „oldjuk meg okosba’”. A gépnek egy dokumentum csak egy sorszám, amihez egy értéket rendel a benne lévő adatok és szavak alapján, de nem érti azt. Az ember pedig lehet, hogy minden tizedik sorban figyelmetlen, de képes egy dokumentumot kontextusba helyezni: érti, hogy ez gyanús vagy hogy mi lehet valami mögött.

Másban jó az ember, és másban a gép.

Egy jól megszervezett jogi munkában a gép és az ember egymást tanítja, illetve ellenőrzi, de nem versenyeznek egymással, mert más a dolguk.

Mely AI eszközöknek a legelterjedtebb a használata? Tudnál mondani egy-két olyan konkrét példát, ahol már beváltak?

A legtöbbre a ROSS-t tartom, ami egy folyamatosan bővülő, mesterséges intelligenciával keresőalkalmazás, de nagyon komoly gépi tanulás van már a Kira-ban, Relativity-ben és a Clearwell-ben is. Ez utóbbi hárommal még az a baj, hogy ha nem vagy IT-geek, akkor nagyon keveset tudsz belőle kihozni egymagad.

Egyelőre geek-nek kell lenni, hogy az algoritmusokat használni tudjuk.

Végül vannak nagyon jó alkalmazások sokkal kevesebb algoritmussal: Contract Companion , Drafting AssistantWord Rake, Contract ExpressHotDocs.

Sok jogász, aki már az anyatejjel Ulpianust szívta magába, és inkább a klasszikus műveltségben jeleskedik, idegenkedik a matematikától, esetleg megijed az algoritmus szó hallatán. Hogyan bátorítanád őket, és hogyan győznéd meg őket arról, hogy ez az egész jogi technológia vonal nem ördöngösség, és ez a tudás is elsajátítható?

Szögezzük le: az avítt nyelvezet, a terjengős megfogalmazás és a körmönfont érvelés nem azonos a klasszikus műveltséggel.

If you want new ideas, read old books.

Nem itt tartana a magyar jogász társadalom, ha meglenne legalább a klasszikus műveltség.

De tisztában vagyok azzal is, hogy a mai jogászképzés nemcsak a mesterséges intelligenciára nem készít fel, hanem a jogi szakmára sem: nem az AI hiányzik, hanem az ahhoz vezető tíz lépésből minimum kilenc. És ez nagy baj. Ha viszont arról kérdezel, hogy érdemes-e a jogi technológiákkal foglalkozni, akkor én azt látom, hogy nincs valós alternatíva.

Nem lesznek digitalizáció-mentes és digitalizált világok,
offline és online jogászok:
egy valóság van, és
nehéz nem látni, hogy az milyen irányba megy.

És mit üzensz azoknak akik nagyon érzik a Zeitgeistot és már azt is tudják mi az a blockchain? Merre képezzék magukat tovább, hogy a holnap kihívásai mellett a holnaputánt se kelljen aggódva várniuk?

A blockchain egy vallás: aki hisz benne, az nemcsak azt hiszi, hogy minden blockchain alapon fog működni, hanem nem is érti, hogy ezt miért nem látja be mindenki. Bele se kezdenék, hogy mennyi problémát látok a blockchainnel, de abban biztos vagyok, hogy ha valamilyen szinten sikerül is elterjednie, akkor úgy fog működni, mint egy láthatatlan háttér-technológia: tudomásunk sem lesz róla. Szerintem a blockchain egy divat.

És ezzel kapcsolatos lenne a tanácsom is, ami majdnem hogy az egész életre is igaz: ne ülj fel az aktuális divatoknak. Nemcsak ruházkodási divatok vannak, hanem vannak életvitelszerű, politikai, üzleti és minden más divatok is. Bármivel is foglalkozol, legyen az jog, jogi technológia, vagy éppen mesterséges intelligencia, ne az éppen aktuális trendet kövesd, hanem próbáld meg ezeknek a valós tartalmát és működési mechanizmusát megérteni.

A valós tudás biztosan nem megy ki a divatból.
Minden más úgy változik, mint a szélirány.

 

Vajon tényleg csak a régi művekben találni újdonságot?

Írd meg a legeredetibb jogi innovációról szóló cikket, és vidd haza az OPL különdíját!

Gönczi Gergely

Jogász, 2016 júniusában végzett az SZTE-ÁJK-n. Ezt követően a Siegler - Weil, Gotshal & Manges iroda ügyédjelöltjeként szerzett  gyakorlati tapasztalatot. Érdeklődése kiterjed a jogi innováció és a lawtech területén felül a technológia fejlődésének társadalmi következményeire is.

*** Wulters Kluwer logo A Jog és Innováció rovat támogatója a Wolters Kluwer

***

Ha nem szeretnél lemaradni a további írásainkról, kövesd az Ars Bonit a facebookon.