Mesterséges agyak a gépben – mire jók a neurális hálózatok?

A számítógépek már évtizedek óta jobban teljesítenek az embereknél bizonyos területeken: számítási kapacitásban verhetetlenek, jobb a memóriájuk, és képesek párhuzamosan több feladatot végezni. A képzeletünket, kreativitásunkat és a józan gondolkodásunkat azonban még nem sikerült tökéletesen reprodukálni, bár a mesterséges intelligenciával felruházott algoritmusok évről évre, sőt szinte napról napra egyre fejlettebbek. De hogyan tanul, hogyan gondolkodik egy gép? A kutatók és mérnökök erre a kérdésre az agy működésében keresik a választ.

Az emberi szervezetben az információk feldolgozásáért és ezek alapján a döntések meghozataláért a központi idegrendszer felel, amelynek legfőbb része az agy. Ennek idegsejtjei, a neuronok elektrokémiai jelzések formájában továbbítják a feldolgozott információt a sejtek közötti kapcsolódási helyeken, az úgynevezett szinapszisokban. Az agy hozzávetőlegesen 86 milliárd neuronja így egy rendkívül összetett neurális hálózatot alkot, amely fejlettségének köszönhetően képessé teszi az embert a logikus és elvont gondolkodásra, valamint a tanulásra.

A tanult képességek, például a felismerés a kellően összetett neurális hálózattal rendelkező élőlények sajátjai. Az ember könnyen felismeri az arcokat, annak ellenére, hogy nem feltétlenül tudja megmondani, milyen ismertetőjegyek alapján különböztet meg egymástól két arcot. De ugyanez a bonyolult hálózat felel azért, hogy a telefon torzításában is megismerjük egymás hangját, vagy hogy könnyen meg tudunk különböztetni egymástól egy van Gogh- és egy Picasso-festményt – de az avatottabb szeműek még egy Rembrandt- és egy Velázquez-képet is. Még szavakkal is nehéz leírni, hogyan ismerünk fel dolgokat, így szinte lehetetlen ezt a folyamatot hagyományos algoritmusokba foglalni, amelyek a számítógépek működésének alapját jelentik.

Hogy tanítható be egy gépnek, hogy ismerje fel a macskát?

A felismerés bonyolult folyamatának szimulálására már a 20. század közepén megalkották, azóta pedig folyamatosan csiszolgatják a mesterséges neurális hálózatok (ANN) modelljét, amelyben a neuronokat különböző rétegekbe helyezett számítási egységek helyettesítik. A bemeneti réteg az elemzésre szánt adatokat továbbítja, amelyek egy vagy több rejtett rétegen áthaladva úgy módosulnak, hogy a kimeneti rétegből már az adathalmaz legátfogóbb ismerete alapján érkezzen meg a rendszer által generált válasz.

A neurális hálózatokat a gépi tanulás (machine learning) módszerével lehet különböző feladatokra megtanítani. A gépi tanulás egy olyan folyamat, amely során az adott rendszer egy nagy adathalmazból minták alapján önállóan is képes szabályszerűségeket felismerni.

Ha például azt szeretnénk, hogy a neurális hálónk tanulja meg felismerni a macskákat, akkor a bemeneti rétegen keresztül be kell táplálnunk több ezer macskáról készült fotót, amelyeken a rendszer a rejtett rétegekben minták után kutat, majd végül remélhetőleg elsajátítja a macskák felismerésének képességét. Hogy ez sikerült-e, az a következő lépésben, a hiba-visszaterjesztés (backpropagation) során derül ki.

Ebben a lépésben már egy vegyes képhalmazt kell „megetetni” a rendszerrel, macskás és nem macskás fotókkal. Ezután arra utasítjuk az ANN-t, hogy az előzőleg betanult macskafelismerési módszert alkalmazva jelölje meg a macskát tartalmazó képeket, majd leellenőrizzük, hogy sikerrel járt-e. Amennyiben hibát vétett az ANN, tudatjuk vele, majd az új ismeretek fényében újra lefuttatjuk a tanulási folyamatot. Ez lényegében a mesterséges neuronok közötti kapcsolatok súlyozását finomhangolja, így lehet tökéletesíteni a neurális hálózat feladatmegoldó képességét. Vagyis ez a megoldás még emberi segítséget igényel, de ahelyett, hogy kézileg kellene megalkotni a macskák jellemzői alapján egy algoritmust (értsd: a cirmosság képlete, a macskabajusz geometriája), csak egy nagy adag fotóval kell megismertetni a gépet, amelyekből megtanulhatja a macskák jellemzőit.

Néhány óra mélytanulás, és máris sakkvilágbajnok a gép

A neurális hálózatok történetében fontos előrelépést jelentett a mélytanulás (deep learning) módszerének megjelenése. A mélytanuló hálózatok többrétegűek, és az egyes rétegek különböző jellemzők megállapítására alkalmasak, így egyre összetettebb feladatok megoldására válnak képessé. Ha például azt szeretnénk, hogy egy meghatározott tárgyat ismerjen fel egy képen, akkor az első rétegben a képpontok fényerejét elemzi, a másodikban a színek szerint tagolja a kép éleit, a harmadikban az alakzatokat csoportosítja, és így tovább, amíg a képen látható elemekhez komplex jellemzőket társít. A rendszer megtanulhatja például, hogy a szemek, az orr és a száj általában együtt szerepel a képeken, vagyis az egy arcot jelent. A végeredményt fel lehet címkézni, de minél többet tanul a rendszer, annál kevésbé van szükség a hibák visszaterjesztésére.

A gépi tanulás egyik népszerű válfaja a megerősítéses tanulás (reinforcement learning), amit például a Google mesterséges intelligenciával foglalkozó műhelye, a DeepMind is használ. Az AlphaZero nevű programot ezzel a módszerrel tanították be úgy, hogy a go, a sakk, a póker, de még a StarCraft játékában is legyőzze az addigi legfejlettebb programokat, az emberi játékosokról nem is beszélve. Míg korábban úgy tanították be a játékos neurális hálózatokat, hogy azokkal emberek játszmáinak millióit elemeztették – tehát a lehetséges lépéseket példák alapján sajátították el – az AlphaZerót már egyedül csak a játékszabályokkal ismertették meg, így szinte a nulláról kellett megtanulnia gózni vagy sakkozni. A megerősítéses tanulás során azonban több millió játszmát játszott le önmaga ellen, és az azok során levont tanulságok, a jó és rossz lépések alapján olyan stratégiát alakított ki néhány óra alatt, amivel sem ember, sem más gép nem tudta felvenni a versenyt.

Neurális hálók, neurális hálók mindenhol

Annak ellenére, hogy már a 2006-ban, Horváth Gábor szerkesztésében, megjelent Neurális hálózatok tankönyv is 50 éves múltat tulajdonít a neurális számítástechnikának, csak az elmúlt néhány évben, valamikor az előző évtizedben vált annyira megkerülhetetlenné a gépi tanulásos hálózatok alkalmazása, hogy szinte nem találunk olyan területet, ahol ne lenne haszna.

Nem kell jobb reklám a neurális hálók erejének annál, hogy megnézzük, milyen mértékben vált életünk részévé a közösségi média. A több milliárd felhasználó viselkedését, adatait folyamatosan elemző szolgáltatások egy többrétegű előreterjesztéses neurális hálózat segítségével bányásznak a gigantikus adathalmazban – ennek az eredménye az, hogy a lájkjaink, ismerőseink és becsekkolt helyeink alapján ijesztően pontos hirdetéseket dobnak elénk.
Az arcfelismerő rendszerekkel néhány évtizede még csak a sci-fikben lehetett találkozni, de ma már nemcsak az okostelefonunkat biztosítjuk be az arcképes azonosítással, hanem a bűnüldöző szervek is egyre nagyobb hasznát veszik – igaz, az adatvédelmi aggályokról még le kell folytatni a társadalmi vitát. Az ilyen rendszerek általában konvolúciós neurális hálózatok (CNN) segítségével végzik a képfeldolgozást, majd az arcképes adatbázisokkal összevetve a felismerést. Hasonló elven működik az aláírás-hitelesítés is.
Az arcfelismerés és a képelemzés az egészségügyben is csak a hasznára válhat az orvosoknak. A neurális hálózatok segítségével képzett algoritmusok rákos szöveteket azonosíthatnak mikroszkopikus méretben, de akár olyan ritka betegségeket is felismerhetnek korai stádiumban, amelyek fizikai jellemzőkben, például az arcon és a bőrön nyilvánulnak meg, és az orvosok számára csak később válnak felismerhetővé.
A neurális hálókon tanított természetesnyelv-feldolgozó (NLP) rendszereknek köszönhető, hogy ma már gépelés nélkül, pusztán a hangunkkal is kereshetünk vagy üzenhetünk a telefonunkon. Az NLP-nek tudható be , hogy a nyelvek átfogó ismeretével egyre jobbak az online fordító szolgáltatások, vagy hogy olyan nyelvi modellek jelennek meg, mint a GPT-3, amely több tíz millió weboldal, internetes bejegyzés, könyv és újságcikk elolvasása után úgy elsajátította az emberi nyelvet, hogy az utasításra előállított szövegeit nagyon nehéz megkülönböztetni az emberi írástól.
A marketing és az értékesítés világába is megváltóként érkezett a mesterséges neurális hálózat: az egyes felhasználók böngészési előzményeire, kedveléseire és más adataira támaszkodó személyre szabott marketingnek köszönhetően már nem kell a sötétben tapogatózni, hiszen minden lényeges adat hozzáférhető a célközönség megtalálásához – a hiányzó pontokat a neurális hálók kötik össze.
Nem szabad megfeledkezni az előrejelzésekről sem. A neurális hálóval, sok egyéb mellett, a részvényárfolyamok, a mezőgazdasági termelés, az időjárás vagy akár egy kórokozó terjedésének prognózisát is elkészíthetjük, pontosíthatjuk. A neurális hálózatok abban jelentenek óriási előnyt a hagyományos prediktív modellekhez képest, hogy a megfelelően nagy beviteli adathalmazokból szabad szemmel láthatatlan összefüggésekre is rámutathatnak.