http://komlomedia.hu/interreg-refresh2020/13-iq100/14736-prediktiv-mukodessel-sporolhat-energiat-az-agyunk#sigProIdb71cc29bf0
A neurális hálózatokon és az élő agyakon végzett kutatások is alátámasztják azt a teóriát, miszerint az agy előrejelzésekbe bocsátkozik a világ észlelése közben, hogy spóroljon az energiával.
Hogy hogyan dolgozza fel az agy az érzékszervekből befutó jeleket, azt a mai napig sok rejtély övezi. Az utóbbi évtizedek kutatásai alapján azonban az egyre inkább világosnak tűnik, hogy agyunk nem egyszerűen összetoldozza a szenzoros információkat, mintha egy hatalmas kirakóst rakna össze a jelekből. Ezt többek közt a látás működése is cáfolja: pusztán az a tény, hogy a szemükbe jutó fény alapján képesek vagyunk leképezni környezetünket egy olyan jelkáoszból, amely rendkívül zajos és ellentmondásos, azt sugallja, hogy az agy többet tesz az információk összefércelésénél.
Számos idegkutató gondolja úgy, hogy az agy nem egyszerűen befogadja és dekódolja a környezeti jeleket, hanem előrejelzéseket is végez: a feldolgozás során a világról való előzetes tudásunk alapján értelmezi a rendelkezésre álló információkat, következtetéseket von le ezek forrásával kapcsolatban, és megjósolja, hogy mi várható.
A szakértők szerint lehetséges, hogy ezek az agy által generált hipotézisek adják az észlelés alapját, nem pedig közvetlenül a szenzoros információk. És minél ellentmondásosabbak bemeneti jelek, annál jobban építünk erre a prediktív feldolgozásra.
A prediktív feldolgozási keretrendszer szépsége abban rejlik, hogy számos különböző jelenségre ad magyarázatot az agy működésével kapcsolatban, mondja Floris de Lange, a Radboudi Egyetem idegkutatója. Ami azonban a teóriával kapcsolatos bizonyítékokat illeti, ezek többnyire közvetettek vagy más magyarázat is lehet rájuk, teszi hozzá Tim Kietzmann, a hollandiai egyetem egy másik kutatója, aki a gépi tanulás és az idegtudomány vizsgálatával foglalkozik.
A szakértők éppen ezért döntöttek úgy, hogy mesterséges neurális hálózatokkal próbálják modellezni a biológiai idegsejtek működését, és azt, hogyan működhet a prediktív folyamat. Ezek a modellek sok tekintetben rendkívül magas szinten képesek imitálni az agy működését, és a velük végzett kísérletek azt sugallják, hogy a prediktív működés nem csak, hogy lehetséges, de energiatakarékos is.
TUDATTALAN INTERFERENCIA
A prediktív feldolgozás elmélete kapcsán első hallásra úgy tűnhet, hogy ez túlságosan is bonyolultan írja le a percepciót az egyszerű jelfeldolgozáshoz képest, ugyanakkor a kutatók régóta pedzegetik, pontosan azért, mert egy sor jelenségre nincs jobb válasz. A teória kezdetleges formája már Hasan Ibn Al-Haytham arab csillagász és matematikus ezer évvel ezelőtt írt műveiben is felbukkant. De az elmélet új lendületet kapott a 19. század második felében, amikor Hermann von Helmholtz német fizikus és orvos azt állította, hogy az agy a beérkező érzékszervi jelekből azok forrására következtet, nem pedig magukból a jelekből építi fel a percepciót.
Helmholtz saját koncepcióját tudattalan interferenciaként emlegette, és ebben sejtette az olyan észlelések működését, amikor egy kép többféleképpen is értelmezhető. Ilyen kép például a Ludwig Wittgenstein által híressé tett kacsa–nyúl-illúzió, egy olyan ábra, amely kacsaként és nyúlként is értelmezhető. Ha mindkét értelmezést sikerül meglátnunk a képben, agyunk ide-oda vált a két állat között. Helmholtz szerint ez a bistabil percepció csak annak az érzéki jelek forrására következtető tudattalan interferencia eredménye lehet, hiszen a retinánkra vetülő kép nem változik.
A 20. század során a kognitív pszichológusok egyre több bizonyítékot halmoztak fel azzal kapcsolatban, hogy az észlelés egy aktív konstrukciós folyamat, amelyben az érzéki információk és az előzetes tudás egyaránt szerepet játszik. A vonatkozó kutatások egyik fontos állomása volt Richard Langton Gregory Perceptions as Hypotheses (Az észlelés mint hipotézis) című tanulmánya, amelyben a szerző arról értekezik, hogy az kacsa és a nyúl illúziójához hasonló észlelési jelenségek lényegében annak köszönhetők, hogy az agy találgatásokba bocsátkozik az érzéki benyomások forrásával kapcsolatban. Időközben a gépi látáson dolgozók is problémákba ütköztek, amikor megpróbálták csak a beérkező jelekből, a külvilágról szóló belső modellek referenciaként való használata nélkül rekonstruálni a környezetet.
Miközben a prediktív feldolgozási modell elfogadottsága egyre nőtt, továbbra is kérdéses volt, hogy mindez hogyan működhet konkrétan az agyban. Az egyik népszerű elképzelés, a prediktív kódolás elmélete szerint agyunkban az információ feldolgozása különböző egymásra épülő szinteken történik. A legfelsőbb szinten a leginkább elvont, magasabb rendű tudás kap helyet, és ez a szint végzi a találgatást, előre jelezve az alatt található szint idegi aktivitását. Ennek megfelelő jeleket is küld a kérdéses réteg felé, amely összeveti a tényleges aktivitást az előre jelzettel, és ha eltérést tapasztal, felfelé irányuló hibajelzést indít útjára, ami alapján a felsőbb szint képes javítani az általa felépített reprezentációt.
Ez a folyamat a hierarchikus rendszerben minden egymásra épülő réteg között lezajlik, egészen a legalsóig, ahová az érzéki jelek futnak be. A hibaüzenetek nyomán folyamatosan átépülő hipotetikus reprezentáció egyre pontosabb lesz, így a legfelső réteg, amely eleinte például attól tartott, hogy egy sötét sarokban egy kígyó rejtőzik, idővel az alsóbb rétegek üzeneteit felhasználva frissíti, pontosítja a képet, így kiderülhet, hogy valójában nem is kígyó leselkedik az illetőre, csak egy feltekert kötéldarab.
A prediktív kódolás agykéregre értelmezett elméletének lényege, hogy az agy két idegsejt-populációval rendelkezik: az egyik az aktuális legjobb jóslatot kódolja az észleltekkel kapcsolatban, a másik pedig azt jelzi, ha a beérkező érzéki jelek alapján hiba van az előre jelzett képben – mondja de Lange.
Rajesh Rao és Dana Ballard, a Salk Intézet és a Rochesteri Egyetem kutatói 1999-ben lenyűgöző számítási modellt alkottak a prediktív kódolás rendszeréről. Ebben a főemlős agy vizuális feldolgozó rendszerének egyik útvonalát modellezték, amely az arcok és a tárgyak felismerésért felel, és hierarchikusan szervezett régiókból épül fel. A modell számos rejtélyre választ kínált a főemlősök látásával kapcsolatban.
Ez a modell azonban még a mai, sokkal fejlettebb, mély neurális hálózatok előtt készült, amelyek már több rétegből állnak. 2012-re számos idegkutató dolgozott ilyen hálózatokkal, amelyeket többek közt a főemlősök látásának modellezésére is használtak. A legtöbb ilyen modell azonban előrecsatolt (feedforward) volt: az információ csak a bemeneti rétegtől a kimeneti felé áramlott. Az agy azonban biztosan nem így működik, benne majdnem annyi visszacsatolás van, mint amennyi a bemeneti-kimeneti irányú információáramlás, mondja de Lange.
A kutatók egy része ezért egy másik típusú modellhez, a visszacsatolt vagy rekurrens neurális hálózatokhoz fordult (RNN). Ezek felépítésüket tekintve ideálisak az agy modellezésére, hiszen előre irányuló és visszacsatoló kapcsolatok is vannak a bennük, és folyamatos aktivitás van a neuronok között, amely független a bemenő jelektől.
ENERGIAHATÉKONY JÓSLATOK
A Harvard kutatói, William Lotter, David Cox és Gabriel Kreiman 2016-ban egy olyan RNN-t mutattak be, amely képes volt megtanulni megjósolni egy videó következő képkockájának történéseit. A PredNet nevű rendszer a prediktív kódolás alapelvei szerint építették fel, négy hierarchikus réteggel, amelyek oda-vissza üzengettek egymásnak. A korábban leírtak szerint a felső réteg lefelé továbbított egy hipotetikus képet, amit az alatta levő réteg összevetett a rendelkezésre álló információkkal, és hibaüzenetet küldött felfelé, ha eltérést tapasztalt.
A hálózatot egy autóra szerelt kamera által készített videókon trenírozták, és a PredNet idővel megtanulta pontosan előre jelezni a következő képkockát. „Nem tudtuk, hogy működni fog-e” – mondta Lotter. „Kipróbáltuk, és idővel azt láttuk, hogy tényleg képes előre jelezni.”
A következő lépés a PredNet és az idegtudományok összekapcsolása volt. Lotter és társai tavaly arról számoltak be a Nature Machine Intelligence oldalain, hogy a PredNet olyan folyamatokat demonstrál, amelyeket majmok agyában is megfigyeltek váratlan stimulusok kapcsán. Ezen folyamatok egy részét az előrecsatolt hálózatokban sosem sikerült modellezni.
Kietzmann, Marcel van Gerven és a Radboudi Egyetem kutatói közben valami mással próbálkoztak. Míg az említett modellek specifikusan predikcióra és hibajavításra képes mesterséges neuronokat tartalmaztak, a folyamathoz szükséges speciális mechanizmusokkal, a holland szakértők friss kutatásukban kipróbálták, hogy mi történik, ha nem ennyire célzott az építőelemek működése. Mivel az korábban is ismert volt, hogy a neurális kommunikáció energiaigényes (az agy a leginkább energiaigényes szerv az egész szervezetben), a kutatók azt vizsgálták, hogy egy kevésbé specializált építőelemekből álló neurális hálózatban létrejön-e a prediktív kódolás mechanizmusa, ha annyit kötnek meg a hálózat működéséhez, hogy annak minél energiatakarékosabbnak kell lennie.
A kutatók az RNN-t egyjegyű számsorokon trenírozták, amelyek emelkedő sorrendben követték egymást, majd a sor végén újraindultak a számok (pl. 1234567890, 3456789012, 6789012345). A számjegyeket 28x28 pixeles képek formájában mutatták meg a hálózatnak. Az RNN megtanult egy belső modellt, amely alapján meg tudta jósolni, hogy mi lesz a következő számjegy, bárhonnan is kezdődjön a számsor. A hálózatnak pedig az volt a feladata, hogy a lehető legkevesebb energia felhasználásával szállítsa a megoldást.
A kísérlet során bevált a kutatók sejtése: a hálózatban egyes neuronok prediktív egységekként kezdtek viselkedni, és hipotéziseket kínáltak a sejtett bemeneti jelekkel kapcsolatban. Más mesterséges neuronok hibaegységekké váltak. Ezek leginkább akkor voltak aktívak, amikor a prediktív egységek még nem tanulták meg helyesen megtippelni a következő számot, majd ahogy telt az idő, egyre csökkent az aktivitásuk. A legérdekesebb azonban, hogy a hálózat magától váltott erre az architektúrára, nem voltak előre kiosztott szerepek, hierarchiák, csak az energiahasználat minimalizálása volt a cél a feladat megoldása során.
Egyszerűen megtanulta azokat a gátló hatásokat, amiket korábban mindenki célzottan beleépített a rendszerbe – mondja Kietzman.
AZ AGYMŰKÖDÉS EGYESÍTETT ELMÉLETE?
Utóbbi kísérlet legfontosabb tanulsága, hogy az energiatakarékos működés előhívta a prediktív feldolgozás egyik módját, ami azt sugallja, hogy a biológiai agyak is hasonlóan működhetnek. De ennek tényleges igazolásához persze az élő agyban kell megmutatni a mechanizmus működését. Pontosan ez volt a célja a McGill Egyetem kutatóinak, Blake Richardsnak és kollégáinak, akik az Allen Intézet munkatársaival karöltve kidolgozták, hogyan kellene egy prediktív feldolgozási módnak kinéznie az élő agyban, majd egereken végzett kísérletek során elkezdték keresni a teoretikusan meghatározott jeleket.
A kísérlet során különösen nagy figyelem irányult az agykéreg piramissejtjeire, amelyekről régóta úgy tartják, hogy anatómiailag különösen alkalmasak lehetnek a prediktív feldolgozásra. Az egereknek úgynevezett Gábor-foltokat, sötét és világos csíkokból álló, nagyjából hasonlóan orientált foltok együtteseit mutogatták. Amikor ezeket az egerek megszokták, a foltok egyikét szokatlan irányba forgatták. Ezen az állatok először meglepődtek, majd azt is megszokták, hogy a megmutatott ábrán a foltok egyike kilóg a sorból.
Közben a kutatók folyamatosan figyelték az állatok agyműködését, és hogy mely neuronok reagálnak a várt és a váratlan stimulusokra. Így megfigyelték, hogy a váratlan esemény utáni első napon (tehát a kísérlet elején és a rendellenes folt beiktatásakor) erős felfelé irányuló jelek figyelhetők meg a rétegek közt, ezek azonban elhalványulnak, ahogy telnek a napok. Vagyis prediktív feldolgozás fogalomkörével élve, ekkor a felső rétegek hipotézisei először intenzív hibajavításra szorultak az alsó rétegek részéről, majd ahogy a felső réteg megtanulta az új rendet, a pontosabb jóslatok gátlólag hatottak az alsóbb rétegek korrigáló működésére.
A lefelé irányuló jelekkel ugyanakkor más volt a helyzet. Ezek egyre aktívabbá váltak, ahogy teltek a napok és egyre ismerősebb lett a mintázat. A váltás kizökkentette őket is, ugyanakkor a második tanulási fázisban már gyorsabban megtanulták az új mintázatot, vagyis a neurális áramkörök adaptálódtak ahhoz, hogy a váratlan eseményeket gyorsabban ismerjék fel, és hamarabb adjanak pontos jóslatokat ezek megjelenése után is.
Ez a kutatás tehát immár biológiai agyak kapcsán erősíti meg azt, hogy valóban valamiféle prediktív kódolás vagy prediktív tanulás révén működik az észlelés.
És bár az említett eredmények közül egyes megfigyelésekre lehetnek alternatív magyarázatok, a kutatók szerint a prediktív feldolgozás az egyetlen, amely egységes keretrendszert kínál a teljes jelenség és általában az agy működésének megértéséhez.
Forrás: ipon.hu / quantamagazine.org