• A mesterséges intelligencia legalább annyira mulatságos a képek magyarázó szövegeinek megalkotásakor, mint az ember…
  • Már mémszövegek írásából is lehet kreditet szerezni a diplomához – főként, ha mélytanulással ötvöződik az alkotói folyamat
  • Erről Lawrence Peirson bőven tudna mit mesélni…
Ténygyár-tartalom
5 percnyi olvasnivaló

Bár a 23 éves fiatalember, Lawrence Peirson elméleti asztrofizikából szándékozik doktorálni a Stanfordon, de úgy döntött, hogy idén jelentkezik néhány mesterséges intelligenciával foglalkozó kurzusra is. Évfolyamtársával, E. Meltem Tolunay-vel közösen meg is alkotott egy olyan neurális hálózatot, amely internetes mémekhez ír szöveget, ezt most a mélytanulás angol megfelelőjét (deep = mély, dark = sötét, de némi áthallással jelezheti az internet legmélyebb bugyrait is) alaposan elferdítve Dank Learning címmel jelentették meg egy fehér könyv formájában (a dank a magyarban is előforduló cool kifejezés szinonimája.)
Számos példa van már olyan mélytanulási modellek alkalmazására, amelyek irodalmi aláírásokat generálnak a képként megjelenő információkhoz – így születik például egy „szörfdeszkázó férfi” vagy egy „gyermek fagylalttölcsérrel” felirat. A mémek esetében Peirsonék számára az volt a különlegesen érdekes, hogy megtapasztalják: képes-e egy neurális hálózat elrugaszkodni a szó szerinti értelmezéstől, így hozva létre humoros feliratokat.
Bár kezdetben szkeptikusak voltak a mémek vicces voltát illetően, de később Peirson úgy találta, hogy a mélytanulási modell „meglehetősen érdekes és eredeti humorral készült” aláírásokat is eredményezett.

A mémek mélyén
Peirsonéknak többek között egy farkasszemet néző – mindenkinél tovább bírja! –, mémmé vált macska portréjához kellett megfelelő aláírásokat illeszteniük a mélytanulási hálózat révén. A modell felkészítéséhez szükséges gyűjteményt Peirson a memegenerator.net weboldalról szerezte be: 400 000, felhasználók által generált mémet. Ez az oldal mém-sablonokat készít, és lehetővé teszi a felhasználók számára saját feliratok létrehozását.
Az adatkészlet körülbelül 3000 kiindulási képet számlált, mindegyiket sok-sok különböző felirattal. Mivel a bemeneti adatok számos forrásból érkeztek, a mémszövegek változatos skáláját kellett feldolgozni a mélytanulási modellhez.
„Mind a 400 ezer darab mém persze nem lehet igazán vicces, de legalább képesek megtanítani a rendszernek, hogy milyen is a mém, és melyik vicc igazán releváns” – szögezte le Peirson.
Bizonyos mémek már évek óta keringenek az interneten, markáns nyomokat hagyva többek között a Reddit, a Facebook, a 9GAG és a Quick Meme oldalain. Közülük a legnépszerűbbekhez már több mint 2 millió egyedi felirat készült.
A mémek gyakran hivatkoznak a popkultúrára, valamilyen aktuális eseményre vagy a változatos internetes szubkultúra valamely ezoterikus szeletére. (Peirson mémoldalának címe: „Az európium fajlagos hőteljesítménye normál hőmérsékleten és nyomáson”.)
Ennek következményeképpen felszívják a digitális kultúra jó és rossz tulajdonságait egyaránt – ki is mutatható egyfajta torzulás a nyomdafestéket nem tűrő, a rasszista és szexista mémek irányába. Peirson tudja, hogy ezeket ki kell szűrni a jövőbeni munkáknál, de rámutat arra, hogy mindez nem csupán a mémek esetében, hanem a természetes nyelvű feldolgozásban általában is jelentkező probléma.
Messze nem tökéletes mindegyik mém, de…
A mélytanulási modell sikerének értékeléséhez a munkatársak kiszámították a zavarodottság pontszámát, amely azt ellenőrzi, hogy a neurális hálózat képes-e egyértelmű mintázatokat felismerni az adatokban. Ezt a mutatót kiszámították néhány száz, előre beállított formátumhoz, például a mindig az „Egyszerűen nem lehet…” fordulattal kezdődő Boromir-mémekhez.

Természetesen egy mém igazi próbája az, hogy vicces-e.
Egy minőségi felmérés során Peirsonék egymás mellett mutattak be emberek alkotta és a mélytanulási rendszer generálta mémeket. Két kérdést tettek fel: vajon a mémet ember vagy számítógép hozta-e létre, és milyennek értékelik a felmérésben részt vevők a mém humorát.
A visszajelzések azt mutatják, hogy a mélytanulási rendszerek generálta mémeket alig lehet megkülönböztetni az ember alkotta igaziaktól.
Azt is megvizsgálták, hogy a neurális hálózat képes-e aláírással ellátni olyan képeket, amelyek nem szerepeltek a fejlesztési sablonok között. Ezekben az esetekben az algoritmus kikövetkezteti az ismeretlen kép mintáit. Peirson még a saját képmását is megmutatta a mélytanulási rendszernek – szórakoztató eredmények születtek.
A mémek gyakran úgy terjednek, mint a vírusok, és a jelek szerint ugyanígy hódítanak a témául a mémeket választó dokumentumok is. Peirsonékat alaposan meglepte ugyan a média fokozott érdeklődése a projektjük iránt, de már el is készítették a szintén a Dank Learning címet viselő kiegészítő mobilalkalmazást, amely hamarosan elérhető lesz az App Store-ban.

Ez a cikk is érdekelhet

Negyven éve először
nem nőtt a demokráciák
száma a világon

Választás szabadság nélkül: ez lett Magyarországból A Göteborgi Egyetem 3000 szakértő segí…