Facebookov AI lahko analizira meme, a jih lahko razume? Facebookova tehnologija Rosetta analizira milijarde slik, ki vsebujejo besedilo, vendar so memi preveč zapleteni za umetno inteligenco. Na družbene medije se vsak dan naloži milijarde besedil, fotografij in videoposnetkov. To je množica informacij, ki jih človeški moderatorji in njihovi preverjevalci dejstev ne morejo izčrpno presejati, nadzorovati in nadzorovati. Podjetja, kot sta Facebook in YouTube, se že dolgo zanašajo na umetno inteligenco, da preprečijo neželeno pošto, nasilje, kritično vsebino in pornografijo s svojih platform!
Nekaj, kot je sistemsko kritičen meme brez besedila, je lahko za njegove superračunalnike in njihove algoritme težko analizirati in obdelati, saj ta naloga zahteva izračun več različnih vizualnih elementov hkrati. Avtomatizirani sistemi, tako imenovani botski sistemi, morajo prepoznati in »prebrati« besede nad fotografijo ter analizirati in dodeliti samo sliko. Meme lahko opišemo tudi kot zapletene kulturne artefakte, ki jih je težko razumeti zunaj konteksta. Kljub izzivom, ki jih predstavljajo, vse večje družbene platforme že uporabljajo AI za nadzor memov, vključno s Facebookom, ki uporablja orodje, imenovano Rosetta, za analizo fotografij in videoposnetkov, ki vsebujejo besedilo in napise.
Po Facebooku se Rosetta že uporablja za samodejno zaznavanje vsebine, ki krši smernice sovražnega govora. S pomočjo Rosette si Facebook prizadeva nadzorovati uporabniško vsebino, vključno s fotografijami in videoposnetki, ne le besedilnih objav. Rosetta podpira postopek, v katerem se samodejno preveri, ali so bile slike in videi, ki vsebujejo besedilo, predhodno označeni kot "kritični". Rosetta združuje tehnologijo OCR (optično prepoznavanje znakov) z drugimi tehnikami strojnega učenja za ogled, obdelavo, razvrščanje in dodeljevanje besedila v in na fotografijah in videoposnetkih ter ga nato shrani. Prvič, OCR se uporablja za določitev, kje je besedilo v memu ali videu. To jim omogoča hitro preoblikovanje podatkov in uporabo svojih »izbirnikov« za ovrednotenje vsebine.
Ko Rosetta ve, kje so besede, Facebook uporabi nevronsko mrežo, ki lahko razume besedilo, njegov prepis in njegov pomen. To besedilo je nato mogoče prenesti skozi druge sisteme, na primer sistem, ki preveri, ali je meme virusno sporočilo, ki je bilo že razkrito v skladu z njihovimi smernicami. Razvijalci in raziskovalci Rosetta trdijo, da lahko orodje zdaj v realnem času izvleče besedilo iz katere koli slike, javno naložene na Facebook, in prepozna besedila ter "prebere" njihove jezikovne identifikatorje, vključno z angleščino, španščino, nemščino in arabščino.
Rosetta lahko analizira tudi slike, ki vsebujejo besedilo v številnih različnih oblikah, kot so fotografije protestnih napisov, meniji restavracij, izložbe trgovin in drugo. Viswanath Sivakumar, programski inženir pri Facebooku, ki dela na Rosetti, je v e-poštnem sporočilu dejal, da orodje dobro deluje tako za prepoznavanje besedila v pokrajini, kot je ulični znak, kot za meme – vendar je slednje bolj zahtevno. "V kontekstu proaktivnega odkrivanja sovražnega govora in druge vsebine, ki krši politike, slike v slogu memov predstavljajo bolj zapleten izziv AI," je zapisal.
Za razliko od ljudi mora AI običajno videti tudi več deset tisoč primerov, preden se lahko nauči dokončati zapleteno nalogo, pravi Sivakumar. Toda meme ni mogoče neskončno nadzorovati, niti za Facebook, zato se lahko izkaže za težavno zbiranje in shranjevanje dovolj primerov v različnih jezikih in čustvih. Iskanje visokokakovostnih sporočil je stalni izziv za širše raziskovanje umetne inteligence. Podatke je pogosto treba skrbno ročno označiti in arhivirati. Številne zbirke podatkov so zaščitene tudi z avtorskimi pravicami.
Da bi Rosetto napolnili s potrebnimi podatki in usposobili njeno uporabnost, se besedilo, skupaj z napisi in lokacijami, iz katerih so bili objavljeni, združijo v računalniški proces. Preprosto povedano, ustvarili ste program za ustvarjanje točno tistih primerov, katerih vsebina se zdi vprašljiva. To pomeni, da je celoten postopek do neke mere avtomatiziran: en program samodejno izpljune meme, drugi pa jih poskuša analizirati. Umetna inteligenca se bo soočila z zelo velikimi izzivi. Na primer, Rosetta se sooča z jeziki, kot je arabščina, ki se bere od desne proti levi, v nasprotju z drugimi jeziki, kot sta angleščina ali nemščina. Rosetta "bere" arabščino nazaj, nato pa Facebook obrne znake po obdelavi. Ta trik deluje presenetljivo dobro in omogoča enoten model, ki deluje tako za jezike od leve proti desni kot za jezike od desne proti levi.
Avtomatizirani sistemi so lahko izjemno uporabni za moderiranje vsebine in preverjanje dejstev, vendar niso vedno enostavni. WeChat na primer uporablja dva različna algoritma za filtriranje slik. Prvi, program, ki temelji na OCR, filtrira fotografije, ki vsebujejo besedilo o prepovedanih temah, drugi pa cenzurirajo slike, podobne tistim na črnem seznamu, ki ga je verjetno ustvarila kitajska vlada. S filtri WeChat lahko enostavno odstranite značilnosti slike, pa tudi barvo ali spremenjeno orientacijo. Facebookova Rossetta je zapletena, a verjetno ni popolna. Sistem je mogoče zaobiti s težko berljivim besedilom ali popačeno pisavo. Vsi algoritmi za prepoznavanje slik so prav tako še vedno potencialno ranljivi za nasprotujoče si primere, rahlo spremenjene slike, ki so ljudem videti enake, vendar povzročajo zmedo AI.
Facebook in druge platforme, kot so Twitter, YouTube in Reddit, so v več državah pod ogromnim pritiskom, da nadzorujejo nekatere vrste vsebine. Leta 2018 je Evropska unija predlagala nove zakone, ki bi od družbenih medijev zahtevali, da odstranijo teroristične objave v eni uri po obvestilu, sicer bi jim grozila denarna kazen. Rosetta in druga podobna avtomatizirana orodja že pomagajo Facebooku in drugim platformam pri izpolnjevanju podobnih zakonov v državah, kot je Nemčija. In postajajo boljši pri svojem delu: pred dvema letoma je izvršni direktor Mark Zuckerberg dejal, da Facebookovi sistemi umetne inteligence proaktivno prestrežejo le približno polovico vsebine, ki jo je podjetje odstranilo. Ljudje morajo najprej označiti ostalo. Po podatkih Facebooka njegova orodja AI zaznajo skoraj 100 odstotkov neželene pošte, ki jo obsojajo, pa tudi 99,5 odstotka teroristične vsebine in 86 odstotkov grafičnega nasilja. Druge platforme, kot je YouTube, so dosegle podoben uspeh z avtomatiziranimi sistemi za prepoznavanje vsebine.
Vendar to ne pomeni, da so sistemi AI, kot je Rosetta, popolna rešitev, zlasti ko gre za bolj niansirane oblike izražanja. Za razliko od menija v restavraciji je lahko težko analizirati pomen mema, ne da bi poznali kontekst, v katerem je bil objavljen. Zato obstajajo cele spletne strani, ki jih razlagajo. Memi pogosto vključujejo notranje šale ali so zelo specifični za določeno spletno subkulturo ter njeno moralno in etično ozadje. In umetna inteligenca še vedno ne more razumeti mema ali videa tako, kot bi ga človek. Zaenkrat se bo Facebook še vedno moral zanašati na človeške moderatorje in njihove preverjevalce dejstev, da bodo sprejemali odločitve o odstranitvi mema.
Prevod članka iz revije Wired 14.09.2018. september XNUMX
(Via Vale Rion)