Istraživanje umjetne inteligencije je vatra u kontejneru, a Google drži šibice


Svijet istraživanja umjetne inteligencije je u ruševinama. Od akademika koji daju prednost shemama koje se lako unovčavaju u odnosu na probijanje novih temelja, do elite iz Silicijeve doline koja koristi prijetnju gubitka posla kako bi potaknula hipoteze prilagođene korporacijama, sustav je razbijena zbrka.

A Google zaslužuje lavovski dio krivnje.

Kako je počelo

Bilo ih je oko 85.000 znanstvenih radova objavljeno na globalnoj razini na temu AI/ML-a 2000. godine. Premotajte naprijed do 2021. i bilo ih je gotovo dvostruko više objavljenih samo u SAD-u.

Reći da je došlo do eksplozije na terenu bilo bi veliko podcjenjivanje. Ovaj priljev istraživača i novih ideja doveo je do toga da duboko učenje postane jedna od najvažnijih svjetskih tehnologija.

Između 2014. i 2021. velika tehnologija gotovo je napustila svoja načela “prvo web” i “najprije mobilni” kako bi usvojila strategije “najprije AI”.

Sada, 2022., AI programeri i istraživači su traženiji (i imaju veću plaću) nego gotovo bilo koji drugi poslovi u tehnici izvan C-suite.

Ali ova vrsta nesputanog rasta ima i mračnu stranu. U borbi za zadovoljavanje tržišne potražnje za proizvodima i uslugama temeljenim na dubokom učenju, ovo područje postalo je jednako tvrdoglavo i nestalno kao profesionalni sport.

U posljednjih nekoliko godina vidjeli smo “GAN otac”, Ian Goodfellow, skok brodom s Googlea na Apple, Timnit Gebru i drugi dobivaju otkaz od Googlea za različita mišljenja o učinkovitosti istraživanja i virtualnu bujicu sumnjivih AI radova uspjeli su nekako razjasniti recenziju.

Poplava talenata koja je stigla nakon eksplozije dubokog učenja također je donijela klizište loših istraživanja, prijevare i korporativne pohlepe.

Kako ide

Google, više od bilo koje druge tvrtke, snosi odgovornost za modernu AI paradigmu. To znači da moramo dati veliki G pune ocjene za donošenje obrade prirodnog jezika i prepoznavanja slika u mase.

To također znači da Googleu možemo pripisati zasluge za stvaranje okruženja istraživač-jedu-istraživača u kojem neki studenti i njihovi profesori s velikim tehnološkim partnerima tretiraju istraživačke radove kao nešto više od mamca za poduzetničke kapitaliste i korporativne lovce na glave.

Na vrhu, Google je pokazao svoju spremnost da zaposli najtalentiranije istraživače na svijetu. A također je više puta pokazano da će ih u tren opaliti ako se ne pridržavaju linije tvrtke.

Tvrtka je dospjela na naslovnice diljem svijeta nakon što je u prosincu 2020. otpustila Timnita Gebrua, istraživača kojeg je unajmila da vodi svoj odjel za etiku umjetne inteligencije. Samo nekoliko mjeseci kasnije otpustila je još jednog člana tima, Margaret Mitchell.

Google tvrdi da rad istraživača nije bio u skladu sa specifikacijama, ali i žene i brojne pristaše tvrde da je do otpuštanja došlo tek nakon što su iznijeli etičku zabrinutost zbog istraživanja koje je potpisao šef AI tvrtke Jeff Dean.

Sada je prošlo jedva više od godinu dana i povijest se ponavlja. Google otpustio još jednog svjetski poznatog istraživača umjetne inteligencijeSatrajit Chatterjee, nakon što je predvodio tim znanstvenika u izazivanju drugog rada koji je Dean potpisao.

Učinak klizišta

Na vrhu, to znači da je konkurencija za visoko plaćene poslove žestoka. A potraga za sljedećim talentiranim istraživačem ili programerom počinje ranije nego ikad.

Od studenata koji rade na naprednim stupnjevima u područjima strojnog učenja i umjetne inteligencije, a koji na kraju požele raditi izvan akademskih krugova, očekuje se da autor ili koautor istraživačkih radova koji pokazuju njihov talent.

Nažalost, cijev od akademske zajednice do velike tehnologije ili startup svijeta pod vodstvom VC-a prepun je bezveznih radova koje su napisali studenti čija je sva volja pisati algoritme koji se mogu unovčiti.

Brza pretraga Google Scholar-a za “obradu prirodnog jezika”, na primjer, pokazuje gotovo milijun pogodaka. Mnogi od navedenih radova imaju stotine ili tisuće citata.

Na površini, to bi ukazivalo na to da je NLP uspješan podskup istraživanja strojnog učenja koji je privukao pozornost istraživača širom svijeta.

Zapravo, pretraživanja za “umjetnu neuronsku mrežu”, “računalnu viziju” i “učenje s pojačanjem” dovela su do sličnih rezultata.

Nažalost, značajan dio istraživanja AI i ML-a je ili namjerno lažan ili pun loše znanosti.

Ono što je možda dobro funkcioniralo u prošlosti brzo postaje potencijalno zastarjeli način komuniciranja istraživanja.

Stuart Richie iz Guardiana nedavno je napisao članak pitajući se trebamo li uopće ukinuti istraživačke radove. Prema njima, problemi znanosti su zapečeni prilično duboko:

Ovaj sustav dolazi s velikim problemima. Glavni među njima je pitanje pristranosti objavljivanja: recenzenti i urednici će vjerojatnije dobro napisati znanstveni rad i objaviti ga u svom časopisu ako izvještava o pozitivnim ili uzbudljivim rezultatima. Stoga se znanstvenici jako trude potaknuti svoje studije, osloniti se na svoje analize kako bi proizveli “bolje” rezultate, a ponekad čak i počine prijevaru kako bi impresionirali te vrlo važne vratare. To drastično iskrivljuje naš pogled na ono što se stvarno dogodilo.

Problem je u tome što vratari koje svi pokušavaju impresionirati obično drže ključeve budućeg zaposlenja studenata i primanja akademika u prestižne časopise ili konferencije – istraživači možda neće uspjeti dobiti njihovo odobrenje na vlastitu odgovornost.

Čak i ako neki rad uspije proći kroz recenziju, nema jamstva da ljudi koji provlače stvari ne spavaju na prekidaču.

Zato je Guillaume Cabanac, izvanredni profesor računalnih znanosti na Sveučilištu u Toulouseu, osmislio projekt pod nazivom Problematično prosijavanje papira (PPS).

PPS koristi automatizaciju za označavanje papira koji sadrže potencijalno problematičan kod, matematiku ili glagole. U duhu znanosti i poštenja, Cabanac osigurava da svaki rad koji je označen zastavicom dobije ručnu recenziju od ljudi. Ali posao je vjerojatno prevelik da bi ga šačica ljudi mogla raditi u svoje slobodno vrijeme.

Prema a izvješće iz Spectrum Newsa, postoji mnogo problematičnih novina. A većina ima veze s strojnim učenjem i umjetnom inteligencijom:

Probirač je smatrao da je oko 7650 studija problematično, uključujući više od 6000 zbog izmučenih fraza. Čini se da većina radova koji sadrže izmučene fraze potječu iz područja strojnog učenja, umjetna inteligencija i inženjering.

Mučene fraze su izrazi koji podižu crvenu zastavu istraživačima jer pokušavaju opisati proces ili koncept koji je već dobro uhodan.

Na primjer, uporaba izraza kao što su “krivotvoreni neural” ili “man-made neural” mogla bi ukazivati ​​na upotrebu dodatka za tezaurus koji koriste loši akteri koji se pokušavaju izvući s plagiranjem prethodnog rada.

Rješenje

Iako se Google ne može kriviti za sve što je neugodno na području strojnog učenja i umjetne inteligencije, on je odigrao veliku ulogu u prenošenju recenziranih istraživanja.

To ne znači da Google također ne podržava i ne podupire znanstvenu zajednicu putem otvorenog koda, financijske pomoći i istraživačke potpore. I sigurno ne pokušavamo implicirati da svi koji proučavaju umjetnu inteligenciju samo žele brzo zaraditi.

No, sustav je postavljen tako da prvo potakne unovčavanje algoritama, a zatim da unaprijedi polje. Kako bi se to promijenilo, velika tehnologija i akademska zajednica moraju se posvetiti općoj reformi u načinu na koji se istraživanja prezentiraju i pregledavaju.

Trenutačno ne postoji općepriznato tijelo treće strane za provjeru dokumenata. Sustav stručnog ocjenjivanja više je nalik kodeksu časti nego skupu dogovorenih načela koje slijede institucije.

Međutim, postoji prednost za uspostavu i djelovanje nadzornog odbora s dometom, utjecajem i stručnošću za upravljanje izvan akademskih granica: NCAA.

Ako uspijemo ujediniti sustav poštenog natjecanja za tisuće amaterskih atletskih programa, sigurna je oklada da bismo mogli formirati upravljačko tijelo koje će uspostaviti smjernice za akademsko istraživanje i reviziju.

Što se tiče Googlea, šanse su veće od nule da će izvršni direktor Sundar Pichai ponovno biti pozvan pred kongres ako tvrtka nastavi otpuštati istraživače koje unajmljuje da nadgledaju svoje etičke programe umjetne inteligencije.

Američki kapitalizam znači da je tvrtka obično slobodna zapošljavati i otpuštati koga god želi, ali dioničari i radnici također imaju prava.

Naposljetku, Google će se morati posvetiti etičkom istraživanju ili se neće moći natjecati s tvrtkama i organizacijama koje to žele.