Megrökönyödtél azokon a programokon, amik felismernek a fotókon?

Most már azt is tudják, hogy mit csinálsz.

A Google által fejlesztett Deep Dream felrobbantotta múlthéten az internetet. Tudjátok, azok a képek, amiken kutyafeje van az embereknek, lófeje a kutyáknak, házak nőnek ki a hegyekből, és mindezt úgy, mintha közben slaggal locsolnák az LSD-t az ember szemébe.

Hogy csinálták? Mágia?Nem, egyszerűen csak fogtak egy képet, feltöltötték a rendszerbe, majd arra kérték a Deep Dreamet, hogy ismerjen fel egy rajta szereplő motívumot (például az állatokat), és módosítsa úgy a képet, hogy az adott motívum ki legyen hangsúlyozva. Majd az így kapott képet megint feltöltötték, és újra meg újra eljátszották ezt. (Daily Mail)

A Google ezzel sikeresen szimulálta a képzelet működését egy mesterséges hálózaton. Most viszont valami sokkal durvább dolog történt AI területen.

A Stanford Egyetem kifejlesztette a NeuralTalkot, ami nem csak tárgyakat ismer fel, hanem le is írja, mi történik az adott képen.

és tényleg ez történik!

Akár csak a Deep Dream, ez is egy úgynevezett neural network, tehát egy olyan rendszer, ami tanítható, és amit egyszer megtanult, azt ha a későbbiekben "látja" felismeri és meg is érti.

Még van egy kis időnk, mivel nem teljesen tökéletes, sok mindent pontatlanul ír le, például az „egy boldog pár a kertben egy születésnapi tortával” képet  „egy zöld pólós férfi egy elefánt mellett áll”-ként értelmezi, bár ezek általában a másodlagos találgatásai.

A NeuralTalk azért jó, mert a vizuális információ felcímkézését idáig emberek végezték, ami persze megbízhatóbb – mondhatnák a Terminátoron felnőtt aggódók –, de ami emberi munkaerővel két heti munka, az a Google Brainnek például egy óra volt.

Mostantól nem a mi, hanem a mit csinál a fontos.

Gondoljunk bele, hogy több tízezer fotó és videó közt kereshetünk úgy, hogy elég csak beírni egy attribútumot, például azt a jelenetet keresem a Sátántangóból, amikor elszáll egy madár a két sétáló feje fölött, vagy a kétszáz ugyanolyan horvátországi nyaralás képei közül azt szeretném kikutatni, amin elúszik egy hajó a távolban.

A neural networknek pedig tagadhatatlanul szerepe lesz a jövőben: az idei CES-en, az Nvidia például bejelentette a Drive PX nevű, autós szuperszámítógép rendszerét, egy olyan technológiát, ami képes útközben automatikusan felismerni a veszélyforrásokat, például gyalogosokat, táblákat, baleseteket, vagy más objektumokat.

Vagy éppen öntudatra ébredve fogja az emberiséget leigázni?

via The Verge

ReklámKlub Impresszum Médiaajánlat