Лесно се познава къде е направена снимката, ако се вижда Айфеловата кула, например. Разработчиците на Google са създали невронна мрежа, която може да установи мястото, където е направена едва ли не всяка фотография.
Това може да стане дори по снимка в стая, по чиния в ресторант, по посоката на уличното движение, по настилката на улицата, по архитектурата на сградите и всички тези фактори заедно.
Екипът изследователи от Google и Рейнско-Вестфалския технически университет в Аахен (RWTH Aachen University) е създал програмата PlaNet, която по снимка (каквато и да е, дори на храна или домашен любимец) определя в коя точка на земното кълбо е направена снимката. Новият алгоритъм се основава на обучението на изкуствени невронни мрежи и се различава от предшествениците си с това, че не разчита само на някакви известни забележителности, а използва пълния наличен набор от детайли, например, ландшафт, цветове, архитектурни особености, характерни животни и растения.
Препринт е публикуван в arXiv.org.
Използвана е база от 126 милиона снимки от интернет, заедно с техната геолокация (EXIF-данни). 91 милиона снимки са били използвани за обучение на невронната мрежа, а останалите 34 милиона - за оценка на нейната работа.
Авторите след това разделят земната повърхност на квадрати, така че всеки един от тях да имал повече от 10 000 фотографии, разпределени в 26 000 зони с различна големина в зависимост от броя на снимките, направени в рамките на определен район. Големите градове имат повече клетки, защото са направени повече снимки, докато в селските райони клетките са по-големи. Площите на моретата, океаните и полярните области (с по-малко от 50 снимки), не са включени.
За да се провери ефективността на невронната мрежа, са използвани 2,3 милиона геотаргетирани снимки от Flickr. 3,6% от изображенията PlaNet е познала до улица, 10% - с точност до град, 28.4% - до държава и 48% - континента.
Този резултат е сравнен с възможностите на дузина пътешественици с помощта на играта GeoGuessr.com, в която трябва да се познае място по Google Street View. PlaNet бие хората със среден резултат на грешка от 1131.7 км. Хората грешали средно с 2320.75 км.
Според един от основните изследователи Тобиас Уейанд (Tobias Weyand) предимството на машината е, че невронната мрежа "вижда" много повече, отколкото който и да е жив човек, пътувал цял живот по света.
Разработчиците са отишли по-далеч и работят с фотографии, направени в помещения. Местоположението им се разпознава в случаите, когато снимката е част от албум - програмата разглежда целия албум и търси специфични ображения, направени на едно и също място.
Самата невронна мрежа е само 377 MB.
Коментари
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!
1
10.04 2016 в 20:32
Абе, авторът прочете ли си статията след написването? Според текста излиза, че в повече от половината пъти мрежата не познава дори континента. Това е резултат като за ези-тура, а не нещо което определяме с "едва ли не всяка фотография".
Познаването на държавата е дори в по-малко от 1/3 от случаите.
А това за чинията в ресторант пък е още по-голяма глупост. Очевидно програмата приема, че ако познае определен брой снимки в албума, то целият албум е сниман на едно и също място. Това не е "познаване".
Текстът ви е като от любителски блог, но заглавието е още по-зле - като от жълт вестник.
Последни коментари