
Лесно се познава къде е направена снимката, ако се вижда Айфеловата кула, например. Разработчиците на Google са създали невронна мрежа, която може да установи мястото, където е направена едва ли не всяка фотография.
Това може да стане дори по снимка в стая, по чиния в ресторант, по посоката на уличното движение, по настилката на улицата, по архитектурата на сградите и всички тези фактори заедно.
Екипът изследователи от Google и Рейнско-Вестфалския технически университет в Аахен (RWTH Aachen University) е създал програмата PlaNet, която по снимка (каквато и да е, дори на храна или домашен любимец) определя в коя точка на земното кълбо е направена снимката. Новият алгоритъм се основава на обучението на изкуствени невронни мрежи и се различава от предшествениците си с това, че не разчита само на някакви известни забележителности, а използва пълния наличен набор от детайли, например, ландшафт, цветове, архитектурни особености, характерни животни и растения.
Препринт е публикуван в arXiv.org.
Използвана е база от 126 милиона снимки от интернет, заедно с техната геолокация (EXIF-данни). 91 милиона снимки са били използвани за обучение на невронната мрежа, а останалите 34 милиона - за оценка на нейната работа.
Авторите след това разделят земната повърхност на квадрати, така че всеки един от тях да имал повече от 10 000 фотографии, разпределени в 26 000 зони с различна големина в зависимост от броя на снимките, направени в рамките на определен район. Големите градове имат повече клетки, защото са направени повече снимки, докато в селските райони клетките са по-големи. Площите на моретата, океаните и полярните области (с по-малко от 50 снимки), не са включени.
За да се провери ефективността на невронната мрежа, са използвани 2,3 милиона геотаргетирани снимки от Flickr. 3,6% от изображенията PlaNet е познала до улица, 10% - с точност до град, 28.4% - до държава и 48% - континента.
Този резултат е сравнен с възможностите на дузина пътешественици с помощта на играта GeoGuessr.com, в която трябва да се познае място по Google Street View. PlaNet бие хората със среден резултат на грешка от 1131.7 км. Хората грешали средно с 2320.75 км.
Според един от основните изследователи Тобиас Уейанд (Tobias Weyand) предимството на машината е, че невронната мрежа "вижда" много повече, отколкото който и да е жив човек, пътувал цял живот по света.
Разработчиците са отишли по-далеч и работят с фотографии, направени в помещения. Местоположението им се разпознава в случаите, когато снимката е част от албум - програмата разглежда целия албум и търси специфични ображения, направени на едно и също място.
Самата невронна мрежа е само 377 MB.
Коментари
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!
1
10.04 2016 в 20:32
Абе, авторът прочете ли си статията след написването? Според текста излиза, че в повече от половината пъти мрежата не познава дори континента. Това е резултат като за ези-тура, а не нещо което определяме с "едва ли не всяка фотография".
Познаването на държавата е дори в по-малко от 1/3 от случаите.
А това за чинията в ресторант пък е още по-голяма глупост. Очевидно програмата приема, че ако познае определен брой снимки в албума, то целият албум е сниман на едно и също място. Това не е "познаване".
Текстът ви е като от любителски блог, но заглавието е още по-зле - като от жълт вестник.
Последни коментари
dolivo
Учените, работещи за връщането на вълнестия мамут, създават вълнести мишки
dolivo
Обществото умее да разпознава фалшиви новини, но е скептично към верните новини, показва метаанализ
dolivo
Прогноза за развитие на технологиите до 2099 от Рей Курцвейл
dolivo
Може ли удар от малка черна дупка да убие човек?
Kahles
Учен от НАСА създава двигател, работещ без гориво, което противоречи на законите на физиката