Миналия месец разработчиците от OpenAI обявиха, че са създали алгоритъм за генериране на текст, наречен GPT-2, който според тях е твърде опасен за пускане свободно, тъй като може да се използва за замърсяване на мрежата с безкрайни, написани от бот, материали.
Но сега екип от учени от лабораторията MIT-IBM Watson AI и Харвардския университет изградиха алгоритъм, наречен GLTR, който определя колко е вероятно всеки отделен текст да е написан от инструмент като GPT-2 - интригуваща ескалация в битката срещу спама, съобщава Futurism.
Битката
Когато OpenAI представи GPT-2, те показаха как може да се използва за писане на измислени, но все пак убедителни новинарски статии, споделяйки една, написана от алгоритъма за учени, открили еднорози.
GLTR използва точно същите модели, за да прочете окончателния резултат и да определи дали е написан от човек или GPT-2. Точно както GPT-2 пише изречения, като предвижда кои думи трябва да следват, GLTR определя дали изречението използва думата, която фалшификаторът бот за писане на новини би избрал.
„Ние правим предположението, че компютърно генерираният текст заблуждава хората, като се придържа към най-вероятните думи на всяка позиция, трик, който може да накара хората да му повярват”, пишат учените, създали GLTR в блога си. „Обратното, в естествения текст всъщност по-често се избират непредсказуеми думи, които имат смисъл в контекста. Това означава, че можем да открием дали текстът изглежда вероятно да е написан от човек! "
Учените от IBM, MIT и Harvard, които стоят зад проекта, създадоха уебсайт, който позволява на хората да тестват GLTR за себе си. Инструментът подчертава думите в различни цветове на базата на вероятността те да са написани от алгоритъм като GPT-2 - зеленото означава, че изречението съответства на GPT-2, а нюансите на жълто, червено и особено лилаво показват, че вероятно е написано от човек.
Текстът за еднорозите: Можем да видим, че в текста няма нито една пурпурна дума и само няколко червени думи. Повечето думи са зелени или жълти, което е силен индикатор, че това е генериран текст.
И още един текст, този път написан беспорно от човек.
Изследователят на изкуствения интелект Дженал Шейн (Janelle Shane) обаче установи, че GLTR не се справя добре с алгоритми, генерирани от текст, различни от GPT-2 на OpenAI.
Тествайки го на собствения си текстов генератор, Шейн откри, че GLTR неправилно е определил, че полученият текст е толкова непредсказуем, че би трябвало да го е написал човек, което предполага, че ще ни трябва нещо повече от този единствен инструмент в продължаващата борба срещу дезинформацията и фалшивите новини.
Коментари
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!
Няма коментари към тази новина !
Последни коментари