Програма пише политически речи

Компютър генерира сам политически текстове

Наука ОFFNews Последна промяна на 22 януари 2016 в 09:16 2737 0

Вероятно сте забелязали, че изказванията на политиците, независимо от коя партия са, си приличат - стандартни са им тезите и стандартно са формулирани. Като че ли са писани по един алгоритъм.

Валентин Касарниг (Valentin Kassarnig) от Масачузетския технологичен институт (MIT) публикува програма, която прави точно това: генерира политически речи, удивително подобни на истински, съобщава сайтът на MIT.

Повече за генератора на политическите текстове авторът обяснява в научна статия в arxiv.org.

В разработката на генератора Касарниг използва база от близо 4000 фрагменти от политически дебати в Конгреса на САЩ. Базата данни включва повече от 50 000 изречения, всяко със средно 23 думи. Касарниг класифицира всяка реч според политическата партия (републиканци/демократи), както и дали подкрепя или не обекта на обсъжданията.

Разбира се, най-важно е как ще се анализира тази база данни. Авторът опитва различни варианти, но в крайна сметка се спира на N-грамите

N-грама е последователност от n елементаи. В този случай е последователност от думи и фрази.

Касарниг първо анализира текста, използвайки подхода "части на речта" (parts-of-speech), който маркира всяка дума или фраза с неговата граматическа роля (съществително, глагол, прилагателно и т.н.). След това използва следния алгоритъм: в базата данни се търсят всички 6-грами и се изчислява вероятността да се появят определени думи или фрази, в зависимост от това кои пет са пред тях. "Това ни даде възможност бързо да определим всички думи, които могат да се появят след петте известни предходни думи, и каква е вероятността от появата на всяка една от тях" - обяснява Касарниг.

Процесът на генериране на текст следва от този алгоритъм. В програмата се въвеждат политическа ориентация: републиканец или демократ. След това алгоритъмът проучва базата данни за 6-грами за тази категория, за да намери целия набор от 5-грами, които могат да се използват за начало на такива изказвания. След това на случаен принцип се избира една от тези 5-грами, изчислява се най-вероятната дума, завършваща 6-грамата. А след това тя започва да предсказва дума след дума до края на текста.

Има няколко тънкости, например, програмата определя вероятността да се спомене определена тема и какви съпътстващи теми е вероятно да се появят заедно с нея.

Ето един пример:

Mr. Speaker, for years, honest but unfortunate consumers have had the ability to plead their case to come under bankruptcy protection and have their reasonable and valid debts discharged. The way the system is supposed to work, the bankruptcy court evaluates various factors including income, assets and debt to determine what debts can be paid and how consumers can get back on their feet. Stand up for growth and opportunity. Pass this legislation.

Резултатите са изненадващо добри. Така че англоезичните политици имат в ръцете си на инструмент за бързо генериране на речи, ако трябва внезапно да се появят пред публика и нямат какво да кажат.

Програмата може да генерира други текстове - например коментари под статии. 

Най-важното
Всички новини
За писането на коментар е необходима регистрация.
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!

Няма коментари към тази новина !