Защо машините няма да управляват света - Втора част

Георги Гърков Последна промяна на 13 февруари 2024 в 00:00 9184 0

От предпазване на пациентите до предвиждане на бедствия: изкуственият интелект надгражда ядрените технологии

Това описва процес, при който прости части се събират стъпка по стъпка в сложна форма: Започва с шест отделни звена. Три от тях се свързват, за да образуват звезда, а другите три образуват триъгълник. След това триъгълникът се прикрепя към звездата, образ

21/07/2025

Идват роботи, които изяждат други роботи, за да растат и ремонтират (видео)

За AI агентите и хлебарките

Както видяхме в "Възходът и провалът на "изкуствения интелект" - Първа част", ChatGPT, Midjourney, Google Bard или скромната дълбока невронна мрежа, която правя на компютъра си, не са съвсем AI. Но какво тогава е това?

За да имаме един приличен ИИ, трябва да имаме не само статистически модел, а преди всичко някакъв агент, действащ субект, който има някаква цел (или предпочитание за света), възползва се от различни математически и статистически модели на света, търси решения на проблеми в различни среди, използва някаква логика (напр. размита логика), обработва различни естествени езици… – и си взаимодейства със средата чрез сензори и ефектори (“сетива” и “крайници”). (https://people.engr.tamu.edu/guni/csce421/files/AI_Russell_Norvig.pdf)

На мен лично доста ми допада минималистичното определение на Родни Брукс за AI агент, тип “хлебарка”. Брукс дефинира AI агент като нещо, което “се движи насам-натам в променящите се среди, възприемайки обкръжаващия го контекст толкова добре, че да постигне необходимото равнище на живот и възпроизводство.”

Пример за груба схема на изкуствен агент, който е способен да следва цели и предпочитания

Според Ландгребе и Смит една често използвана в литературата за ИИ функция на полезността, е:

Като съответно тя изразява очакваната стойност от безкрайния сбор на различните “награди” r_n, които агентът π трупа в средата μ при всяка своя стъпка, която прави в условията на средата. По този начин функцията отдава по-голяма стойност на среди, които са по-сложни или изискват по-сложни поведения, отколкото такива, които се решават в няколко стъпки.

Проблемът с подобен тип масово използвани дефиниции обаче, както посочват двамата учени, е, че не се отчита интенционалният характер на възприятието; тоест, “насочеността” му. Такъв е случаят когато например някакъв хищник преследва плячката, минавайки през различни и променящи се среди. Нещо повече, елементарната логика, по която ИИ агентът получава наградите, няма нищо общо с последователността на “наградите” в сложните и променливи контексти, в които реалните хора (и хлебарки) се намират.

Въз основа на тази идея за полезност редица автори извеждат следното математическо определение за интелигентност.

Като това е просто сборът на различните полезности в рамките на множеството от средите на агента: C. K е функция за сложността на Колмогоров, която дава дължината на най-краткия алгоритъм, с който да се представят описанията на средите.

Тези подходи вършат навярно добра работа в редица ограничени аспекти, където има ясно понятие за “награда” или полезност, но и потенциално необятен брой данни за обучение – като видео игри, където трябва да изтрепеш най-бързо и ефикасно чудовищата на някакъв предварително фиксиран терен с ясни правила.

Но основният проблем на истинския свят е, че той не е видео игра, а е сложна система с непостоянно и странно поведение, включваща в себе си множество други сложни системи.

Големи и малки светове

Истинският свят действително позволява да бъде адекватно моделиран в някакви ограничени контексти, но процесите в него са фундаментално размити, информацията е оскъдна, зле поднесена или двусмислена. Ако следваме класическата рамка на Савидж и някои скорошни изследвания, критикуващи ограниченията на AI, хората и примитивните организми живеят в т.нар. “Голям свят”, докато алгоритмите населяват т.нар. “Малък свят”.

В действителност данните, с които даден алгоритъм се обучава, го провалят често пъти поради една много проста на пръв поглед причина. Хубавите данни и модели не са даденост, а резултат на творчески решения, обширни импровизации и много внимателно масажиране, без готови рецепти. Или както философът на науката Нанси Картрайт го нарича, artful modeling. Тук могат да възникнат всякакви ситуации. Но за да оценим това положение, можем да вземем за пример нещо, близко до самия мен и засега скромния ми познавателен опит. Не е кой знае колко силен пример (концепцията за големи и малки светове е доста по-нюансирана), но все пак показва как тълкувам лично за себе си критиките, отправени от горните учени…Това по-долу са данните от някакъв невронаучен експеримент, върху които се упражнявах онзи ден. Всеки участник минава през четири внимателно контролирани експериментални условия, като му се показват разни стимули и се мерят реакциите на мозъка му чрез електроди.

Топографска карта на мозъчната дейност на един човек в даден момент. Имената на отделните електроди са вписани върху нея. Синьото е относително по-отрицателен сигнал, червеното е положителен.

За да извлечем индивидуалната “закономерност”, която мозъкът на всеки участник показва, съответно усредняваме данните от различните опити и от различните електроди във времето.

Със сигурност всеки човек е отделна вселена и има собствени закономерности. Но дори леки промени в контекста му може драстично да изменят реакцията на мозъка му или да прецакат сериозно експеримента. Понякога дори всичко да бъде направено точно, самите моментни впечатления от средата и хората, които правят експеримента – или представите на участника за резултатите, които се очакват от други експерименти, може да променят осезаемо резултатите му.

На фона на това изключително крехко положение се събират все пак някакви данни, които обаче съдържат ефектите на неща като мигания, гримаси, въртене на очите, разсейване, движения на тялото, ефекти на околната среда върху измерването на електрическия сигнал и т.н.

Данните се преглеждат многократно, обсъждат се различни и понякога взаимно противоречащи си критерии. Пуска се например някакъв анализ на независимите компоненти, идентифицират се потенциални артефакти, които замърсяват сигнала, дефектни електроди, гледа се на око (с помощта на опитен невробиолог) и “лошите части” се “изрязват” или обработват по някакъв специфичен начин, но всичко това е с оглед на целите на експериментатора; за едни цели сигналът може да бъде много замърсен, за други компромисът да е приемлив.

В резултат на всички тези сложни съображения (и много повече) имаме някакви прилични, подредени данни, които да използваме накрая, за да обучим някакъв статистически модел; успели сме да “набутаме” нещо в малкия свят на алгоритмите и да му наложим някаква координатна система отгоре.

Тези добре дефинирани данни обаче не са даденост. И идеята тук е именно, че хората без проблем импровизират при някакви зле дефинирани проблеми – медитират върху тях и са готови да нарушат правилата си, за да намерят отговора (бел. авт. както Пол Файерабенд илюстрира богато в трудовете си върху епистемичния анархизъм в историята на науката, няма единен критерий за рационалност, наука или методология, работещи във всички случаи https://monoskop.org/images/7/7e/Feyerabend_Paul_Against_Method.pdf). За един самоподобряващ се AI агент обаче липсата на софистицирана чувствителност към контекстите при намирането на данните, с които да се ъпдейтне за състоянието на света, може да бъде фатална в дългосрочен план. Това, както и фактът, че огромното количество от данните за света са без етикети, обозначаващи изходните категории, на които те би следвало да отговарят; тоест, са във вида [ x_i, NA ].

Съответно данните [ x_i,… x_n ] на какви категории хора и обстоятелства съответстват [ cat_i,… cat_n ]. Вкарването на човек във веригата, разбира се, решава тези проблеми. Но това не е тогава някакъв ”автономен изкуствен интелект”, а поддържана с доста труд от група хора имитация. Без структурирани и добре обозначени данни, мечтата за появата на истински интелигентни и самоподобряващи се машини някой ден излита безславно през прозореца. Да, има алгоритми за semi-supervised machine learning, но те все още не решават фундаментално този проблем, а просто намаляват в някаква минимална степен усилията по слагането на етикети.

Отвъд това ако отидем на едно по-фундаментално равнище, възниква проблемът, че сложните системи, живи и неживи, са като цяло неергодични – което поставя предварителни ограничения пред възможността да се сдобием с представителни извадки за нашите модели в дългосрочен план. И макар и ергодичността да е доста по-заплетено понятие, накратко този проблем се свежда до това, че проследяването на отделните елементи от системата за достатъчно дълго време не е в състояние да ни разкрие достатъчно за “разпределението на възможностите” в системата като цяло (за скромна илюстрация на ергодичната теорема, виж бележката след края на статията).

Във великолепната си книга от 2023 г. “Why machines will never rule the world” Ландгребе и Смит обясняват доста подробно техническите проблеми, които създава липсата на ергодичност (и далеч, далеч не само това) пред разнообразните подходи за моделирането на сложните системи / проектирането на адекватни AI агенти. При все това с разочарование установявам, че нито едно издателство не я е превело все още на български, нито откъси от нея, нито някой въобще си е направил труда да я коментира по медиите ни.

Неизчислимост?

Безпорядъкът, присъстващ при събирането на данните, артефактите, инцидентите и грешките, със сигурност усложняват задачата да изградиш някакъв приличен модел на света. Но дори да пренебрегнем това, на едно метафизично равнище проблемът с моделирането на реалността става още по-сериозен, доколкото реалността има неизчислими аспекти. Както посочва теоретикът на сложните системи в биологията Йоханес Йегер, неизследваното (и донякъде псевдонаучно) допускане на много от съвременните AI учени е, че в основата си реалността може да бъде (не просто ограничено и практически полезно!, ами) изчерпателно “напъхана” в някакъв компютър – метафизична идея, известна като computationalism. В крайна форма (но не задължително) това води до хипотезата за симулацията – че всички живеем в някаква гигантска космическа симулация, пусната от някакъв мистериозен симулатор, скрит зад сенките.

Гръбнакът на компютационализма е идеята, че случващото се около нас може да бъде симулирано на универсална Тюринг машина (или някаква еквивалентна парадигма) – абстрактен модел, вдъхновил основите на днешните компютри, който обаче за разлика от тях има неограничена памет и скорост на обработката.

По-конкретно казано, във физиката има нещо, наречено предположение на Чърч-Тюринг-Дойч, което гласи, че всеки физически процес във Вселената е изчислим. Подобни радикални идеи обаче остават като цяло недоказани емпирично спекулации. Всъщност множество физически процеси включват най-малкото неизчислими реални числа и безкрайности.

Отвъд тези доста общи неясноти, пише Йегер, съществува конкретен контрапример за неизчислими физически процеси в рамките на хипотезата на Робърт Розен, че живите системи (и всички онези системи, които ги съдържат в себе си, като екологии и общества) не могат да бъдат обхванати напълно чрез алгоритмична симулация. Това теоретично прозрение, което се основава на клона на математиката, известен като теория на категориите, е формулирано за първи път в края на 50-те години на миналия век, описано подробно в книгата на Розен „Самият живот“ (1991 г.) и по-късно изведено математически от неговия ученик Алойзиус Луи в „Повече от самия живот“. Работата им остава широко пренебрегната, въпреки че твърденията им устояват на многобройните опити за опровержение.

Най-интересното от резултатите на Розен за алгоритмичната симулация на живите системи и импликациите им за AI е, че те възникват съвсем непреднамерено, като страничен ефект на неговата работа в математическата биология. Импликациите на неговите резултати за изграждането на изкуствени агенти бяха наскоро коментирани в някои статии, публикувани във Frontiers in Ecology and Evolution и ArXiv.

Всичко тече, всичко се променя

Разбира се, светът в действителност непрекъснато еволюира и елементите, които са в неговото фазово пространство, променят същността си, докато си взаимодействат помежду си. Хората натрупват опит, експериментират с времето и пространството, израстват и т.н. В резултат на това измежду променливите, които позволяват да опишем и проследим във времето състоянието на” човешката природа”, да изградим някаква ясна “картина” на аспектите й, някои изчезват, други се обединяват или заменят от нови. Тук отново ще се опитам да интерпретирам и илюстрирам тези прозрения според ограничения ми опит и онова, което съм видял с очите си.

Ако използваме теоремата на Такенс за фазовите пространства на динамичните системи, можем (с малко алгоритмично джу-джицу и предварителни тестове) да генерираме някаква несъвършена картина на “правилата” зад някаква динамична система – пространството от възможности, които системата следва във времето.

Ето как например мозъчните записи на двамата участници изглеждат, след като си поиграх малко в R.

Колкото и впечатляващи да са тези геометрични форми, не бива обаче да пренебрегваме, че те в действителност са плод на някакви стерилни експериментални условия и машинни метафори, които изолират човек от “вплетеността” му в околните контексти, тяхната размитост и богатство. Или онова, което критиците на машинния подход в когнитивната наука наричат “Embodied embedded cognition”. В действителност геометрията или измеренията на едно фазово пространство е вероятно да се изменят по разнообразни начини от контекст до контекст и от човек до човек.

С риск да нараня чувствата на креационистите и някои AI инженери с псевдонаучно отношение към билогията, правилата на живите същества се “променят” непрестанно и те не са нещо “отделено” от средата си, както е една машина.

Най-малкото, сравняването на мозъка с някаква машина, която просто се “задейства” при излагането на стимул, е фундаментално сбъркано. В отделните неврони се натрупват соматични мутации, огромното количество от атомите на тялото ни се сменят от ден на ден и от година на година с други, а начинът по който “се изразяват” гените в клетките ни се променя според цялостната среда на клетките и взаимодействията на продуктите им – които също са такива благодарение на свойствата в тази сложна и взаимно пораждаща се среда.

Така че докато ние можем да изведем някакво фазово пространство на даден аспект от човешката природа, съществува реалната опасност това да се окаже просто илюзорен и крехък артефакт на математическите методи, които сме в състояние да приложим, и експерименталната среда, която сме били в състояние да измислим. И да изчезне при едно бъдещо повторение на експерименталния контекст – или при “излизането” на човек навън, в сложността на реалния живот.

Разбира се, когато един човек (или хлебарка) действа, светът не остава константа, а се появяват нови цели, ситуации, възможности за взаимодействия и предназначения на обектите, които не са били мислими преди. Звучи като абстрактна философия, но не е.

По примера на Кауфман и колеги, оригиналното предназначение на отвертката е да се затягат винтове, но може да се използва също така за отваряне на кутии, арт инсталация, бъркане в носа, оръжие, част от някакво ново изобретение и т.н. – в зависимост от новите контексти, които възникват във всеки момент и после изчезват. В еволюцията една подобна идея се нарича екзаптация – когато структура, изпълняваща една “функция”, придобие съвсем друга роля в променящото се цяло на организмите и възможностите на средата им.

Тази фундаментална променливост и двусмисленост влиза в разрез с възможностите на днешните алгоритми (за кратък коментар върху еволюционните алгоритми виж втората бележка след края на статията).

Или както обобщават положението Ландгребе и Смит:

“Когато някакъв AI агент си взаимодейства с прости системи – например агент, създаден за целите на противоракетната отбрана – системата работи, като моделира движението на входящите ракети, които са прости системи, използващи законите на Нютон. Фазовото пространство на ракетите е фиксирано, поведението им е марковско, траекторията им е ергодична.

Когато обаче AI агентът е в движеща се самоуправляваща се кола – минаваща през задръстванията в центъра на Сан Франциско или през планинските проходи около езерото Тахо, тогава и в двете ситуации той може да се сблъска с променливи, които се изменят постоянно. Макар и за нетренираното око на нематематик колата просто да се движи в Евклидовото пространство с изминаването на времето, през погледа на инженера тя се изправя пред огромно фазово пространство, зависещо от различните субекти, пресичащи пътя й.

Защото и одушевените, и неодушевените системи имат често изменчиво и непостоянно поведение, нови измерения на фазовото пространство, които ги е нямало при обучението на колата, могат да се появят по всяко време. Като например ято птици, което прелита ниско над пътя, докато дете тича по него, за да хване топката си; или когато объркан пешеходец се препъне на пътя в гъста мъгла, която силно разсейва светлините на колата. Цялостната ситуация, пред която се изправя колата, се определя от сложна система, съставена от сложни системи, чието поведение е неергодично на всяко ниво” (Landgrebe & Smith, 2021, стр. 9).

В този смисъл, ако се замислим по-дълбоко, процесуалната (и неергодичната) природа на света е и проблем с фундаментални импликации за ограниченията на AI.

Заключение

Цялата тази абстрактна и разхвърляна дискусия (която нарочно не зачекна спора дали AI агентите въобще някога ще могат да станат съзнателни, подходящ за отделна статия) ни води до напълно очакваните провали, видими с просто око и ставащи все повече видими около нас. Проблемите, с които малко или много започнахме статията. Така че докато вероятно прилагането на разнообразни открития от областта на ИИ ще доведе до редица умерени подобрения в множество ограничени контексти, които са специално контролирани за целта (направени тенденциозно по-предсказуеми и прости за ограничените възможности на машините; изчистени от “хаоса”), а някои работни места ще се променят значително, засега нямаме повод да очакваме възхода на някакви свръхинтелигентни машини. Или дори средноинтелигентни роботизирани хлебарки. Не и без някакви радикални и фундаментални открития, които да разтресат основите на мейнстрийма на науката като цяло. При всички положения истински, свръхинтелигентен разум е доста по-вероятно и напълно реалистично да излезе от биологична лаборатория, отколкото от такава за интелигентни машини.

Това обаче далеч не означава, че съвременните AI изследвания са безобидни или че не крият фундаментални рискове за човечеството като цяло. Проблемът е именно в онова, което някои учени наричат закон на непреднамерените последствия – и опасността да заживеем в един свят на нискокачествено съдържание, още по-тежка дезинформация, грозно изкуство, неудовлетворяващо обслужване на клиенти, зловещи инциденти и ненадеждни системи като цяло.

Бележки и (леко по-технически) уточнения

Тук съм нахвърлял коментари с някои допълнителни уточнения и странични въпроси, които може да нямат особено пряко отношение към въпросите в статията, но дават по-голяма пълнота на идеите, изразени в нея. Уравненията, разбира се, не са задължителни за четене.

Чувствителност към изначалните условия и непредсказуемост

Не обсъждаме чувствителността на сложните системи към началните условия в статията, но си струва да се спомене като странична подробност, че дори детерминистични модели (на сложни системи), “напъхани” в компютъра, с няколко ясно определени променливи, могат да се окажат фундаментално непредсказуеми, а най-малката неточност при измерването да се увеличи значително с изминаването на времето. Тук можете да видите примерна илюстрация на странен атрактор на Лоренцова система, която генерирах в R. Според начина по който задаваме параметрите на диференциалните уравнения, които ръководят поведението на системата, се изменя и фазовото й пространство. За определени техни стойности съответно се появява хаосът, който виждаме на графиката, а при други той изчезва.

Фазовото пространство има три измерения: X, Y, Z, но на графиката се виждат само две и така се създава илюзорното впечатление, че траекториите на хаотичната система се пресичат помежду си. Освен това нейното поведение не се повтаря с абсолютна точност във времето. На графиката са изобразени две детерминистични траектории – синя и черна, с разлика в началните състояния: Δ =.001.

В противовес на тази опростена картина, при сложните системи, съставени от хора, го има проблема не само, че в дългосрочен план предсказанията се разпадат или че на първо време нямаме надежден набор от променливи, които да използваме да ги предскажем / обясним изчерпателно, но и че самият акт на изследването, описването или наблюдаването им ги изменя; тоест, че те реагират на научните описания и моделите, които им правим, за да ги разберем по-добре. Ако човек знае, че очакваш определено поведение от него при определени условия, ще вземе предвид тази тенденция в поведението си.

Или пък ако един модел на пазара работи много добре и хората започнат да експлоатират масово предсказанията му, той просто ще спре да работи по същия начин. Впрочем Бари Смит има хубава статия за т.нар. “Model-induced escape” в контекста на филтрите за спам, които се използват в имейлите – и надпреварата да се хванат отличителните белези на спама.

В по-общ план, идея за ефектите на моделите върху хората има общо с нещо, наречено looping effect – или “верижен ефект”. Създаването и измислянето на нови типове хора чрез научните класификации, в които напъхваме хората, за да ги разберем по-добре. Верижните ефекти са добре застъпени в историята на психиатрията и епидемиите от “временни психични разстройства”, които изчезват с промяната на обществените отношения, но повече за това друг път. Темата е доста обширна. https://press.princeton.edu/books/paperback/9780691059082/rewriting-the-soul

Еволюционни алгоритми

Разбира се, щом хората и животните непрестанно се променят и еволюират, някой може основателно да възрази, че съществуват най-малкото еволюционни алгоритми, които ни позволяват да обхванем променливия характер на сложните системи. Не мисля, че бих могъл да възразя.

По-сериозният проблем обаче, който възниква на свой ред тук, е, че обикновено алгоритмите, опитващи се да обхванат особеностите на някакви еволюционни процеси и променящи се аспекти, отново удрят по един по-софистициран начин тавана, доколкото се свеждат до предварително ограничен тип взаимодействия и набор от възможности. В книгата си “Защо машините никога няма да управляват света”, Ландгребе и Смит обсъждат например следния популярен в литературата за сложните системи еволюционен алгоритъм:

Като σ е векторът на фазовото пространство, σ_u е състоянието на елемента u от еволюционната система. F и G са активационни функции, а α е тип взаимодействие. Що се отнася до M, това е зависима от времето матрица на взаимодействията, която моделира начина, по който елементите от системата си взаимодействат.

Тези уравнения трябва да се параметризират експлицитно, вместо автоматично (както, от друга страна, става с дълбоките невронни мрежи). За съжаление обаче достъпните експериментално данни върху разни сложни системи обикновено не позволяват откриването на параметри, които да предсказват добре нещата в разнообразни контексти. И нещата стават по-неприятни, доколкото, разбира се, типовете възможни взаимодействия α са предварително заложени и ограничени в системата.

Ергодични процеси

Ергодичността е доста техническо понятие – и за запалените да разберат повече Станфордската енциклопедия на философията има доста подробна (и достъпно написана) статия върху него. Но да речем, че имаме стохастичния процес Yt – тоест, някаква последователност от случайни променливи Y = 1, 2, 3, 4…, за време t = 1, 2, 3, 4... Този процес е, грубо казано, ергодичен, доколкото всеки две колекции от случайни променливи, отдалечени в последователността, имат (почти) независими разпределения.

Ергодичната теорема ни позволява да използваме например средния резултат във времето на някакъв стационарен и ергодичен процес, за да доближим средния резултат за групата.

Т.е. усреднената във времето t=1 до t=T сума на Yt доближава средната стойност на групата от N последователности в даден момент, с увеличаването на T и N до безкрайност.

В противовес на това, като един интуитивен, доста ограничен пример за отсъствието на ергодичност, можем да се сетим за случайното блуждаене – при което с всяка следваща стъпка някакъв “пияница” е еднакво “склонен” да направи стъпка в едната посока или в другата посока.

Както се вижда от графиката, тази ситуация води до положение, при което средната стойност на групата пияници е като цяло нула, докато средните стойности на отделните пияници все повече се “разпръсват” с изминаването на времето.

Още по темата

09/02/2024
Технологии

Възходът и провалът на "изкуствения интелект" - Първа част

23/02/2023
Технологии

Изкуствен интелект открива месопотамски археологически обекти в сателитни снимки

22/02/2023
Технологии

Може ли изкуственият интелект да помогне за прогнозиране на времето?

21/02/2019
Технологии

Можем ли да се доверим на научни открития, направени с машинно самообучение?

Виж още за:
изкуствен интелект AI машинно самообучение machine learning AI агент ергодичност

Горещ мантиен балон под Апалачите се насочва към Ню Йорк. Образувал се е, когато Гренландия се е отделила от Северна Америка

30/07/2025