Интернет е пълен с анонимни акаунти, тъй като потребителите приемат псевдоними, понякога по незлонамерени причини, като например, за да говорят свободно, а друг път - по злонамерени причини или са просто "тролове". Но тази ера на онлайн поверителност може би е към своя край.
В проучване, достъпно на сървъра за препринти arXiv, изследователи демонстрират, че големите езикови модели (LLM) могат да идентифицират хората зад тези акаунти в голям мащаб.
Години наред се смяташе, че ако деанонимизацията е теоретично възможна, но би била твърде времеемка, трудна и скъпа за изпълнение. Но авторите на изследването са уверени, че LLM-тата са станали достатъчно мощни, за да разбият онлайн анонимността.
За да проверят дали това е така, екипът е разработил автоматизирана рамка, която да възпроизвежда процеса на вземане на решения от човешки следовател.
Намиране на анонимни потребители
Първо, изкуственият интелект преглежда историята на публикациите на потребителя в Reddit или Hacker News, като изследва неструктуриран текст. Това е сурова, неорганизирана информация като коментари, шеги, обучение и фини особености в писането. След това той превръща тези микроданни в математическо представяне на профила на човека, за да намери съвпадения на кандидати в милиони други профили в отворената мрежа или на отделни сайтове като LinkedIn.
Преглед на изследователската рамка за мащабна деанонимизация. Като се имат предвид неструктурирани потребителски публикации, авторите (1) извличат характеристики, свързани с идентичността, използвайки LLM, (2) търсят съвпадения на кандидати чрез семантични вграждания; (3) избират най-добрите кандидати чрез LLM и (4) дават оценка на доверието, за да калибрират прага на решение. Кредит: arXiv (2026). DOI: 10.48550/arxiv.2602.16800
Когато изкуственият интелект открива възможни съвпадения, той преценява доказателствата, че и двата профила принадлежат на едно и също лице. След това присвоява оценка за достоверност на предвиденото съвпадение. Ако LLM не е сигурен, не записва нищо. Това помага да се гарантира, че не прави необмислени предположения.
Изследователите тестват своята рамка върху близо 1000 профила в LinkedIn, за да видят дали може да ги съпостави с акаунти в Hacker News. Това са профили, при които реалната идентичност е известна на екипа, който премахва имена, връзки и други очевидни идентификатори от биографиите.
Успешни разкрития
Рамката, задвижвана от изкуствен интелект, успешно свързва акаунти с точност до 67% при 90% прецизност, докато най-добрите методи без изкуствен интелект са далеч от този успех.
Системата успява да съпостави и хора в различни Reddit общности, дори ако тези потребители разпределят дейностите си в различни акаунти и периоди от време.
Изследователите също така установяват, че идентификацията на потребителите е евтина, струвайки само от 1 до 4 долара изчислителна мощност за успешно свързан акаунт.
"Практическата неизвестност, която дълго време е защитавала псевдонимните потребители... вече не е валидна", пишат изследователите в своята статия.
"Псевдонимността не осигурява смислена защита онлайн. Потребителите, които публикуват с постоянни потребителски имена, трябва да приемат, че противниците им могат да свържат акаунтите им с реални самоличности или помежду си и че вероятността нараства с всяка публикувана от тях единица микроданни."
Резултатите показват, че ако бъде допълнително развита, тази система би могла да намери приложения в множество области, като например правоприлагането и киберсигурността.
Справка: Simon Lermen et al, Large-scale online deanonymization with LLMs, arXiv (2026). DOI: 10.48550/arxiv.2602.16800
Източник: How AI could end online anonymity, Paul Arnold, Phys.org



















Коментари
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!
Няма коментари към тази новина !
Последни коментари
Прост Човек
Колко бързо става квантовото вплитане? Учени го изследват в атосекунден мащаб
Прост Човек
Последната теорема на Стивън Хокинг преобръща времето и причинността
Прост Човек
Разрязването на фотон на две създава безкраен рояк от частици
zlatkov
Учени сканират 74 милиона радиосигнала от междузвезден обект за признаци на извънземни технологии