Математическо изследване на учени от Политехниката в Лозана показва каква е връзката между героите, съотношението на представителите на различни раси на героите на сагата "Междузвездни войни", съобщава в своя блог един от изследователите, Кирел Бенци (Kirell Benzi).
Използвайки базата данни от Wookieepedia, енциклопедията на "Междузвездни войни", комбинирали данните за героите в *граф, с помощта на написана от тях специална уеб-скрейпър (Web scraping) програма, която прави разбор на персонажите и установява връзката между тях. Персонажите се считат за свързани, ако името на един от тях се споменаха на една и съща страница с името на другите.
*Графът е математически обект, който се състои от върхове (възли), свързани с дъги (ребра) и се използва за решаването на редица интересни задачи от практиката.
Програмата е анализирала около 20 000 персонажа като е установила връзките между тях, съотношението на количеството раси и дори и епохите, в които живеят героите.
Най-много връзки с други герои имат Анакин Скайуокър, Палпатин и Люк Скайуокър.
Източник: Kirell Benzi / kirellbenzi.com
Общо действието на сагата, според изчисленията, обхваща повече от 36 хиляди години. Графиката показва разпределението на героите в различните епохи. Допълнителните цветове показват героите, живеещи в различни епохи. Например Дарт Вейдър живее по време на "Възхода на Империята" и в епохата на "Въстанието" тук е в зелено.
Източник: Kirell Benzi / kirellbenzi.com
Когато липсва информация от коя епоха е персонажът на същата страница, алгоритъмът анализира най-близкият му връзка в графа:
В черен цвят са показани героите, за кото не се знае от коя епоха са. Софтуерът автоматично я възстановява. Източник: Kirell Benzi / kirellbenzi.com
Вселената на "Междузвездни войни" е огромна и се състои от различни видове. Като цяло масивът от данни съдържа 640 раси, живеещи на 294 планети. Кирел Бенци показва разпределението на 10-те най-разпространени вида.
Най-много се оказаха хора, те са близо 80% от населението на галактиката. Програмата също така преброи 1367 джедаи и 724 сити .
Написаната от изследователите уеб-скрейпър програма демонстрира, че може да се справи с голям набор от несортирани данни и независимо да възстанови липсващи връзки. Учените смятат, че такава програма може да се използва за запълване на липсващи данни на дигитализирани документи и архиви.
Коментари
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!
12.02 2016 в 11:16
Последни коментари