Има цели фабрики, които скалъпват псевдонаучни текстове

Наука ОFFNews Последна промяна на 01 април 2015 в 10:12 6722 1

Във Франция е създадена програма, която може да идентифицира фалшиви, компютърно генерирани научни статии. Експерти смятат, че независимо че програмата се предлага с открит достъп, ситуацията с фалшивите научни статии драстично няма да се промени - програмата е безсилна срещу обикновената човешка глупост, разказва в статия газета.ру.

В Русия още не е отшумял скандалът с кодово име "Корчеватель" (Изкъртвач). Статия с това заглавие е публикувана в сайта "Списание за научни публикации на аспиранти и докторанти" през август 2008 година. Тази статия е генерирана на английски език с генератора за псевдо-научни статии SCIgen и преведена на руски с програма "ЕТАП-3", т.е. преводът е машинен. Въпреки това, статията минава рецензия.

След избухването на скандала в медиите, статията е премахната от сайта на списанието, но списанието е извадено от списъка на резензируемите издания на ВАК (Висшата атестационна комисия) на Русия.

Програмата SCIgen - провокация за фалшивата наука

Програма SCIgen е създадена през 2005 г. от трима аспиранти (Jeremy Stribling, Max Krohn, Dan Aguayo) от Масачузетския технологичен институт. Тяхната програма съчетава произволна поредица от думи, които създават впечатление за научна, но безсмислена публикация и са я със същата цел, с която е била използвана в руския проект "Корчеватель"  - за да се покаже липсата на експертност на долнокачествените научни конференции, които за пари публикуват всякакви наукоподобни глупости. Започват да се нижат скандали - например, организаторите на годишната конференция на World Multi-Conference on Systemics, Cybernetics, and Informatics (WMSCI) оттеглят две фалшиви публикации и понасят големи загуби от спонсорите си. Случаят в Русия е още по-анекдотичен, защото руските шегаджии превеждат точно една от тези злополучни статии.

Голяма част от конференциите, които приемат фалшиви публикации, се провеждат в Китай, както и повечето от авторите на фалшиви статии са китайц.

"Не бях сигурен на степента на проблема, но знаех, че това се случва. Понякога получаваме писмо, което ни уведомява, че някъде се е появила", - казва Джереми Стриблинг, съавтор на програмата SCIgen.

Програмата SCIgen бързо става популярна из цял свят, има безброй варианти, даващи възможност да се пишат научни глупости по всякаква тема, от математика до теорията на постмодернизма.

Детекторът на Лабе за фалшиви публикации

Всичко това продължава безпроблемно до 2012 г., докато компютърният специалистът Сирил Лабе (Cyril Labbé) от Университета Жозеф Фурие в Гренобъл не разработил метод за автоматично разпознаване на текстове, генерирани от програмата SCIgen. Той публикува принципите на метода си в списание Scientometric. С помощта на този метод, е уловил 85 псевдонаучни доклади, приети на 24 компютърни конференции, повече от 100 статии в издателство IEEE в Ню Йорк. По-късно принуждава издателство Шпрингер (Springer-Verlag) да оттегли повече от 120 произведения на SCIgen. От Шпрингер проявяват интерес към работата на Сирил Лабе и сключват договор с него за ъпгрейт на програмата му.

Новата програма на финансираната от издателството лаборатория на Сирил Лабе, SciDetect лежи на същите принципи, както на първоначалната, но са добавени и статистически методи, подобни на тези, които се използват за откриване на спам. Тя не търси ключови думи, а граматични особености, които подсказват, че тексът е дело на машина. Според представители на Шпрингер, програмата може да разконспирира и друг софтуер, не само SCIgen.

Твърде много информация

Количеството на научните знания за света расте все по-бързо и по-бързо и учените стават все по-специализирани. Понастоящем малко учени могат да се похвалят с енциклопедични познания за всичко, а и това физически е просто невъзможно. Проблемът не е, че хуманитаристите не разбират техничарите. Дори един учен вече трудно може да разбере какво прави колегата му в съседната лаборатория, ако изследванията му лежат в друга област. И проверяващите в издателствата понякога просто не разполагат с достатъчно време за да вникнат добре темата на статията. Така се увеличава вероятността от фатална грешка, когато пристигне фалшива наукообразна статия и като следствие се нанасят сериозни вреди на репутацията на изданието. SCIDetect и други подобни програми могат да помогнат за намаляване на вероятността от такива грешки - като спам филтри в имейл пощите.

Срещу човешките безсмислици няма софтуер

"Ситуацията няма да се промени" - казва Майкъл Гелфанд, организатор на руската провокация "Корчеватель". - "Програмата SciDetect ще хване само тези текстове, които се генерират от компютър, но е безпомощна пред безсмислица, създадена от човек". 

Според него, създаването на фалшиви статии по обективни причини от дълго време е станало кошмар и за издателите, и за цялата научна общност. Една от причините е създаването на онлайн научни списания с отворен достъп. Само по себе си, това е добро явление, но благоприятства и достъпа на фалшиви публикации.

"Авторът, на когото му трябва публикация, плаща за фалшивата статия, редакторът я публикува във фалшивото си списание за 10-20 минути." - казва Гелфанд. -  "Получава се нещо като симбиоза между фалшиви автори и фалшиви редактори. Има и втора причина - повишава се натискът върху научните работници, от които се искат публикации за отчет, за средства, за поддържане на репутацията."

"Подозирам, че някъде има цели фабрики, където се произвеждат тези псевдонаучни текстове." - завършва Гелфанд, редактор на списание "Молекулярна биология".

Най-важното
Всички новини
За писането на коментар е необходима регистрация.
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!

01.04 2015 в 17:29

Много яко! Генерирах си една статия и я пуснах във Facebook по случай първи април.