Учените трябва да продължат да поставят под съмнение точността и възпроизводимостта на научните открития, направени чрез машинно обучение, докато не развият нови самокритични изчислителни системи, смята Джинивра Алън (Genevera Allen), статистик в Унверситета Райс.
Алън, доцент по Статистика, Компютърни системи и Електро и Компютърно Инженерство в Университета Райс и Детска Неврология в Колежът по Медицина Бейлор, коментира темата на прес-брифинг и общата сесия на Годишната Среща на Американската Асоциация за Напредък на Науката 2019 (AAAS).
"Въпросът е можем ли наистина да се доверим на открития, направени в момента с техниките на машинното обучение, приложено към голям обем от данни", се пита Алън. "Отговорът в много ситуации вероятно е - Не и без да проверим, но се работи по създаването на ново поколение самообучаващи се машини, които ще оценяват сигурността и възпроизводимостта на своите предвиждания."
Машинното самообучение (ML) е клон от статистиката и компютърните науки, което се занимава с построяване на изчислителни системи, които се учат от данните по-скоро отколкото да следват точни инструкции. Алън пояснява, че голямо значение се отдава на разработването на модели, които биха позволили на ML да прави прогнози за бъдещи данни, основавайки се на вече изследвани такива.
"Много от тези техники са създадени така, че винаги да направят прогноза", обяснява тя. "Те никога няма да дадат отговор "Не знам" или "Не открих нищо", защото не са създадени така". Тя посочва, че добър пример за това са наскоро публикувани ML открития, основани на непотвърдени данни за рака.
"В персонализираната медицина е важно да се открият групи пациенти с генно сходни профили, за да може да се разработят лекарствени терапии, предназначение за определен геном при техните заболявания," разказва Алън. "Машинното самообучение е приложено към геномните клинични данни, за да се открият групи или струпвания на пациенти със сходни генетични профили."
"Но има случаи, когато откритията не са възпроизводими; групите, открити в едно изследване се различават коренно от тези в друго." Алън дава и отговорът "Така е, защото повечето техники за машинно обучение винаги казват, че са открили група. Понякога би било по-полезно да отговорят "Смятам, че някои от тези са настина групирани, но не е сигурно за другите."
Източник: Can we trust scientific discoveries made using machine learning?
Коментари
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!
Няма коментари към тази новина !
Последни коментари