Можем ли да се доверим на научни открития, направени с машинно самообучение?

Ивайла Сопотенска Последна промяна на 21 февруари 2019 в 00:05 16793 0

Създадено е ново влакно по-здраво и по-тънко от кевлара

Това е частична карта на интернет, базирана на данни от 15 януари 2005 година

29/10/2025

На тази дата е рожденият ден на интернет

Учените трябва да продължат да поставят под съмнение точността и възпроизводимостта на научните открития, направени чрез машинно обучение, докато не развият нови самокритични изчислителни системи, смята Джинивра Алън (Genevera Allen), статистик в Унверситета Райс.

Алън, доцент по Статистика, Компютърни системи и Електро и Компютърно Инженерство в Университета Райс и Детска Неврология в Колежът по Медицина Бейлор, коментира темата на прес-брифинг и общата сесия на Годишната Среща на Американската Асоциация за Напредък на Науката 2019 (AAAS).

"Въпросът е можем ли наистина да се доверим на открития, направени в момента с техниките на машинното обучение, приложено към голям обем от данни", се пита Алън. "Отговорът в много ситуации вероятно е - Не и без да проверим, но се работи по създаването на ново поколение самообучаващи се машини, които ще оценяват сигурността и възпроизводимостта на своите предвиждания."

Машинното самообучение (ML) е клон от статистиката и компютърните науки, което се занимава с построяване на изчислителни системи, които се учат от данните по-скоро отколкото да следват точни инструкции. Алън пояснява, че голямо значение се отдава на разработването на модели, които биха позволили на ML да прави прогнози за бъдещи данни, основавайки се на вече изследвани такива.

"Много от тези техники са създадени така, че винаги да направят прогноза", обяснява тя. "Те никога няма да дадат отговор "Не знам" или "Не открих нищо", защото не са създадени така". Тя посочва, че добър пример за това са наскоро публикувани ML открития, основани на непотвърдени данни за рака.

"В персонализираната медицина е важно да се открият групи пациенти с генно сходни профили, за да може да се разработят лекарствени терапии, предназначение за определен геном при техните заболявания," разказва Алън. "Машинното самообучение е приложено към геномните клинични данни, за да се открият групи или струпвания на пациенти със сходни генетични профили."

"Но има случаи, когато откритията не са възпроизводими; групите, открити в едно изследване се различават коренно от тези в друго." Алън дава и отговорът "Така е, защото повечето техники за машинно обучение винаги казват, че са открили група. Понякога би било по-полезно да отговорят "Смятам, че някои от тези са настина групирани, но не е сигурно за другите."

Източник: Can we trust scientific discoveries made using machine learning?

Още по темата

18/12/2017
Технологии

Как работи дълбокото самообучение на невронните мрежи?

04/04/2016
Технологии

Невронни мрежи се самообучават да оцветяват черно-бели снимки