Ново проучване, направено от испанския Национален център за изследване на рака (CNIO), показа, че до 20% от гените, класифицирани като кодиращи (такива, които кодират информацията, необходима за живите клетки да произвеждат протеини, които са градивните елементи на всички живи същества), всъщност може да не кодират нищо в края на краищата, тъй като имат характеристики, които са типични за некодиращи или псевдогени (остарели кодиращи гени), съобщава Science Daily.
Това поредно намаляване на размера на човешкия геном може да има важни ефекти в биомедицината, тъй като броят на гените, които произвеждат протеини и тяхната идентификация е от жизненоважно значение за изследването на множество заболявания, включително рак, сърдечно-съдови заболявания и др.
Работата, публикувана в списание Nucleic Acids Research, е резултат от международно сътрудничество, ръководено от Майкъл Трес (Michael Tress) от CNIO Bioinformatics Unit заедно с изследователи от Института Wellcome Trust Sanger, Великобритания, Масачузетския технологичен институт, САЩ, Университета Pompeu Fabra и Националния център за суперкомпютри (BSC-CNS) в Барселона и Националния център за сърдечно-съдови изследвания (CNIC) в Мадрид.
След като декодирането на човешкия геном през 2003 г. експерти от цял свят работят за съставянето на финалния човешки протеом (общия брой протеини, генерирани от гените) и гените, които ги произвеждат. Тази задача е огромна предвид сложността на човешкия геном и факта, че имаме около 20 000 отделни кодиращи гени.
Изследователите анализират гените, каталогизирани като кодиращи протеини в основните референтни човешки протеоми: подробното сравнение на референтните протеоми от GENCODE / Ensembl, RefSeq и UniProtKB откри 22 210 кодиращи гени, но само 19,446 от тези гени присъстват във всичките 3 анотации*.
*ДНК анотацията или геномната анотация е процесът на идентифициране на местоположенията на гените и на всички кодиращи региони в генома и определянето на това, което правят тези гени.
Когато екипът анализира 2 764 гени, присъстващи само в едно или две от тези референтни анотации, бе изненадан да открие, че експерименталните данни и ръчните анотации показват, че почти всички тези гени е по-вероятно да са некодиращи гени или псевдогени. Всъщност, тези гени, заедно с още 1470 кодиращи гени, които присъстват в трите референтни каталога, не се развиват като типични гени, кодиращи протеини. Заключението на изследването е, че повечето от тези 4 234 гена вероятно не кодират протеини.
Изследването вече се изплаща, според учените. "Ние можем да анализираме много от тези гени подробно", обяснява Трес, "и повече от 300 гена вече са прекласифицирани като некодиращи". Резултатите вече са включени в новите анотации на човешкия геном от международния консорциум на GENCODE, в който участват изследователи на CNIO.
Дебатът за броя на генните през последните години
Новото изследване отново подчертава съмненията за броя на реалните гени, присъстващи в човешките клетки 15 години след секвенирането на човешкия геном. Макар последните данни да сочат, че броят на гените, кодиращи човешките протеини, може да надхвърли 20 000, "нашите данни показват, че хората може да имат само 19 000 кодиращи гени, но все още не знаем кои са тези 19 000 гена", заявява водещият автор на изследването Федерико Абасал (Federico Abascal) от Института Wellcome Trust Sanger във Великобритания.
"Изненадващо някои от тези необичайни гени са добре проучени и имат повече от 100 научни публикации, базиращи се на предположението, че генът произвежда протеини", подчертава значението на тези резултати Дейвид Хуан (David Juan) от Университета Pompeu Fabra и участник в изследването.
Това изследване показва, че все още има голяма степен на несигурност - крайният брой на кодиращите гени може да е 2 000 повече или 2 000 по-малко, отколкото е сега. Човешкият протеом все още изисква много работа, особено предвид значението му за медицинската общност.
Коментари
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!
Няма коментари към тази новина !
Последни коментари