* До кого трябва да се адресира кореспонденция. Имейл: [email protected]

ортологичните

Отдел „Физически биологични науки“, Национална лаборатория „Лорънс Бъркли“, Бъркли, Калифорния, САЩ, Виртуален институт за микробен стрес и оцеляване, Калифорнийски университет, Бъркли, Бъркли, Калифорния, Съединени американски щати

Отдел „Физически биологични науки“, Национална лаборатория „Лорънс Бъркли“, Бъркли, Калифорния, САЩ, Виртуален институт за микробен стрес и оцеляване, Калифорнийски университет, Бъркли, Бъркли, Калифорния, Съединени американски щати

Отдел Физически биологични науки, Национална лаборатория Лорънс Бъркли, Бъркли, Калифорния, САЩ, Виртуален институт за микробен стрес и оцеляване, Калифорнийски университет в Бъркли, Бъркли, Калифорния, Съединени американски щати, Департамент по биоинженерство, Калифорнийски университет в Бъркли, Бъркли, Калифорния, Съединени американски щати

  • Morgan N Price,
  • Paramvir S Dehal,
  • Адам Р Аркин

Фигури

Резюме

Резюме на автора

Цитат: Price MN, Dehal PS, Arkin AP (2007) Ортологичните транскрипционни фактори в бактериите имат различни функции и регулират различни гени. PLoS Comput Biol 3 (9): e175. https://doi.org/10.1371/journal.pcbi.0030175

Редактор: Уве Олер, Университет Дюк, Съединени американски щати

Получено: 2 февруари 2007 г .; Прието: 25 юли 2007 г .; Публикувано: 7 септември 2007 г.

Това е статия с отворен достъп, разпространявана при условията на декларацията на Creative Commons Public Domain, която предвижда, че след като бъде поставена в публичното достояние, това произведение може свободно да се възпроизвежда, разпространява, предава, модифицира, надгражда или използва по друг начин от всеки за всяка законна цел.

Финансиране: Авторите не са получили конкретно финансиране за това проучване.

Конкуриращи се интереси: Авторите са декларирали, че не съществуват конкуриращи се интереси.

Съкращения: BBH, двупосочни най-добри BLAST хитове; COG, колекции от ортологични групи; HGT, хоризонтален трансфер на ген; TF, транскрипционен фактор

Въведение

Основна цел на сравнителната геномика е да идентифицира общите функционални характеристики между организмите и да изясни еволюционната дивергенция на тези характеристики. Например, кога информацията за генната регулация може да бъде прехвърлена от моделни организми към секвенирани роднини? Как еволюира транскрипционната регулация при бактериите и как самите транскрипционни фактори (TFs) се развиват [1–5]? Тъй като един бактериален геном може да кодира стотици TF, включително десетки представители на едно семейство регулатори, анализът на еволюцията на тези TFs не е ясен. Всъщност ще покажем, че популярен метод в сравнителната геномика дава заблуждаващи резултати, когато се прилага към TF.

Първата стъпка в повечето сравнителни геномни анализи е да се идентифицират съответните гени или ортолози. Ортолозите се определят формално като хомоложни гени, които се отклоняват от общ прародител чрез вертикално спускане [6]. Ортолозите контрастират на паралози, т.е.гени, които се разминават чрез дублиране на гени, и ксенолози, т.е.хомоложни гени, чиято история на дивергенция включва едно или повече събития с хоризонтален трансфер на гени (HGT). Както е строго определено, ортологията описва еволюционните взаимоотношения на гените, а не техните функционални взаимоотношения. По този начин ортологичните гени не е задължително да имат запазени функции. Въпреки че ортологията често се разглежда като едно към едно отношение между два гена от различни организми, еволюционната ортология позволява по-сложни взаимоотношения: например два наскоро дублирани гена в един организъм са еволюционни коортолози на съответния ген от род, който не е преживял събитието на дублиране.

При изследванията на бактериалната еволюция обаче това еволюционно определение на ортологията обикновено не се използва. Поради високите нива на HGT, много гени са по-скоро ксенолози, отколкото ортолози. За съжаление, идентифицирането на всички случаи на HGT е доста трудно и различните методи дават противоречиви резултати [7]. Въпреки това е ясно, че HGT е широко разпространен и има съгласие, че много или повечето от гените в съществуващите бактерии са били придобити от HGT [8–10].

Вместо еволюционна ортология, повечето работници в тази област използват неформална концепция за функционална еквивалентност: ортолозите са хомоложни гени, които са тясно свързани и се предвижда да имат еднаква или тясно свързана функция. Поради липсата на функционални данни за повечето гени, ортолозите се определят като двупосочни най-добри BLAST попадения (BBH) или са получени от подходи, базирани на BLAST на по-високо ниво, като колекции от ортологични групи (COG) [11]. Тази оперативна дефиниция на ортологията има предимството, че функционално съответстващите гени могат да се считат за еквивалентни, независимо от детайлите на тяхната еволюционна история. Тъй като обаче повечето от разглежданите гени са известни само от геномната последователност, е трудно да се разбере дали те действително имат съответни функции. По този начин използването на предсказана функционална еквивалентност като основа за ортология е критикувано за липса на строгост [12]. Друг проблем с BBHs е, че поради неравномерните темпове на еволюция най-добрият BLAST удар може да не е най-близкият хомолог в еволюционното дърво [13].

Чудехме се как понятието и практиката на ортологията, независимо дали са дефинирани от еволюционен анализ или от очакваната функционална еквивалентност, се прилагат за TF. Най-популярните методи за определяне на ортология са BBH и COG. Подходът COG е по-малко полезен за изучаване на TF, тъй като той свива големи семейства TF в единични ортологични групи. Например, E. coli K12 има 45 членове от групата LysR (COG583), които реагират на голямо разнообразие от сигнали и регулират различни набори от гени.

От друга страна, много проучвания са използвали базирани на BLAST ортолози за изследване на регулацията при бактерии [2,4,5,14-16]. Тези изследвания предполагат, че регулацията е запазена, така че ортологичните TF ще регулират ортоложните гени. Тъй като обаче бактериалните геноми често съдържат много членове на семейство TF, подозирахме, че ортологичното назначение от BBHs често би дало подвеждащи резултати. Наличието на големи семейства показва, че TFs често се дублират и подходът с най-добри хитове ще избере най-малко отклонения дубликат като ортолог. Също така, ако всички близки хомолози са били изтрити, тогава далечните хомолози ще продължат да присъстват и един от тези отдалечени хомолози може да е фалшив BBH. При бактериите паралогичните TF обикновено имат различни функции и транскрипционните регулаторни мрежи могат да се развият бързо [1,3,4], така че и в двата случая функцията на хомолога вероятно ще се промени. За разлика от това, еволюционните анализи на ортологията разглеждат всички геноми, а не само двама наведнъж, така че тези грешки могат да бъдат избегнати.

Независимо от това, базирани на BLAST ортолози успешно се използват за идентифициране на запазени регулаторни последователности [2,14–16] и за свързване на клъстери от подобни регулаторни последователности („мотиви“) с TF, които свързват тези последователности [17]. Ние твърдим, че тези анализи са успели, тъй като са се фокусирали върху тясно свързани бактерии, като семейството на ентеробактериите, в които дублирането и промяната на функцията са имали по-малко време. Всъщност, много по-вероятно е да се намерят запазени регулаторни последователности, когато се вземат предвид само близки роднини [18]. Това илюстрира друга причина, поради която BLAST-базирани ортолози са били ефективни в този контекст, а именно, че търсенето на мотиви обикновено връща резултати само за тези гени, чиято регулация е запазена. Ако регламентът се е променил, тогава тези методи обикновено не връщат резултати, а не неправилни резултати.

Съвсем наскоро еволюционните проучвания изследват запазването на TF и ​​техните регулирани гени в отдалечени бактерии [4,5]. Тези проучвания използват предполагаеми ортолози от BBHs, за да определят наличието и отсъствието на TF, и прогнозират, че ортологичните TF ще регулират ортологичните гени, ако и двата ортолога присъстват. (Тези проучвания не търсят запазени регулаторни последователности.) При по-големите филогенетични разстояния, разгледани от тези проучвания, BBHs могат да дадат подвеждащи резултати.

Тук тестваме BBHs на характеризираните TFs на E. coli както по еволюционни, така и по функционални критерии. За да проверим дали BBHs са еволюционни ортолози, ние изградихме филогенетични дървета за всички BBHs на TF между E. coli и B. subtilis. За да определим дали регулацията се поддържа между BBH, ние систематично изследвахме характеризирани TF и ​​данни за експресия от организми на редица филогенетични разстояния от Е. coli. Установихме, че ортологичните задания за TF от отдалечено свързани бактерии (напр. Бактерии от различни отдели) са ненадеждни: по-често BBHs не са еволюционни ортолози и имат различни функции. Освен това данните за експресията показват, че регулаторните взаимодействия често не се запазват, дори на по-близко филогенетично разстояние и дори когато засегнатите гени са еволюционни ортолози. Намерихме експериментални доказателства в литературата и доказателства в геномната последователност, за да потвърдим някои от тези промени. По този начин генната регулация изглежда се развива по-бързо, отколкото се смяташе досега.

Резултати

„Ортологични“ транскрипционни фактори между Е. coli и В. subtilis

Първо изследвахме предполагаемите ортолози от BBH за TF в E. coli K12 и B. subtilis. Това сравнение е удобно, защото десетки TF във всеки организъм са изследвани експериментално и защото са съставени известни регулаторни взаимодействия [19–22]. Освен това много роднини на тези бактерии са секвенирани (Фигура 1). Въпреки че Е. coli и В. subtilis са отдалечено свързани и принадлежат на различни видове, последните еволюционни проучвания разглеждат „ортологични“ TFs между тях [4,5].