Резюме

Въведение

Докато GWAS са идентифицирали хиляди корелации между често срещаните генетични варианти и сложни черти, степента на успех при определянето на причинно-следствените гени е несъразмерно ниска [24, 25]. Едно наскоро предложено решение на това предизвикателство включва пресичане на данните за количествени признаци на експресия (eQTL) с локусите на риска на GWAS [26, 27], стратегия, наречена Менделова рандомизация (MR). Този подход има за цел да разреши асоциациите на генетичните черти и предлага способността да се оцени силата на причинно-следствените ефекти в локусите на GWAS [28–30].

анализи

Тук обединяваме редки асоциации на CNV в безпристрастни възрастни популации и клинични кохорти; фенотипизиране на 16p11.2 модели мишки; MR и единичен ген in vivo анализи за риба зебра за характеризиране на неоценени досега генетични асоциации за репродуктивни признаци. Нашите агностични подходи идентифицираха вероятни причиняващи гени за увреждане както на времето, така и на процесите на развитие, свързани със сексуалното развитие.

Материали и методи

Материалите и методите са подробно описани в Допълнителни методи

Кохорти за изучаване

Носителите на CNV 16p11.2 са дефинирани като лица, които носят повтарящи се проксимални 16p11.2 BP4-BP5 600 kb хемизиготна делеция или хетерозиготно дублиране в биобанката в Обединеното кралство (UKBB), Естонския център за геном, biobank на Университета в Тарту (EGCUT), Паневропейски и Simons VIP 16p11.2 кохорти. Вижте Допълнителна таблица S1 за обобщени характеристики и Допълнителни методи за кохортни описания, подробности за генотипирането и анализи на асоцииране.

Модели на мишка 16p11.2

Оценихме репродуктивните параметри на жените и мъжете, включително естрозна цикличност, брой на сперматозоидите, аногенитално разстояние, морфология на органите на урогениталния тракт и обем на хипоталамуса в предварително проектирани модели на мишки 16p11.2 Del/+ и 16p11.2 Dup/+ [31, 32].

Мозъчен структурен магнитен резонанс (ЯМР)

Данни за структурна ЯМР на човешката структура бяха получени, обработени и анализирани, както е описано [16, 17, 33]. Масово-едномерният статистически анализ на карти на обема на целия мозък е извършен при 146 индивида след пубертета, както е описано [34]. Ядрено-магнитен резонанс на мишка е извършен, както е описано подробно в [35].

Анализ на обогатяване на заболяването

Оценихме обогатяването чрез g: Profiler [36] и MetaCore ™ в списъци с гени, диференцирано експресирани в 16p11.2 CNV носители и модели [37, 38].

Менделов анализ на рандомизацията

Използвахме едномерна [28] и многовариантна [39–41] MR за оценка на причинно-следствените ефекти на 16p11.2 гени върху регулацията на AaM.

Фенотипизиране на GnRH неврон при зебра

Направихме свръхекспресия и CRISPR/Cas9 редактиране на генома на 16p11.2 гени в ембриони на зебра, както е описано [42, 43]. In vivo изобразяване на невронални образци в gnrh3: например трансгенни репортерски ларви на egfp [44] е описано в Допълнителни методи.

Сходство на глобалната генна експресия

Анализирахме сходство на експресията на идентифицираните гени-кандидати в публично достъпни набори от данни за експресия на човешки и миши, използвайки инструментите Multi Experiment Matrix (MEM) [45] и funcExplorer [46]. Анализите за обогатяване надолу по веригата бяха проведени с помощта на g: Profiler набор инструменти [47].

Резултати

Жълто, синьо и зелено изобразяват носители на 16p11.2 изтриване, дублиране и CNV (изтриване и дублиране комбинирани), съответно, докато контролите са показани в сиво. Огледална връзка с възрастта при менархе при индивиди от европейски произход (A) първата кохорта на UKBB (UKBB-1), (Б.) втората кохорта на UKBB (UKBB-2) и (° С) кохортата на EGCUT. Последователно несъществена тенденция към променено време на мъжки пубертетни черти, напр. самоотчитане на „първото окосмяване по лицето“ на „по-млада“, „средна“ или „по-възрастна“ възраст от съвременниците в (д) първата UKBB, а през (Е.) втората кохорта на UKBB. (F) Честота на избрани репродуктивни диагнози при жени 16p11.2 CNV носители в кохортата EGCUT. Диагностицираните заболявания са представени съгласно кодовете ICD-10, N91 „отсъстваща, оскъдна и рядка менструация“, E28 „дисфункция на яйчниците“, N83 „невъзпалителни нарушения на яйчниците, фалопиевата тръба и широките връзки“, N70-77 „възпалителни заболявания на жените тазови органи ”. AaM: Възраст в менархе; DEL: 16p11.2 изтриване; DUP: дублиране 16p11.2

Цветен код като в Фигура 1. Променена възраст на първо ниво от (A) 16p11.2 Del/+ и (Б.) 16p11.2 Dup/+ женски мишки в сравнение с дивите тийнейджъри. (° С) Значително увеличен размер на матката при 16p11.2 Dup/+ женски и (д) съкратено ано-генитално разстояние при 16p11.2 Dup/+ мъжки мишки. (Е.) Архитектурата на семенните тубули показва региони с ненормална хистология при 3 от 5 анализирани 16p11.2 Dup/+ мъже, по-специално тубули с дегенерация на зародишни клетки и тубулна атрофия с вакуолизация.

(A) GWAS пик за възраст в менархе спрямо гените CNV в интервала 16p11.2, изчислен с LocusZoom, използвайки данни от [22]. (Б.) Едномерно и (° С) многовариантни анализи на рандомизация по Мендел, показващи стандартизирани оценки на причинно-следствения ефект за AaM с 95% доверителни интервали. Резултатите в червено преминават коригирания от Bonferroni значим праг (P 0,009). Ефектите на гените INO80E и KCTD13 върху AaM са последователни и в двата анализа. (д) Данни за изразяване на 38 GTEx човешки тъкани, групирани с помощта на автоматичен анализ на обогатяване от funcExplorer, разкриват, че ASPHD1 и CELF4 принадлежат към един и същ клъстер. Клъстерът # 1133 се състои от 258 коекспресирани гени, които показват активиране най-вече в мозъчните региони и хипофизата. Това е показано от собствения профил, характеризиращ пълния клъстер, и топлинната карта на тези 258 гена в 38 тъкани. Клъстерът е обогатен с термини за генна онтология и реактом, свързани с невроналната система, невроналната проекция и невротрансмисията (вляво).

(A) Схематично дорзално представяне на gnrh3: egfp трансгенна ларва при 5 dpf, с gnrh3, изразяващ неврон, маркиран в зелено. (Б.) Отляво надясно представителни гръбни изгледи на GFP сигнал в Tg (gnrh3: egfp) ларви неинжектирани, инжектирани с ASPHD1, ASPHD1 и KCTD13, asphd1 направляваща РНК (gRNA) и Cas9 при 5 dpf; скала 50 µm.

Количествена оценка на GFP сигнала в gnrh3: egfp ларви, инжектирани с човешки mRNAs, кодиращи за гени, картографирани в интервала 16p11.2 BP4-BP5. (° С) ASPHD1 иРНК индуцира значително намаляване на GFP сигнала в сравнение с контролите. Дозировка: 12,5 pg за KIF22 и PPP4C; 50 pg за всички останали гени. Вижте Допълнителна таблица S10 за броя на ларвите. (д) F0 мутантни ларви, инжектирани с asphd1 gRNA, показват намаляване на GFP сигнала. Дозировка: 100 pg asphd1 gRNA и 200 pg Cas9 протеин. Брой ларви: Неинжектирани (n = 153), asphd1 gRNA (n = 111), asphd1 gRNA + Cas9 (n = 138). (Е.) Съвместното инжектиране на ASPHD1 иРНК с транскриптите, приоритизирани чрез рандемизация на Мендел (KCTD13, INO80E, MAPK3 и YPEL3), идентифицира епистаза между ASPHD1 и KCTD13. Дозировка: 25 pg за ASPHD1; 50 pg за всички останали гени. Вижте Допълнителна таблица S11 за броя на ларвите.

Данните са представени като средно ± стандартно отклонение; ns, без значение; * p -09; „Предаване през химически синапси“ REAC: 112315, p = 1,04 × 10 −10; „Свързване на невротрансмитерния рецептор и предаване надолу по веригата в постсинаптичната клетка“ REAC: 112314, p = 3.7 × 10 −09) (Фигура 3D и Фигура S6; g: резултатите за профилиране са достъпни на https://biit.cs.ut.ee/gplink/l/AOYgmspNQu).

Дискусия

Натрупващите се данни показват, че често срещаните и редки вариации действат адитивно, за да повлияят на сложните черти [59, 60]. Тук докладваме модел за използване на информация както от редки, така и от често срещани варианти, за да се разбере биологичната основа на размножаването, многофакторен фенотип.

Въпреки многобройните проучвания върху 16p11.2 CNV в клинични кохорти, участието в репродуктивната ос е пренебрегнато най-вече, с изключение на съобщено обогатяване на 16p11.2 BP4-BP5 делеции при пациенти с аплазия в Müllerian [61, 62]. Тук показваме, че дозата 16p11.2 при хора и мишки е свързана значително с пубертетно начало, репродуктивни черти и обем на хипоталамуса. По този начин добавяме към репертоара на съобщените по-рано връзки между тези CNV и психични разстройства, ИТМ, обиколката на главата и размера на мозъка [8, 9, 12, 13, 15, 16, 31, 32]. Досегашното недооценяване на фенотипите на сексуалното развитие може да е резултат от констатационно пристрастие, при което фенотипите, представени с ранно начало и най-големите предизвикателства в областта на медицинското управление, са били приоритетни. По-специално, нашите констатации са в съответствие с конвергентната тема за ендокринните, метаболитните и поведенческите фенотипове при редки носители на CNV и често срещаните асоциативни варианти в локуса 16p11.2 [18, 22, 63].

Подобно на локусите на GWAS, CNV представляват определен интервал, свързан с фенотипа, но често не предлагат отделни причиняващи гени [64]. Докато MR се превърна в популярен инструмент за приоритизиране на причинно значими гени след GWAS, авторите на тези първоначални проучвания се въздържат от функционално валидиране на своите констатации, де факто признавайки, че недостатъчните данни за eQTL от целевите тъкани могат да бъдат непреодолимо ограничение [28, 30 ]. Тук ние използвахме предимствата на широкомащабната MR и преодоляхме нейното тъканно специфично ограничение чрез агностична оценка на ефекта от промяна на дозата на единичен ген върху моделирането на неврони, експресиращи GnRH в контекста на развитието на зебра. Демонстрираме силата на комбиниране в silico и in vivo методи, като идентифицираме ASPHD1 и KCTD13 като двигател и модификатор на репродуктивната ос 16p11.2, съответно.

Два други гена, пребиваващи в 16p11.2, TBX6 и MAZ, са били свързани преди това с вродени дефекти на бъбреците и пикочните пътища [73, 74], докато GWAS са предложили TBX6 [23], MAPK3 [21] и INO80E [22] като потенциални кандидати за AaM. Освен това 14-генният клъстер (дистален до проксимален: SPN, QPRT, ZG16, KIF22, PRRT2, MAZ, MVP, SEZ6L2, ASPHD1, KCTD13, TMEM219, TAOK2, INO80E, DOC2A) е показан под координирана естроген-медиирана регулация [75]. Заедно тези данни предлагат независима подкрепа за генетичната сложност, залегнали в основата на фенотипите в локуса 16p11.2 и засилват вероятна олигогенна етиология с първични двигатели и множество модификатори, регулиращи вариацията в свързаните черти [42, 57, 76, 77].

В заключение, нашето проучване илюстрира как характеризирането на черти, свързани с редки варианти при неселектирани възрастни популации, може да осигури обективна представа за етиологията на заболяването. По-нататък демонстрираме силата на интердисциплинарен подход за определяне на гени-кандидати и основните биологични процеси в локусите на GWAS за сложни признаци.

Авторски приноси

KM, EED, RM и AR проектираха проучването, контролираха отделни етапи и допринесоха за интерпретацията на данните. KM, ML, KL, TL, CML и RM подготвиха и анализираха данни за човешки кохорти. AP, HA, CA, AM, SR, ED, JC, YH, JCS, SN, KM и AR предоставят модели на гризачи, допринасят за отглеждането и фенотипизирането. SMB и BD извършиха човешки ЯМР, а JE, JPL, LRQ и RMH анализ на ЯМР на мишка. ML, KL и ZK извършиха рандемизацията на Мендел. TA, ZAK, NC и EED осигуриха линиите на данио и извършиха експерименти. HP и KM анализираха данните за генната експресия. Членовете на 16p11.2 European и Simons VIP Consortia предоставиха информация за фенотипа съответно на пациенти от Европа и Северна Америка. Членовете на консорциума eQTLGen предоставиха данни за метаанализ на eQTL от цяла кръв. KM и AR написаха ръкописа с приноси от TA, ML, KL, AP, HA, HP, SN, BD, EED и RM. Всички автори прочетоха и одобриха окончателния ръкопис.

Благодарности

Изразяваме своята благодарност към участниците в EGCUT. Благодарим на персонала на EGCUT за тяхната помощ при набирането, фенотипирането, маршрутизирането на проби, генотипирането и административните отговорности, особено на Lili Milani, Viljo Soo, Kairit Mikkel и Mari-Liis Tammesoo Благодарим на 16p11.2 общоевропейски участници и техните семейства за техния принос в това проучване. Благодарни сме на всички семейства в участващите сайтове на Simons Variation in Individuals Project (Simons VIP), както и на консорциума Simons VIP. Оценяваме получаването на достъп до данни за генотип, фенотип и изображения на SNP на база SFARI. Одобрени изследователи могат да получат набора от данни за населението на Simons, описан в това проучване, като кандидатстват на https://base.sfari.org. Изследването в тази статия е проведено с помощта на британския ресурс Biobank (приложение 17085). Анализите на данните за тази работа бяха извършени отчасти в Изчислителния център с висока производителност на Университета в Тарту. Образните изследвания на човешкия мозък са извършени на ЯМР платформата на Département des Neurosciences Cliniques, Center Hospitalier Universitaire Vaudois, която е щедро подкрепена от фондациите Roger De Spoelberch и Partridge. Благодарим на Йонатан Зохар (Университет на Мериленд) за предоставената линия за трансгенна риба зебра от gnrh3: egfp.

Тази работа беше подкрепена от безвъзмездни средства от Швейцарската национална научна фондация (31003A-143914 за ZK; 31003A_160203 и 31003A_182632 за AR; 32003B_159780 за BD; PP00P3_144902 за SJ), проектът за побратимяване Horizon2020 ePerMed (692145 за AR); Фондация Джейкъбс (към KM); Фондация Jérôme Lejeune (към CA и AR); Естонският изследователски съвет отпуска IUT20-60, IUT24-6 и PUTJD726 (на TL); Европейски съюз чрез Европейски фонд за регионално развитие Проект № 2014-2020.4.01.15-0012 GENTRANSMED и 2014-2020.4.01.16-0125; Фондация Leenaards (към BD); и US NIH отпуска P50HD028138 (на NK и EED), R01MH106826 (на EED) и R01HD096326 (на NK). CA е получател на стипендия за жени за Факултета по биология и медицина към Университета в Лозана. SJ е получател на канадски изследователски стол за невроразвитие и нарушения на фондация Jeanne et Jean Louis Levesque.

Финансистите не са играли роля в дизайна на проучването, събирането и анализа на данни, решението за публикуване или подготовката на ръкописа.

Бележки под линия

↵ 23 Съавтори

Имената и принадлежностите на членовете на Европейския 16p11.2 и на eQTLGen Consortium са изброени в Допълнителни материали.