ЭВОЛЮЦИОННО-ГЕНЕТИЧЕСКИЙ АНАЛИЗ РОЛИ РЕГУЛЯТОРНЫХ УЧАСТКОВ ГЕНА CORO2A В ФОРМИРОВАНИИ НАСЛЕДСТВЕННОЙ ПРЕДРАСПОЛОЖЕННОСТИ К ПРЕЭКЛАМПСИИ У РУССКИХ И ЯКУТОВ
Aннотация
Актуальность: Преэклампсия (ПЭ) признана одним из наиболее тяжелых осложнений беременности и является ведущей причиной материнской и перинатальной заболеваемости и смертности, поскольку в настоящее время отсутствуют прогностические биомаркеры и эффективная фармакологическая терапия ПЭ, а ее этиопатогенез остается плохо изученным. В связи с этим, изучение генетической компоненты ПЭ представляется актуальным. Цель исследования: Изучение генетической компоненты ПЭ по системе регуляторных полиморфных вариантов (rSNP) нового гена-кандидата CORO2A и выявление роли естественного отбора в ее формировании. Материалы и методы: Проанализировано 925 образцов ДНК женщин из этнических выборок русских и якутов (группа больных ПЭ, N=412 чел.; контрольная группа, N=513 чел.). Поиск rSNP проводили с помощью ресурса «RegulomeDB». Генотипирование осуществляли методом MALDI-TOF масс-спектрометрии. Для сравнения частот аллелей и генотипов между анализируемыми группами использовали критерий χ² Пирсона или двусторонний точный тест Фишера. Для поиска сигналов естественного отбора в эволюционной линии парвотряда Catarrhini использовали метод INSIGHT. Результаты: В этнической выборке русских для аллеля C регуляторного полиморфного варианта rs10985257 показана ассоциация с развитием ПЭ (p=0.005, OR=2.33, CI:1.32-4.11), тогда как аллель A (p=0.005, OR=0.43, CI:0.24-0.76) и генотип AA (p=0.02, OR=0.45, CI:0.24-0.85) обладают протективными свойствами. В эволюционной линии парвотряда Catarrhini выявлено действие слабого очищающего отбора для rs10985257, rs2231656 и rs78486797. Заключение: Продемонстрирована значимая роль rs10985257 и его адаптивных изменений на макроэволюционном уровне в формировании наследственной предрасположенности к ПЭ.
Ключевые слова: преэклампсия, регуляторный однонуклеотидный полиморфный вариант (rSNP), ассоциативное исследование, ген CORO2A, плацента, транскриптом, естественный отбор
Введение. В настоящее время использование подходов эволюционной биологии в изучении различных аспектов многофакторных заболеваний (МФЗ), включая и анализ их генетической архитектуры, приобретает широкое распространение. Результаты ряда проведенных на сегодняшний день исследований свидетельствуют о значимой роли естественного отбора и адаптивных факторов в происхождении генетической компоненты распространенных болезней [1, 2]. Изучение адаптивных изменений в геноме человека, возникших в условиях новой среды обитания с момента расселения Homosapiens из Африки около 100 тыс. лет назад, способствует не только пониманию процессов формирования генетического разнообразия в современных популяциях, а также может использоваться для оценки роли их фенотипических проявлений в развитии болезней и здоровья современного человека и рассматриваться в качестве способа обнаружения «упущенной наследуемости» при МФЗ [3, 4].
В настоящем исследовании эволюционный подход к анализу генетической архитектуры МФЗ был применен в отношении преэклампсии (ПЭ) – наиболее тяжелого гипертензивного расстройства беременности, для которого на сегодняшний день отсутствуют прогностические биомаркеры и эффективная фармакологическая терапия, что определяет высокую частоту материнской и перинатальной заболеваемости и смертности [5]. Общепризнанно, что основной причиной ПЭ является нарушение процессов формирования плацентарной ткани в ранние сроки гестации, тогда как главным патогенетически значимым процессом в развитии данной патологии считается нарушение ремоделирования спиральных артерий [6]. В связи с этим, все большее внимание направлено на изучение вариабельности уровня экспрессии генов плацентарной ткани при ПЭ и физиологично протекающей беременности, а также регуляции данных изменений [7, 8]. В свою очередь, регуляторные полиморфные варианты (rSNP) представляют значительный интерес, поскольку путем изменения уровня экспрессии кандидатных генов могут играть значимую роль в развитии различных патологических состояний человека [9, 10].
Существенный интерес в контексте ведущей роли плаценты в этиопатогенезе данной патологии беременности представляет эволюционный подход к анализу генетической архитектуры ПЭ по системе генов, вовлеченных в молекулярные процессы, происходящие в плацентарной ткани. Так, риск развития гестационных осложнений, связанных с аномалиями плаценты (ПЭ и послеродовое кровотечение) может быть следствием действия естественного отбора на гены, продукты которых вовлечены в регуляцию глубины инвазии трофобласта и ремоделирования спиральных артерий [11]. Существует предположение, согласно которому в эволюции степени инвазивности плаценты в линии предков человекообразных обезьян участвовал положительный отбор, направленный на гены, кодирующие белки, которые определяют глубину инвазии цитотрофобласта и ремоделирование спиральных артерий [12]. По результатам недавних исследований показано, что для представителей семейства Hylobatidae (гиббон) характерна малая глубина инвазии трофобласта и расширение спиральных артерий внутри децидуальной оболочки, тогда как у представителей подсемейства Homininae (человек, шимпанзе, горилла) наблюдается глубокая степень инвазии трофобласта и ремоделирование спиральных артерий, проходящее в миометрий. Однако следует отметить, что развитие ПЭ характерно прежде всего для человека, имеются редкие сообщения о возникновении данной патологии у обезьян: горилл, шимпанзе, макак [13, 14].
Цель исследования. Охарактеризовать генетическую архитектуру ПЭ по системе rSNP нового гена-кандидата CORO2A, впервые выявленного благодаря исследованию транскриптома плацентарной ткани [7, 15, 16] и изучить роль естественного отбора на макроэволюционном уровне в ее формировании.
Материал и методы исследования. В исследовании было проанализировано 925 образцов ДНК женщин из двух этнических выборок: русские из г. Томск (N=498 чел.) и якуты из г. Якутск (N=427 чел.). Группа больных ПЭ включала 412 женщин с умеренной и тяжелой степенью ПЭ (русские, N=195 чел., средний возраст 30±7 лет; якуты, N=217 чел., средний возраст 28±6 лет) и была неоднородной по наличию ранее предшествующих и сопутствующих фоновых заболеваний. Диагноз «преэклампсия» установлен врачами-акушерами в соответствии с Международной классификацией болезней 10-го пересмотра (МКБ-10). Контрольная группа представлена 513 женщинами с физиологичной беременностью и родами, отсутствием неблагоприятного акушерского анамнеза (русские, N=303 чел., средний возраст 27±5 лет; якуты, N=210 чел., средний возраст 32±7 лет). Материал собран на базе МАУЗ «Родильный дом № 4» и ОГАУЗ «Областной перинатальный центр» г. Томска, Перинатального центра РБ№4 г. Якутска.
Для поиска значимых rSNP использовали онлайн ресурс «RegulomeDB» [17]. Поиск rSNP проводили с учетом расстояний – 5000 п.н. от начала и + 5000 п.н. от конца гена, в которых расположены энхансеры и инсуляторы [18, 19]. Критерием отбора служили значения «score» равные 1, 2 и 3, определяющие степень доказательности регуляторного потенциала каждого полиморфного варианта гена CORO2A, таким образом было выявлено 57 rSNP. Только 39 rSNP встречались с частотой редкого аллеля более 5% (в среднем по популяциям из проекта «1000 геномов»), из которых в состав мультиплекса для дальнейшего анализа вошли 5 rSNP: rs10985257, rs2231656, rs56916178, rs735111, rs78486797. Генотипирование проводили методом MALDI-TOF масс-спектрометрии на масс-спектрометре «MassARRAY Analyzer 4» («Sequenom», США), как описано ранее [20], последовательности праймеров доступны по запросу.
Проверку распределения наблюдаемых частот генотипов на соответствие ожидаемым при равновесии Харди-Вайнберга осуществляли с помощью точного теста Фишера. Для сравнения частот аллелей и генотипов между анализируемыми группами использовали критерий χ² Пирсона с поправкой Йейтса или двусторонний точный тест Фишера. Для оценки ассоциаций rSNP с развитием ПЭ рассчитывали показатель отношение шансов (OR). Поиск сигналов естественного отбора на макроэволюционном уровне проводили с использованием нового вычислительного ресурса INSIGHT, основанного на методе комбинации межвидовой дивергенции и внутривидового разнообразия (рисунок 1) [21]. Внешняя группа сравнения была представлена геномами представителей парвотряда Catarrhini: шимпанзе, орангутан и макака-резус, геномы выровнены в соответствии с геномом человека (hg19) база данных «UCSC Genome Browser». Данные о полиморфных вариантах человека получены из полногеномных сиквенсов 54 неродственных индивидуумов, представителей 11 популяций (база «Complete Genomics»): LWK – лухья (г. Уэбуай, Кения), MKK – масаи (Кения), YRI – йоруба (г. Ибадан, Нигерия), ASW – афроамериканцы (США), TSI – тосканцы (Италия), CEU – европейцы (штат Юта, США), GIH – индийцы (выходцы из штата Гуджарат, проживающие в г. Хьюстон, США), CHB – китайцы (г. Пекин), JPT – японцы (г. Токио), MXL – мексиканцы (проживающие в г. Лос-Анджелес, США), PUR – пуэрториканцы (Пуэрто-Рико) [21, 22].
Горизонтальные линии представляют собой индивидуальные последовательности генома популяций человека (X, красный цвет) или внешней группы сравнения (О, серый цвет). Филогенетическая модель (слева) используется для вероятностного выведения серии предковых аллелей (A и Z) с маркировкой сайтов N, D, L или H (где N - мономорфный недивергентный сайт, D - мономорфный дивергентный сайт, L - полиморфный сайт с низкой частотой производного аллеля (5-35%), H - полиморфный сайт с высокой частотой производного аллеля (65-95%)). В таблице слева представлена модель для естественного отбора, на основе которой происходит оценка общей доли участков, находящихся под отбором (ρ). Таблица справа - вероятностная модель, содержит следующие параметры: λ - нейтральная скорость расхождения между предковым геномом (Z) и популяциями человека (A); θ - нейтральная скорость возникновения полиморфизмов, представлена скоростью мутаций в масштабе популяции; β - относительная частота нейтральных полиморфных участков с низкой частотой аллеля среди нейтральных полиморфизмов; η - отношение скорости дивергенции на сайтах под отбором к нейтральной скорости дивергенции; γ - отношение скорости возникновения полиморфизма на сайтах под отбором к нейтральной скорости возникновения полиморфизма. Желтым цветом обозначены сайты, находящиеся под действием отбора, выявленные путем сравнения частоты четырех классов (N, D, L и H) в пределах элементов с теми, которые находятся во фланкирующих нейтральных сайтах (темно-серый цвет) [21].
Horizontal lines represent individual sequences of the human population genome (X, red) or the external comparison group (O, gray). The phylogenetic model (left) is used for probabilistic derivation of a series of ancestral alleles (A and Z) labeled N, D, L or H (where N is a monomorphic non-divergent site, D is a monomorphic divergent site, L is a polymorphic site with a low frequency of the derived allele (5-35%), H - polymorphic site with a high frequency of the derived allele (65-95%)). The table on the left shows the model for natural selection, on the basis of which the total share of sites under selection (ρ) is estimated. The table on the right is a probabilistic model, contains the following parameters: λ is the neutral rate of divergence between the ancestral genome (Z) and human populations (A); θ is the neutral rate of occurrence of polymorphisms, represented by the rate of mutations in the population scale; β is the relative frequency of neutral polymorphic areas with a low allele frequency among neutral polymorphisms; η is the ratio of the divergence rate at sites under selection to the neutral divergence rate; γ is the ratio of the rate of occurrence of polymorphism at sites under selection to the neutral rate of occurrence of polymorphism. Yellow color indicates sites under the effect of selection, identified by comparing the frequency of four classes (N, D, L and H) within the elements with those located in flanking neutral sites (dark gray) [21].
Рис. 1. Основной принцип метода INSIGHT
Fig. 1. The main principle of the INSIGHT method
Проведение исследования одобрено Комитетом по биомедицинской этике НИИ медицинской генетики Томского НИМЦ. Экспериментальные исследования выполнены на базе Центра коллективного пользования научно-исследовательским оборудованием и экспериментальным биологическим материалом «Медицинская геномика» НИИ медицинской генетики Томского НИМЦ.
Результаты исследования. Ген CORO2A, является новым геном-кандидатом ПЭ и впервые выявлен благодаря исследованию транскриптома плацентарной ткани. Следует отметить, что в опубликованных литературных данных отсутствует информация о роли его однонуклеотидных полиморфных вариантов в развитии данной патологии беременности. Тогда как в исследовании, проведенном нами ранее на меньших объемах выборок [23], показана ассоциация с ПЭ для двух rSNP гена CORO2A: rs10985257 в этнических выборках русских и якутов, rs735111 в популяции якутов.
Краткая характеристика изученных пяти rSNP и распределение частот их предковых аллелей в исследуемых этнических выборках, полученных в настоящем исследовании, представлена в таблице 1. В обследуемых группах для большинства rSNP наблюдалось соответствие распределения частот генотипов равновесию Харди-Вайнберга за исключением трех rSNP в популяции русских: rs78486797 в группе контроля и rs10985257, rs2231656 в группе больных ПЭ, что может отражать специфику популяционно-генетических процессов, происходящих в популяции или функциональную значимость данных rSNP. В целом, частоты генотипов и аллелей соответствовали диапазону частот, наблюдаемому в мировых популяциях по данным проекта «1000 геномов» [24]. Из пяти изученных rSNP полиморфными оказались все, за исключением: rs78486797 во всех изученных группах этнической выборки якутов и группе больных ПЭ в этнической выборке русских. Анализ генетического разнообразия распределения частот генотипов между группами контроля и между группами больных ПЭ, исследуемых этнических выборок выявил статистически значимые различия для rs56916178 (χ2=9.05, p=0.01) в контрольных группах и rs10985257 (χ2=9.53, p=0.009) в группах с ПЭ. Вероятно, наблюдаемая вариабельность распределения частот генотипов отражает эволюционные процессы, происходившие в ходе формирования данных популяций.
Результаты анализа распределения частот аллелей и генотипов пяти rSNP гена CORO2A продемонстрировали статистически значимую ассоциацию с развитием ПЭ для rs10985257 в этнической выборке русских. Так, значимое повышение частоты встречаемости аллеля C (p=0.005, OR=2.33, CI:1.32-4.11) и снижение частоты генотипа AA (p=0.02, OR=0.45, CI:0.24-0.85) и аллеля A (p=0.005, OR=0.43, CI:0.24-0.76) было показано в группе больных ПЭ по сравнению с группой контроля. Примечательно, что в этнической выборке якутов ни для одного из изученных rSNP не было выявлено статистически значимых ассоциаций с развитием ПЭ.
Таблица 1
Характеристика изученных rSNP и распределение частот их предковых аллелей (%) в анализируемых группах
Table 1
Characteristics of the studied rSNPs and the frequency of their ancestral alleles (%) in the analyzed groups
rSNP, значение «score» | Локализация в гене | ПА | Обследованные группы | |||
Русские | Якуты | |||||
ПЭ | К | ПЭ | К | |||
rs10985257, 3a | Интрон | A | 83.1 | 92.0 | 92.4 | 96.2 |
rs2231656, 3a | Интрон вблизи 5'-UTR | С | 96.8 | 97.8 | 96.9 | 96.9 |
rs56916178, 2b | Интрон вблизи 5'-UTR | T | 91.1 | 87.6 | 91.4 | 93.7 |
rs735111, 1f | Экзон | G | 87.4 | 86.0 | 82.2 | 86.8 |
rs78486797, 2b | Вблизи 5'-UTR | G | 99.7 | 99.0 | 100 | 100 |
Значение «score» базы данных «RegulomeDB», характеризующее степень доказательности регуляторного потенциала SNP, обозначено цифровыми и буквенными символами; Наибольшим регуляторным потенциалом обладают rSNP со значением «score» равным 1a (регуляторный потенциал уменьшается с увеличением цифрового значения и в алфавитном порядке). Локализация rSNP определена согласно данным базы «NSBI». ПА – предковый аллель, ПЭ – группа больных с преэклампсией, К – контрольная группа.
The “score” value of the RegulomeDB database, which characterizes the degree of evidence of the regulatory potential of the SNP, is indicated by numeric and alphabetic characters; The highest regulatory potential has rSNP with a “score” value equal to 1a (the regulatory potential decreases with increasing digital value and in alphabetical order). Localization of rSNP is determined according to the NSBI database. PA is an ancestral allele, PE is a group of patients with preeclampsia, K is a control group.
При проведении оценки роли действия естественного отбора на формирование генетической структуры пяти rSNP с помощью метода INSIGHT в эволюционной линии представителей парвотряда Catarrhini (человек, шимпанзе, орангутан, макака-резус) на первом этапе расчетов из анализа автоматически были исключены два rSNP (rs56916178 и rs735111), что обусловлено одной из причин: сайт исключен на этапе геномной фильтрации, отсутствуют данные о полиморфном варианте, данные о сиквенсах внешней группы сравнения недостаточны для проведения анализа. Действие слабого очищающего отбора показано для трех rSNP гена CORO2A: rs10985257 (апостериорная вероятность 92.11%, p˂0.01), rs2231656 (апостериорная вероятность 92.10%, p˂0.01) и rs78486797 (апостериорная вероятность 92.14%, p˂0.01). Полученные результаты свидетельствуют о консервативном характере данных rSNP в ряду представителей изученной эволюционной линии, возникшем за счет удержания производных аллелей в популяциях на низком уровне. Примечательно, что в этнической выборке русских для rs10985257 при ПЭ характерно значимое повышение частоты производного аллеля C по сравнению с контрольной группой, в то время как предковый аллель A и генотип AA обладают протективными свойствами.
Обсуждение. В настоящем исследовании проведен эволюционно-генетический анализ роли пяти rSNP нового гена-кандидата CORO2A в формировании структуры наследственной подверженности к ПЭ. Результаты анализа распределения частот аллелей и генотипов исследуемых rSNP, проведенного на большем объеме выборок, продемонстрировали статистически значимую ассоциацию с развитием ПЭ для rs10985257 в этнической выборке русских, тогда как для rs10985257 и rs735111 в этнической выборке якутов ассоциация с данной патологией беременности не была подтверждена. Поиск сигналов естественного отбора в эволюционной линии парвотряда Catarrhini выявил действие слабого очищающего отбора для трех rSNP: rs10985257, rs2231656 и rs78486797.
Как было отмечено нами ранее [23] ген CORO2A (Coronin 2A) является новым геном-кандидатом ПЭ, функции которого на сегодняшний день недостаточно изучены. Однако известно, что продукт данного гена - коронин 2A, принадлежит семейству актин-связывающих белков и вовлечен в процессы, связанные с мембранным транспортом, клеточной подвижностью, трансдукцией межклеточных сигналов. Кроме того, результаты недавнего исследования продемонстрировали способность коронина 2А осуществлять дерепрессию Toll-подобных рецепторов генов-мишеней в макрофагах [25], что способствует формированию воспалительного ответа и, вероятно, может приводить к развитию ПЭ. Следует также отметить, что при ПЭ в плацентарной ткани наблюдается гиперэкспрессия гена CORO2A [7, 15, 16].
Примечательно, что ассоциированный в данном исследовании с развитием ПЭ у русских регуляторный полиморфный вариант rs10985257, согласно базе данных «RegulomeDB» располагается в сайте связывания с транскрипционным фактором (ТФ) CEBPB (CCAAT/Enhancer Binding Protein Beta). Данный ТФ играет важную роль в регуляции генов, участвующих в иммунных и воспалительных реакциях, действует как модулятор окислительного стресса. Также известно о способности ТФ CEBPB подавлять экспрессию ТФ MYC (MYC Proto-Oncogene, BHLH Transcription Factor) [26], что приводит к смещению дифференцировки Т-клеток в сторону Т-хелперов 2 типа, которые играют важную роль в успешной беременности путем регулирования иммунного ответа на плод, в то время как для ПЭ характерно смещение баланса в пользу Т-хелперов 1 типа [27, 28]. Важно отметить, что в условиях гипоксии наблюдается повышение уровня экспрессии ТФ CEBPB, что способствует нарушению инвазии вневорсинчатого трофобласта, поверхностной плацентации и, как следствие, развитию ПЭ [29, 30]. Таким образом, регуляторный полиморфный вариант rs10985257 может быть вовлечен в этиопатогенез ПЭ на стадии формирования плаценты посредством взаимодействия с ТФ CEBPB.
Полученные в настоящем исследовании результаты свидетельствуют о консервативном характере трех rSNP (rs10985257, rs2231656 и rs78486797) среди представителей эволюционной линии парвотряда Catarrhini и демонстрируют, что слабый очищающий отбор является значимым эволюционным фактором, действующим на регуляторные участки гена CORO2A. Вероятно, все указанные rSNP могут вносить вклад в формирование наследственной подверженности к ПЭ в современных популяциях человека. Доказательством этого предположения может служить полученная в настоящей работе ассоциация rs10985257 с развитием ПЭ в русской этнической выборке. Так, было показано, что действие слабого очищающего отбора приводит к элиминации производного аллеля С, ассоциированного с данной патологией и закреплению предкового аллеля А, обладающего протективными свойствами.
Заключение. Полученные в настоящей работе данные выявили значимую роль rs10985257 гена CORO2A и адаптивных изменений данного регуляторного полиморфного варианта на макроэволюционном уровне в формировании наследственной предрасположенности к развитию ПЭ. Продемонстрировано, что слабый очищающий отбор на таком значительном филогенетическом расстоянии является значимым эволюционным фактором, действующим на регуляторные участки исследуемого гена.
В целом, результаты проведенного исследования показали применимость эволюционного подхода к анализу формирования структуры наследственной подверженности к ПЭ. Для дальнейшего анализа эволюционной компоненты данной патологии беременности предполагается расширить список изучаемых rSNP.
В отношении данной статьи не было зарегистрировано конфликта интересов.
Список литературы