Выпуск №4, 2024 - стр. 7-19

Компьютерная реконструкция взаимодействия генов, ассоциированных с синдромом Ангельмана DOI: 10.29188/2712-9217-2024-10-4-7-19

Для цитирования: Карпын А.Б., Орлова Н.Г., Рожнова Т.М., Орлов Ю.Л. Компьютерная реконструкция взаимодействия генов, ассоциированных с синдромом Ангельмана. Российский журнал телемедицины и электронного здравоохранения 2024;10(4):7-19; https://doi.org/10.29188/2712-9217-2024-10-4-7-19
  • Карпын А.Б. – студентка Первого Московского государственного медицинского университета им. И.М. Сеченова (Сеченовский университет); Москва, Россия
  • Орлова Н.Г. – к.ф.-м.н., доцент Финансового Университета при Правительстве РФ; Москва, Россия; РИНЦ Author ID 124930
  • Рожнова Т.М. – к.м.н., член-корр. РАЕН, доцент кафедры медицинской генетики ФГАОУ ВО Первого МГМУ имени И.М. Сеченова Минздрава России (Сеченовский университет); Москва, Россия; РИНЦ Author ID 921779
  • Орлов Ю.Л. – д.б.н., проф. РАН, профессор Первого Московского государственного медицинского университета им. И.М. Сеченова (Сеченовский университет); Москва, Россия; РИНЦ Author ID 78993, https://orcid.org/0000-0003-0587-1609
30

ВВЕДЕНИЕ

Реконструкция генных сетей с помощью методов биоинформатики позволяет определять молекулярные и функциональные взаимодействия между генами, ассоциированными с изучаемым заболеванием, определять центральные, узловые гены в сети с целью более эффективного лекарственного воздействия. Компьютерное исследование ассоциированных с заболеванием генов, анализ их взаимодействий расширяют применение интернет-технологий в медицине [1, 2].

Мы рассматриваем анализ генов синдрома Ангельмана – расстройства развития нервной системы, характеризующегося серьезными трудностями в обучении, атаксией, судорожным расстройством, едва заметными дисморфическими чертами лица и изменениями поведения. У большинства детей наблюдается задержка в развитии, не развивается речь [3].

Пациенты с синдромом Ангельмана имеют характерный поведенческий фенотип с резкими движениями, частым и иногда неуместным смехом, расстройством сна. Больные имеют тонкие черты лица, широкий улыбающийся рот, выдающийся подбородок и глубоко посаженные глаза. Такой фенотип вызван различными генетическими аномалиями, включающими область хромосомы 15q11-13, которая подвержена геномному импринтингу. Генетические механизмы обнаруживаются у 85-90% пациентов с клиническим фенотипом, и все они связаны с экспрессией гена UBE3A (ubiquitin-protein ligase E3A), распложенного на данном участке хромосомы 15 [4, 5]. UBE3A демонстрирует тканеспецифичный импринтинг, экспрессируясь исключительно от материнской аллели в головном мозге. В то же время с развитием технологий секвенирования, получением новых геномных данных появляется новая информация о генах и их продуктах, которые могут быть функционально связаны с синдромом Ангельмана. Актуальным является исследование синдрома Ангельмана с помощью современных средств биоинформатики.

Компьютерная реконструкция взаимодействия макромолекул (генов и белков), ассоциированных с исследуемым заболеванием, задает генную сеть – матрицу взаимодействий генов и графическую структуру. Определение ключевых генов заболевания, полученных с помощью анализа структуры генной сети, важно для дальнейшего определения наиболее значимых генов в структуре сети с целью дальнейшего подбора вариантов фармакологических воздействий для лечения [6]. Сама методика использования компьютерных средств для анализа сетевых взаимодействий генов, ассоциированных с наследственными заболеваниями, представляет большой научный интерес. Подобные работы по реконструкции генных сетей с помощью онлайн инструментов биоинформатики проводились нами для других комплексных заболеваний, в частности болезни Паркинсона и шизофрении [7, 8]. В настоящее время компьютерные средства биоинформатики развиваются все более активно, включая онлайнплатформы, средства статистической обработки и визуализации генных сетей, интегрированные с базами данных [6, 8]. Представлены программные конвейеры обработки списков генов, включающие наборы взаимно дополняющих онлайн-инструментов [9].

Решение задачи анализа генов синдрома Ангельмана началось с построения актуального списка ассоциированных генов по существующим базам данных генетической информации, верификации генов по представленности в различных базах. Далее с помощью инструментов биоинформатики выполнена функциональная аннотация, определение категорий генных онтологий для списка генов, выполнена реконструкция генной сети, построена визуализация графической структуры. В нашей работе представлена методика реконструкции генной сети на примере синдрома Ангельмана. Выделены узловые элементы сети, кластеры генов, показаны сетевые взаимодействия с другими заболеваниями.

МАТЕРИАЛЫ И МЕТОДЫ

Составление списка генов, связанных с наследственной предрасположенностью к синдрому Ангельмана, выполнено с помощью интернет-ресурса OMIM (Online Mendelian Inheritance in Man) [10] (https://omim.org/) и GeneCards (GeneCards®: The Human Gene Database) (https://www.genecards.org/) [11]. Эти онлайн ресурсы интегрируют экспериментальную информацию по генам человека и их фенотипическим проявлениям из других баз данных, аннотацию генов NCBI GenBank, функциональную аннотацию белков из базы UniProt (https://uniport.org), информацию по нуклеотидным полиморфизмам из dbSNP (Single Nucleotide Polymorphism database) [12].

По классическому определению синдрома Ангельмана к заболеванию можно отнести лишь ген UBE3A. Интерес представляет расширение списка генов ассоциированных генов, меняющих экспрессию у пациентов, с доказанной связью с фенотипом заболевания. Запрос «Angelman syndrome» к базе данных секвенирования SRA (Short Reads Archive) (https://www.ncbi.nlm.nih.gov/sra) [13] показывает экспериментальные работы данных секвенирования, относящиеся к заболеванию – 338 наборов данных, из которых лишь половина относится к данным по человеку, остальные выполнены на модельных животных. Для определения генов заболевания после перерасчета данных можно выделить дифференциально экспрессирующиеся гены, как ассоциированные с заболеванием. Был выбран путь поиска ассоциированных генов по запросам к базам данным, интегрирующим уже известную экспериментальную информацию.

Ресурсы OMIM [10] и GeneCards [11] были использованы для анализа генов менделевского наследования у человека, поиск проводился по запросу «Angelman syndrome». По нашему запросу (Search: «angelman syndromе» (Search in: Entries with: Genemap; Retrieve: gene map)) база данных OMIM выдает 56 результатов, которые включают 139 официальных символов гена. База данных GeneCards выдает 1,116 результатов.

Реконструкцию генной сети взаимодействий генов синдрома Ангельмана проводили с помощью двух ресурсов STRING-DB [14] и GeneMANIA [15]. Найдено разное количество генов в базе, используемой конкретным ресурсом.

Ресурс GeneMANIA (Multiple Association Network Integration Algorithm) ориентирован на анализ ассоциаций, представленных в научной литературе, с возможностью интерактивного перестроения (отрисовки) графа генной сети онлайн (https://genemania.org). Онлайн-ресурс и база данных STRING (Search Tool for the Retrieval of Interacting Genes) (https://string-db.org/) изначально был ориентирован на анализ белок-белковых взаимодействий, обладает гибким функционалом, возможностями перерисовки, редактирования структуры сети онлайн, статистических оценок связности сети, выполнения операций кластеризации (выделения связных элементов сети).

Анализ категорий генных онтологий выполнялся с помощью ресурса DAVID (Database for Annotation, Visualization and Integrated Discovery) (https://david.ncifcrf.gov/summary.jsp, новый сайт – https://davidbioinformatics.nih.gov/) [16]. Для анализа онтологий по основным группам – биологические процессы, молекулярные функции, клеточные компартменты – использовался ресурс PANTHER (Protein Analysis Through Evolutionary Relationships, http://pantherdb.org) [17].

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Используя ресурсы OMIM и GeneCards [11], по запросу angelman syndrome был получен актуальный список 240 наименований генов. Рассмотрим функциональную аннотацию генов синдрома Ангельмана, интегрируя источники информации с помощью ресурса GeneCards [11].

Онлайн-платформа GeneCards дает оценки релевантности запроса (ассоциированности термина с искомым заболеванием) в вариантах GIFtS (GeneCards Inferred Functionality Scores) по представленности в базах данных [18], и Score («счет» – число упоминаний заданного термина в аннотации каждого конкретного гена в базах данных). Рассмотрим наиболее релевантные гены (приоритезированный список), по GeneCards из более чем 1000 генов (по запросу Аngelman syndrome) (табл. 1).

Из таблицы видно, что первые места по ассоциированности с синдромом Ангельмана занимают Убиквитин Протеинлигаза E3A (UBE3A), как и отмечается в литературе [4, 5], Циклинзависимая Киназа, Подобная 5 (CDKL5), и МетилCpG-связывающий белок 2 (MECP2). Большая часть списка – белок-кодирующие гены.

Интерес представляет описание общих молекулярных функций для генов из полного списка. Далее был выполнен расчет обогащенных категорий и анализ генных онтологий для полного списка генов синдрома Ангельмана с помощью ресурса DAVID. Дополнительно ресурс, ресурс DAVID позволяет рассчитывать перепредставленность терминов по другим базам данных, например по базе данных метаболических путей KEGG (Kyoto Encyclopedia of Genes and Genomes) (представлено группой категорий KEGG_PATHWAY) (https://www.kegg.jp/).


Таблица 1. Гены, ассоциированные с синдромом Ангельмана по данным CeneCards
Table 1. Cene, associated with Angelman syndrome by CeneCards annotation
Официальное имя гена
Official gene name
Описание гена
Gene description
Категория
Category
GIFtS* Счет **
Score **
1 UBE3A Убиквитин-протеинлигаза
E3A Ubiquitin Protein Ligase E3A
Белок-кодирущий ген
Protein Coding
57 135,76
2 CDKL5 Циклинзависимая киназа, подобная 5
Cyclin Dependent Kinase Like 5
Белок-кодирущий ген
Protein Coding
52 113,38
3 MECP2 Белок, связывающий метил-CpG 2
Methyl-CpG Binding Protein 2
Белок-кодирущий ген
Protein Coding
55 111,98
4 TP53 Опухолевый белок P53
Tumor Protein P53
Белок-кодирущий ген
Protein Coding
62 107,04
5 FBN1 Фибриллин 1
Fibrillin 1
Белок-кодирущий ген
Protein Coding
56 105,08
6 SNHG14 Ген-хозяин малой ядрышковой РНК 14
Small Nucleolar RNA Host Gene 14
Ген длинной некодируюшей РНК (lncRNA)
RNA Gene (lncRNA)
24 101,50
7 PTCH1 Патчированный 1
Patched 1
Белок-кодирущий ген
Protein Coding
60 95,58
8 KMT2D Лизинметилтрансфераза 2D
Lysine Methyltransferase 2D
Белок-кодирущий ген
Protein Coding
53 73,87
9 CDH1 Кадхерин 1
Cadherin 1
Белок-кодирущий ген
Protein Coding
58 71,61
10 SNRPN Полипептид малого ядерного рибонуклеопротеина N
Small Nuclear Ribonucleoprotein Polypeptide N
Белок-кодирущий ген
Protein Coding
53 60,17
11 NLRP3 Пириновый домен семейства NLR, содержащий 3 NLR
Family Pyrin Domain Containing 3
Белок-кодирущий ген
Protein Coding
57 58,88
12 PEX1 Фактор биогенеза пероксисом 1
Peroxisomal Biogenesis Factor 1
Белок-кодирущий ген
Protein Coding
53 57,03
13 AR Рецептор андрогена
Androgen Receptor
Белок-кодирущий ген
Protein Coding
60 56,23
14 CDKN2A Ингибитор циклинзависимой киназы 2A
Cyclin Dependent Kinase Inhibitor 2A
Белок-кодирущий ген
Protein Coding
60 54,55
15 BBS4 Синдром Барде-Бидля 4
Bardet-Biedl Syndrome 4
Белок-кодирущий ген
Protein Coding
50 54,35
16 CDKN1C Ингибитор циклин-зависимой киназы 1C
Cyclin Dependent Kinase Inhibitor 1C
Белок-кодирущий ген
Protein Coding
53 53,16
17 NSD1 Белок, связывающий набор доменов ядерного рецептора 1
Nuclear Receptor Binding SET Domain Protein 1
Белок-кодирущий ген
Protein Coding
53 50,19
18 KIF7 Член семейства кинезинов 7
Kinesin Family Member 7
Белок-кодирущий ген
Protein Coding
48 48,09
19 POLGARF Альтернативная рамка считывания POLG
POLG Alternative Reading Frame
Белок-кодирущий ген
Protein Coding
17 47,30
20 SLC9A6 Семейство растворимых носителей 9, член A6
Solute Carrier Family 9 Member A6
Белок-кодирущий ген
Protein Coding
54 46,61

Примечание: * счет (оценка) функциональной аннотации гена GIFtS (GeneCards Inferred Functionality Scores) по представленности в базах данных, следуя [18];

** счет релевантности оценивает соответствие поисковому запросу в базе данных по синдрому Ангельмана (Angelman syndrome).

Note: * score (estimate) of gene functionalityа GIFtS (GeneCards Inferred Functionality Scores) is counted following method described in [18];

** score of relevance to the search term in the databases (for term Angelman syndrome).


Таблица 2 содержит Категории генных онтологий с указанием группы данных в базе DAVID (Биологические процессы – GOTERM_BP_DIRECT, Клеточные компоненты – GOTERM_CC_DIRECT, Молекулярные функции – GOTERM_MF_DIRECT, Пути KEGG – KEGG_PATHWAY); термины онтологий, которые обогащены в данном наборе генов; процент генов в выборке; уровень значимости для перепредставленности онтологий в данном набоек P-Value и корректированное P* (коррекция Бонферрони на множественность гипотез). Из таблицы 2 видно, что наиболее значимыми группами онтологий для генов синдрома Ангельмана являются регуляция транскрипции, хроматин, развитие синапсов, работа гормонов (оригинальные термины positive regulation of transcription from RNA polymerase II promoter, chromatin, postsynapse, GABA-A receptor complex, hormone activity, Endocrine resistance). Действительно, данное заболевание связано с развитием, функцией гормонов, и вовлеченность таких категорий онтологий обоснована.


Таблица 2. Категории генных онтологий для генов, ассоциированных с синдромом Ангельмана, рассчитанные с помощью ресyрса DAYID
Table 2. Cene ontology categories for the genes associated with Angelman Syndrome, calculated using the DAYID resource
Категории онтологий
Group of ontologies
Термины онтологий
Ontology term
% генов
% genes
Знач. P
P
-value
P*
Биологические процессы
GOTERM_BP_DIRECT
Реакция на эстрадиол
Response to estradiol
5,8 7,0E-12 1,7E-8
Биологические процессы
GOTERM_BP_DIRECT
Положительная регуляция транскрипции с промотора РНК-полимеразы II
Positive regulation of transcription from RNA polymerase II promoter
17,5 2,7E-10 6,4E-7
Клеточные компоненты
GOTERM_CC_DIRECT
Хроматин
Chromatin
15,0 4,1E-9 1,7E-6
Клеточные компоненты
GOTERM_CC_DIRECT
Постсинапс Postsynapse 5,4 2,6E-8 1,1E-5
Клеточные компоненты
GOTERM_CC_DIRECT
ГАМК-рецепторный комплекс
GABA-A receptor complex
2,9 3,1E-8 1,3E-5
Молекулярные функции
GOTERM_MF_DIRECT
Гормональная активность
Hormone activity
5,0 2,8E-8 1,5E-5
Пути KEGG
KEGG_PATHWAY
Эндокринная резистентность
Endocrine resistance
5,4 6,2E-8 1,6E-5
Молекулярные функции
GOTERM_MF_DIRECT
Активность ГАМК-рецепторов
GABA-A receptor activity
2,9 3,5E-8 1,8E-5
Молекулярные функции
GOTERM_MF_DIRECT
ДНК-связывающая
DNA binding
16,2 3,8E-8 2,0E-5
Биологические процессы
GOTERM_BP_DIRECT
Cинаптическая передача, ГАМКергическая
Synaptic transmission, GABAergic
3,3 1,1E-8 2,7E-5
Пути KEGG
KEGG_PATHWAY
Взаимодействие нейроактивных лиганд-рецепторов
Neuroactive ligand-receptor interaction
9,6 1,3E-7 3,3E-5
Пути KEGG
KEGG_PATHWAY
Старение клеток
Cellular senescence
6,2 2,5E-7 6,6E-5
Рецептор андрогена
Androgen Receptor
Активность ГАМК-зависимых хлорид-ионных каналов
GABA-gated chloride ion channel activity
2,5 1,6E-7 8,6E-5
Пути KEGG
KEGG_PATHWAY
Рак поджелудочной железы
Pancreatic cancer
4,6 4,1E-7 1,1E-4
Пути KEGG
KEGG_PATHWAY
Пути развития рака
Pathways in cancer
11,2 4,5E-7 1,2E-4
Биологические процессы
GOTERM_BP_DIRECT
Положительная регуляция каскада МАРК
Positive regulation of MAPK cascade
5,8 5,3E-8 1,3E-4
Биологические процессы
GOTERM_BP_DIRECT
Положительная регуляция экспрессии генов
Positive regulation of gene expression
9,6 6,2E-8 1,5E-4
Клеточные компоненты
GOTERM_CC_DIRECT
Синапс Synapse 8,8 4,4E-7 1,8E-4
Клеточные компоненты
GOTERM_CC_DIRECT
Проекция нейронов
Neuron projection
6,7 1,0E-6 4,2E-4
Молекулярные функции
GOTERM_MF_DIRECT
Активность внеклеточных ионных каналов, управляемых лигандами
Extracellular ligand-gated ion channel activity
2,9 8,4E-7 4,4E-4
Клеточные компоненты
GOTERM_CC_DIRECT
Комплекс хлоридных каналов
Chloride channel complex
3,3 1,5E-6 6,3E-4
Молекулярные функции
GOTERM_MF_DIRECT
Связывание протеинкиназы
Protein kinase binding
8,3 1,2E-6 6,4E-4
Молекулярные функции
GOTERM_MF_DIRECT
Связывание хроматина
Chromatin binding
8,3 1,4E-6 7,3E-4
Клеточные компоненты
GOTERM_CC_DIRECT
ГАМКергический синапс
GABAergic synapse
3,8 2,0E-6 8,3E-4
Пути KEGG
KEGG_PATHWAY
Глиома
Glioma
4,2 3,5E-6 9,2E-4

Примечание к таблице: P* – корректированное по Бонферрони значение уровня значимости p

Table Note: P* – corrected by Bonferroni P-value


Из таблицы видна обогащенность набора генов синдрома Ангельмана категориями онкологических заболеваний, например глиомы, что может быть связано с нарушениями работы клеток мозга.

Для дальнейшего уточнения категорий онтологий на независимой базе данных использовался ресурс PANTHER (Protein ANalysis THrough Evolutionary Relationships) (http://pantherdb.org/). Данные PANTHER ассоциированы с полной базой онтологий генов человека ресурса Gene Ontology (https://geneontology.org/ ). Из набора исходных генов часть идентификаторов были не распознаны системой. С помощью PANTHER построена таблица онтологий (табл. 3) для категорий биологических процессов. Для получения наиболее информативных результатов значения P были ограничены с учетом коррекции Бонферрони. Таблица содержит три стандартных раздела: онтологии для биологических процессов, молекулярных функций и клеточных компонент (компартментов), обогащения числа генов в наборе в разы (параметр Fold Change) по сравнению с ожидаемым, и корректированное значение P (вероятность получить такое число генов по случайным причинам).


Таблица 3. Категории генных онтологий для генов синдрома Ангельмана, рассчитанные с помощью ресyрса PANTHER
Table 3. Cene ontology categories for genes associated with Angelman syndrome calculated by PANTHER tool
Категории генных онтологий для биологических процессов
Gene Ontology Categories for Biological Processes
FC* P*
Регуляция процесса развития
Regulation of developmental process
3,43 1,94E-16
Процесс развития
Developmental process
2,3 2,06E-16
Системы развития
System development
2,72 4,98E-15
Развитие многоклеточного организма
Multicellular organism development
2,57 9,56E-15
Реакция на эндогенный стимул
Response to endogenous stimulus
4,5 1,59E-14
Процессы многоклеточного организма
Multicellular organismal process
2,07 2,26E-14
Развитие анатомических структур
Anatomical structure development
2,31 5,53E-14
Регуляция биологического качества
Regulation of biological quality
2,64 1,06E-13
Категории генных онтологий для молекулярных функций
Gene Ontology Categories for Molecular Functions
FC* P*
Гормональная активность
Hormone activity
3,43 2,24-E7
Активность анионных каналов, управляемых лигандами
Ligand-gated anion channel activity
2,3 1,87E-6
ГАМК-управляемая активность хлорид-ионного канала
GABA-gated chloride ion channel activity
2,72 1,46E-5
Сигналы связывающих рецепторов
Signaling receptor binding
2,57 2,28E-5
Белковый связывающий комплекс
Protein-containing complex binding
4,5 8,13E-5
Активность ГАМК-рецептора
GABA-A receptor activity
2,07 9,2E-5
Категории клеточных компартментов
Cellular compartment categories
FC* P*
Синапсы
Synapse
3,81 3,49E-10
Ципоплазматические везикулы
Cytoplasmic vesicles
2,78 2,0E-9
Внутриклеточная везикула
Intracellular vesicle
2,78 2,09E-09
Везикулы
Vesicle
2,19 5,0E-8
Белковый комплекс
Protein-containing complex
1,88 1,17E-7
Мембранные органеллы
Membrane-bounded organelle
1,36 2,16E-7
Внутриклеточные мембранные органеллы
Intracellular membrane-bounded organelle
1,39 7,68E-7

Примечание: FC* (fold change) – превышение наблюдаемого числа генов в наборе к ожидаемому (по общей доле генов данной категории онтологий в геноме)

Note: FC* (fold change) – ratio of observed number of genes in the sample to the number expected by chance


Приведенные в таблице 3 оценки обогащенности онтологий показывают, что наиболее значимыми для генов синдрома Ангельмана по биологическим процессам являются категории регуляции процесса развития, регуляции на эндогенный стимул и развитие анатомических структур. По молекулярным функциям наиболее значимыми являются категории гормональной активности, активность анионных каналов, связывания рецепторов, белков, а также активность ГАМК-рецепторов. Для клеточных компартментов наиболее значимые категории в проявлении синдрома Ангельмана – синапсы, везикулы и другие категории, связанные с нервной тканью. Данные таблиц 2 и 3, построенных с помощью разных программных инструментов DAVID и PANTHER для исследуемых генов синдрома Ангельмана, подтверждают общие категории генных онтологий – это процессы развития организма, гормональная активность, компоненты нейрона. Таким образом, можно дать функциональное описание данного заболевания как болезни роста, нервной системы с нарушениями работы мозга.

Далее для реконструкции и визуализации генной сети ассоциированных с синдром Ангельмана генов использовались онлайн-инструменты GeneMANIA и STRING-DB (https://string-db.org/). Структура сети по GeneMANIA (http://genemania.org/search/homo-sapiens/UBE3A/CDKL5/MECP2/TP53/FBN1/SNH... C/NSD1/KIF7/POLGARF/SLC9A6//) представлена на рисунке 1.


Генная сеть генов синдрома Ангельмана, реконструированная с помощью ресурса GeneMANIA
Рис. 1. Генная сеть генов синдрома Ангельмана, реконструированная с помощью ресурса GeneMANIA (http://genemania.org/)
Fig. 1. Gene network of genes associated with Angelman syndrome reconstructed by GeneMANIA (http://genemania.org/)

На рисунке 1 показана генная сеть взаимодействий для 20 генов синдрома Ангельмана (табл. 1), реконструированная с помощью онлайнинструмента GeneMANIA (http://genemania.org/). Сеть включает взаимодействия, автоматически построенные по литературным данным и собранные на данном открытом ресурсе. Заданные по списку гены показаны на рисунке большими черными кругами со штриховкой, контактирующие с ними гены представлены кругами меньшего размера. Расположение по окружности является одним из параметров визуализации системы GeneMANIA.

В построенной сети (рис. 1) находятся гены (продукты генов – белки), имеющие большое число связей с другими элементами – UBE3A, MECP2, SNHG14. При этом видно, что не все узлы связаны друг с другом.

Гены в реконструированной сети имеют взаимодействия разных типов, установленные как экспериментально (физические взаимодействия – Physical interaction), так и по косвенным данным (совместная экспрессия, совместная локализация в геноме Co-expression, Co-localization) (рис. 2).


Параметры взаимодействий для генов синдрома Ангельмана, представленные в инструменте GeneMANIA
Рис. 2. Параметры взаимодействий для генов синдрома Ангельмана, представленные в инструменте GeneMANIA
Fig. 2. Interaction parameters for Angelman syndrome genes presented in the GeneMANIA tool

Основные типы взаимодействий (выделено цветом), использованные при построении сети на основе литературных источников – белок-белковые контакты (физические взаимодействия), совместная экспрессия, в меньшей степени – генетические взаимодействия.

Рисунок 2 показывает большее участие физических взаимодействий между макромолекулами в данной сети.

Далее мы использовали ресурс STRING-DB для реконструкции генной сети по заданному списку генов, расширив его до 240 имен генов (официальных символов – official gene symbol). Использовались параметры по умолчанию (белок-белковые контакты, экспериментальные данные, совместная локализация генов, аналогично используемым в инструменте GeneMANIA). Из-за большого числа связей разных типов сеть представляет собой сложный рисунок. Мы использовали ограничение визуализации в STRING-DB только на экспериментально доказанные взаимодействия.

Рисунок 3 представляет результат реконструкции генной сети синдрома Ангельмана с помощью STRING-DB с учетом только экспериментально доказанных взаимодействий.

Статистика структуры сети показала, что сеть имеет неслучайно большое число связей, хотя есть и не связанные гены. Связи соответствуют определенным взаимодействиям – физическим, генетическим, регуляторным, как и в системе GeneMANIA (рис. 1). Статистические оценки структуры сети генов синдрома Ангельмана в STRING-DB (https://string-db.org/) показывают высокую связность (значимость <1,0E-16). Средняя степень связности узла сети – 3.21, коэффициент кластеризации – 0.357. Общее число узлов сети (распознано имен генов) – 205, число связей между ними – 329 (при ожидаемом по случайным причинам – 166). На рисунке можно выделить несколько кластеров сети, самый большой из которых включает гены UBE3A, GABRB3, ATP10A, SNRPN. Кластеры сети показаны на рисунке 4 (кластеризация выполнена по методу k-средних (k-means clustering), инструмент в программе STRING-DB).

Большой кластер (показан красным цветом) занимает центральную позицию полученной сети и более детально представляет большую структуру сети, построенную по тем же генам на рисунке 3. Кластер связан с наибольшим числом других объектов.


Реконструкция сети взаимодействий генов синдрома Ангельмана с помощью STRING-DB
Рис. 3. Реконструкция сети взаимодействий генов синдрома Ангельмана с помощью STRING-DB (https://string-db.org/)
Fig. 3. Reconstruction of the network of interactions of Angelman syndrome genes using STRING-DB (https://string-db.org/)

На рисунке 4 видно присутствие в сети кластеров генов меньшего размера, не связанных непосредственно с основным кластером, включающим UBE3A.

Ген UBE3A кодирует убиквитин-белковую лигазу Е3, входящую в систему деградации белка убиквитина [3, 4]. Этот импринтированный ген экспрессируется в мозге и биаллельно экспрессируется в других тканях. Унаследованная от матери делеция этого гена вызывает синдром Ангельмана, характеризующийся выраженной моторной и интеллектуальной задержкой, атаксией, гипотонией, эпилепсией, отсутствием речи и характерными чертами лица. Белок взаимодействует с белком Е6 вируса папилломы человека типов 16 и 18, что приводит к убиквитинированию и протеолизу опухолевого белка р53.

Мутации в гене CDKL5 были связаны с синдромом Х-сцепленного инфантильного спазма (синдром Веста) и синдромом Ретта [19]. Также отмечается, что мутации CDKL5 шире, чем сообщалось ранее. Они являются важной причиной инфантильных спазмов и ранних эпилептических припадков у пациенток женского пола, а также более поздних трудноизлечимых судорожных расстройств [19].

Взаимосвязь между заболеваниями рассматривалась с помощью ресурса MalaCards [20], интегрирующего данные по генетическим заболеваниям и расстройствам. Реконструкция сети заболеваний возможна по общим признакам, связывающим каждую пару заболеваний, таким как гены, метаболиты, симптомы, общие лекарственные средства, упоминание в литературе. Рассмотрим аннотацию самого заболевания на ресурсе MalaCards (https://www.malacards.org/card/ angelman_syndrome), входящем в платформу GeneCards (рис. 5).

На рисунке 5 видна связь синдрома Ангельмана с хромосомными нарушениями, синдромом Ретта, с синдромом Прадера-Вилли, что подтверждается наличием общих генов и общих симптомов.


Кластеры сети взаимодействий генов синдрома Ангельмана. Кластеризация выполнена в STRING-DB
Рис. 4. Кластеры сети взаимодействий генов синдрома Ангельмана. Кластеризация выполнена в STRING-DB (https://string-db.org/)
Fig. 4. Clusters of the network of interactions of the genes of Angelman syndrome. Clustering is performed in STRING-DB (https://string-db.org/)

Связанные заболевания для синдрома Ангельмана по MalaCards
Рис. 5. Связанные заболевания для синдрома Ангельмана по MalaCards (https://www.malacards.org/card/angelman_syndrome)
Fig. 5. Related diseases for Angelman syndrome by MalaCards (https://www.malacards.org/card/angelman_syndrome)

Ресурс MalaCards представляет свой набор генов, так называемые «элитные» гены, описанные в литературе и ассоциированные с данным заболеванием (https://www.malacards.org/card/angelman_syndrome). Список представлен в таблице 4.

Список генов в Таблице 4 отличается от других списков, сохраняя, тем не менее, самые важные гены, такие как UBE3A, а также показывает число публикаций в PubMed, описывающих связь гена с заболеванием – синдромом Ангельмана. Интересно отметить, что наибольшее число связей в генной сети соответствует месту гена синдрома Ангельмана в приоретизированном списке как по Таблице 1 (построенной с помощью ресурса GeneCards), так и по таблице 4 (MalaCards).

Связь между заболеваемостью синдромом Ангельмана и локусом, содержащим гены, наиболее интересна для изучения, поскольку мутации в хромосомной области человека 15q11-q13 имеют гены, импринтированные по материнской линии (т. е. экспрессированные по отцовской линии), гены, импринтированные по отцовской линии (т. е. экспрессированные по материнской линии), и биаллельно экспрессированные гены [21].

Генетические исследования человека показали, что синдром Ангельмана вызван 4 молекулярными механизмами: de novo материнскими делециями хромосомы 15q11-q13 (70-80%); внутригенными мутациями в унаследованном от матери UBE3A в пределах хромосомы 15q11-q13 (10-20%); отцовской унипарентальной дизомией для хромосомы 15q11-q13 (3-5%); дефектами импринтинга в хромосоме 15q11-q13, изменяющими экспрессию унаследованного от матери UBE3A (3-5%). Существует вариабельность для каждого молекулярного класса синдрома Ангельмана: пациенты с делецией имеют более тяжелый фенотип, а те, у кого наблюдаются дефекты импринтинга, менее тяжелый фенотип [22, 23]. Известны случаи заболевания расстройствами аутического спектра и синдромом Ангельмана, вызванные общей хромосомной делецией [22].

ЗАКЛЮЧЕНИЕ

Реконструкция генных сетей, основанная на анализе данных генов, вызывающих синдром Ангельмана, приводит к выявлению сетевых структур, функционально связанных с генами риска заболевания. Обнаружение функциональных связей будет иметь жизненно важное значение для разработки эффективных подходов к лечению. Учитывая совпадение симптомов с другими нарушениями развития нервной системы, ожидается, что эти данные будут широко применяться.

Исследование связанных заболеваний (сети заболеваний), в частности, с помощью MalaCards позволяет определить лекарственные средства, уже применяемые для лечения других заболеваний. Представленное использование онлайн инструментов биоинформатики создает методический задел для анализа генов редких наследственных заболеваний, расширяя применение для других заболеваний [7, 8]. Дальнейшее исследование синдрома Ангельмана требует объединения клинических и биоинформационных исследований для построения более точных моделей.


Таблица 4. Наиболее важные («элитные») гены синдрома Ангельмана по данным MalaCards (https://www.malacards.org)
Table 4. The most important («elite») genes of Angelman syndrome according to MalaCards (https://www.malacards.org)
Имя гена
Gene Name
Описание гена
Gene description
Тип гена
Gene type
Число публикаций
Number of publications
1 UBE3A Убиквитин-протеинлигаза E3A
Ubiquitin Protein Ligase E3A
Белок-кодирущий ген
Protein Coding
100
2 SNHG14 Ген-хозяин малой ядрышковой РНК 14
Small Nucleolar RNA Host Gene 14
Ген РНК
RNA Gene
41
3 MECP2 Белок, связывающий метил-CpG 2
Methyl-CpG Binding Protein 2
Белок-кодирущий ген
Protein Coding
20
4 CDKL5 Циклинзависимая киназа, подобная 5
Cyclin Dependent Kinase Like 5
Белок-кодирущий ген
Protein Coding
1
  5   GABRG3 Субъединица рецептора Гамма-аминомасляной кислоты типа А Гамма 3
Gamma-Aminobutyric Acid Type A Receptor Subunit Gamma3
Белок-кодирущий ген
Protein Coding
 
6 TPP1 Трипептидилпептидаза 1
Tripeptidyl Peptidase 1
Белок-кодирущий ген
Protein Coding
 

ЛИТЕРАТУРА

1. Лебедев Г.С., Шадеркин И.А., Фомина И.В., Лисненко А.А., Рябков И.В., Качковский С.В., Мелаев Д.В. Эволюция интернеттехнологий в системе здравоохранения. Журнал телемедицины и электронного здравоохранения 2017;2(4):63-78. [Lebedev G.S., Shaderkin I.A., Fomina I.V., Lisnenko A.A., Ryabkov I.V., Kachkovsky S.V., Malaev D.V. Evolution of Internet technologies in the healthcare system. Rossiyskiy zhurnal telemeditsiny i elektronnogo zdravookhraneniya = Russian Journal of Telemedicine and E-Health 2017;2(4):63-78. (In Russian)]. https://doi.org/10.29188/2542-2413-2017-3-2-63-78.
2. Koshechkin KA, Lebedev GS, Fartushnyi EN, Orlov YL. Holistic Approach for Artificial Intelligence Implementation in Pharmaceutical Products Lifecycle: A Meta-Analysis. Applied Sciences 2022;12(16):8373. https://doi.org/10.3390/app12168373.
3. Buiting K, Williams C, Horsthemke B. Angelman syndrome – insights into a rare neurogenetic disorder. Nat Rev Neurol 2016;12(10):584-93. https://doi.org/10.1038/nrneurol.2016.133.
4. Archer HL, J Evans, S Edwards, J Colley, R Newbury-Ecob, F O'Callaghan, et al. CDKL5 mutations cause infantile spasms, early onset seizures, and severe mental retardation in female patients. J Med Genet 2006;43(9):729-34. https://doi.org/10.1136/jmg.2006.041467.
5. Yang L, Shu X, Mao S, Wang Y, Du X, Zou C. Genotype-Phenotype Correlations in Angelman Syndrome. Genes (Basel) 2021;12(7):987. https://doi.org/10.3390/genes12070987.
6. Turkina VA, Orlova NG, Orlov YL. Biophysics education section and computational training discussion at VII Congress of Russian Biophysicists. Biophysical Reviews 2023;15:807-9. https://doi.org/10.1007/s12551-02301147-5.
7. Дохоян А.Ю., Глущенко М.В., Орлов Ю.Л. Реконструкция генной сети шизофрении для поиска генов-мишеней. Ульяновский медикобиологический журнал 2022;3:6-22. [Dokhoyan A.Yu., Glushchenko M.V., Orlov Y.L. Reconstruction of schizophrenia gene network in search for target genes. Ul'yanovskiy mediko-biologicheskiy zhurnal = Ulyanovsk Medical and Biological Journal 2022;3:6-22. (In Russian)]. https://doi.org/10.34014/2227-1848-2022-3-6-22.
8. Орлов Ю.Л., Галиева А.Г., Орлова Н.Г., Иванова Е.Н., Мозылева Ю.А., Анашкина А.А. Реконструкция генной сети болезни Паркинсона для поиска генов-мишеней. Биомедицинская химия 2021;67(3):222-30. [Orlov Y.L., Galieva A.G., Orlova N.G., Ivanova E.N., Mozyleva Y.A., Anashkina A.A. Reconstruction of gene network associated with Parkinson disease for gene targets search. Biomeditsinskaya khimiya = Biomedical chemistry 2021;67(3):222-30. (In Russian)]. https://doi.org/10.18097/PBMC20216703222.
9. Gubanova NV, Orlova NG, Dergilev AI, Oparina NY, Orlov YL. Glioblastoma gene network reconstruction and ontology analysis by online bioinformatics tools. Journal of Integrative Bioinformatics 2021;18:20210031. https://doi.org/10.1515/jib-2021-0031.
10. Amberger JS, Bocchini CA, Schiettecatte F, Scott AF, Hamosh A. OMIM.org: Online Mendelian Inheritance in Man (OMIM®), an online catalog of human genes and genetic disorders. Nucleic Acids Res 2015;43:D789-D798. https://doi.org/10.1093/nar/gku1205.
11. Safran M., Dalah I., Alexander J., Rosen N., Iny Stein T., Shmoish M., et al. GeneCards Version 3: the human gene integrator. Database: the journal of biological databases and curation 2010;2010:baq020. https://doi.org/10.1093/database/baq020.
12. Smigielski EM, Sirotkin K, Ward M, Sherry ST. dbSNP: a database of single nucleotide polymorphisms. Nucleic Acids Res 2000;28(1):352-5. https://doi.org/10.1093/nar/28.1.352.
13. Sayers EW, O'Sullivan C, Karsch-Mizrachi I. Using GenBank and SRA. Methods Mol Biol 2022;2443:1-25. https://doi.org/10.1007/978-1-0716-2067-0_1.
14. Szklarczyk D, Kirsch R, Koutrouli M, Nastou K, Mehryary F, Hachilif R, et al. The STRING database in 2023: protein-protein association networks and functional enrichment analyses for any sequenced genome of interest. Nucleic Acids Res 2023;51(D1):D638-D646. https://doi.org/10.1093/nar/gkac1000.
15. Mostafavi S, Ray D, Warde-Farley D, Grouios C, Morris Q. GeneMANIA: a real-time multiple association network integration algorithm for predicting gene function. Genome Biol 2008;9(Suppl 1):S4. https://doi.org/10.1186/gb-2008-9-s1-s4.
16. Sherman BT, Hao M, Qiu J, Jiao X, Baseler MW, Lane HC, et al. DAVID: a web server for functional enrichment analysis and functional annotation of gene lists (2021 update). Nucleic Acids Res 2022;50(W1):W216-W221. https://doi.org/10.1093/nar/gkac194.
17. Mi H, Muruganujan A, Ebert D, Huang X, Thomas PD. PANTHER version 14: more genomes, a new PANTHER GO-slim and improvements in enrichment analysis tools. Nucleic Acids Res 2019;47(D1):D419-D426. https://doi.org/10.1093/nar/gky1038.
18. Harel A, Inger A, Stelzer G, Strichman-Almashanu L, Dalah I, Safran M, Lancet D. GIFtS: annotation landscape analysis with GeneCards. BMC Bioinformatics 2009;10:348. https://doi.org/10.1186/1471-2105-10-348.
19. Jiang Y, Lev-Lehman E, Bressler J, Tsai TF, Beaudet AL. Genetics of Angelman syndrome. Am J Hum Genet 1999;65(1):1-6. https://doi.org/10.1086/302473.
20. Rappaport N, Twik M, Plaschkes I, Nudel R, Iny Stein T, Levitt J, et al. MalaCards: an amalgamated human disease compendium with diverse clinical and genetic annotation and structured search. Nucleic Acids Res 2017;45(D1):D877-D887. https://doi.org/10.1093/nar/gkw1012.
21. Magenis RE, Brown MG, Lacy DA, Budden S, LaFranchi S. Is Angelman syndrome an alternate result of del(15)(q11q13)? Am J Med Genet 1987;28(4):829-38. https://doi.org/10.1002/ajmg.1320280407.
22. Peters SU, Horowitz L, Barbieri-Welge R, Taylor JL, Hundley RJ. Longitudinal follow-up of autism spectrum features and sensory behaviors in Angelman syndrome by deletion class. J Child Psychol Psychiatry 2012;53(2):152-9. https://doi.org/10.1111/j.1469-7610.2011.02455.x.
23. Tan WH, Bacino CA, Skinner SA, et al. Tan WH, Bacino CA, Skinner SA, et al. Angelman syndrome: Mutations influence features in early childhood. Am J Med Genet A 2011;155A(1):81-90. https://doi.org/10.1002/ajmg.a.33775.
Прикрепленный файлРазмер
Скачать файл2.46 Мб
синдром Ангельмана; наследственные заболевания; базы данных; генные онтологии; генные сети; сеть заболеваний

Я хочу получать электронную версию журнала


Мы в соцсетях

  • VK