По итогам работ, выполненных в 2024–2026 годах, в GRCh38.rus интегрировано более 1,8 млн генетических вариантов, специфических для населения России.
"Использование созданного отечественного референса GRCh38.rus позволяет устранить систематические неточности и анализировать миллионы «скрытых» мутаций, которые не могли быть обнаружены ранее из-за неадаптированности зарубежной «референсной» последовательности GRCh38 и особенностей биоинформатических алгоритмов", – подчеркивают в ФМБА.
Вместо международного стандарта
В настоящее время в мире для интерпретации результатов полногеномного секвенирования используется международная референсная последовательность генома человека GRCh38, созданная в 2013 году международным консорциумом Genome Reference Consortium (США и Великобритания).
Этот стандарт применяется как "система координат" при "выравнивании" фрагментов ДНК, полученных в результате секвенирования. GRCh38 представляет собой комбинацию геномов 61 донора: 70% последовательности представляет геном одного человека африкано-европейского происхождения, еще 22% – десяти других доноров, а оставшиеся 7% включают фрагменты от более пятидесяти дополнительных доноров.
Такая конструкция не отражает в полной мере генетические особенности населения отдельных стран и не содержит последовательностей от лиц, проживающих в России, что при использовании GRCh38 российскими учеными повышает риск неточностей и искажений при интерпретации данных, полученных для жителей РФ.
Новая методология оценки результатов секвенирования
Параллельно ФМБА России впервые в нашей стране разработало и апробировало методологию оценки результатов высокопроизводительного секвенирования. Она включает способ оценки точности секвенирования ДНК человека и последующей биоинформатической обработки, а также российский эталонный образец ДНК человека (патент RU 2846268 C1 от 3 сентября 2025 года).
В рамках валидации проведено 27 секвенирований ДНК одного донора с использованием технологий короткоридового и длинноридового полногеномного секвенирования, протоколов пробоподготовки со стадией ПЦР и без нее, с длинами прочтений 2×100, 2×150 и 2×160 нуклеотидов. Дополнительно применялись таргетное секвенирование, полноэкзомное секвенирование и секвенирование отдельных регионов по методу Сэнгера.
Разработанная методология обеспечивает возможность, вне зависимости от приборной базы, способов пробоподготовки и используемого биоинформатического инструментария, объективно оценивать точность секвенирования нуклеиновых кислот и последующей обработки генетических данных.
Внедрение разработанного комплекса биоинформатических инструментов в практику должно повысить воспроизводимость и клиническую достоверность результатов генетических исследований, а также ускорить создание новых высокоточных методов диагностики и персонализированной терапии орфанных и социально значимых заболеваний.

