6 Декабря, 4:47

«Полное описание генома человека занимает не менее 200 гигабайт»

26 Сентября 2016, 18:08
6337
Фото: ЕМС

Директор сколковского Центра разработок Dell EMC – о том, как  большие данные изменят медицину

7 сентября 2016 года закрылась крупнейшая в истории ИТ-индустрии сделка – американская компьютерная корпорация Dell за $67 млрд приобрела компанию ЕМС, лидера на глобальном рынке хранения и обработки данных. «Большие данные» (Big Data) применяются во множестве областей человеческой деятельности, и медицина ‒ одно из самых перспективных направлений. Генеральный директор Центра исследований и разработок в Dell EMC Леонид Левкович-Маслюк рассказал Vademecum, что такое биоинформатика и какие возможности она открывает для создания принципиально новых методов диагностики и лечения.

‒ Начнем с определений: что такое биоИТ, или биоинформатика?

‒ Это информационные технологии (ИТ) для биологии и медицины. Сейчас возникает персонализированная медицина,  основанная на обработке и анализе больших массивов новых типов данных. Прежде всего это молекулярные данные, получаемые путем анализа структуры молекул ДНК (их изучает геномика), молекул РНК (транскриптомика), белковых молекул (протеомика) и других типов подобных данных, называемых «омиксными». Такие данные стали входить в широкий обиход в медицине совсем недавно. Они очень велики по объему. Полное описание генома человека занимает не менее 200 гигабайт. Структура этих данных крайне сложна, их медицинская интерпретация далеко не всегда ясна, поиск такой интерпретации ‒ это предмет активнейших исследований. Но именно такие данные могут дать наиболее полную индивидуальную картину состояния  организма пациента. Кроме того, есть еще и традиционные данные (результаты всевозможных анализов, двухмерные и трехмерные изображения, записи и назначения в медицинской карте). Информационные  технологии, которые объединяют  все такие данные, позволяя эффективно извлекать из них полезную информацию, и есть биоИТ. Сейчас специалисты стремятся к тому, чтобы врач мог, условно говоря, нажать кнопку и получить доступ ко всей этой информации, провести ее анализ с помощью специализированных программных инструментов и получить конкретные рекомендации по диагностике или лечению. Задачи биоИТ включают в себя разработку таких инструментов, инженерию данных, создание необходимых программных и аппаратных платформ.

‒ Как биоИТ уже сейчас применяются в медицине?

‒ Например, при скрининге новорожденных на известные наследственные заболевания расшифровка структуры их ДНК (секвенирование) дает чрезвычайно полезную информацию. Раньше новорожденных проверяли на генетические болезни иначе ‒ с помощью нескольких стандартных тестов на присутствие в крови определенных веществ ‒ биомаркеров. Этот подход давал много ошибок. С использованием геномного секвенирования появилась возможность ставить диагноз гораздо точнее, при помощи специальных программ глубоко анализируя мутации, обнаруженные в геномных данных младенца. Кроме того, секвенирование помогает находить и ранее не известные мутации, приводящие к этим же болезням. Чем раньше диагностируют такую болезнь, тем больше шансов вовремя начать правильное лечение.

БиоИТ очень важны для  онкологии. Здесь есть два направления. Во-первых, обеспечить наиболее эффективное лечение. После совместного компьютерного анализа ДНК опухоли и здоровой ткани в некоторых случаях можно заранее сказать, что один из типов химиотерапии точно не подействует на пациента, а другой – подействует. Сейчас такие принципы лечения уже начинают использовать.

днк.jpg

Фото: schd.ws

Второе направление, как считают многие специалисты, еще более перспективное, – ранняя диагностика. Смертность в онкологии была бы гораздо ниже, а лечение – эффективнее, если бы все опухоли удавалось обнаружить на ранних стадиях. Сейчас многие исследователи работают над поиском надежных биомаркеров для ранней диагностики заболеваний на основе секвенирования  ДНК и/или РНК. Это требует выявления изменений в процессе создания белковых молекул и в спектре самих белковых молекул (так называемой экспрессии генов). Среди них нужно найти признаки, характерные для ранних стадий различных заболеваний – онкологических, инфекционных, аутоиммунных. Такой анализ требует объемных компьютерных вычислений, а также подготовки большого объема молекулярных данных разной природы.

– Какие компании занимаются биоинформатикой?

– БиоИТ занимаются многие крупнейшие компании, среди которых Dell EMC, Microsoft, Intel и другие. Но очень важную роль в этой индустрии играют и множество малых и средних стартапов, которые прекрасно встроились в рынок. Они создают специализированные решения для обработки медицинских и омиксных данных, некоторые из них уже достигли миллиардной капитализации.

В России тоже есть такие стартапы, но их немного, и в основном они находятся на ранней стадии развития. Например, недавно мы работали с питерской  компанией ParseqLab. Мы для них сделали программную платформу, которая помогает работать с геномными данными о наследственных заболеваниях, это как раз тот вид исследований, о котором я только что рассказывал. Насколько я знаю, планируется подключить эту компанию к скринингу новорожденных в Ленинградской области.

– Где хранятся «большие данные»?

– Уже созданы и поддерживаются базы данных, связывающие между собой информацию о структуре генома у конкретного больного, описание симптомов его болезни, описание применявшегося лечения. Крупных баз данных такого типа сейчас несколько десятков в мире, в них вносят вклад различные медицинские и исследовательские группы.

Есть также базы данных, которые ведут крупные фармкомпании. В некоторых больницах уже сейчас собраны колоссальные массивы медицинских данных, в том числе и геномных. Однако эти организации не имеют права делиться данными даже для исследовательских целей, так как это очень чувствительная информация, которая считается одной из самых охраняемых и защищаемых в мире. Все очень боятся ее утечки и того, что она будет использоваться во вред. И в этом заключается большая проблема, потому что для исследовательских целей нужно как можно больше такой информации.

bioinformatics.jpg

Фото: thecureisnow.org

С другой стороны, многие люди ради прогресса медицины готовы предоставить ученым данные полного секвенирования своего генома. В любом случае, и в закрытом, и в открытом варианте геномные банки имеют огромное значение для медицинского использования геномной информации.

– Можете привести примеры таких проектов?

– Конечно. Вот, например, в Англии есть крупный государственный проект, который ведет специально созданная для этого компания Genomics England. Там будет храниться 100 тысяч человеческих геномов, значительная часть этой информации уже собрана. Однако эти данные не находятся в открытом доступе – ими могут пользоваться только врачи, и то со сложными процедурами доступа. Есть и более открытые проекты, вроде американского The Сancer Genome Atlas – в нем десятки тысяч геномов людей, страдающих онкологическими заболеваниями. Это открытый банк и доступ к этим данным (кроме, разумеется, персональных данных пациентов) может получить любой исследователь.

– Каков порядок затрат на создание подобных проектов?

– Вложения в создание Genomics England составили 100 млн фунтов стерлингов. В Европе, США, Китае на такие проекты выделяются миллиарды долларов. Конечно, не все эти деньги тратятся на программную разработку, но сотни миллионов долларов идут именно на это.

– Какие главные проблемы стоят перед индустрией биоИТ?

– Во-первых, проблема стандартизации. Дело в том, что разные установки секвенирования, а также разные научные и медицинские группы часто хранят полученные  молекулярные данные в несколько отличающихся форматах. И когда какая-то медицинская группа сообщает, что она провела анализ таких-то генов, выявила какие-то варианты (изменения определенных участков генома) и установила, что они связаны с определенной болезнью, другим специалистам бывает трудно интерпретировать и проверить эти результаты. Кроме того, при различии форматов становится очень сложным автоматический обмен данными. Точное описание использованного процесса компьютерного анализа данных тоже требует однозначной интерпретации. Для того чтобы все это обеспечить, и нужна стандартизация.

Вторая огромная проблема – это географическая разбросанность данных, из-за чего к ним трудно получить доступ. Как мы уже говорили, многие организации хранят омиксные данные в своих внутренних хранилищах. Это связано и с законодательством. Проблема здесь заключается в том, что медучреждение не имеет права выносить в открытый доступ  информацию о геноме пациента. Такое положение не только в России, но и в зарубежных странах.

Дополнительная техническая сложность состоит в том, что пересылка омиксных данных по интернету для анализа в удаленном центре требует слишком много времени из-за их объема. Поэтому сейчас в США, например, по некоторым  исследованиям порядка 40% научных  и медицинских учреждений пересылают подобную информацию по почте, записанную на диск.

Объем омиксных  баз данных уже сейчас составляет десятки петабайт [1 петабайт равен 1 млн гигабайт. – Vademecum]. Когда сбор омиксных данных станет массовым, объем будет измеряться экзабайтами (это 1 тысяча петабайт), возможно, и зеттабайтами (1 млн петабайт). Поэтому сейчас важная задача – правильно сконфигурировать программное обеспечение, чтобы проводить необходимый анализ на серверах, где хранятся данные, это называется приближать вычисления к данным.

– Насколько хорошо биоИТ развиты в России?

– В России развитие биоИТ носит фрагментарный характер. Насколько я знаю, в нашей стране сейчас нет ни одной крупной базы омиксных данных. Существует ряд проектов по их созданию, но пока они всерьез не реализуются. Наши врачи пользуются биоИТ в очень ограниченных масштабах. В России есть медучреждения, которые собирают и хранят у себя геномную информацию, но таких клиник пока совсем немного.

– Какие сейчас есть перспективные коммерческие проекты в сфере биоИТ?

–  Например, американская компания Seven Bridges создала  хорошую платформу  для работы с данными геномики. При секвенировании генома возникает огромный файл. Исследователю необходимо уметь извлекать из него конкретные участки, делать необходимые запросы, применять к их результатам программные инструменты биоинформатики. В таких запросах могут участвовать десятки тысяч файлов и десятки инструментов, передающих друг другу результаты своей работы. Платформа Seven Bridges дает удобные средства для решения этой задачи и считается одной из лучших среди многих существующих решений.

– У вашей компании есть проекты в биоинформатике?

– По-настоящему глубокой интеграции омиксных данных с традиционной медицинской информацией мы пока не видим. Наш проект – это попытка создать такой инструмент. Там, где уже есть достаточное понимание медицинской стороны дела, он поможет автоматизировать диагностику ряда заболеваний по совместным результатам молекулярных и «обычных» медицинских исследований. Пилотный вариант такой системы мы тестируем сейчас совместно с одной из лучших в США больниц – Massachusetts General Hospital (MGH). 

геном, информатизация здравоохранения, информационные системы, емс
Поделиться в соц.сетях
Липецкое УФАС признало четырех поставщиков МИ виновными в картеле на 316 млн рублей
5 Декабря 2019, 19:08
Ростовский Минздрав после задержания Быковской отменил лекарственные аукционы на 44,7 млн рублей
5 Декабря 2019, 17:25
Михаил Каабак: НМИЦ здоровья детей получил на 2019 год три квоты на трансплантации почек
5 Декабря 2019, 14:54
Дмитрий Медведев: «В сарае невозможно лечить людей»
5 Декабря 2019, 14:09
Опрос: только 4% медорганизаций в РФ перешли на электронные медкарты
Компания «Медицинские информационные решения» (МИР) представила результаты исследования «Практическое применение медицинскими работниками цифровизации (информатизации) здравоохранения», которое проводилось с 23 по 29 октября 2019 года совместно с Ассоциацией развития медицинских информационных технологий (АРМИТ). Опрос, в котором приняли участие 4 398 (87%) врачей и 682 (13%) специалиста среднего медицинского персонала из 82 регионов России, был посвящен изменениям в работе медорганизаций после вступления в силу 1 января 2018 года федерального закона №242-ФЗ, регламентирующего оказание медпомощи с применением телемедицинских технологий.
19 Ноября 2019, 18:40
ЦНИИ эпидемиологии запатентовал методы лечения вирусных инфекций посредством редактирования генома
13 Ноября 2019, 18:24
Ion Beam Applications выиграла годовой контракт на 362 млн рублей по обслуживанию протонного центра в Димитровграде
Российское представительство бельгийского производителя циклотронов Ion Beam Applications (IBA) – ООО «Ай.Би.Эй» – выиграло аукцион на техническое обслуживание в 2020 году протонной установки, которой оборудован Федеральный высокотехнологичный центр медицинской радиологии (ФВЦМР) в Димитровграде, общей стоимостью 362 млн рублей. В связи с тем, что к моменту принятия решения на аукционе осталась лишь заявка от «Ай.Би.Эй», тендерная комиссия акцептовала заключение контракта с единственным поставщиком.
12 Ноября 2019, 14:08
Senior Group запустила сервис по подбору сиделок «Помогуру»
31 Октября 2019, 19:36
Сервис протонного центра ФМБА в Димитровграде оценили в 1 млн рублей в день
15 Октября 2019, 13:49
Утверждена Национальная стратегия развития искусственного интеллекта
11 Октября 2019, 15:26
ЕМС запустит в своих клиниках систему распознавания лиц
9 Октября 2019, 16:46
Мединдустрия
Гонка при следователях: что не устроило Генпрокуратуру в экспорте медуслуг от НМИЦ Блохина и турагента «Русский доктор»
5564
Выходцы из Сбербанка и ВТБ вложились в медицинский онлайн-сервис «Мое здоровье»
Бывший старший вице-президент Сбербанка Теймур Штернлиб и экс-директор по маркетингу ВТБ Виктор Шкипин инвестировали в санкт-петербургское ООО «Здоровье города», получившее статус ИИС СЗ (иные информационные системы в сфере здравоохранения, п. 5 ст. 91 323-ФЗ) и управляющее платформой для записи к врачу «Мое здоровье» по ОМС. Финансовые подробности сделки представители компании не раскрывают.
20 Сентября 2019, 17:20
Представители крупнейших частных клиник обсудили перспективы «двойного лицензирования»
18 Сентября 2019, 15:46
EMC купил 20% сервиса для маршрутизации пациентов MedStatus
10 Сентября 2019, 15:19
Сбербанк, Росатом и ФМБА разработают IT-решения для здравоохранения
5 Сентября 2019, 13:34
В аптеках сети «36,6» могут появиться медицинские кабинеты
3 Сентября 2019, 13:09
Госдума потратит 9 млн рублей на исследование репродуктивных технологий
2 Сентября 2019, 16:24
Сбербанк запускает медицинский сервис SberHealth
Управляющий директор дирекции по развитию экосистемы Сбербанка Антон Собе-Панек 3 августа 2019 года на своей странице в Facebook анонсировал запуск медицинского сервиса SberHealth, опубликовав вакансии руководящих должностей для проекта. Новое подразделение банка будет заниматься телемедициной, ДНК-тестами и развитием искусственного интеллекта в здравоохранении.
6 Августа 2019, 21:14
Генпрокуратура внесла представление Скворцовой из-за недочетов в оказании россиянам медпомощи
30 Июля 2019, 14:22
Мединдустрия
«У нас в стране нет «белого» медицинского бизнеса с EBITDA в 30%»
Vademecum пригласил на авансцену самых незасвеченных персонажей российского рынка медуслуг
253
Правительство РФ внесло законопроект о персональных генетических данных
2 Июля 2019, 8:14
«Одно дело – давать строителям заработать, другое – здоровье людей». Путин раскритиковал регионы за перебои в лекобеспечении
20 Июня 2019, 14:07
Артем Гапеев
Генеральный директор Ильинской больницы
«Мечта – через четыре-пять лет начать публиковать наши клинические результаты»
27 Мая 2019, 8:59
Яндекс.Метрика