Автор: Исследовательская группа Mapping Cancer Markers
17 октября 2016
Кратко:
Исследователи Mapping рака Маркеры анализируют результаты исследовательских задач рака легких, работащих на World Community Grid, а также первые наборы данных рака яичников. Эта свежая новость дает детальный взгляд на инструменты и процессы, которые они используют для этого анализа, а также список своих последних публикаций и событий в их лаборатории.
Целью проекта Mapping Cancer Markers является выявление химических маркеров, связанных с различными типами рака. Это поможет исследователям обнаружить рак раньше и разработать более персонализированное лечение рака. Ниже исследовательская группа описывает, как они анализируют данные рака легких из научно-исследовательских задач, которые были выполнены на World Community Grid, а также первые наборы данных рака яичников. Они также обновить нас на событиях в своей лаборатории, а также предоставлять информацию о своих последних публикаций.
Новости лаборатории
Доктор Анн-Кристин Hauschild недавно присоединилась к нашей лаборатории в качестве постдокторского научного сотрудника и будет участвовать в проекте Mapping Cancer Markers путем применения интеллектуального анализа данных и алгоритмов машинного обучения, чтобы расставить приоритеты сигнатур и охарактеризовывания вовлеченных генов.
Наша работа была признана в третий раз подряд Thomson Reuters, который включил нас в список часто цитируемых исследователей из 127 в области компьютерных наук и 3,266 во всем мире в 21 областях науки.
Переход к набору данных яичников
Наша предыдущая новость описывает запланированный переход к набору данных яичников рака от анализа рака легких. Из-за сроков на испытания набора данных яичников и их запуска на World Community Grid, у нас было несколько дополнительных, незапланированных дней анализа рака легких. Мы использовали эти дополнительные дни, чтобы исследовать сигнатуры рака легких (30-100 маркеров). Предыдущие блоки работы исследовали меньше сигнатур (5-25 маркеров). Все результаты от рака легких, которые были собраны, наряду с первыми несколькими результатами рака яичников. Мы усердно работали, анализируя завершенные легкие и предварительные результаты яичников.
Как мы обрабатываем результаты
В рамках этой работы, мы переработали то, как мы обрабатываем и обрабатали результаты, которые мы получаем от World Community Grid. В частности, мы изменили нашу систему Extract-Transform-Load (ETL), который принимает необработанные, упакованные исследовательские задачи, полученные от World Community Grid, и распаковывает, сопоставляет, реорганизует и перекодирует результаты в эффективный и простой в нагрузке формат для последующего анализа. Наша предыдущая система ETL была встроена в наш IBM InfoSphere Streams. Отделение этапа ETL от анализа дало несколько преимуществ проекту. Это позволяет более эффективно хранить данные, это упрощает наш главный конвейер анализа потоков, и самое главное, это позволяет осуществлять прямой анализ результатов MCM с другими инструментами и платформами (например, интеллектуальный анализ данных и анализ данных инструментов, таких как R и scikit-Learn ).
Сведение к минимуму потенциальной систематической ошибки в наборе данных яичников рака
Набор данных рака яичников Mapping Cancer Markers объединяет данные из нескольких независимых исследований рака. Эти исследования не следуют идентичным протоколам отбора пациентов, сбору ткани образцов или подготовки, или записи клинических ковариатов. Объединение данных из нескольких источников одновременно требует тщательной нормализации (процесс реорганизации данных). Поиски успешных сигнатур в таком наборе данных облегчается, если набор данных минимизирует смещение. Мы будем продолжать изучать вопрос о нормализации данных в наборе данных яичников рака и можем обновлять набор данных в будущем, если мы обнаруживаем улучшения, или если анализ результатов показывает отклонения.
порталы интеграции данных
Наша команда разработала два портала интеграции данных, чтобы помочь нам интерпретировать и проверять результаты, которые мы получаем от Mapping Cancer Markers. Функции этих двух порталов, называемые mirDIP и pathDIP, подробно описаны ниже.
Использование mirDIP для интерпретации результатов картирования рака Маркеры
Одним из проектов, над которыми наша группа работает над в течение последних нескольких месяцев является портал интеграции данных микроРНК (mirDIP). Этот веб-ресурс позволяет пользователям запрашивать микроРНК (миРНК) и исследовать их взаимодействия с РНК (мРНК) целями. МикроРНК это короткие и некодирующие молекулы РНК, наблюдаемые у растений, животных и вирусов (1). По большей части, эти короткие молекулы связываются с мРНК, чтобы контролировать количество производимого белка. Например, в том случае, когда кто-то может получить травму и кровотечение, если тело определяет, что существует непосредственная потребность в большем количестве крови, микроРНК могут связываться с их целями и прибавлять производство белка гемоглобина. Эти молекулы играют важную роль в изучении рака, так как, в частности, они контролируют, когда все должно быть включено или выключено. МикроРНК известны цели более одного гена, поэтому понимание их взаимоотношения с генами является важным шагом в понимании того, как гены и белки функционируют.
Один из способов, которые мы планируем использовать mirDIP в тандеме с нашим проектом картирования рака маркеров, является более внимательный взгляд на общие гены, идентифицированныы двумя методами. Ниже мы используем пример того, как это делается. Если мы возьмем одну из многих публикаций, чтобы начать (2), мы можем идентифицировать микроРНК, которые, как известно, связаны с раком яичников. Как видно на рисунке из публикации, мы можем определить некоторыъ из ключевых участвующих игроков. Такие сети, как эта предоставляют ценную информацию, но отнюдь не полностью характеризуют окружающую среду.

Рисунок 1. Онкогенный и супрессоры опухолей микроРНК при раке яичников. На основе их функции, микроРНК может быть использована для диагностики и терапии. Некоторые микроРНК, такие как семейства микроРНК-200, let-7 семьи, MIR-21, MIR-214 и MIR-100 имеют сильный диагностический/прогностический потенциал при раке яичников. Рисунок и надпись из статьи с Заман и др. (2), под лицензией CC BY 2.0.
Мы можем использовать mirDIP для выявления других основных и второстепенных генов, которые могут быть вовлечены в эти процессы. Если создадим последовательность с использованием 8-ми примеров микроРНК и ограничим результаты для тех, что ссылаются, на по крайней мере, 5 баз данных, мы можем быстро сузить список интересующих генов. Здесь мы покажем, анализ с помощью разработанного нами программного пакета для визуализации и анализа сетей белок-белковых взаимодействий (NAViGaTOR 3.0) из 8-ми микроРНК и связанных с ними генов, где по крайней мере 2 микроРНК являются генами-мишенями.

Рисунок 2. Сеть НАВИГАТОР 3.0 рака яичников ассоциированных с микроРНК и генами. Бирюзовые узлы указывают микроРНК и серые ячейки указывают на связанные гены, предсказанные нашим порталом mirDIP. Два из микроРНК HSA-MIR-34A-5p и-Mir-34c-5P связаны друг с другом и, таким образом, имеют высокий процент перекрытия генов, которые они регулируют. HSA-Mir-100-5p не имеет взаимодействующих генов; Тем не менее, эта сеть показывает только взаимодействие, подтвержденное более чем 5-ю независимыми базами данных. HSA-MIR-100-5p взаимодействия могут быть идентифицированы с использованием значительно меньшего количества источников.
В свою очередь, эти гены могут указывать на критические пути (некоторые из которых, определенные на рис.1), или новые пути, которые могут быть скомпрометированы. Если мы сравним результаты нашего анализа mirDIP с нашим набравшим наибольшее количество баллов сигнатур Mapping Cancer Markers, мы можем дополнительно идентифицировать конкретные гены, представляющие интерес. Понимание того, какие игроки (пути, гены, белки, микроРНК и т.д.) участвуют и прогнозирование возможного механизма приведет к сосредоточению дальнейших исследований, и может привести к выявлению целенаправленного лечения для конкретных подгрупп пациентов - цели точной медицины.
Систематический и всесторонний анализ пути с использованием pathDIP
Это подводит нас к другому ресурсу, который мы создали для комплексной характеристики профилей рака: pathDIP. Важно отметить, что этот общественный ресурс объединяет 20 баз данных и позволяет вычислительно прогнозировать затрагивающие пути объединения, необходимый шаг, чтобы полностью понять сигнальные каскады здоровых и болезненных условий. Перекрестная проверка наших прогнозов обеспечивает 71% точность, а также прогнозы обеспечивают новые аннотации для 5732 белков ранее не имеющих, пути характеристики.
Принимая результаты из рисунка 2 (36 генов, идентифицированных с помощью mirDIP), портал pathDIP идентифицирует два существенно обогащенных пути (р <0,05): 1) микроРНК при раке, и 2) Центральный метаболизм углерода в раке (база KEGG). Первый путь напрямую подтверждает наши шаги до этого момента, пока последний путь указывает еще один путь для исследования. Действительно, путь центрального метаболизма включает в себя превращение глюкозы в молочную кислоту, процесс, известный как эффект Варбурга, который является общим в яичниках и других видах рака. Этот процесс, как было показано, контролируется оксидом азота (3), а также другими микроРНК (4).
Изучение противораковых свойств брокколи
Тем не менее, возвращаясь к регуляции генов микроРНК - портал mirDIP теперь позволяет нам изучить вопрос о том может ли микроРНК из животных, растений и вирусов регулировать человеческие гены. Этот механизм межвидового регулирования открывает огромный потенциал для понимания увеличения риска и профилактики заболеваний. В качестве первого исследования в этом направлении, мы недавно завершили и опубликовали документ, показывающий, что микроРНК брокколи действительно регулируют человеческие гены, активируемых при раке легкого, обеспечивая тем самым потенциальное объяснение того, почему потребление брокколи было связано с противораковыми свойствами многих эпидемиологических исследований.
...
новость на англ.
17 октября 2016
Кратко:
Исследователи Mapping рака Маркеры анализируют результаты исследовательских задач рака легких, работащих на World Community Grid, а также первые наборы данных рака яичников. Эта свежая новость дает детальный взгляд на инструменты и процессы, которые они используют для этого анализа, а также список своих последних публикаций и событий в их лаборатории.
Целью проекта Mapping Cancer Markers является выявление химических маркеров, связанных с различными типами рака. Это поможет исследователям обнаружить рак раньше и разработать более персонализированное лечение рака. Ниже исследовательская группа описывает, как они анализируют данные рака легких из научно-исследовательских задач, которые были выполнены на World Community Grid, а также первые наборы данных рака яичников. Они также обновить нас на событиях в своей лаборатории, а также предоставлять информацию о своих последних публикаций.
Новости лаборатории
Доктор Анн-Кристин Hauschild недавно присоединилась к нашей лаборатории в качестве постдокторского научного сотрудника и будет участвовать в проекте Mapping Cancer Markers путем применения интеллектуального анализа данных и алгоритмов машинного обучения, чтобы расставить приоритеты сигнатур и охарактеризовывания вовлеченных генов.
Наша работа была признана в третий раз подряд Thomson Reuters, который включил нас в список часто цитируемых исследователей из 127 в области компьютерных наук и 3,266 во всем мире в 21 областях науки.
Переход к набору данных яичников
Наша предыдущая новость описывает запланированный переход к набору данных яичников рака от анализа рака легких. Из-за сроков на испытания набора данных яичников и их запуска на World Community Grid, у нас было несколько дополнительных, незапланированных дней анализа рака легких. Мы использовали эти дополнительные дни, чтобы исследовать сигнатуры рака легких (30-100 маркеров). Предыдущие блоки работы исследовали меньше сигнатур (5-25 маркеров). Все результаты от рака легких, которые были собраны, наряду с первыми несколькими результатами рака яичников. Мы усердно работали, анализируя завершенные легкие и предварительные результаты яичников.
Как мы обрабатываем результаты
В рамках этой работы, мы переработали то, как мы обрабатываем и обрабатали результаты, которые мы получаем от World Community Grid. В частности, мы изменили нашу систему Extract-Transform-Load (ETL), который принимает необработанные, упакованные исследовательские задачи, полученные от World Community Grid, и распаковывает, сопоставляет, реорганизует и перекодирует результаты в эффективный и простой в нагрузке формат для последующего анализа. Наша предыдущая система ETL была встроена в наш IBM InfoSphere Streams. Отделение этапа ETL от анализа дало несколько преимуществ проекту. Это позволяет более эффективно хранить данные, это упрощает наш главный конвейер анализа потоков, и самое главное, это позволяет осуществлять прямой анализ результатов MCM с другими инструментами и платформами (например, интеллектуальный анализ данных и анализ данных инструментов, таких как R и scikit-Learn ).
Сведение к минимуму потенциальной систематической ошибки в наборе данных яичников рака
Набор данных рака яичников Mapping Cancer Markers объединяет данные из нескольких независимых исследований рака. Эти исследования не следуют идентичным протоколам отбора пациентов, сбору ткани образцов или подготовки, или записи клинических ковариатов. Объединение данных из нескольких источников одновременно требует тщательной нормализации (процесс реорганизации данных). Поиски успешных сигнатур в таком наборе данных облегчается, если набор данных минимизирует смещение. Мы будем продолжать изучать вопрос о нормализации данных в наборе данных яичников рака и можем обновлять набор данных в будущем, если мы обнаруживаем улучшения, или если анализ результатов показывает отклонения.
порталы интеграции данных
Наша команда разработала два портала интеграции данных, чтобы помочь нам интерпретировать и проверять результаты, которые мы получаем от Mapping Cancer Markers. Функции этих двух порталов, называемые mirDIP и pathDIP, подробно описаны ниже.
Использование mirDIP для интерпретации результатов картирования рака Маркеры
Одним из проектов, над которыми наша группа работает над в течение последних нескольких месяцев является портал интеграции данных микроРНК (mirDIP). Этот веб-ресурс позволяет пользователям запрашивать микроРНК (миРНК) и исследовать их взаимодействия с РНК (мРНК) целями. МикроРНК это короткие и некодирующие молекулы РНК, наблюдаемые у растений, животных и вирусов (1). По большей части, эти короткие молекулы связываются с мРНК, чтобы контролировать количество производимого белка. Например, в том случае, когда кто-то может получить травму и кровотечение, если тело определяет, что существует непосредственная потребность в большем количестве крови, микроРНК могут связываться с их целями и прибавлять производство белка гемоглобина. Эти молекулы играют важную роль в изучении рака, так как, в частности, они контролируют, когда все должно быть включено или выключено. МикроРНК известны цели более одного гена, поэтому понимание их взаимоотношения с генами является важным шагом в понимании того, как гены и белки функционируют.
Один из способов, которые мы планируем использовать mirDIP в тандеме с нашим проектом картирования рака маркеров, является более внимательный взгляд на общие гены, идентифицированныы двумя методами. Ниже мы используем пример того, как это делается. Если мы возьмем одну из многих публикаций, чтобы начать (2), мы можем идентифицировать микроРНК, которые, как известно, связаны с раком яичников. Как видно на рисунке из публикации, мы можем определить некоторыъ из ключевых участвующих игроков. Такие сети, как эта предоставляют ценную информацию, но отнюдь не полностью характеризуют окружающую среду.

Рисунок 1. Онкогенный и супрессоры опухолей микроРНК при раке яичников. На основе их функции, микроРНК может быть использована для диагностики и терапии. Некоторые микроРНК, такие как семейства микроРНК-200, let-7 семьи, MIR-21, MIR-214 и MIR-100 имеют сильный диагностический/прогностический потенциал при раке яичников. Рисунок и надпись из статьи с Заман и др. (2), под лицензией CC BY 2.0.
Мы можем использовать mirDIP для выявления других основных и второстепенных генов, которые могут быть вовлечены в эти процессы. Если создадим последовательность с использованием 8-ми примеров микроРНК и ограничим результаты для тех, что ссылаются, на по крайней мере, 5 баз данных, мы можем быстро сузить список интересующих генов. Здесь мы покажем, анализ с помощью разработанного нами программного пакета для визуализации и анализа сетей белок-белковых взаимодействий (NAViGaTOR 3.0) из 8-ми микроРНК и связанных с ними генов, где по крайней мере 2 микроРНК являются генами-мишенями.

Рисунок 2. Сеть НАВИГАТОР 3.0 рака яичников ассоциированных с микроРНК и генами. Бирюзовые узлы указывают микроРНК и серые ячейки указывают на связанные гены, предсказанные нашим порталом mirDIP. Два из микроРНК HSA-MIR-34A-5p и-Mir-34c-5P связаны друг с другом и, таким образом, имеют высокий процент перекрытия генов, которые они регулируют. HSA-Mir-100-5p не имеет взаимодействующих генов; Тем не менее, эта сеть показывает только взаимодействие, подтвержденное более чем 5-ю независимыми базами данных. HSA-MIR-100-5p взаимодействия могут быть идентифицированы с использованием значительно меньшего количества источников.
В свою очередь, эти гены могут указывать на критические пути (некоторые из которых, определенные на рис.1), или новые пути, которые могут быть скомпрометированы. Если мы сравним результаты нашего анализа mirDIP с нашим набравшим наибольшее количество баллов сигнатур Mapping Cancer Markers, мы можем дополнительно идентифицировать конкретные гены, представляющие интерес. Понимание того, какие игроки (пути, гены, белки, микроРНК и т.д.) участвуют и прогнозирование возможного механизма приведет к сосредоточению дальнейших исследований, и может привести к выявлению целенаправленного лечения для конкретных подгрупп пациентов - цели точной медицины.
Систематический и всесторонний анализ пути с использованием pathDIP
Это подводит нас к другому ресурсу, который мы создали для комплексной характеристики профилей рака: pathDIP. Важно отметить, что этот общественный ресурс объединяет 20 баз данных и позволяет вычислительно прогнозировать затрагивающие пути объединения, необходимый шаг, чтобы полностью понять сигнальные каскады здоровых и болезненных условий. Перекрестная проверка наших прогнозов обеспечивает 71% точность, а также прогнозы обеспечивают новые аннотации для 5732 белков ранее не имеющих, пути характеристики.
Принимая результаты из рисунка 2 (36 генов, идентифицированных с помощью mirDIP), портал pathDIP идентифицирует два существенно обогащенных пути (р <0,05): 1) микроРНК при раке, и 2) Центральный метаболизм углерода в раке (база KEGG). Первый путь напрямую подтверждает наши шаги до этого момента, пока последний путь указывает еще один путь для исследования. Действительно, путь центрального метаболизма включает в себя превращение глюкозы в молочную кислоту, процесс, известный как эффект Варбурга, который является общим в яичниках и других видах рака. Этот процесс, как было показано, контролируется оксидом азота (3), а также другими микроРНК (4).
Изучение противораковых свойств брокколи
Тем не менее, возвращаясь к регуляции генов микроРНК - портал mirDIP теперь позволяет нам изучить вопрос о том может ли микроРНК из животных, растений и вирусов регулировать человеческие гены. Этот механизм межвидового регулирования открывает огромный потенциал для понимания увеличения риска и профилактики заболеваний. В качестве первого исследования в этом направлении, мы недавно завершили и опубликовали документ, показывающий, что микроРНК брокколи действительно регулируют человеческие гены, активируемых при раке легкого, обеспечивая тем самым потенциальное объяснение того, почему потребление брокколи было связано с противораковыми свойствами многих эпидемиологических исследований.
...
новость на англ.