paroh: (Default)
[personal profile] paroh
Автор:Исследовательская группа Mapping Cancer Markers
6 апреля 2017 г.

Кратко:
В этой новости команда Mapring Cancer Markers описывает, как они анализируют 45 миллионов наиболее перспективных результатов данных о раке легких и как они начали распространять свои ранние результаты.

Проект Marking Cancer Markers (MCM) продолжает обрабатывать рабочие единицы для набора данных о раке яичников. Поскольку мы накапливаем эти результаты, мы продолжаем анализировать результаты MCM из предыдущего набора данных о раке легких. Ниже мы обсудим одно направление, в котором мы проводим анализ.

Образцы сигнатур генов семейства в раке легких



При раке, в человеческой биологии в целом множественные биомаркеры (гены, белки, микроРНК ит.д.) могут иметь сходные модели активности. Это может быть потому, что гены выполняют избыточные роли или потому, что гены (или другие молекулы) участвуют вместе в группе, чтобы служить биологической функции. Сигнатура рака, состоящая из набора специфических генов, может отличаться от другой сигнатуры, состоящей из разных специфических генов, и тем не менее, играет похожую роль, потому что гены в каждой функционально связаны. Учитывая эту проблему, кандидат наук Анн-Кристин Хаушильд (Anne-Christin Hauschild) ведет исследование часто встречающихся закономерностей (или мотивов) генов, присутствующих в высокопроизводительных генах рака легких.

(Нажмите на картинку ниже, чтобы увидеть увеличенную версию.)

Иллюстрация 1: Краткое описание рабочего процесса анализа

Этот проект рассмотрел результаты первого этапа анализа рака легких, который был систематическим исследованием всего пространства потенциальных сигнатур с фиксированной длиной. Мы начали с выбора 45-ти миллионов сигнатур с высокими показателями, полученных из результатов MCM, рассчитанных на основе World Community Grid. Эти подписи вычислялись для того, чтобы нести большую информацию для диагностики рака легких.

Затем мы разделили все гены в наборе данных по раку легких на 180 кластеров (семейств генов), где гены в каждой семье показывают сходную активность в наборе данных о раке легких. Затем мы обозначили эти топовые сигнатуры семействами генов, в которые были назначены гены. Это дало нам набор высокоэффективных сигнатур, выраженных как генные семейства вместо генов. Это позволило нам рассматривать две разные сигнатуры генов как одну и ту же сигнатуру генной семьи, если соответствующие гены в каждой сигнатуре являются членами одного и того же семейства.

Чтобы помочь понять сами семейства генов, мы можем визуализировать каждый из них с помощью облаков слов, описывающих функции генов, которые они содержат или биологические пути, которые они представляют. Мы извлекаем эту информацию из таких баз данных, как Gene Ontology, pathDIP или других источников.

Оттуда мы искали шаблоны в этих сигнатурах генной семьи: какие семейства появляются необычно часто (или редко) в высокопроизводительных сигнатурах или семействах, которые имеют тенденцию появляться несколько раз в одной и той же сигнатуре. Мы использовали алгоритм Frequent-Itemset для обнаружения конкретных шаблонов, которые встречаются необычно часто в хороших сигнатурах.

Иллюстрация 2: Некоторые семейства генов встречаются несколько раз в одной сигнатуре с удивительной частотой (высокой или низкой). Семья 109 редко появляется ниесколько раз. Семья 12 появляется неожиданно часто в 9x кратных количествах.
(Нажмите на картинку ниже, чтобы увидеть увеличенную версию.)

Иллюстрация 3: Несколько важных семейств генов, характеризующихся облаками слов, описывающих аннотации молекулярных функций генов из базы данных генной онтологии (Gene Ontology). Круги группируют семейства в общие шаблоны, найденные в высокопроизводительных сигнатурах. Шаблоны часто пересекаются, как в этом примере: один шаблон, содержащий семейства 3, 5 и 18, пересекает другой, содержащий семейства 12, 18 и 57.

Используя такие базы данных, как или pathDIP, мы можем использовать эти шаблоны и исследовать взаимосвязи между содержащимися в них генами, поэтому мы можем начать понимать, почему определенные комбинации таких семей несут так много информации о раке легких. Мы используем NAViGaTOR для визуализации и изучения этих сложных наборов взаимосвязей.

(Нажмите на картинку ниже, чтобы увидеть увеличенную версию.)


Иллюстрация 4: Взаимосвязь между 11 значимыми семействами генов (большие круги) в сети взаимодействия с белками. Показаны только самые важные гены (точки, цветовой код по биологической функции) в каждой семье.

Ранние результаты проекта, представленные на Personalizing Cancer Medicine 2017



Мы представили предварительные результаты этого проекта канадским и международным исследователям рака в феврале этого года в плакате на конференции Personalizing Cancer Medicine 2017 в Торонто, Онтарио. Мы получили много инсайтов и идей от обсуждения этой ранней работы, и мы продолжаем развивать их дальше.

Некоторые из дополнительных, связанных результатов были представлены в других публикациях, в том числе:...

новость на англ.
[identity profile] thundersnatch.livejournal.com
Автор: Исследовательская группа Mapping Cancer Markers
17 октября 2016

Кратко:
Исследователи Mapping рака Маркеры анализируют результаты исследовательских задач рака легких, работащих на World Community Grid, а также первые наборы данных рака яичников. Эта свежая новость дает детальный взгляд на инструменты и процессы, которые они используют для этого анализа, а также список своих последних публикаций и событий в их лаборатории.

Целью проекта Mapping Cancer Markers является выявление химических маркеров, связанных с различными типами рака. Это поможет исследователям обнаружить рак раньше и разработать более персонализированное лечение рака. Ниже исследовательская группа описывает, как они анализируют данные рака легких из научно-исследовательских задач, которые были выполнены на World Community Grid, а также первые наборы данных рака яичников. Они также обновить нас на событиях в своей лаборатории, а также предоставлять информацию о своих последних публикаций.

Новости лаборатории

Доктор Анн-Кристин Hauschild недавно присоединилась к нашей лаборатории в качестве постдокторского научного сотрудника и будет участвовать в проекте Mapping Cancer Markers путем применения интеллектуального анализа данных и алгоритмов машинного обучения, чтобы расставить приоритеты сигнатур и охарактеризовывания вовлеченных генов.

Наша работа была признана в третий раз подряд Thomson Reuters, который включил нас в список часто цитируемых исследователей из 127 в области компьютерных наук и 3,266 во всем мире в 21 областях науки.

Переход к набору данных яичников

Наша предыдущая новость описывает запланированный переход к набору данных яичников рака от анализа рака легких. Из-за сроков на испытания набора данных яичников и их запуска на World Community Grid, у нас было несколько дополнительных, незапланированных дней анализа рака легких. Мы использовали эти дополнительные дни, чтобы исследовать сигнатуры рака легких (30-100 маркеров). Предыдущие блоки работы исследовали меньше сигнатур (5-25 маркеров). Все результаты от рака легких, которые были собраны, наряду с первыми несколькими результатами рака яичников. Мы усердно работали, анализируя завершенные легкие и предварительные результаты яичников.

Как мы обрабатываем результаты

В рамках этой работы, мы переработали то, как мы обрабатываем и обрабатали результаты, которые мы получаем от World Community Grid. В частности, мы изменили нашу систему Extract-Transform-Load (ETL), который принимает необработанные, упакованные исследовательские задачи, полученные от World Community Grid, и распаковывает, сопоставляет, реорганизует и перекодирует результаты в эффективный и простой в нагрузке формат для последующего анализа. Наша предыдущая система ETL была встроена в наш IBM InfoSphere Streams. Отделение этапа ETL от анализа дало несколько преимуществ проекту. Это позволяет более эффективно хранить данные, это упрощает наш главный конвейер анализа потоков, и самое главное, это позволяет осуществлять прямой анализ результатов MCM с другими инструментами и платформами (например, интеллектуальный анализ данных и анализ данных инструментов, таких как R и scikit-Learn ).

Сведение к минимуму потенциальной систематической ошибки в наборе данных яичников рака

Набор данных рака яичников Mapping Cancer Markers объединяет данные из нескольких независимых исследований рака. Эти исследования не следуют идентичным протоколам отбора пациентов, сбору ткани образцов или подготовки, или записи клинических ковариатов. Объединение данных из нескольких источников одновременно требует тщательной нормализации (процесс реорганизации данных). Поиски успешных сигнатур в таком наборе данных облегчается, если набор данных минимизирует смещение. Мы будем продолжать изучать вопрос о нормализации данных в наборе данных яичников рака и можем обновлять набор данных в будущем, если мы обнаруживаем улучшения, или если анализ результатов показывает отклонения.

порталы интеграции данных

Наша команда разработала два портала интеграции данных, чтобы помочь нам интерпретировать и проверять результаты, которые мы получаем от Mapping Cancer Markers. Функции этих двух порталов, называемые mirDIP и pathDIP, подробно описаны ниже.

Использование mirDIP для интерпретации результатов картирования рака Маркеры

Одним из проектов, над которыми наша группа работает над в течение последних нескольких месяцев является портал интеграции данных микроРНК (mirDIP). Этот веб-ресурс позволяет пользователям запрашивать микроРНК (миРНК) и исследовать их взаимодействия с РНК (мРНК) целями. МикроРНК это короткие и некодирующие молекулы РНК, наблюдаемые у растений, животных и вирусов (1). По большей части, эти короткие молекулы связываются с мРНК, чтобы контролировать количество производимого белка. Например, в том случае, когда кто-то может получить травму и кровотечение, если тело определяет, что существует непосредственная потребность в большем количестве крови, микроРНК могут связываться с их целями и прибавлять производство белка гемоглобина. Эти молекулы играют важную роль в изучении рака, так как, в частности, они контролируют, когда все должно быть включено или выключено. МикроРНК известны цели более одного гена, поэтому понимание их взаимоотношения с генами является важным шагом в понимании того, как гены и белки функционируют.

Один из способов, которые мы планируем использовать mirDIP в тандеме с нашим проектом картирования рака маркеров, является более внимательный взгляд на общие гены, идентифицированныы двумя методами. Ниже мы используем пример того, как это делается. Если мы возьмем одну из многих публикаций, чтобы начать (2), мы можем идентифицировать микроРНК, которые, как известно, связаны с раком яичников. Как видно на рисунке из публикации, мы можем определить некоторыъ из ключевых участвующих игроков. Такие сети, как эта предоставляют ценную информацию, но отнюдь не полностью характеризуют окружающую среду.

Рисунок 1. Онкогенный и супрессоры опухолей микроРНК при раке яичников. На основе их функции, микроРНК может быть использована для диагностики и терапии. Некоторые микроРНК, такие как семейства микроРНК-200, let-7 семьи, MIR-21, MIR-214 и MIR-100 имеют сильный диагностический/прогностический потенциал при раке яичников. Рисунок и надпись из статьи с Заман и др. (2), под лицензией CC BY 2.0.

Мы можем использовать mirDIP для выявления других основных и второстепенных генов, которые могут быть вовлечены в эти процессы. Если создадим последовательность с использованием 8-ми примеров микроРНК и ограничим результаты для тех, что ссылаются, на по крайней мере, 5 баз данных, мы можем быстро сузить список интересующих генов. Здесь мы покажем, анализ с помощью разработанного нами программного пакета для визуализации и анализа сетей белок-белковых взаимодействий (NAViGaTOR 3.0) из 8-ми микроРНК и связанных с ними генов, где по крайней мере 2 микроРНК являются генами-мишенями.

Рисунок 2. Сеть НАВИГАТОР 3.0 рака яичников ассоциированных с микроРНК и генами. Бирюзовые узлы указывают микроРНК и серые ячейки указывают на связанные гены, предсказанные нашим порталом mirDIP. Два из микроРНК HSA-MIR-34A-5p и-Mir-34c-5P связаны друг с другом и, таким образом, имеют высокий процент перекрытия генов, которые они регулируют. HSA-Mir-100-5p не имеет взаимодействующих генов; Тем не менее, эта сеть показывает только взаимодействие, подтвержденное более чем 5-ю независимыми базами данных. HSA-MIR-100-5p взаимодействия могут быть идентифицированы с использованием значительно меньшего количества источников.

В свою очередь, эти гены могут указывать на критические пути (некоторые из которых, определенные на рис.1), или новые пути, которые могут быть скомпрометированы. Если мы сравним результаты нашего анализа mirDIP с нашим набравшим наибольшее количество баллов сигнатур Mapping Cancer Markers, мы можем дополнительно идентифицировать конкретные гены, представляющие интерес. Понимание того, какие игроки (пути, гены, белки, микроРНК и т.д.) участвуют и прогнозирование возможного механизма приведет к сосредоточению дальнейших исследований, и может привести к выявлению целенаправленного лечения для конкретных подгрупп пациентов - цели точной медицины.

Систематический и всесторонний анализ пути с использованием pathDIP

Это подводит нас к другому ресурсу, который мы создали для комплексной характеристики профилей рака: pathDIP. Важно отметить, что этот общественный ресурс объединяет 20 баз данных и позволяет вычислительно прогнозировать затрагивающие пути объединения, необходимый шаг, чтобы полностью понять сигнальные каскады здоровых и болезненных условий. Перекрестная проверка наших прогнозов обеспечивает 71% точность, а также прогнозы обеспечивают новые аннотации для 5732 белков ранее не имеющих, пути характеристики.

Принимая результаты из рисунка 2 (36 генов, идентифицированных с помощью mirDIP), портал pathDIP идентифицирует два существенно обогащенных пути (р <0,05): 1) микроРНК при раке, и 2) Центральный метаболизм углерода в раке (база KEGG). Первый путь напрямую подтверждает наши шаги до этого момента, пока последний путь указывает еще один путь для исследования. Действительно, путь центрального метаболизма включает в себя превращение глюкозы в молочную кислоту, процесс, известный как эффект Варбурга, который является общим в яичниках и других видах рака. Этот процесс, как было показано, контролируется оксидом азота (3), а также другими микроРНК (4).

Изучение противораковых свойств брокколи

Тем не менее, возвращаясь к регуляции генов микроРНК - портал mirDIP теперь позволяет нам изучить вопрос о том может ли микроРНК из животных, растений и вирусов регулировать человеческие гены. Этот механизм межвидового регулирования открывает огромный потенциал для понимания увеличения риска и профилактики заболеваний. В качестве первого исследования в этом направлении, мы недавно завершили и опубликовали документ, показывающий, что микроРНК брокколи действительно регулируют человеческие гены, активируемых при раке легкого, обеспечивая тем самым потенциальное объяснение того, почему потребление брокколи было связано с противораковыми свойствами многих эпидемиологических исследований.
...

новость на англ.
[identity profile] thundersnatch.livejournal.com
Автор: Исследовательская группа Mapping Cancer Markers
21 апреля 2016

Кратко:
Проект Mapping Cancer Markers (составление карт маркеров рака) теперь включает в себя маркеры для наиболее распространенных форм рака яичников, с целью понять как эта болезнь прогрессирует от ранней стадии до поздней стадии.

Проект Mapping Cancer Markers, который был сосредоточен на раке легких, в настоящее время включает в себя рабочие юниты, связанные с раком яичников. Исследователи стремятся распознать гены, которые играют важную отличительную роль между ранней и поздней стадиями рака яичников.

Цели Mapping Cancer Markers

Рак вызывается генетикой или изменениями окружающей среды, которые влияют на биологические механизмы, контролирующие рост клеток. Эти изменения могут быть обнаружены в образцах тканей через присутствие их уникальных химических показателей, таких как ДНК и белки, которые вместе известны как "маркеры". Конкретные комбинации этих маркеров могут быть связаны с данным типом рака. Кроме того, структура маркеров может определить, является ли физическое лицо восприимчивым к развитию специфической формы рака и может также прогнозировать прогрессирование заболевания, помогая предложить лучшее лечение для данного индивида. Для того, чтобы определить эти маркеры, проект анализирует миллионы элементов данных, собранных из тысяч здоровых и раковых образцов ткани пациентов.

Почему рак яичников?

Во всем мире, около 250000 женщинам ставят диагноз рака яичников каждый год и он отвечает за 140000 смертей ежегодно. Статистические данные показывают, что только 45 процентов женщин с раком яичников выживают в течение пяти лет. Основные видами рака яичников являются эпителиальные, зародышевых клеток и стромальных клеток, считая эпителиальный тип для примерно 85-90 процентов всех случаев. Рак яичников часто не обнаруживается на ранних стадиях из-за заболевания, которое локализовано в яичнике, неуловимостью симптомов, а также отсутствием эффективного инструмента скрининга. Таким образом, большинство наглядных симптомов заболевания выявляются на поздних стадиях или после того, как рак распространился за пределы яичника, что делает лечение менее эффективным и менее вероятно успешным. Именно по этим причинам мы выбрали эпителиальный рак яичников для нашей следующей области исследования.

Понимание прогрессирования рака яичников

На следующем этапе сопоставления рака маркеров, мы попытаемся выявить важные гены в определении различий между ранней и поздней стадиями рака. Существует сильная корреляция между временем выживания и стадией рака; пациенты с раком на ранних стадиях, как правило, живут дольше. Мы будем использовать специально отобранную базу данных выживания с раком яичников, разработанную исследователями во всем мире, в качестве отправной точки.

Для целей данного исследования, мы определяем смерть на ранней стадии, как до трех лет после установления диагноза и смерть на поздней стадии, как более четырех лет после установления диагноза. Мы ищем гены, играющие важную отличительную роль между этими двумя классами рака яичников, чтобы позволить нам понять основные механизмы того, как рак прогрессирует.

По сравнению с более ранней работой по составлению карт рака маркеров, где мы изучали рак легких, эта фаза будет иметь больший и более сложный набор данных. По нашим оценкам, число «экспериментов», которые мы можем выполнить в одном рабочем юните будет значительно меньше, так как каждый эксперимент займет больше времени для решения. Несмотря на то, что набор данных больше, это означает, что мы можем использовать наш алгоритм против много большего количества элементов данных, которые, мы надеемся, вернут очень понятный результат.

Мы благодарим тысячи добровольцев World Community Grid, которые поддержали этот проект с момента его запуска в 2013 году и с нетерпением ждем продолжения работы с вами по мере того, как наше исследование прогрессирует.

новость на англ.
[identity profile] thundersnatch.livejournal.com
Автор: Исследовательская группа The Mapping Cancer Markers (отображение маркеров рака)
15 декабря 2015

Краткое изложение

Последние этапы проекта Mapping Cancer Markers (MCM) высветили белок-белковые взаимодействия и биологические пути, вовлеченные в рак легких, а также предложили неожиданные результаты его биомаркеров. После того, как этот нынешний этап завершится, МСМ перейдет к анализу рака яичников. Благодаря вашей помощи мы делаем открытия и помогаем международному научному сообществу. Доктор Jurisica, в частности, является одним из самых часто цитируемых исследователей во всем мире.

Третий этап анализа рака легких в процессе разработки

В нашей предыдущей свежей новости мы объявили второй, целевой этап открытия сигнатур рака легких. Мы после этого перешли на новый, третий этап анализа рака легких: таргетинг высоко результатных некоррелированных биомаркеров. Эти различные этапы являются частью общих трудозатрат для понимания сигнатур рака легких. Первый этап обследовал возможные сигнатуры рака легких, взятые из комплекта биомаркеров рака легких нашего набора данных. Статистика собранная в этом первом этапе были использована, чтобы сузить список биомаркеров для изучения на последующих этапах. Второй и третий этапы изучают сигнатуры рака легких, взятые из небольших наборов сигнатур с высокими показателями, отобранные двумя различными способами. На втором этапе, мы сосредоточили внимание на 1%-м подмножестве биомаркеров, выбранному по частоте, с которой каждый появлялся в высоко результативных сигнатурах начальной стадии. На третьем этапе, мы выбрали различные подмножества биомаркеров, которые одновременно высоко результаттвны и в значительной степени коррелируют друг с другом.

Корреляция является мерой общей информации между двумя источниками данных. Два биомаркера коррелируют, если они демонстрируют похожие паттерны в наборе данных рака. Например, два коррелированных гена могут показать высокую активность в одном наборе образцов опухоли, низкую активность во втором наборе и среднюю активность в третьей. В том числе, два высоко коррелирующих биомаркера в той же сигнатуре могут снизить качество сигнатуры, потому что они будут способствовать избыточной информации для сигнатуры. Для сигнатуры фиксированного размера избыточный биомаркер потенциально может вытеснить другой биомаркер, имеющий другое информационное содержание.

В качестве аналогии, рассмотрим информацию, содержащуюся в небольшой библиотеке учебников. Предположим, есть три книги: A, B и C. Если A и В две копии одного и того же учебника, один из них является излишним. Удаление B из библиотеки не изменит информацию, содержащуюся в библиотеке и замена B другим учебником (D), приведет к увеличению информации в библиотеке. Если А и В были похожие, но не одинаковые книги (например, две книги по введению в молекулярную биологию, написанные разными авторами), все еще будет некоторое дублирование текстов и возможно преимущество замены B с D.

Производительность сигнатуры

Поскольку целевые биомаркеры в этом третьем этапе были выбраны, чтобы быть минимально взаимно-коррелирующими, каждая сигнатура должна быть свободна от избыточной информации. Поэтому мы предположили, что сигнатуры в третьей стадии будут работать лучше в среднем, чем те, на втором этапе. На рисунке 1 показаны удивительные результаты: сигнатуры второго этапа (потенциально содержащие коррелирующие биомаркеры) превзошли те, от третьей ступени. Мы анализируем эти результаты и дальше, чтобы определить основные причины разницы в производительности.

Рисунок 1. Распределение баллов сигнатур для второго (черный) и третьего этапов (синий). Как и следовало ожидать, более крупные сигнатуры, как правило, обгоняют меньшие. Удивительно, что второй этап сигнатур обошел третий этап в среднем.

Влияние размеров на шкалу биомаркеров в топовых сигнатурах

Большие сигнатуры (т.е., сигнатуры, содержащие больше биомаркеров) включают более подробную информацию и потенциально могут предложить лучшую точность, но являются более сложными и дорогими для реализации в клинике. Все три этапа MCM пока что исследовали сигнатуры рака легких различных размеров. Для каждого размера сигнатуры нами рассмотренной, целевые подмножества биомаркеров для второго этапа были выбраны по отдельности, основываясь на статистике из первого этапа. Набор маркеров, выбранных для третьего, фиксируется во всех размерах сигнатуры. Этот фиксированный набор позволяет сравнить эффекты размера сигнатуры на частоте каждого биомаркера в высоко результативных сигнатурах. Рисунок 2 показывает изменение частоты при переходе от 10-ти биомаркеров в подписи к 20-ти. Каждая точка на графике представляет собой биомаркер. Ось Х представляет собой частоту, с которой биомаркеры появляются в size_10 сигнатурах. Ось Y показывает частоту в size_20 сигнатурах. Обратите внимание, что биомаркеры изменились в шкале, но, в основном, коррелируют. Сигнатуры size_10 показывают большее распространение частоты биомаркеров: некоторые имеют относительно высокую частоту, и многие низкую частоту. Частоты биомаркеров в крупных (size_20) сигнатурах даже больше.

Биомаркер соединяется в пары, как белковые взаимодействия?

Мы применили и расширили анализ биомаркеров пар, описанных в новости августа 2015 года в ранние результаты данных третьего этапа, ищущих специально пары биомаркеров в обоих втором и третьем этапах, которые появляются на удивление часто в высоко результативных сигнатурах рака легких. Когда два гена или белка появляются в подписях вместе с большей частотой, чем ожидалось случайно, мы прогнозируем более сильное, связанное с раком соединение (взаимодействие).

Мы искали каких-нибудь известных соединений (взаимодействий) в базе данных интегрированных взаимодействий (IID), базе данных известных и предсказанных белок-белковых взаимодействий, созданной нашей лабораторией. Мы нашли несколько пересечений в IID, которые отражают эти раковые взаимодействия, но перекрытие не было статистически значимым.

Метаболический путь усовершенствования знаний в целях второго и третьего этапов

Мы также взяли гены, выбранные для второго и третьего этапов, и искали для них в базе данных биологических метаболических путей. См. рисунок 3. Мы обнаружили, наши списки генов были обогащены (присутствовали в статистически значимых числах; р ≤ 0,01) в ряде метаболических путей. См. таблицу 1.

Хотя наш анализ продолжается, мы видим, что два из выявленных путей - компоненты метаболизма мевалоната. Пути мевалонаты уже являются целями для многих лекарств, таких как статины и вовлечены в качестве мишеней для лечения рака легких. Некоторые из неприоритетных анализов сфокусируются на том как сигнатуры, обнаруженные при обработке World Community Grid, в конечном счете подключаются к путям и другим исследованиям. Мы использовали мевалонат в качестве примера, но есть многое другое, что может быть рассмотрено для оценки жизнеспособности наших лучших сигнатур.

Переход от рака легких к анализу рака яичников

Третий этап почти завершен и будет заключительная часть MCM анализа рака легких на World Community Grid, прежде чем мы переключимся на рак яичников.

Рак яичников является гинекологической злокачественной опухолью, занимающей 8-е место по заболеваемости и 5-е по смертности среди всех женских онкологических заболеваний. Наблюдение Американского национального института рака, Эпидемиологии и Конечные результаты (SEER) программы дают оценку в 22,240 новых случаев и 14,030 смертей от рака яичников в 2013-м. Пациенты, как правило, диагностируется на поздней стадии (61% присутствует метастазы рака) и имеют плохой прогноз (27,3 месяцев до стадии метастазирования. (SEER)).

Мы ожидаем, что переход к исследованию рака яичников начнется в начале 2016 года и не ожидаем каких-либо перерывов в потоке рабочих юнитов.

Статья полностью, с картинками и таблицей (англ.)
[identity profile] thundersnatch.livejournal.com
"Краткое содержание.
За кадром продолжается работа над проектом Help Conquer Cancer - команда анализирует миллионы изображений кристаллизации белка, обработанных добровольцами World Community Grid, с надеждой найти паттерны, которые помогут исследователям построить лучшие инструменты скрининга рака.

Уважаемые волонтеры World Community Grid:

Мы продолжаем анализировать миллионы изображений кристализированного белка, которые вы обрабатывали в рамках Help Conquer Cancer (HCC), с конечной целью обретения понимания в процесса кристаллизации. В свою очередь, это позволит нам кристаллизовать рак и другие белки заболеваний, определять их структуру, функции и проектировать лекарства соответственно. Мы стремимся выявить нетривиальные, интересные и в конечном счете полезные модели в этом большом и ценном наборе данных.

Мы стремимся интегрировать более подробные данные, которые мы получили от института Hauptman Woodward, которые позволят нам интерпретировать паттерны, идентифицированные нами и связывать свойства белков, условия и временнЫе данные с конкретными изображениями, которые были обработаны на World Community Grid.
...
В настоящее время, вот некоторые недавние связанных с раком публикации и освещение в СМИ нашей группы, которые все относятся к нашей попытке определить лучшие алгоритмы для определения прогностических/прогнозирующих сигнатур и работать в направлении поиска и проверки новых методов лечения для больных раком. В сочетании, результаты этих работ дают данные для наших новых юниты работы из проекта MCM, и, в свою очередь, результаты проектов MCM снабжают данными это исследование."

Статья полностью. (англ.)
[identity profile] thundersnatch.livejournal.com
"Краткое содержание.
Хотя работа продолжается, достаточно данных уже были обработаны для того, чтобы команда Mapping Cancer Markers начала определять некоторые сигнатуры и ассоциировать их с конкретными биомаркерами рака легких. Конечной целью является нахождение сигнатур, которые служат отличительным признаком многих видов рака, давая врачам и исследователям еще один инструмент, чтобы улучшить выявление, лечение и исходы пациентов.

Новый этап MCM открытия биомаркеров рака легких.

После долгого первого этапа разведочного анализа, Mapping Cancer Markers (MCM) начали новый, более целенаправленный этап анализа рака легких в апреле 2015-го. Обработка результатов от первого этапа показали, подмножество примерно 1% биомаркеров, которые часто встречаются в некоторых сигнатурах. Второй этап исследования MCM рака легких будет сосредоточен на сигнатурах, взятых из этого подмножества биомаркеров.

Среди первых вопросов исследования, на которые мы нацелены отвечать на второй стадии, являются данные о характере успешных сигнатур и ограниченном пространстве сигнатур. Будет ли подмножество биомаркеров в изучаемой стадии лучше различать рак легких в образцах тканей? Будет ли эффект от длины сигнатуры (количество биомаркеров) на выполнение сигнатуры, которые мы заметили в исследовательской стадии также появляются в этой суженном пространстве сигнатуры? Какие паттерны биомаркеров характеризуют наиболее активные сигнатуры рака? Большинство биологических функций достигается несколькими генами (или белками), участвующими в скоординированной сети или сигнальном каскаде (проводящих путях), так можем ли мы обнаружить пары или более крупные группы биомаркеров, которые часто сосуществуют в успешных сигнатурах? Будут ли эти группы биомаркеров соотносится с известными биологическими сетями, или же успешные сигнатуры обязательно обращают их членов из составных сетей?

Достаточно результатов второго этапа было возвращено, чтобы позволить нам начать предварительный анализ. Одна из главных целей второго этапа заключается в выявлении высокоактивных сигнатур рака. Мы использовали результаты первого этапа, чтобы сузить поле потенциальных биомаркеров с 22,000+ до подмножества 223.

Короткие или длинные сигнатуры?

Один из вопросов, которым может заинтересоваться сообщество добровольцев, может быть таким: "почему мы продолжаем фокусироваться на более коротких сигнатурах гена, если тренд в данных показывает, что длинные сигнатуры гена работают лучше. Несмотря на эту тенденцию, бОльшая генетическая сигнатура может более предсказывающей, но не всегда лучшей. Одна из причин практическая. БольшАя часть работы в области выявления биомаркеров имеет конечной целью производство сигнатур, которая может быть переведена на клиническое испытание. Технико-экономическое обоснование и экономика будет играть важную роль на этом этапе. Процесс перемещения результата исследования через тестирование и утверждение является длительным и сложным, так что 10-ти геновую сигнатуру проще и дешевле перевести чем 65 геновую сигнатуру. Жизнеспособность размеров генетической сигнатуры грубо ориентируется, как мы определяем наши нижние и верхние пределы поиска размер для проекта MCM.

Пары биомаркеров.

Одна из наших целей в анализе генетических сигнатур - посмотреть на меньшие комбинации генов и выявить группы генов, которые связаны с исходом пациента в подобной манере (то есть они могут предоставить альтернативные варианты для сигнатуры). Это важно по целому ряду причин. С аналитической стороны, если мы можем найти два гена, которые выполняют почти то же самое, то успешная генетическая сигнатура, скорее всего, только одна из них. Это поможет нам уменьшить пространство поиска, но также, найти альтернативы. С практической стороны, одна из двух (или более) альтернатив может быть проще довести до клинической практике. Таким образом, мы стремимся, чтобы найти несколько сигнатур, и охарактеризовать их с точки зрения их отношений. Еще одна причина, чтобы посмотреть на комбинации генов включает наблюдение, того могут ли два гена иметь биологическую причину для связи. Это особый рак, поразивший два гена, в одно и то же время? Нарушен ли конкретный биологический путь? Эти виды вопросов можно объяснить различия между пациентами или почему некоторые люди лучше реагируют на конкретные методы лечения. Эти вопросы, которые гораздо дальше по пути научно-исследовательской работы, но мы хотели бы коснуться их, чтобы сообщество осознало, где в источнике информации ваши вклады помогли, а также то, что еще нужно сделать. Если пара (или бОльшая группа) генов, связанны с болезнью, сигнатуры, содержащие эти гены или связанные или родственные биомаркеры должны выполняться хорошо."

Статья полностью (англ.)

Profile

Volunteer Computing ( добровольные вычисления )

August 2017

S M T W T F S
  1 2345
6789101112
1314151617 1819
202122 23242526
2728293031  

Syndicate

RSS Atom

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Sep. 20th, 2017 05:33 am
Powered by Dreamwidth Studios