![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
24 ноября 2017 г.
Кратко:
Данные Uncovering Genome Mysteries (все 30 терабайт) были переданы исследовательским группам в Бразилии и Австралии в этом году. Теперь исследователи анализируют этот огромный объем данных и ищут способы облегчить понимание другими учеными и общественности.
В этом видео доктор Торстен Томас объясняет основные цели проекта Uncovering Genome Mysteries.
Краткая предистория.
В прошлом году волонтеры World Community Grid завершили расчеты для проекта Uncovering Genome Mysteries, который исследовал около 200 миллионов генов самых разных форм жизни, чтобы помочь обнаружить новые функции белка. Основные цели проекта:
Перенос 30-ти терабайт данных.
Данные, полученные добровольцами World Community Grid, были перегруппированы на новый сервер биоинформатики в Фонде Освальдо Крус (Fiocruz) под руководством доктора Вима Деграва. Кроме того, полная копия всех данных была отправлена сотруднику д-ра Торстен Томасу и его команде из Центра морской биоинновации и Школы биологических, наук о Земле и окружающей среды Университета Нового Южного Уэльса в Сиднее, Австралия. В Университете Нового Южного Уэльса результаты сравнения белков помогут интерпретировать анализы морских бактериальных экосистем, где микроорганизмы, коралловые рифы, губки и многие другие интригующие существа взаимодействуют и формируют свои жизненные сообщества. Пересылка из Бразилии в Австралию набора данных, содержащего более 30 терабайт в сжатой форме, заняла несколько месяцев.
Обработка и анализ данных в Fiocruz
Команда Fiocruz была занята дальнейшей обработкой первичных результатов вычислений проекта. В рабочем процессе необработанные данные расширяются и дешифруются, ассоциируясь с правильными сравнениями между геномами, проверяются на наличие ошибок, отображаются в таблицах и связаны со многими различными объектами данных, чтобы преобразовать их в значимую информацию.
Команда имеет дело с быстро растущим размером базы данных, а также приобрела и установила новое оборудование (600 Tb), чтобы помочь разместить все данные. Они также хотят создать интерфейс базы данных, который обращается к широкой общественности, заинтересованной в биоразнообразии, и не только к ученым, специализирующимся на функциональном анализе закодированных белков в геномах конкретных форм жизни.
Некоторые из данных в настоящее время используются в таких проектах, как разработка вакцин и лекарств против арбовирусов, таких как вирусы Зика, лихорадка денге и желтой лихорадки, а также для понимания взаимодействия бактерий с окружающей их средой и того, как это отражается в их метаболических путях, когда свободные живые бактерии сравниваются с их близкими родственниками, которые являются человеческими патогенами, такими как Mycobacterium tuberculosis и экологическими микобактериями.
Поиск партнерства
Fiocruz ищет партнерские отношения, которые добавили бы дополнительную аналитику данных и искусственный интеллект в проект. Исследователи хотели бы включить визуализацию функциональных связей между организмами, а также особенности из самых разных организмов, включая глубоководные термальные артечные бактерии; бактерии и протисты (любой одноклеточный организм, который не является животным, растением или грибком) из почвы, воды, земли и моря или важных для здоровья человека, животных или растений; и очень сложные геномы растений, животных и человека.
Мы благодарим всех, кто участвовал в части проекта World Community Grid этого проекта, и с нетерпением ожидаем возможности поделиться свежими новостями по мере продолжения анализа данных.
на англ.
Кратко:
Данные Uncovering Genome Mysteries (все 30 терабайт) были переданы исследовательским группам в Бразилии и Австралии в этом году. Теперь исследователи анализируют этот огромный объем данных и ищут способы облегчить понимание другими учеными и общественности.
В этом видео доктор Торстен Томас объясняет основные цели проекта Uncovering Genome Mysteries.
Краткая предистория.
В прошлом году волонтеры World Community Grid завершили расчеты для проекта Uncovering Genome Mysteries, который исследовал около 200 миллионов генов самых разных форм жизни, чтобы помочь обнаружить новые функции белка. Основные цели проекта:
- Открытие новых функций белка и увеличение знаний о биохимических процессах в целом
- Определение того, как организмы взаимодействуют друг с другом и окружающей средой
- Документирование текущего базового микробного разнообразия, позволяющее лучше понять, как микроорганизмы изменяются под воздействием экологического стресса, таких как изменение климата
- Понимание и моделирование сложных микробных систем
Перенос 30-ти терабайт данных.
Данные, полученные добровольцами World Community Grid, были перегруппированы на новый сервер биоинформатики в Фонде Освальдо Крус (Fiocruz) под руководством доктора Вима Деграва. Кроме того, полная копия всех данных была отправлена сотруднику д-ра Торстен Томасу и его команде из Центра морской биоинновации и Школы биологических, наук о Земле и окружающей среды Университета Нового Южного Уэльса в Сиднее, Австралия. В Университете Нового Южного Уэльса результаты сравнения белков помогут интерпретировать анализы морских бактериальных экосистем, где микроорганизмы, коралловые рифы, губки и многие другие интригующие существа взаимодействуют и формируют свои жизненные сообщества. Пересылка из Бразилии в Австралию набора данных, содержащего более 30 терабайт в сжатой форме, заняла несколько месяцев.
Обработка и анализ данных в Fiocruz
Команда Fiocruz была занята дальнейшей обработкой первичных результатов вычислений проекта. В рабочем процессе необработанные данные расширяются и дешифруются, ассоциируясь с правильными сравнениями между геномами, проверяются на наличие ошибок, отображаются в таблицах и связаны со многими различными объектами данных, чтобы преобразовать их в значимую информацию.
Команда имеет дело с быстро растущим размером базы данных, а также приобрела и установила новое оборудование (600 Tb), чтобы помочь разместить все данные. Они также хотят создать интерфейс базы данных, который обращается к широкой общественности, заинтересованной в биоразнообразии, и не только к ученым, специализирующимся на функциональном анализе закодированных белков в геномах конкретных форм жизни.
Некоторые из данных в настоящее время используются в таких проектах, как разработка вакцин и лекарств против арбовирусов, таких как вирусы Зика, лихорадка денге и желтой лихорадки, а также для понимания взаимодействия бактерий с окружающей их средой и того, как это отражается в их метаболических путях, когда свободные живые бактерии сравниваются с их близкими родственниками, которые являются человеческими патогенами, такими как Mycobacterium tuberculosis и экологическими микобактериями.
Поиск партнерства
Fiocruz ищет партнерские отношения, которые добавили бы дополнительную аналитику данных и искусственный интеллект в проект. Исследователи хотели бы включить визуализацию функциональных связей между организмами, а также особенности из самых разных организмов, включая глубоководные термальные артечные бактерии; бактерии и протисты (любой одноклеточный организм, который не является животным, растением или грибком) из почвы, воды, земли и моря или важных для здоровья человека, животных или растений; и очень сложные геномы растений, животных и человека.
Мы благодарим всех, кто участвовал в части проекта World Community Grid этого проекта, и с нетерпением ожидаем возможности поделиться свежими новостями по мере продолжения анализа данных.
на англ.