Наука: в единой базе впервые собрали большинство известных белков - их 200 миллионов

 11.08.2022 03:29:00

Опубликована база данных AlphaFold Protein Structure от DeepMind. В нее входит более 200 млн белков.

В 2021 году компания Alphabet DeepMind выпустила базу данных с открытым исходным кодом, в которой были раскрыты 3D-структуры сотен тысяч белков. В частности, около 20 тыс. известных белков, которые есть в человеческом организме.

Теперь эту базу данных расширили до 200 млн. В нее входят почти все известные науке белки.

Сегодня ученым по прежнему сложно рассчитать точную структуру белка на основе аминокислот, из которых он состоит. Обычно для этого нужно затратить огромное количество вычислительных мощностей и времени. Это назвали проблемой сворачивания белка. Поэтому прогресс в этой области идет относительно медленно.

Теперь компания Alphabet натренировала мощный ИИ DeepMind. Он был обучен на 100 000 известных белковых структура. Такая система, по словам разработчиков, может предсказывать структуры миллионов других белков. На определение каждого уходили минуты или секунды, а не месяцы или годы.

Теперь DeepMind выпустила новое масштабное обновление базы данных. Теперь в нее входит около 214 млн структур из миллиона видов. Это почти все белки, известные в настоящее время науке. Отмечается, что база данных поможет проводить исследования в области лечения заболеваний, создания вакцин, а также поможет решить проблему устойчивости к антибиотикам.

Всю базу, которая состоит из 25 терабайт данных, можно загрузить из Google Cloud.


Источник: https://hightech.fm

При поддержке