Нейросеть научилась прогнозировать свойства органических соединений
Учёные из России, Эстонии и Великобритании создали новый метод прогнозирования важного свойства органических молекул – фактора биоконцентрации, сообщается на сайте Сколтеха.
Новый подход, основанный на классических моделях физико-химических взаимодействий растворителя с растворяемым веществом и современных методах машинного обучения, позволяет прогнозировать сложные свойства веществ, используя минимальный набор исходных данных.
Фактор биоконцентрации характеризует степень накопления вещества в живых организмах, он является одним из важнейших свойств органических веществ, используемых при оценке безопасности того или иного химического соединения.
Оценить этот параметр на практике можно, добавив исследуемое вещество, к примеру, в ёмкость с живой рыбой и спустя некоторое время померив его концентрацию в рыбе и в окружающей воде. Но как оценить фактор биоконцентрации чисто теоретически, без проведения дополнительных экспериментов?
Первый способ – это сгенерировать множество параметров (дескрипторов), описывающих молекулы, и построить на основе этих данных математическую модель. Она может получиться точной, но плохо интерпретируемой за счёт большого числа параметров.
Что ещё хуже, модель может работать неудовлетворительно для соединений, слишком отличающихся от представленных в обучающей выборке.
Второй подход основан на молекулярной теории жидкости, описывающей поведение веществ в растворах. Однако так как биоконцентрация – это сложный параметр, зависящий от множества факторов, то, используя физико-химическую теорию напрямую, предсказать биоконцентрацию тоже не получится.
Учёные из Сколтеха, Университета Тарту (Эстония) и Университета Стратклайда (Великобритания) под руководством профессора Сколтеха Максима Федорова разработали гибридный метод предсказания фактора биоконцентрации.
Сначала они проводят физико-химические расчёты, на основе которых определяют трёхмерные плотности водорода и кислорода вокруг изучаемой молекулы, а потом применяют к этим данным 3D свёрточные нейронные сети, технологию, уже успешно используемую для распознавания изображений.
Данный подход демонстрирует, что для описания сложных свойств органических веществ достаточно небольшого объёма исходной информации.
"Разработанный нами метод позволит существенно упростить прогнозирование экологической нагрузки от того или иного вещества. Но самое главное в нашей работе это то, что мы разработали универсальный способ описания молекулы для передачи её "образа" в трёхмерную свёрточную нейронную сеть", — говорит аспирант Сколтеха Сергей Соснин, первый автор опубликованной статьи.
По его словам, в перспективе разработки позволят прогнозировать свойства различных экзотических молекул и принципиально новых соединений, для которых существующие методы поиска соотношений структура-свойство неприменимы.
Результаты исследования опубликованы в издании Journal of Physics: Condensed Matter.
К слову, ранее авторы проекта "Вести.Наука" (nauka.vesti.ru) рассказывали о том, что искусственный интеллект научился прогнозировать побочные эффекты от приёма нескольких лекарств. Более того, нейросеть научилась проходить лабиринты лучше человека и даже прогнозировать риск смерти.