ПРИМЕНЕНИЕ СОВРЕМЕННЫХ МЕТОДОВ DATA MINING ДЛЯ ПРОГНОЗИРОВАНИЯ ЗАВИСИМОСТИ «СТРУКТУРА/СВОЙСТВО» ХИМИЧЕСКИХ СОЕДИНЕНИЙ СУЛЬФАНИЛАМИДОВ
Аннотация
В настоящее время актуальна разработка современных интеллектуальных технологий прогнозирования новых лекарственных препаратов с заданными фармакологическими свойствами на базе методов искусственного интеллекта и статистического анализа данных. Статья посвящена исследованиям в области компьютерного молекулярного дизайна новых лекарственных препаратов сульфаниламидов с применением современного программного обеспечения для интеллектуального анализа данных Rapid Miner. Разработана база данных дескрипторов сульфаниламидов на основе крупнейшего мирового ресурса химической информации Mol-Instincts. Представлена графическая модель предварительной обработки дескрипторов сульфаниламидов в среде Rapid Miner с помощью алгоритма Random Forest и метода главных компонент. Получены результаты численного моделирования, осуществлена визуализация данных в 2D и 3D форме.
Ключевые слова: data mining, сульфаниламидтер дескрипторы