Проблема отбора релевантных дескрипторов при прогнозировании токсичности химических веществ

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Введение. Математические модели широко применимы при проведении токсикологических исследований и могут использоваться для заполнения пробелов, возникающих при оценке химической безопасности. Большая часть внимания уделяется вопросам изучения алгоритмов построения моделей, а не подходам к выбору наиболее информативных признаков.

Поэтому, цель настоящей работы — осветить аспекты проблемы выбора полезных переменных при проведении математического моделирования.

Материал и методы. В интерактивной среде Google Colaboratory на основании программного кода при помощи обеспечения RDKit, Mordred были сгенерированы SMILES и молекулярные дескрипторы для фосфорорганических инсектицидов. С помощью инструментов библиотеки scikit-learn Ver. 1.2.2 происходил отбор признаков методом фильтрации и методом рекурсивного исключения признаков. Из официальных информационных источников о химических веществах были взяты значения параметров острой пероральной токсичности. Полученные модели прошли процедуру внутренней валидации, проведена сравнительная оценка производительности моделей.

Результаты. Необходимо отметить, что модели, где использовалось рекурсивное исключение признаков, обладают лучшими характеристиками, чем модели на основе дескрипторов, отобранных методом фильтрации. В частности, модель прогнозирования острой токсичности для органотиофосфатов на основе метода дерева принятия решения с рекурсивным исключением признаков обладает высоким коэффициентом детерминации (R2=0,91713), сравнительно небольшой среднеквадратичной ошибкой (RMSE=0,35099), а также высоким значением коэффициента детерминации кросс-валидации (Q2LOO= 0,79756).

Ограничения исследования. Полученные результаты могут быть использованы только при прогнозировании токсичности указанной группы химических веществ со сходным механизмом действия.

Заключение. Использование математического моделирования — перспективный инструмент оценки токсичности химических веществ, имеющий ряд особенностей: с одной стороны, это быстрый и удобный ресурс для проведения скрининга токсичности веществ, с другой — модель необходимо обучить на основе не только надежных данных исследований, но и провести процедуру качественного отбора признаков, вносящих значительный вклад в функционирование прогностической модели.

Соблюдение этических стандартов. Исследование не требует представления заключения комитета по биомедицинской этике или иных документов.

Конфликт интересов. Авторы заявляют об отсутствии конфликтов интересов.

Финансирование. Исследование не имело спонсорской поддержки.

Дата поступления: 21 сентября 2023 / Дата принятия к печати: 03 декабря 2023 / Дата публикации: 29 декабря 2023

Об авторах

Екатерина Андреевна Гусева

Федеральное государственное автономное образовательное учреждение высшего образования Первый Московский государственный медицинский университет имени И.М. Сеченова Министерства здравоохранения Российской Федерации (Сеченовский Университет)

Автор, ответственный за переписку.
Email: guseva_e_a@staff.sechenov.ru
ORCID iD: 0000-0001-8389-7981

Ассистент кафедры экологии человека и гигиены окружающей среды Института общественного здоровья им. Ф.Ф. Эрисмана ФГАОУ ВО Первый МГМУ им. И.М. Сеченова Минздрава России (Сеченовский Университет), 199911, Москва, Россия

e-mail: guseva_e_a@staff.sechenov.ru

Россия

Список литературы

  1. Сухачев В.С., Иванов С.М., Филимонов Д.А., Поройков В.В. Альтернативные методы исследования. Компьютерная оценка острой токсичности для грызунов. Лабораторные животные для научных исследований. 2019; 4. https://doi.org/10.29296/2618723X-2019-04-04
  2. Gramatica P., Papa E., Sangion A. QSAR modeling of cumulative environmental end-points for the prioritization of hazardous chemicals. Environmental Science: Processes & Impacts. 2018; 20(1): 38–47. https://doi.org/10.1039/C7EM00519A
  3. Carrio P., Sanz F., Pastor M. Towards a unifying strategy for predicting toxicological endpoints based on structure. Archive of Toxicology. 2016; 90: 2445–460. https://doi.org/10.1007/s00204-015-1618-2
  4. Reyes A.B., Bayich V.B. In silico toxicology: computational methods for predicting chemical toxicity. Interdisciplinary reviews of Wiley: Computational Molecular Science. 2016; 6(2): 147–72. https://doi.org/10.1002/wcms.1240
  5. Villaverde J.J., Sevilla-Moran B., Lopez-Goti S., Alonso-Prados J.L., Sandin-España P. QSAR/QSPR models based on quantum chemistry for assessing the risk of pesticides in accordance with current European legislation. SAR and QSAR in environmental studies. 2020; 31(1): 49–72. https://doi.org/10.1080/1062936X.2019.1692368
  6. Жолдакова З.И., Харчевникова Н.В. Система ускоренной оценки токсичности и опасности химических веществ в воде. Здоровье населения и среда обитания. 2014; 8(257): 21–3.
  7. Idakwo G., Luttrell J., Chen M., et al. A review on machine learning methods for in silico toxicity prediction. Journal of environmental science and health. Part C. Environmental carcinogenesis & ecotoxicology reviews. 2018; 36(4): 169–91. https://doi.org/10.1080/10590501.2018.153711
  8. Moriwaki H., Tian Y.S., Kawashita N. et al. Mordred: a molecular descriptor calculator. J Cheminform 2018; 10, 4. https://doi.org/10.1186/s13321-018-0258-y
  9. Gallagher M.E. Toxicity testing requirements, methods and proposed alternatives. Environmental Law and Policy Journal. 2003; 26(2): 257–73.
  10. Dearden J.C., Cronin M. T.D., Kaiser K.L.E. How not to develop a quantitative structure–activity or structure–property relationship (QSAR/QSPR). SAR and QSAR in Environmental Research. 2009; 20(3–4): 241–66. https://doi.org/10.1080/10629360902949567
  11. Golbraikh A., Tropsha A. Predictive QSAR modeling based on diversity sampling of experimental datasets for the training and test set selection. Journal of Computer-Aided Molecular Design. 2002; 16(5/6): 357–69. https://doi.org/10.1023/A:1020869118689
  12. Frimayanti N., Yam M.L., Lee H.B., Othman R., Zain S.M., Rahman N.A. Validation of Quantitative Structure-Activity Relationship (QSAR) Model for Photosensitizer Activity Prediction. International Journal of Molecular Sciences. 2011; 12(12): 8626–44. https://doi.org/10.3390/ijms12128626

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Гусева Е.А., 2024



СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № ФС 77 - 81728 от 11 декабря 2013.