[Back]


Publications in Scientific Journals:

A. Haywood, J. Redshaw, M. Hanson-Heine, A. Taylor, A. Brown, A. Mason, T. Gärtner, J. Hirst:
"Kernel Methods for Predicting Yields of Chemical Reactions";
Journal of Chemical Information and Modeling, 62 (2022), 9; 2077 pages.



English abstract:
The use of machine learning methods for the prediction of reaction yield is an emerging area. We demonstrate the applicability of support vector regression (SVR) for predicting reaction yields, using combinatorial data. Molecular descriptors used in regression tasks related to chemical reactivity have often been based on time-consuming, computationally demanding quantum chemical calculations, usually density functional theory. Structure-based descriptors (molecular fingerprints and molecular graphs) are quicker and easier to calculate and are applicable to any molecule. In this study, SVR models built on structure-based descriptors were compared to models built on quantum chemical descriptors. The models were evaluated along the dimension of each reaction component in a set of Buchwald-Hartwig amination reactions. The structure-based SVR models outperformed the quantum chemical SVR models, along the dimension of each reaction component. The applicability of the models was assessed with respect to similarity to training. Prospective predictions of unseen Buchwald-Hartwig reactions are presented for synthetic assessment, to validate the generalizability of the models, with particular interest along the aryl halide dimension.

German abstract:
Der Einsatz von Methoden des maschinellen Lernens für die Vorhersage der Reaktionsausbeute ist ein neues Gebiet. Wir demonstrieren die Anwendbarkeit der Support-Vektor-Regression (SVR) für die Vorhersage von Reaktionsausbeuten unter Verwendung kombinatorischer Daten. Molekulare Deskriptoren, die bei Regressionsaufgaben im Zusammenhang mit chemischer Reaktivität verwendet werden, basieren häufig auf zeitaufwändigen, rechenintensiven quantenchemischen Berechnungen, in der Regel der Dichtefunktionaltheorie. Strukturbasierte Deskriptoren (molekulare Fingerabdrücke und molekulare Graphen) sind schneller und einfacher zu berechnen und auf jedes Molekül anwendbar. In dieser Studie wurden SVR-Modelle, die auf strukturbasierten Deskriptoren basieren, mit Modellen verglichen, die auf quantenchemischen Deskriptoren basieren. Die Modelle wurden entlang der Dimensionen der einzelnen Reaktionskomponenten in einer Reihe von Buchwald-Hartwig-Aminierungsreaktionen bewertet. Die strukturbasierten SVR-Modelle übertrafen die quantenchemischen SVR-Modelle entlang der Dimensionen der einzelnen Reaktionskomponenten. Die Anwendbarkeit der Modelle wurde im Hinblick auf die Ähnlichkeit mit dem Training bewertet. Zur Validierung der Verallgemeinerbarkeit der Modelle werden prospektive Vorhersagen von ungesehenen Buchwald-Hartwig-Reaktionen zur synthetischen Bewertung vorgestellt, mit besonderem Interesse entlang der Arylhalogenid-Dimension.

Keywords:
Addition reactions,Additives,Aromatic compounds,Chemical reactions,Molecules


"Official" electronic version of the publication (accessed through its Digital Object Identifier - DOI)
http://dx.doi.org/10.1021/acs.jcim.1c00699

Electronic version of the publication:
https://pubs.acs.org/doi/10.1021/acs.jcim.1c00699


Created from the Publication Database of the Vienna University of Technology.