Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

CREATION OF GROUPS OF RADICAL ABSTRACTION REACTIONS BY ALGORITHM K-MEANS FOR THE PREDICTION OF PHYSICAL AND CHEMICAL CHARACTERISTICS OF REAGENTS

Tumanov V.E. 1
1 Institute of Problems of Chemical Physics RAS
Algorithms of a clustering to k-means and c-means were applied to splitting of radical abstraction reactions of atom of hydrogen into groups. Program realization of algorithms was executed in the C# programming language. Comparison of the constructed classification of radical abstraction reactions with classification constructed by an expert way is carried out. Distinction and similarity of these classifications of radical reactions is shown. The new method of an evaluation of bond dissociation energy of organic molecules on kinetic data with use of coordinates of the center of a cluster is offered. On the example of one cluster computing experiment on estimates of bond dissociation energy is executed. Comparison with literary data is given. Approach to an evaluation of reactionary ability of organic molecules in radical abstraction reactions of atom of hydrogen with use of coordinates of the center of a cluster is offered. Calculation of reactionary ability of hypothetical radical abstraction reactions of atom of hydrogen is given.
clustering
k-means algorithms
radical abstraction reaction
bond dissociation energy
activation energy
1. Berezin I.V. Vlijanie struktury i sredy na reakcionnuju sposobnost’ uglevodorodov v reakcijah s metil’nymi radikalami v zhidkoj faze / I.V. Berezin, O. Dobish // DAN SSSR. 1962. T. 144. no. 2. рр. 374–377.
2. Berezin I.V. Otnositel’naja reakcionnaja sposobnost’ ketonov pri vzaimodejstvii ih so svobodnymi metil’nymi radikalami. / I.V. Berezin, V.L. Ivanov, N.F. Kazanskaja, N.N. Ugarova // Zhurnal fizicheskoj himii. 1965. T. 39. no. 12. pp. 3011–3014.
3. Denisov E.T. Novye jempiricheskie modeli reakcij radikal’nogo otryva / E.T. Denisov // Uspehi himii. 1997. T. 66. no. 10. pp. 953–971.
4. Dobish O. Reakcionnaja sposobnost’ uglevodorodov v reakcijah s metil’nymi radikalami. Diss. …. kandidata himicheskih nauk. M.: MGU. 1962.
5. Zhavnerko G.K. Reakcii sec-geptil radikalov s C-H-svjazjami alkilaromaticheskih i alifaticheskih uglevodorodov / G.K. Zhavnerko, V.E. Agabekov, L.V. Beresnevich // Kinetika i kataliz. 1988. T. 29. no. 1. pp. 54–58.
6. Tumanov V.E. Ocenka jenergij dissociacii S-Н-svjazej v uglevodorodah i jental’pij obrazujushhihsja iz nih radikalov na osnove kineticheskih dannyh / V.E. Tumanov, E.T. Denisov // Neftehimija. 2001. T.41. no. 2. pp.108–117.
7. Tumanov V.E. Sistema nauchnoj osvedomlennosti po fizicheskoj himii radikal’nyh reakcij / V.E. Tumanov, A.I. Prohorov, D.Ju. Lazarev, M.E. Solov’eva // Informacionnye resursy Rossii. 2010. no. 5. pp. 16–21.
8. Bezdek J.C. Pattern Recognition with Fuzzy Objective Function Algorithms. New York, Plenum Press, 1981. 256 p.
9. Buckley R.P. Reactions of methyl radicals with substrates acting as hydrogen donors and as methyl radical acceptors / R.P. Buckley, F. Leavitt, M. Szwarc // J. Am. Chem. Soc. 1956. Vol. 78. no. 21. pp. 5557–5560.
10. Eachus A.S. Reactions of methyl radicals with aromatic hydrocarbons. / A. S. Eachus, J. A. Meyer, J. Pearson, M. Szwar // J. Am. Chem. Soc., 1968, Vol. 90, no. 14, pp. 3646–3650.
11. Gresser J. Methyl affinities of some cyclic olefins and polyenes./ J. Gresser, A. Rajbenbach, M. Szwarc // J. Am. Chem. Soc., 1961, Vol. 83, no. 14, pp. 3005–3008.
12. Luo Y.-R. Comprehensive Handbook of Chemical Bond Energies. CRC Press, Boca Raton, London New York, 2007. 1655 p.
13. Miyamoto S., Ichihashi H., Honda K. Algorithms for Fuzzy Clustering. Methods in c-Means Clustering with Applications. Springer-Verlag Berlin Heidelberg, 2008. 244 p.

В настоящее время применение методов интеллектуального анализа данных в предметно-ориентированных информационных системах химических данных является актуальной научно-практической задачей [13]. Одним из таких методов является метод кластеризации, в результате которого могут быть построены группы химических объектов, близких по набору своих физико-химических характеристик. В ряде случаев построенное разбиение исходного множества на группы может быть использовано для предсказания некоторых характеристик объектов.

Целью настоящего работы является использование алгоритмов кластеризации к-средних для автоматического построения групп радикальных реакций отрыва, обладающих сходной реакционной способностью, по экспериментальным выборкам из нескольких баз данных.

Постановка задачи и метод решения

Элементарную радикальную реакцию отрыва атома водорода Rº + R1H → RH + Rº1 можно описать следующим набором характеристик [3, 6]:

1. Классическая энтальпия реакции:

DHe = Di – Df + 0,5(hLni – hLnf), (1)

где ni – частота валентного колебания разрываемой связи; nf – частота валентного колебания образующейся связи; h – постоянная Планка; L – число Авогадро; Di – энергия диссоциации разрываемой связи; Dei = Di + 0,5hLni,, где Df – энергия диссоциации образующейся связи, Def = Df + 0,5hLnf.

2. Классический потенциальный барьер Ee:

Ee = Ei + 0,5(hLni – RT), (2)

который отсчитывается от минимума потенциальной кривой рвущейся связи до точки минимума переходного состояния. R – газовая постоянная; T – абсолютная температура в К; Ei – экспериментальная энергия активации радикальной реакции.

3. Коэффициенты

b = p(2mi)1/2ni и bf = p(2mf)1/2nf, (3)

которые описывают зависимость потенциальной энергии от амплитуды колебаний атомов вдоль рвущейся (i) и образующейся (f) валентной связи, 2b2 – силовая постоянная связи, mi – приведенная масса атомов для разрываемой связи, mf – приведенная масса атомов для образующейся связи.

4. Коэффициент

a = b/bf . (4)

Первая задача исследования состоит в формировании метрического пространства признаков, исходя из характеристик радикальной реакции отрыва, и затем разбиении экспериментальной выборки реакций на группы в этом пространстве.

Введем переменные

X = (α2(Ee – ΔHe))1/4 и Y = (Ee)1/4.

Тройка {Rº + R1H → RH + Rº1, X, Y} будет метрическим пространством признаков для разбиения исходного набора радикальных реакций на группы (кластеры).

Источником экспериментальных послужили базы данных по константам скорости радикальных жидкофазных реакций и по энергиям диссоциации связей органических молекул предметно-ориентированной системы научной осведомленности в области физической химии радикальных реакций [7]. Для решения задачи группировки радикальных реакций был выбран массив экспериментальных данных по реакциям отрыва атома водорода алкильными радикалами от молекул углеводородов и их производных, выборка из базы данных по энергиям диссоциации связей органических соединений (269 реакций). Согласно классификации радикальных реакций, построенной экспертным путем [3, 6], выборка включала реакции четырех классов: 39 реакций с углеводородами и 100 реакций с производными от углеводородов, объединенных в класс Rº + R1H, 31 реакцию класса Rº + R2H, 99 реакций класса Rº + R3H, где Rº – алкильный радикал, R1H – углеводород, R2H – олефин, R3H – алкилароматический углеводород.

В качестве алгоритмов кластеризации были взяты классический алгоритм к-средних и алгоритм с-средних [8], для которых были разработаны соответствующие программы. Метрикой в алгоритмах кластеризации было евклидово расстояние.

Eqn132_1.wmf (5)

Были выполнены расчеты с различным числом кластеров для обоих алгоритмов (10, 20, 30 кластеров). Результаты разбиения на кластеры, полученные с использованием алгоритма к-средних и алгоритма с-средних, существенно не отличались за исключением того, что в нечетком случае наблюдалось смещение центра кластеров отношению классического случая.

Полученные в результате разбиения кластеры реакций в целом обладают следующими свойствами: кластер образует реакции либо одного радикала с группой соединений одного класса, либо реакции радикалов, которые имеют близкие значения образующей связи Df. Не наблюдается соответствия между классификацией радикальных реакций, построенной экспертным путем [3, 6] и полученной в результате кластеризации: имеет место, например, единичное попадание спиртов, простых и сложных эфиров в кластер с подавляющем содержанием алкилароматических соединений и т.п.). За недостаточностью места мы не будем приводить таблицу с полным разбиением. Рассмотрим несколько характерных примеров кластеров.

Так, кластер 1 содержит 8 реакций алкилароматических соединений с метильным радикалом, для которого Df = 440 кДж/моль [12] (показаны продукты реакции): {5 реакций CH4 + C6H5Cº(CH3)2, реакцию CH4 + (C6H5)2CºH и 2 реакции CH4 + C6H5CºH2}.

Кластер 3 содержит 3 реакции. Прочность С-Н-связи в CHCl3 Df = 392,5 кДж/моль, а в (CH3)3CH она составляет 400 кДж/моль [12]: {реакцию CHCl3 + цикло-[CºH(CH2)4], реакцию CHCl3 + (CH3)3Cº и реакцию (CH3)3CH + цикло-[(CH2)5CºH]}.

Кластер 7 содержит 5 реакций метильного радикала с циклоолефинами (Df = 440,0 кДж/моль [12]). {3 реакции CH4 + цикло-[CH = CHCºH(CH2)3], реакцию CH4 + цикло-[CH = CHCºH(CH2)4], реакцию CH4 + цикло-[CH = CHCºH(CH2)5]}.

Кластер 27 содержит 9 реакций алкильных радикалов с различными углеводородами. Для радикала CH3(CH2)9CºH2 прочность С-Н-связи Df = 422 кДж/моль [12] в CH3-группе. {2 реакции CH3(CH2)9CH3 + C6H5Cº(CH3)2, реакцию CH4 + CH2 = C(CH3)CºH2, реакцию CH4 + C6H5CºH2, 4 реакции CH4 + цикло-[C(O)CºH(CH2)3] и реакцию CH4 + CH3CºHC(O)CH2CH3}. В этом примере кластера алкильные радикалы атакуют различные углеводороды и их производные.

Таким образом, полученные результаты кластеризации отличаются от классификации, построенной экспертным путем. Кластеризация является более детализированной и более точно отражает структуру реакционного центра радикальной реакции отрыва.

Так же как и для классификации, полученной экспертным путем, с каждым кластером можно связать некоторое корреляционное соотношение, которое позволит делать предсказанное значений физико-химических характеристик реагентов [3]. При этом основная роль при предсказании реакционной способности молекул и энергий диссоциации разрываемой связи будет отведена координатам центров полученных кластеров.

Предсказание энергии диссоциации разрываемой С-Н-связи

Предсказание энергии диссоциации связи строится на предположении о том, что радикальная реакция отрыва с неизвестной разрываемой С–Н-связью попадает в определенный кластер. При этом предполагается, что Eqn133.wmf центра кластера и Eqn134.wmf рассматриваемой реакции (неизвестно) отличаются не более чем на определенную величину. За такую величину можно принять

Eqn135.wmf (6)

где Ncl –число элементов кластера; dj – расстояние j-элемента кластера; β – подгоночный параметр – положительная величина меньшая 0,5.

Тогда энергия диссоциации разрываемой С–Н-связи может быть вычислена с помощью следующих шагов.

Вычислить разность энергий активации реакций между реакцией-центром кластера и исследуемой реакции. В пределах одного кластера предэкспоненциальный множитель Ao в расчете на одну реагирующую связь остается постоянным, так что разность энергий активации реакций DEi с участием реагентов RсH и RiH может быть вычислена по формуле:

DEi = –RT ln((kin1)/(k1ni)), (7)

где ki – константа скорости исследуемой реакции; kс – константа скорости реакции-центра кластера; ni, nс – число эквивалентных атакуемых связей в исследуемой реакции и реакции-центра кластера соответственно.

Вычислить энтальпию опорной реакции:

DHeс = Diс1 – Dfс + 0,5(hLni – hLnf). (8)

Вычислить разность прочностей связей в реагенте и продукте. Из формулы расстояния, записанной для реакции-центра кластера и исследуемой реакции, вытекает следующая зависимость между разностью прочности связей DDi = Di – Df и DEi :

Eqn136.wmf (9)

или

Eqn137.wmf (10)

Eei = Eec + DEi; (11)

Eqn138.wmf (12)

или

Eqn139.wmf (13)

где Dd = (di)2 – (dc)2. В случае, когда атака в рассматриваемой паре реакций производится одинаковыми радикалами, то формула (11) принимает вид

Eqn140.wmf (14)

или

Eqn141.wmf (15)

Вычислить энергию диссоциации разрываемой связи по формуле:

Di = DDi + D1 (16)

Покажем применение метода на практике. Рассмотрим кластер 7. Реакция метильного радикала с циклоалкенами. Центром кластера является реакция {метан + циклогексен} с d = 4.9. Прочность С-Н-связи в циклогексене в α-положении к двойной связи равна Df = 341,5 кДж/моль [12]. Результаты расчета приведены в табл. 1.

Как видно из таблицы, результаты вычислений находятся в хорошем согласии с данными справочника [12]: Di = 346,6; 357,2; 329,3 и 330,9 кДж/моль по строкам соответственно.

Предсказание классического потенциального барьера

Исходя из предположений, сделанных в предыдущем разделе статьи, оценить значение классического потенциального барьера исследуемой реакции можно по формулам:

Eqn142.wmf если α ≠ 1; (17)

Eqn143.wmf если α = 1. (18)

Таблица 1

Расчет энергий диссоциации связей Di в олефинах по кинетическим данным. Т – температура в К, ki – константа скорости реакции, k1 – константа скорости опорной реакции, Eei – энергия активации реакции, D1 – энергия диссоциации связи реакции – центра кластера, DDi – приращение энергии диссоциации связей, n1 и ni – число атакуемых связей в опорном и исследуемом реагентах

Радикал

Реагент

R1H Df, кДж/моль

T

ki/k1

n1/ni

DEei

DDi

Di

Л-ра

CºH3

цикло-[CH = CHC{–H}(CH2)4]

Циклогексен

341,5

350

0,63

1,00

1,60

5,08

346,9

[11]

CºH3

цикло-[CH = CHC{–H}(CH2)5]

Циклогексен

341,5

343

0,23

1,00

4,20

15,27

356,8

[11]

CºH3

цикло-[CH = CHC{–H}(CH3)(CH2)2]

Циклогексен

341,5

353

353

333

1,35

0,86

1,14

4,00

–4,95

–3,63

–4,18

–14,28

–10,38

–11,99

327,2

331,1

329,5

329,3

[1]

[4]

CºH3

цикло-[CH = CHCH = CHCH{–H}CH2]

Циклогексен

341,5

333

1,93

2,00

–3,72

–10,04

330,9

[11]

В табл. 2 приведен пример расчета по формуле (14) для уже рассмотренного нами кластера 27. Центром кластера является реакция {метан + кумол} с d = 4,2.

Таблица 2

Энергии активации реакций алкильных радикалов с C-H связью органических соединений Rº + RiH → RH + Riº при различных Т

RiH

E (кДЖ/моль)

CºH3

CH3(CH2)9CºH2

C6H5CH(CH3)2

16,8 (Т = 338 К) [10]

26,7 (Т = 373 К) [5]

C6H5CH3

28,2 (Т = 338 К)

32,7 (Т = 373 К)

CH2 = C(CH3)2

28,6 (Т = 338 К) [9]

12,9 (Т = 373 К)

цикло-[C(O)(CH2)4]

28,9 (Т = 338 К) [2]

49,8 (Т = 373 К)

CH3CH2C(O)CH2CH3

23,4 (Т = 338 К) [2]

51,5 (Т = 373 К)

Полученные данные находятся в хорошем согласии с экспериментальными данными в пределах ошибки ±2,5 кДж/моль (для указанных литературных источников).

Заключение

В статье приведены результаты кластеризации экспериментальной выборки радикальных реакций отрыва типа Rº + RiH → RH + Riº алгоритмами к-средних. Показано, что полученное разбиение отличается от классификации, построенной экспертным путем.

На основе построенной кластеризации радикальных реакций отрыва предложен метод оценки энергии диссоциации С‒Н-связи по кинетическим и термохимическим данным для таких реакций с использованием координат центра кластера в построенном метрическом пространстве. Результаты полученного прогноза для контрольной выборки реакций находятся в хорошем согласии с экспериментальными данными.

В рамках построенной кластеризации предложен метод прогноза реакционной способности реакций радикального отрыва по термохимическим данным с использованием координат центра кластера.

Рецензенты:

Волохов В.М., д.ф.-м.н., зав. отделом, ИПФХ РАН, г. Черноголовка;

Психа Б.Л., д.х.н., зав. лаб., ИПХФ РАН, г. Черноголовка.

Работа поступила в редакцию 27.05.2013.