RU2265244C2 - Method for modeling and predicting linking of ligand molecules with target molecules by quantum mechanics methods with consideration of solvent effect - Google Patents
Method for modeling and predicting linking of ligand molecules with target molecules by quantum mechanics methods with consideration of solvent effect Download PDFInfo
- Publication number
- RU2265244C2 RU2265244C2 RU2003128413/09A RU2003128413A RU2265244C2 RU 2265244 C2 RU2265244 C2 RU 2265244C2 RU 2003128413/09 A RU2003128413/09 A RU 2003128413/09A RU 2003128413 A RU2003128413 A RU 2003128413A RU 2265244 C2 RU2265244 C2 RU 2265244C2
- Authority
- RU
- Russia
- Prior art keywords
- ligand
- atoms
- solvent
- molecule
- target
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/10—Analysis or design of chemical reactions, syntheses or processes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C10/00—Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Crystallography & Structural Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Pharmacology & Pharmacy (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Medicinal Chemistry (AREA)
- Computing Systems (AREA)
- Analytical Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
Abstract
Description
Изобретение относится к разработке новых соединений для медицины, биотехнологии, физики конденсированных сред и различных областей материаловедения, в которых существенны межмолекулярные взаимодействия, и может быть использовано при разработке новых лекарственных препаратов методами in silico - то есть путем численного моделирования комплекса лекарственного вещества с рецептором или целевым белком. В ходе такого моделирования могут быть получены значения энергетических величин, характеризующих интенсивность взаимодействия белка и лекарственного вещества. На основании этих значений можно сделать вывод об устойчивости комплекса лекарственного вещества с рецептором или целевым белком. Устойчивость комплекса прямо связана с возможной эффективностью лекарственного соединения.The invention relates to the development of new compounds for medicine, biotechnology, condensed matter physics and various fields of material science in which intermolecular interactions are significant, and can be used to develop new drugs using in silico methods - that is, by numerically simulating a complex of a drug substance with a receptor or target protein. In the course of such modeling, values of energy quantities characterizing the intensity of the interaction of the protein and the drug substance can be obtained. Based on these values, it can be concluded that the complex of the drug substance with the receptor or target protein is stable. The stability of the complex is directly related to the possible effectiveness of the drug compound.
Для этой цели в настоящее время широко используются модели силового поля (например, такие, как AMBER2002, OPLS-AA, CHARMM, ab-initio силовое поле MMFF), в которых атомы в молекулах рассматриваются как классические частицы, взаимодействующие друг с другом с помощью потенциалов взаимодействия.For this purpose, force field models are currently widely used (for example, such as AMBER2002, OPLS-AA, CHARMM, ab-initio force field MMFF), in which atoms in molecules are considered as classical particles interacting with each other using potentials interactions.
Несмотря на широкое использование моделей силового поля для численного моделирования взаимодействия молекул друг с другом, эта методология часто неадекватно описывает поведение молекулярных систем. Это обусловлено тем, что поведение атомов в молекулах и электронов в атомах подчиняется законам квантовой, а не классической механики. В настоящее время квантовая механика широко применяется для вычисления характеристик молекул сравнительно небольшого размера (десятки атомов) и их взаимодействия между собой. В последнее время в связи с быстрым увеличением мощности компьютеров стали возможны квантовые расчеты молекулярных систем, содержащих сотни и даже тысячи атомов. Точность и время таких расчетов зависят от применяемых методов вычислений и используемых вычислительных мощностей. Учитывая интенсивное развитие первых и быстрый рост вторых, ясно, что применение квантовой механики для численного моделирования молекулярных систем будет возрастать. В частности, для вычисления интенсивности связывания молекулы-лиганда с молекулой-мишенью методы классических силовых полей будут вытесняться методами, основанными на уравнениях квантовой механики.Despite the widespread use of force field models for numerically modeling the interaction of molecules with each other, this methodology often inadequately describes the behavior of molecular systems. This is due to the fact that the behavior of atoms in molecules and electrons in atoms obeys the laws of quantum rather than classical mechanics. At present, quantum mechanics is widely used to calculate the characteristics of relatively small molecules (tens of atoms) and their interactions. Recently, in connection with the rapid increase in the power of computers, quantum calculations of molecular systems containing hundreds and even thousands of atoms have become possible. The accuracy and time of such calculations depend on the applied calculation methods and the used computing power. Given the intensive development of the former and the rapid growth of the latter, it is clear that the use of quantum mechanics for the numerical simulation of molecular systems will increase. In particular, to calculate the intensity of binding of a ligand molecule to a target molecule, the methods of classical force fields will be replaced by methods based on equations of quantum mechanics.
Однако методы квантовой механики ранее крайне редко использовались для описания биологических молекул, которые, как правило, являются макромолекулами, содержащими сотни и тысячи атомов. Так, неэмпирический метод Хартри-Фока и метод функционала плотности (DFT) использованы в работах [1-3] для описания квантовой части системы, которая погружена в молекулярное окружение, описываемое классически с помощью некоторого силового поля. Это так называемое QM/MM приближение, в котором описание части системы происходит по законам квантовой механики (QM), а другой части системы - по законам классической молекулярной механики (MM). В частности, вычисление энергии взаимодействия (а точнее энтальпии взаимодействия) между двумя биологическими молекулами проведено в работе [2], в которой моделировалась фермент-субстратная реакция.However, the methods of quantum mechanics were previously extremely rarely used to describe biological molecules, which, as a rule, are macromolecules containing hundreds and thousands of atoms. Thus, the non-empirical Hartree-Fock method and the density functional method (DFT) were used in [1–3] to describe the quantum part of a system that is immersed in a molecular environment, described classically using a certain force field. This is the so-called QM / MM approximation, in which the part of the system is described by the laws of quantum mechanics (QM), and the other part of the system by the laws of classical molecular mechanics (MM). In particular, the interaction energy (or rather the interaction enthalpy) between two biological molecules was calculated in [2], in which an enzyme-substrate reaction was modeled.
Более простой и соответственно более быстрый квантово-химический полуэмпирический метод PM3 использован в работе [4] для моделирования активного центра в ферменте цитидин деаминаза. Рассмотренная при моделировании молекулярная система содержала активный центр из 1330 атомов. Для расчета столь большой молекулярной системы использовался так называемый метод Divide-and-Conquer (разделяй и побеждай) или сокращенно D&C или DAC.The simpler and correspondingly faster quantum-chemical semi-empirical PM3 method was used in [4] to model the active center in the cytidine deaminase enzyme. The molecular system considered in the simulation contained an active center of 1330 atoms. To calculate such a large molecular system, the so-called Divide-and-Conquer (divide and conquer) method, or D&C or DAC for short, was used.
Полуэмпирический квантово-механический метод AM1 применялся для исследования электронной структуры биологических макромолекул в растворе [5], при этом использовалась континуальная модель растворителя. Энтальпии связывания белок - белок и белок - ДНК получены как разность между энтальпиями образования соответствующих комплексов и энтальпиями образования отдельных их компонентов, однако полученные данные оказались достаточно нереалистическими (около 5-20 эВ).The semi-empirical quantum-mechanical method AM1 was used to study the electronic structure of biological macromolecules in solution [5], and a continuous model of the solvent was used. Protein – protein and protein – DNA binding enthalpies were obtained as the difference between the enthalpies of formation of the corresponding complexes and the enthalpies of formation of their individual components, however, the data obtained turned out to be quite unrealistic (about 5–20 eV).
Несколько органических макромолекул, содержащих от 256 до 9378 атомов, были рассчитаны в рамках полуэмпирического метода PM3 с использованием метода D&C в рамках пакета квантово-химических программ MOPAC [6]. При этом расчеты проводились как в вакууме, так и в водном растворе с использованием приближения COSMO, в котором растворитель моделировался континуально. При этом также не определялись энергетические характеристики исследуемых химических систем, и основное внимание уделялось получению оптимизированных структур макромолекул и времени, требуемому на оптимизацию.Several organic macromolecules containing from 256 to 9378 atoms were calculated using the semiempirical PM3 method using the D&C method as part of the MOPAC package of quantum chemical programs [6]. In this case, the calculations were carried out both in vacuum and in an aqueous solution using the COSMO approximation, in which the solvent was modeled continually. At the same time, the energy characteristics of the studied chemical systems were not determined, and the main attention was paid to obtaining optimized structures of macromolecules and the time required for optimization.
Большинство известных квантово-механических исследований биологических макромолекул посвящено расчету энергетических характеристик различных ферментативных реакций. При этом исследовались механизмы различных реакций с участием молекул воды, их переходные комплексы и соответствующие энергетические барьеры. Однако во всех этих работах нет оценок интенсивности связывания белков и лигандов в их межмолекулярных комплексах, и не учитывается влияние растворителя на рассматриваемые процессы в макромолекулах.Most of the known quantum-mechanical studies of biological macromolecules are devoted to calculating the energy characteristics of various enzymatic reactions. In this case, the mechanisms of various reactions involving water molecules, their transition complexes, and the corresponding energy barriers were studied. However, in all these works there are no estimates of the intensity of binding of proteins and ligands in their intermolecular complexes, and the influence of the solvent on the processes under consideration in macromolecules is not taken into account.
Таким образом, из известной литературы видно, что при применении методов квантовой механики в способах моделирования биологических макромолекул отсутствует единый подход в определении интенсивности связывания молекул-лигандов с молекулами-мишенями. В известных способах с помощью методов квантовой механики определяются, в основном, структурные и электронные характеристики индивидуальных макромолекул с использованием механизмов и энергетических барьеров ферментативных реакций разрыва пептидной связи в белках. Сравнение таких вычисленных данных с экспериментально полученными данными свидетельствует о неудовлетворительной точности полученных величин. Из уровня техники не известны способы моделирования на основе квантово-механических расчетов энергетических характеристик межмолекулярного взаимодействия молекул-лигандов и молекул-мишеней. Кроме того, в существующих способах квантово-механического исследования макромолекул не обеспечивается корректным образом учет влияния растворителя, что очень важно при моделировании связывания биологических молекул-мишеней с молекулами-лигандами, где существенную роль играют водородные связи.Thus, it is seen from the known literature that when applying the methods of quantum mechanics in the methods of modeling biological macromolecules, there is no single approach to determining the intensity of binding of ligand molecules to target molecules. In known methods using the methods of quantum mechanics, mainly structural and electronic characteristics of individual macromolecules are determined using the mechanisms and energy barriers of enzymatic reactions of peptide bond cleavage in proteins. Comparison of such calculated data with experimentally obtained data indicates unsatisfactory accuracy of the obtained values. The prior art methods for modeling based on quantum-mechanical calculations of the energy characteristics of the intermolecular interaction of ligand molecules and target molecules are not known. In addition, the existing methods of quantum-mechanical study of macromolecules do not correctly account for the influence of the solvent, which is very important in modeling the binding of biological target molecules to ligand molecules, where hydrogen bonds play an important role.
В связи с этим задачей настоящего изобретения является создание способа моделирования межмолекулярного взаимодействия в водном растворе на основе методов квантовых расчетов с учетом влияния растворителя, как на молекулярном уровне, так и в виде экранирующего континуума, с учетом пространственной релаксации атомов и перераспределения электронной плотности при образовании межмолекулярного комплекса. Такой способ моделирования должен быть применим к определению интенсивности связывания молекул-лигандов с молекулами-мишенями независимо от состава и размера этих молекул, а также независимо от типа применяемого метода квантового расчета. Этот способ должен использовать минимальное количество подгоночных параметров и опираться по возможности только на основные принципы квантовой механики. Техническим результатом является создание способа моделирования и прогнозирования связывания молекул-лигандов с молекулами-мишенями методами квантовой механики с учетом влияния растворителя.In this regard, the objective of the present invention is to provide a method for modeling intermolecular interaction in an aqueous solution based on quantum calculation methods, taking into account the influence of the solvent, both at the molecular level and in the form of a screening continuum, taking into account spatial relaxation of atoms and redistribution of electron density during the formation of intermolecular complex. This modeling method should be applicable to determining the intensity of binding of ligand molecules to target molecules, regardless of the composition and size of these molecules, and also regardless of the type of quantum calculation method used. This method should use the minimum number of adjustable parameters and rely, if possible, only on the basic principles of quantum mechanics. The technical result is the creation of a method for modeling and predicting the binding of ligand molecules to target molecules by quantum mechanics, taking into account the influence of the solvent.
Указанный результат достигается тем, что предложен способ моделирования и прогнозирования связывания молекул-мишеней и молекул-лигандов, при котором, исходя из структуры и состава межмолекулярного комплекса мишень-лиганд, молекулы-мишени и молекулы-лиганды, формируют модели межмолекулярного комплекса и его компонентов с явным и неявным учетом растворителя, которые используются далее при моделировании связывания молекулы-лиганда и молекулы-мишени с учетом влияния растворителя методами квантовой механики с выбранными параметрами моделирования. Используя результаты этого моделирования, вычисляют энтальпию, энтропию и свободную энергию связывания выбранной молекулы-лиганда и молекулы-мишени, характеризующие интенсивность связывания молекулы-лиганда с молекулой-мишенью, которые для известных лигандов сравнивают с известными экспериментальными данными. Для новых лигандов вычисленные величины при подобранных параметрах моделирования являются критерием интенсивности связывания молекулы-лиганда с молекулой-мишенью и, следовательно, являются критерием при прогнозировании лигандов как потенциальных лекарственных веществ.This result is achieved by the fact that a method for modeling and predicting the binding of target molecules and ligand molecules is proposed, in which, based on the structure and composition of the intermolecular target-ligand complex, target molecule and ligand molecule, models of the intermolecular complex and its components are formed with explicit and implicit accounting for the solvent, which are used later in modeling the binding of the ligand molecule and the target molecule, taking into account the influence of the solvent by quantum mechanics with the selected mode parameters elite. Using the results of this simulation, the enthalpy, entropy, and free binding energy of the selected ligand molecule and target molecule are calculated, which characterize the intensity of binding of the ligand molecule to the target molecule, which is compared with known experimental data for known ligands. For new ligands, the calculated values for the selected modeling parameters are a criterion for the intensity of binding of a ligand molecule to a target molecule and, therefore, are a criterion for predicting ligands as potential drug substances.
В заявленном способе моделирования структуру и состав молекулы-мишени и молекулы-лиганда получают с помощью экспериментальных измерений, из базы данных PDB (Protein Data Bank) [7], кроме того, структуру, состав и координаты атомов новой молекулы-лиганда могут получать с помощью специальных программ - построителей новых лигандов. Если в исходных структурах молекул-мишеней и молекул-лигандов отсутствуют данные о декартовых координатах водородных атомов, координаты недостающих атомов добавляют к координатам атомов молекулы-мишени и молекулы-лиганда, используя различные компьютерные программы построения молекулярных структур. Положения в пространстве добавленных атомов водорода определяют при молекулярно-механической или квантово-механической оптимизации из условия, при котором полная энергия молекулы-мишени и молекулы-лиганда достигает минимума при варьировании координат добавленных водородных атомов.In the claimed modeling method, the structure and composition of the target molecule and the ligand molecule are obtained using experimental measurements from the PDB database (Protein Data Bank) [7], in addition, the structure, composition and atomic coordinates of the new ligand molecule can be obtained using special programs - builders of new ligands. If the initial structures of target molecules and ligand molecules do not contain data on the Cartesian coordinates of hydrogen atoms, the coordinates of the missing atoms are added to the atomic coordinates of the target molecule and ligand molecule using various computer programs for constructing molecular structures. The positions in the space of the added hydrogen atoms are determined by molecular-mechanical or quantum-mechanical optimization from the condition under which the total energy of the target molecule and the ligand molecule reaches a minimum when the coordinates of the added hydrogen atoms are varied.
Структуру межмолекулярного комплекса молекулы-мишени и молекулы-лиганда получают с помощью стыковки молекулы-лиганда и молекулы-мишени или, как чаще принято называть, докинга, для чего выполняют преобразование координат атомов этих молекул таким образом, чтобы наименьшее расстояние между каждым из атомов лиганда и заданными атомами молекулы-мишени находилось в заданном диапазоне.The structure of the intermolecular complex of the target molecule and the ligand molecule is obtained by docking the ligand molecule and the target molecule or, as is often called, docking, for which the coordinates of the atoms of these molecules are transformed so that the smallest distance between each of the ligand atoms and given atoms of the target molecule was in a given range.
Для того чтобы учесть при моделировании влияние растворителя на связывание молекулы-мишени и молекулы-лиганда в рамках явного учета растворителя, множество координат молекул растворителя добавляют к множеству координат межмолекулярного комплекса мишень-лиганд и к множествам координат молекулы-лиганда и молекулы-мишени по отдельности. Это делают так, чтобы молекулы растворителя заполняли собой без взаимопересечений и пересечений с атомами межмолекулярного комплекса, молекулы-мишени и молекулы-лиганда все пространство вокруг этих молекулярных систем. Положение молекул растворителя оптимизируют, как правило, в рамках пакетов молекулярной механики или молекулярной динамики вблизи межмолекулярного комплекса и его компонентов, взятых индивидуально.In order to take into account the influence of a solvent on the binding of a target molecule and a ligand molecule in the course of explicit accounting of the solvent, the set of coordinates of the solvent molecules is added to the set of coordinates of the intermolecular complex of the target ligand and to the sets of coordinates of the ligand molecule and the target molecule separately. This is done so that the solvent molecules fill the entire space around these molecular systems without intersections and intersections with the atoms of the intermolecular complex, the target molecule and the ligand molecule. The position of the solvent molecules is optimized, as a rule, within the framework of packages of molecular mechanics or molecular dynamics near the intermolecular complex and its components taken individually.
Квантово-механические модели молекулы-мишени, молекулы-лиганда и их межмолекулярного комплекса строят на основе полученных структур этого межмолекулярного комплекса и его компонентов с явно учитываемым растворителем. Для этого проводят сортировку атомов межмолекулярного комплекса, молекулы-мишени и молекулы-лиганда вместе с атомами растворителя на две группы. Для межмолекулярного комплекса в первую группу должны войти все атомы молекулы-лиганда, а также атомы молекулы-мишени и молекулы растворителя, расстояния от которых до каждого из атомов молекулы-лиганда не превышают заданное значение, а во вторую группу входят все остальные атомы молекулы-мишени и все остальные молекулы растворителя. Для модели молекулы-мишени в первую группу атомов должны войти те же атомы молекулы-мишени, которые входят в первую группу атомов межмолекулярного комплекса. Кроме этого, в первую группу должны войти молекулы растворителя, которые находятся от атомов молекулы-мишени, включенных в первую группу, на расстоянии, не превышающем заданную величину, а во вторую группу входят все остальные атомы молекулы-мишени и все остальные молекулы растворителя. Для модели молекулы-лиганда в первую группу атомов должны войти все атомы молекулы-лиганда, а также молекулы растворителя, которые находятся от атомов молекулы-лиганда на расстоянии, не превышающем заданную величину, а во вторую группу входят все остальные молекулы растворителя.Quantum-mechanical models of a target molecule, a ligand molecule, and their intermolecular complex are constructed on the basis of the obtained structures of this intermolecular complex and its components with an explicitly taken into account solvent. For this, the atoms of the intermolecular complex, the target molecule and the ligand molecule are sorted together with the solvent atoms into two groups. For an intermolecular complex, the first group should include all the atoms of the ligand molecule, as well as the atoms of the target molecule and the solvent molecule, the distances from which to each of the atoms of the ligand molecule do not exceed a specified value, and the second group includes all other atoms of the target molecule and all other solvent molecules. For the model of the target molecule, the same atoms of the target molecule that are included in the first group of atoms of the intermolecular complex must enter the first group of atoms. In addition, the first group should include solvent molecules that are located from the atoms of the target molecule included in the first group at a distance not exceeding a specified value, and the second group includes all other atoms of the target molecule and all other solvent molecules. To model a ligand molecule, the first group of atoms should include all atoms of the ligand molecule, as well as solvent molecules, which are located at a distance from the atoms of the ligand molecule not exceeding a specified value, and the second group includes all other solvent molecules.
Как правило, атомы первой группы всех рассматриваемых молекулярных систем моделируются методами квантовой механики, а атомы второй группы моделируются методами классической механики, или же атомы второй группы исключаются из моделирования. Для моделирования стыковки двух групп атомов, рассчитываемых в рамках квантового и классического методов, вводятся дополнительные атомы вблизи области пространства, где атомы первой и второй групп находятся на расстоянии друг от друга, не превышающем заданную величину. При этом дополнительные пограничные атомы рассчитывают одновременно в классическом и квантовом приближениях. Если только атомы первой группы рассчитываются в рамках квантового метода, а атомы второй группы исключаются из моделирования, добавленные атомы также рассчитываются в рамках квантового подхода. При этом дополнительные атомы добавляют таким образом, чтобы они образовывали новые ковалентные связи взамен оборванных ковалентных связей между атомами первой и второй групп.As a rule, the atoms of the first group of all considered molecular systems are modeled by the methods of quantum mechanics, and the atoms of the second group are modeled by the methods of classical mechanics, or the atoms of the second group are excluded from the simulation. To simulate the joining of two groups of atoms, calculated in the framework of quantum and classical methods, additional atoms are introduced near the space region where the atoms of the first and second groups are at a distance from each other not exceeding a given value. In this case, additional boundary atoms are calculated simultaneously in the classical and quantum approximations. If only the atoms of the first group are calculated in the framework of the quantum method, and the atoms of the second group are excluded from the simulation, the added atoms are also calculated in the framework of the quantum approach. In this case, additional atoms are added so that they form new covalent bonds instead of dangling covalent bonds between the atoms of the first and second groups.
Для полученных моделей определяют зарядовые состояния различных молекулярных групп и согласно этому добавляют или убирают дополнительные атомы в соответствующих местах этих молекулярных групп. По этим зарядовым состояниям определяют полный заряд построенных моделей межмолекулярного комплекса мишень-лиганд, молекулы-мишени и молекулы-лиганда.For the obtained models, the charge states of various molecular groups are determined and, according to this, additional atoms are added or removed in the corresponding places of these molecular groups. From these charge states, the total charge of the constructed models of the intermolecular target – ligand complex, target molecule, and ligand molecule is determined.
Когда растворителем является вода, для того, чтобы лучше воспроизвести образование и разрыв водородных связей, при переходе от комплекса к его компонентам, в модели вводят дополнительные молекулы воды. К межмолекулярному комплексу добавляют молекулы воды так, чтобы они находились между молекулой-мишенью и молекулой-лигандом и образовывали с ними водородные связи. К молекуле-мишени и к молекуле-лиганду добавляют молекулы воды так, чтобы с их участием восстановить оборванные водородные связи, которые присутствовали в межмолекулярном комплексе между молекулой-мишенью и молекулой-лигандом и которые были оборваны при удалении молекулы-лиганда из молекулы-мишени.When the solvent is water, in order to better reproduce the formation and breaking of hydrogen bonds, when passing from the complex to its components, additional water molecules are introduced into the model. Water molecules are added to the intermolecular complex so that they are between the target molecule and the ligand molecule and form hydrogen bonds with them. Water molecules are added to the target molecule and to the ligand molecule so that, with their participation, the dangling hydrogen bonds that were present in the intermolecular complex between the target molecule and the ligand molecule and which were broken off when the ligand molecule was removed from the target molecule are restored.
Однако для правильного учета влияния растворителя, как правило, недостаточно учесть явно некоторое количество молекул растворителя, и в этом случае требуется учесть растворитель в неявной модели, когда его экранирующее влияние учитывается путем введения в модель непрерывной среды с нужным значением диэлектрической проницаемости. В предложенном методе моделирования связывания мишени и лиганда использованы три типа модели неявного учета растворителя, а именно модель, реализующая решение уравнения Пуассона, модель непрерывного проводника и модель, реализующая решение уравнения Пуассона-Больцмана.However, in order to correctly take into account the influence of the solvent, as a rule, it is not enough to explicitly take into account a certain number of solvent molecules, and in this case, it is necessary to take into account the solvent in the implicit model, when its screening effect is taken into account by introducing into the model a continuous medium with the desired dielectric constant. In the proposed method for simulating target and ligand binding, three types of the model of implicit solvent accounting are used, namely, a model that implements the solution of the Poisson equation, a continuous conductor model, and a model that implements the solution of the Poisson-Boltzmann equation.
Все данные, полученные на этапе построения моделей молекулы-мишени, молекулы-лиганда и межмолекулярного комплекса, используются для формирования входных файлов для квантово-механического моделирования. В этих входных файлах содержится информация о координатах и типах всех атомов рассматриваемых молекулярных систем, их полный заряд и мультиплетность, координаты и тип атомов молекул растворителя, добавленных в явной модели к межмолекулярному комплексу и его компонентам, параметры растворителя в неявной модели. Кроме того, во входных файлах содержится информация о параметрах оптимизационного процесса, а именно метод и параметры метода моделирования, тип оптимизационной процедуры, пределы самосогласования и минимизации.All data obtained at the stage of constructing models of the target molecule, ligand molecule, and intermolecular complex are used to form input files for quantum-mechanical modeling. These input files contain information on the coordinates and types of all atoms of the considered molecular systems, their total charge and multiplicity, the coordinates and type of atoms of the solvent molecules added in the explicit model to the intermolecular complex and its components, the parameters of the solvent in the implicit model. In addition, the input files contain information about the parameters of the optimization process, namely the method and parameters of the modeling method, the type of optimization procedure, the limits of self-consistency and minimization.
Входные файлы используют для того, чтобы с помощью соответствующей программы моделирования полной энергии молекулярной системы, основанной или на комбинации квантово-механического и классического приближения или только на квантово-механическом приближении, найти минимум полной энергии трех рассматриваемых молекулярных систем при варьировании положений всех или некоторых дополнительно определенных атомов. Полученные значения полных энергий молекулы-мишени, молекулы-лиганда и их межмолекулярного комплекса используют для вычисления энтальпии связывания компонентов в комплексе. Энтальпия связывания вычисляется как разность между полной энергией межмолекулярного комплекса мишень-лиганд в растворителе, с одной стороны, и суммой полных энергий молекулы-мишени в растворителе и молекулы-лиганда в растворителе, с другой стороны, при соблюдении и при не соблюдении баланса молекул растворителя.The input files are used to use the appropriate program to simulate the total energy of the molecular system, based either on a combination of the quantum-mechanical and classical approximations, or only on the quantum-mechanical approximation, to find the minimum total energy of the three molecular systems under consideration when varying the positions of all or some of the additional certain atoms. The obtained values of the total energies of the target molecule, the ligand molecule and their intermolecular complex are used to calculate the enthalpy of binding of the components in the complex. The binding enthalpy is calculated as the difference between the total energy of the target-ligand intermolecular complex in the solvent, on the one hand, and the sum of the total energies of the target molecule in the solvent and the ligand molecule in the solvent, on the other hand, while observing and not observing the balance of solvent molecules.
В соответствии с настоящим изобретением вычисление энтальпии связывания молекулы-мишени и молекулы-лиганда можно проводить, используя другой метод, при котором полные энергии молекулы-мишени, молекулы-лиганда и их межмолекулярного комплекса рассчитывают не в точке минимума, а как средние значения полных энергий, полученных для ряда конфигураций межмолекулярного комплекса мишень-лиганд. При этом координаты атомов молекулы-мишени, молекулы-лиганда и их межмолекулярного комплекса, соответствующие каждой из таких конфигураций, могут быть получены в рамках молекулярно-динамического моделирования. В качестве исходных данных при таком виде моделирования также используется структура молекулы-мишени и молекулы-лиганда и их межмолекулярного комплекса, полученного стыковкой координат его компонентов. При молекулярно-динамическом моделировании может использоваться как явная, так и неявная модели растворителя, которые вводятся способами, описанными ранее.In accordance with the present invention, the enthalpy of binding of the target molecule and the ligand molecule can be calculated using another method, in which the total energies of the target molecule, ligand molecule and their intermolecular complex are calculated not at the minimum point, but as average values of the total energies, obtained for a number of configurations of the intermolecular target-ligand complex. In this case, the atomic coordinates of the target molecule, ligand molecule, and their intermolecular complex, corresponding to each of these configurations, can be obtained in the framework of molecular dynamics modeling. The structure of the target molecule and the ligand molecule and their intermolecular complex obtained by joining the coordinates of its components are also used as input data for this type of modeling. In molecular dynamics modeling, both the explicit and implicit solvent models can be used, which are introduced by the methods described previously.
Для межмолекулярного комплекса, вне зависимости от модели растворителя, моделирование осуществляется путем решения уравнений Ньютона или Лагранжа при учете теплового движения всех взаимодействующих друг с другом атомов молекулы-мишени и молекулы-лиганда с учетом наличия молекул растворителя, при этом определяют состояние молекулярной системы, при котором она достигает теплового равновесия. Затем определяют траектории движения всех атомов системы после достижения их теплового равновесия и определяют координаты всех атомов взаимодействующих молекулы-мишени, молекулы-лиганда и молекул растворителя через определенные промежутки времени заданное количество раз для заданного набора конфигураций межмолекулярного комплекса мишень-лиганд. Аналогично получают набор конфигураций молекулы-мишени и молекулы-лиганда.For an intermolecular complex, regardless of the solvent model, modeling is carried out by solving the Newton or Lagrange equations, taking into account the thermal motion of all atoms of the target molecule and the ligand molecule taking into account the presence of solvent molecules, and the state of the molecular system is determined in which it reaches thermal equilibrium. Then, the motion paths of all atoms of the system are determined after their thermal equilibrium is reached, and the coordinates of all atoms of the interacting target molecule, ligand molecule, and solvent molecules are determined at predetermined time intervals for a given number of times for a given set of configurations of the intermolecular target-ligand complex. Similarly, a set of configurations of the target molecule and the ligand molecule is obtained.
Для каждого набора координат межмолекулярного комплекса мишень-лиганд, молекулы-мишени, молекулы-лиганда в явной или неявной модели растворителя проводят сортировку всех атомов на группы аналогично тому, как это осуществлялось ранее. Для каждой конфигурации межмолекулярного комплекса мишень-лиганд, молекулы-мишени, молекулы-лиганда формируют входной файл для квантово-механического моделирования межмолекулярного комплекса мишень-лиганд в растворителе, как описано выше. Для каждого входного файла, то есть для каждой конфигурации межмолекулярного комплекса мишень-лиганд, молекулы-мишени, молекулы-лиганда, с помощью выбранного метода моделирования проводят расчет полной энергии этих молекулярных систем в растворителе без оптимизации пространственного строения комплекса. Затем вычисляют средние значения полной энергии межмолекулярного комплекса мишень-лиганд, молекулы-мишени, молекулы-лиганда в растворителе по всему выбранному набору конфигураций этой молекулярной системы. Используя полученные средние значения полных энергий межмолекулярного комплекса мишень-лиганд в растворителе, молекулы-мишени в растворителе и молекулы-лиганда в растворителе, вычисляют энтальпию связывания молекулы-лиганда с молекулой-мишенью в растворителе как разность между полной энергией межмолекулярного комплекса мишень-лиганд в растворителе, с одной стороны, и суммой полных энергий молекулы-мишени в растворителе и молекулы-лиганда в растворителе, с другой стороны.For each coordinate set of the intermolecular target-ligand complex, target molecule, ligand molecule, in an explicit or implicit solvent model, all atoms are sorted into groups in the same way as before. For each configuration of the intermolecular target-ligand complex, target molecules, ligand molecules, an input file is generated for quantum-mechanical modeling of the target-ligand intermolecular complex in a solvent, as described above. For each input file, that is, for each configuration of the target-ligand intermolecular complex, target molecule, ligand molecule, the total energy of these molecular systems in a solvent is calculated using the selected modeling method without optimizing the spatial structure of the complex. Then, the average values of the total energy of the target-ligand intermolecular complex, the target molecule, and the ligand molecule in the solvent are calculated over the entire selected set of configurations of this molecular system. Using the obtained average values of the total energies of the target-ligand intermolecular complex in the solvent, the target molecules in the solvent, and the ligand molecules in the solvent, the enthalpy of binding of the ligand molecule to the target molecule in the solvent is calculated as the difference between the total energy of the target-ligand intermolecular complex in the solvent on the one hand, and the sum of the total energies of the target molecule in the solvent and the ligand molecule in the solvent, on the other hand.
Расчет энтропии связывания молекулы-лиганда с молекулой-мишенью в растворителе связывания можно разделить на расчет трех ее компонентов, а именно колебательной, поступательной и вращательной составляющих.The calculation of the entropy of binding of a ligand molecule to a target molecule in a binding solvent can be divided into the calculation of its three components, namely, the vibrational, translational, and rotational components.
Энтропия, связанная с потерей колебательных степеней свободы при переходе от свободных состояний молекулы-мишени и молекулы-лиганда в растворителе к их межмолекулярному комплексу, определяется колебательными частотами молекул, участвующих в рассматриваемом процессе. Для получения колебательных частот рассматриваемых молекулярных систем, в рамках используемого способа квантово-механического моделирования рассчитываются силовые постоянные или вторые производные полных энергий, относящиеся к межмолекулярному комплексу, молекуле-мишени и молекуле-лиганду, по всем координатам атомов в точках соответствующих минимумов.Entropy associated with the loss of vibrational degrees of freedom during the transition from free states of a target molecule and a ligand molecule in a solvent to their intermolecular complex is determined by the vibrational frequencies of the molecules involved in the process under consideration. To obtain the vibrational frequencies of the considered molecular systems, the force constant or second derivatives of the total energies related to the intermolecular complex, the target molecule, and the ligand molecule are calculated for all atomic coordinates at the points of the corresponding minima within the framework of the quantum-mechanical modeling method used.
В изменение энтропии при связывании молекулы-лиганда с молекулой-мишенью вносит вклад и то, что эти молекулы при связывании теряют и поступательные и вращательные степени свободы, которыми они обладали в свободном состоянии. Для вычисления этой части энтропии используются только координаты и атомные веса атомов молекулы-мишени, молекулы-лиганда и их межмолекулярного комплекса, и этот расчет, как правило, вынесен за рамки квантово-механического моделирования. Полное изменение энтропии при связывании молекулы-лиганда с молекулой-мишенью рассчитывают как сумму изменений различных ее компонент.The entropy change upon binding of the ligand molecule to the target molecule is also contributed by the fact that these molecules lose both the translational and rotational degrees of freedom that they possessed in the free state upon binding. To calculate this part of the entropy, only the coordinates and atomic weights of the atoms of the target molecule, the ligand molecule, and their intermolecular complex are used, and this calculation, as a rule, is outside the scope of quantum-mechanical modeling. The total change in entropy upon binding of the ligand molecule to the target molecule is calculated as the sum of the changes in its various components.
Процесс связывания молекулы-лиганда с молекулой-мишенью происходит в растворителе. Каждая из этих молекул создает в растворителе полость, расталкивая молекулы растворителя. Этот процесс требует затраты определенной свободной энергии, которая называется энергией кавитации, и она зависит только от свойств растворителя и формы молекулы, помещаемой в растворитель. Изменение кавитационной энергии при связывании молекулы-мишени и молекулы-лиганда вычисляется дополнительно и учитывается при расчете свободной энергии связывания в комплексе. Последняя рассчитывается как сумма энтальпийного, энтропийного членов и члена, характеризующего изменение кавитационной энергии.The process of binding a ligand molecule to a target molecule occurs in a solvent. Each of these molecules creates a cavity in the solvent, pushing apart the solvent molecules. This process requires the expenditure of a certain free energy, which is called cavitation energy, and it depends only on the properties of the solvent and the form of the molecule placed in the solvent. The change in cavitation energy upon binding of the target molecule and the ligand molecule is additionally calculated and taken into account when calculating the free binding energy in the complex. The latter is calculated as the sum of the enthalpy, entropy terms and the term characterizing the change in cavitation energy.
Рассчитанные энтальпия, энтропия и свободная энергия связывания являются энергетическими характеристиками интенсивности связывания молекулы-мишени и молекулы-лиганда и используются для прогнозирования связывания новых лигандов с молекулами-мишенями.The calculated enthalpy, entropy, and free binding energy are energy characteristics of the binding intensity of the target molecule and the ligand molecule and are used to predict the binding of new ligands to target molecules.
Изобретение поясняется на примерах осуществления, иллюстрируемых чертежами, на которых представлено следующее:The invention is illustrated in the embodiments illustrated by the drawings, which represent the following:
Фиг.1 - блок-схема способа квантово-механического моделирования и прогнозирования связывания молекулы-лиганда с молекулой-мишенью;Figure 1 is a flowchart of a method of quantum mechanical modeling and prediction of the binding of a ligand molecule to a target molecule;
Фиг.2 - блок-схема способа выбора молекулы-мишени и молекулы-лиганда и построения межмолекулярного комплекса, состоящего из лиганда и мишени;Figure 2 is a flow diagram of a method for selecting a target molecule and a ligand molecule and constructing an intermolecular complex consisting of a ligand and a target;
Фиг.3 - блок-схема способа построения квантово-механических моделей межмолекулярного комплекса лиганд-мишень и его компонентов с явным и неявным учетом растворителя;Figure 3 is a flowchart of a method for constructing quantum mechanical models of an intermolecular complex of a ligand-target and its components with explicit and implicit consideration of a solvent;
Фиг.4 - блок-схема способа квантово-механического моделирования межмолекулярного взаимодействия между молекулой-лигандом и молекулой-мишенью с учетом растворителя, включающего вычисления энтальпии, энтропии, свободной энергии связывания лиганда и мишени.Figure 4 is a flowchart of a method for quantum-mechanical modeling of intermolecular interaction between a ligand molecule and a target molecule, taking into account a solvent, including calculation of enthalpy, entropy, free binding energy of a ligand and a target.
Фиг.5 - блок-схема молекулярно-динамического способа квантово-механического моделирования связывания молекул-лигандов с молекулами-мишенями в растворителе.5 is a flowchart of a molecular dynamics method for quantum mechanical modeling of the binding of ligand molecules to target molecules in a solvent.
Фиг.6 - структурные формулы (левая колонка) и квантово-механически оптимизированные структуры (правая колонка) лигандов, соответствующих комплексам белок-лиганд, которые были выбраны как тестовые системы для моделирования связывания в системе белок-лиганд методами квантовой механики.6 - structural formulas (left column) and quantum-mechanically optimized structures (right column) of ligands corresponding to protein-ligand complexes that were selected as test systems for modeling binding in a protein-ligand system by quantum mechanics.
Фиг.7 - модель активного центра комплекса 1AJ6 (система 5 по таблице 1). Белок представлен тонкими палочками, молекулы воды представлены толстыми палочками, молекула лиганда представлена шариками и палочками. Пунктирные линии обозначают водородные связи в комплексе белок-лиганд.7 is a model of the active center of the complex 1AJ6 (
Фиг.8 - схема способа W1 добавления молекул воды к компонентам комплекса белок-лиганд.Fig. 8 is a flow diagram of a method W1 for adding water molecules to components of a protein-ligand complex.
Фиг.9 - схема способа W2 добавления молекул воды к компонентам комплекса белок-лиганд.Fig.9 is a diagram of a method W2 adding water molecules to the components of the protein-ligand complex.
На фиг.1 изображена общая схема заявленного способа моделирования и прогнозирования связывания молекулы-лиганда с молекулой-мишенью. На этапе 1 выбирают молекулу-мишень и молекулу-лиганд и получают их структуру. Из выбранных молекулы-мишени и молекулы-лиганда на этапе 2 формируют их межмолекулярный комплекс. Исходя из структуры и состава этого межмолекулярного комплекса, на этапе 3 формируют модели межмолекулярного комплекса мишень-лиганд и его компонентов с явным и неявным учетом растворителя, которые используются далее на этапе 4 при моделировании связывания молекулы-лиганда и молекулы-мишени с учетом влияния растворителя методами квантовой механики с выбранными параметрами моделирования. Используя результаты этого моделирования, на этапе 5 вычисляют числовые данные, характеризующие интенсивность связывания молекулы-лиганда с молекулой-мишенью, а именно энтальпию, энтропию и свободную энергию связывания выбранной молекулы-лиганда и молекулы-мишени, и записывают эти величины в виде числовых данных на носитель информации. На этапе 6 экспериментально измеряются аналогичные величины, характеризующие интенсивность связывания заданной молекулы-лиганда с заданной молекулой-мишенью. Затем рассчитанные при моделировании величины, характеризующие интенсивность связывания молекулы-лиганда с молекулой-мишенью, сравниваются на этапе 7 с измеренными на этапе 6 соответствующими величинами. В случае расхождения выше заданного предела рассчитанных и измеренных величин на этапе 8 корректируются модель построения межмолекулярного комплекса и параметры квантово-механического моделирования взаимодействия молекулы-мишени и молекулы-лиганда, в частности корректируется модель учета влияния растворителя на связывание. Затем снова проводят моделирование на этапе 4 и рассчитывают на этапе 5 величины, характеризующие интенсивность связывания молекулы-лиганда с молекулой-мишенью. Этот процесс выработки оптимальной модели и параметров моделирования продолжается до тех пор, пока расхождение между рассчитанными и измеренными величинами, характеризующими связывание молекул между собой, не станет меньше заданной величины. После этого процесс подгонки параметров моделирования для заданной пары молекулы-мишени и молекулы-лиганда считается законченным.Figure 1 shows a General diagram of the claimed method for modeling and predicting the binding of a ligand molecule to a target molecule. In
Далее, выбирается другая пара молекулы-лиганда и молекулы-мишени, и для нее повторяются описанные выше этапы формирования модели межмолекулярного комплекса (3), квантово-механического моделирования (4), вычисления величин, характеризующих связывание молекулы-лиганда с молекулой-мишенью (5), измерения этих величин (6), сравнения вычисленных и измеренных величин (7) и корректировки параметров (8). В качестве начальных параметров используются значения параметров моделирования, полученные для предыдущей пары молекулы-мишени и молекулы-лиганда. Затем выбирается следующая пара молекулы-мишени и молекулы-лиганда и т.д.Next, another pair of the ligand molecule and the target molecule is selected, and the steps described above for the formation of the model of the intermolecular complex (3), quantum-mechanical modeling (4), and the calculation of the quantities characterizing the binding of the ligand molecule to the target molecule are repeated for it (5 ), measuring these values (6), comparing the calculated and measured values (7) and adjusting the parameters (8). As the initial parameters, the values of the simulation parameters obtained for the previous pair of the target molecule and the ligand molecule are used. Then the next pair of target molecules and ligand molecules, etc., is selected.
В результате такой самосогласованной процедуры определяются параметры моделирования, которые позволяют получать с заданной точностью значения величин, характеризующих интенсивность связывания молекулы-лиганда с молекулой-мишенью, а именно энтальпию, энтропию и свободную энергию связывания, для определенного множества пар молекул-мишеней и молекул-лигандов. Этот процесс расширения множества пар молекул-мишеней и молекул-лигандов и самосогласованной подгонки параметров моделирования продолжается до тех пор, пока для очередной взятой вновь пары молекулы-мишени и молекулы-лиганда характеризующие интенсивность связывания величины, вычисленные с использованием параметров моделирования, полученных для других пар молекул, не будут совпадать с заданной точностью с измеренными для данной пары молекул величинами, характеризующими интенсивность связывания. После этого окончательные значения параметров моделирования записываются на этапе 7 (фиг.1) на носитель информации, и в дальнейшем они используются для прогнозирования.As a result of such a self-consistent procedure, modeling parameters are determined that allow one to obtain, with a given accuracy, the values characterizing the intensity of binding of a ligand molecule to a target molecule, namely, enthalpy, entropy, and free binding energy, for a certain set of pairs of target molecules and ligand molecules . This process of expansion of many pairs of target molecules and ligand molecules and self-consistent fitting of the modeling parameters continues until, for the next pair of target molecules and the ligand molecule, characterizing the binding intensity, the values calculated using the modeling parameters obtained for other pairs molecules will not coincide with a given accuracy with the values measured for a given pair of molecules characterizing the binding intensity. After that, the final values of the simulation parameters are recorded at step 7 (Fig. 1) on a storage medium, and then they are used for forecasting.
На этапе 9 проводится подтверждение правильности выбранных методов формирования квантово-механических моделей и методов моделирования межмолекулярного взаимодействия в комплексе путем демонстрации совпадения с заданной точностью (которая должна быть порядка точности самих квантовых расчетов 0,1-2,0 ккал/моль) экспериментальных и вычисленных в рамках выработанной модели величин, характеризующих интенсивность связывания для очередных пар молекул-мишеней и молекул-лигандов, которые не использовались в итерационной процедуре разработки способа моделирования. В дальнейшем процедура построения квантово-механической модели и моделирования межмолекулярного взаимодействия в комплексе, состоящем из молекулы-лиганда и молекулы-мишени, используются для определения на этапе 10 группы новых лигандов, имеющих лучшее связывание с заданной молекулой-мишенью.At stage 9, the correctness of the chosen methods for the formation of quantum-mechanical models and methods for modeling intermolecular interactions in the complex is demonstrated by demonstrating the coincidence with a given accuracy (which should be on the order of accuracy of the quantum calculations themselves 0.1-2.0 kcal / mol) experimental and calculated in within the framework of the developed model of quantities characterizing the binding intensity for the next pairs of target molecules and ligand molecules that were not used in the iterative procedure ki modeling method. In the future, the procedure for constructing a quantum-mechanical model and modeling intermolecular interactions in a complex consisting of a ligand molecule and a target molecule is used to determine, at step 10, a group of new ligands that have better binding to a given target molecule.
Прогнозирование на этапе 11 молекул-лигандов, которые достаточно сильно связываются с заданной молекулой-мишенью и могут быть новыми потенциальными лекарственными веществами, заключается в следующем. Для заданной молекулы-мишени формируется множество молекул-лигандов, кандидатов для прогнозирования, исходя из различных баз данных и библиотек фрагментов с помощью программ, использующих определенные правила построения лигандов в активном центре молекулы-мишени. Исходные базы данных содержат информацию о структуре молекул или структуре фрагментов молекул, полученную в различных экспериментах, или содержат координаты атомов молекул или фрагментов молекул, построенных с помощью различных компьютерных программ. Количество молекул в таком множестве молекул-лигандов, являющихся кандидатами для прогнозирования, может быть огромно, до нескольких миллионов, и каждая из этих молекул существует в реальности или может быть синтезирована. Важно, чтобы для молекул этого множества имелась информация об их химическом составе, трехмерной структуре и координатах всех атомов. Для каждой молекулы-лиганда из выбранного множества проводится моделирование на этапе 5 (фиг.1) процесса связывания и вычисление на этапе 6 величин, характеризующих связывание, с учетом влияния растворителя, молекулы-лиганда с заданной молекулой-мишенью, а именно энтальпии, энтропии и свободной энергии связывания с использованием окончательных значений параметров моделирования, полученных на предыдущем этапе. В результате такого моделирования получают величины, характеризующие интенсивность связывания всех молекул-лигандов из выбранного множества с заданной молекулой-мишенью. По результатам моделирования выбирают ряд наиболее перспективных молекул-лигандов, имеющих лучшие значения величин, характеризующих интенсивность связывания. Те молекулы-лиганды, для которых прогнозируется хорошее связывание, могут быть использованы в реальных химических экспериментах по связыванию с заданной молекулой-мишенью. Очевидно, что при таком подходе существенно сокращается число молекул-лигандов, для которых необходимо проводить экспериментальные тестирования. Таким образом, предлагаемый способ компьютерного прогнозирования молекул-лигандов, которые могут быть новыми потенциальными лекарственными веществами, позволяет избежать значительных временных и материальных затрат на синтез новых веществ и проведение экспериментов по измерению величин, характеризующих интенсивность связывания молекул-лигандов с молекулами-мишенями.Prediction at stage 11 of the ligand molecules, which are quite strongly associated with a given target molecule and may be new potential drug substances, is as follows. For a given target molecule, a lot of ligand molecules are formed, candidates for prediction based on various databases and fragment libraries using programs that use certain rules for constructing ligands in the active center of the target molecule. The source databases contain information about the structure of molecules or the structure of fragments of molecules obtained in various experiments, or contain the coordinates of the atoms of molecules or fragments of molecules constructed using various computer programs. The number of molecules in so many ligand molecules that are candidates for prediction can be huge, up to several million, and each of these molecules exists in reality or can be synthesized. It is important that for the molecules of this set there is information about their chemical composition, three-dimensional structure and the coordinates of all atoms. For each ligand molecule from the selected set, modeling is carried out at step 5 (Fig. 1) of the binding process and calculation at
Далее подробно описаны основные этапы, представленные на фиг.1, заявленного квантово-механического способа моделирования связывания молекулы-лиганда с молекулой-мишенью с учетом влияния растворителя.The main steps presented in FIG. 1 are described in detail below, of the claimed quantum mechanical method for simulating the binding of a ligand molecule to a target molecule, taking into account the influence of a solvent.
На фиг.2 представлена блок-схема, иллюстрирующая способ формирования межмолекулярного комплекса молекулы-мишени и молекулы-лиганда (этап 2 на фиг.1) в соответствии с изобретением.FIG. 2 is a flowchart illustrating a method for forming an intermolecular complex of a target molecule and a ligand molecule (
Исходя из множества 12 известных молекул-лигандов на этапе 13 выбирают молекулу-мишень, для которой необходимо произвести моделирование и прогнозирование связывания с ней различных молекул-лигандов. Структуру и состав этой молекулы-мишени получают на этапе 14 с помощью экспериментальных измерений, например с помощью рентгеноструктурного анализа, методами рассеяния нейтронов или ядерного магнитного резонанса. Структуру и состав молекулы-мишени можно также получить в виде набора декартовых координат соответствующих атомов, полученных в ходе молекулярно-механического или молекулярно-динамического моделирования, проводимого после считывания с соответствующих носителей информации предварительно сохраненных данных, извлеченных из различных баз данных о строении молекулы-мишени. В том случае, когда молекула-мишень является белком, ее структуру и состав получают из базы данных PDB (Protein Data Bank) [7], доступной через Интернет.Based on the set of 12 known ligand molecules, in
Как правило, в исходных структурах молекул-мишеней отсутствуют данные о декартовых координатах водородных атомов. Координаты недостающих атомов водорода добавляют на этапе 15 там, где это необходимо, к координатам тяжелых атомов молекулы-мишени, используя различные компьютерные программы построения молекулярных структур. Оптимизированные значения декартовых координат добавленных атомов водорода определяют на этапе 16 из условия, при котором полная энергия молекулы-мишени достигает минимума (при молекулярно-механической или квантово-механической оптимизации) при варьировании координат добавленных водородных атомов.As a rule, the initial structures of target molecules do not contain data on the Cartesian coordinates of hydrogen atoms. The coordinates of the missing hydrogen atoms are added in
Информацию о структуре и составе, а также о координатах всех атомов, включая координаты добавленных атомов водорода молекулы-мишени, записывают на этапе 17 на носитель информации в соответствующем формате.Information on the structure and composition, as well as the coordinates of all atoms, including the coordinates of the added hydrogen atoms of the target molecule, is recorded at
Исходя из множества 18 известных молекул-лигандов на этапе 19 выбирают молекулу-лиганд, для которой далее будет проводиться моделирование связывания ее с выбранной молекулой-мишенью. Помимо этого можно построить множество 20 новых лигандов, исходя из различного рода баз данных или библиотек фрагментов лигандов, и выбрать на этапе 19 из этого множества молекулу-лиганд, для которой далее будет проводиться прогнозирование связывания ее с выбранной молекулой-мишенью. Структуру, состав и координаты атомов известной молекулы-лиганда получают на этапе 21 аналогично тому, как это делалось для молекулы-мишени, а именно или с помощью экспериментальных измерений, в рамках молекулярно-механического или молекулярно-динамического моделирования или исходя из базы данных PDB. Структуру, состав и координаты атомов новой молекулы-лиганда могут получать с помощью специальных программ - построителей новых лигандов.Based on a plurality of 18 known ligand molecules, a ligand molecule is selected in
Если экспериментально известная или вновь сформированная структура молекулы-лиганда не содержит атомов водорода, то на этапе 22 к координатам тяжелых атомов лиганда добавляют там, где это необходимо, координаты недостающих атомов водорода, используя различные компьютерные программы формирования молекулярных структур. Координаты этих атомов водорода определяют на этапе 23 путем минимизации (или в рамках молекулярной механики, или в рамках квантовой механики) полной энергии молекулы-лиганда при варьировании координат добавленных атомов водорода. Координаты всех атомов молекулы-лиганда, включая координаты добавленных атомов водорода, записывают на этапе 24 на носитель информации в соответствующем формате.If the experimentally known or newly formed structure of the ligand molecule does not contain hydrogen atoms, then at
Затем на этапе 25 с помощью стыковки молекулы-лиганда и молекулы-мишени получают структуру межмолекулярного комплекса молекулы-мишени и молекулы-лиганда (2 на фиг.1), который впоследствии используется в квантово-механическом моделировании. Для этого считывают координаты всех атомов молекулы-мишени и молекулы-лиганда, включая координаты добавленных атомов водорода, с носителя информации в память компьютера. После этого выполняют преобразование координат атомов этих молекул таким образом, чтобы наименьшее расстояние между каждым из атомов лиганда и заданными атомами молекулы-мишени находилось в заданном диапазоне. Такая процедура стыковки или, как чаще принято называть, докинга, необходима для совмещения в пространстве двух молекул, так как обычно координаты их атомов получаются из различных источников информации. Полученные таким образом координаты атомов межмолекулярного комплекса молекулы-мишени и молекулы-лиганда записывают на этапе 26 в память компьютера и используют для построения квантово-механической модели соответствующего межмолекулярного комплекса.Then, at
Далее межмолекулярный комплекс и его компоненты преобразуют таким образом, чтобы учесть при моделировании влияние растворителя на связывание молекулы-мишени и молекулы-лиганда на основе модели явного учета растворителя. Для этого на этапе 27 множество координат молекул растворителя добавляют к множеству координат межмолекулярного комплекса мишень-лиганд. На этапах 28 и 29 множество координат молекул растворителя добавляют к множеству координат компонентов этого комплекса, взятых индивидуально, а именно к множеству координат молекулы-мишени (на этапе 28) и к множеству координат молекулы-лиганда (на этапе 29). Для межмолекулярного комплекса это делают на этапе 27 путем компьютерного вычисления координат, соответствующих положениям в пространстве множества молекул растворителя, так чтобы их средняя плотность соответствовала экспериментально наблюдаемой плотности растворителя. Молекулы растворителя должны заполнять собой без взаимопересечений и пересечений с атомами межмолекулярного комплекса молекулы-мишени и молекулы-лиганда пространство как между молекулой-мишенью и молекулой-лигандом, так и вокруг них. Аналогично координаты множества молекул растворителя добавляют только к множеству координат молекулы-мишени на этапе 28, так чтобы их средняя плотность соответствовала экспериментально наблюдаемой плотности растворителя, и они заполняли собой без взаимопересечений и пересечений с атомами молекулы-мишени пространство вокруг нее. Также координаты множества молекул растворителя добавляют только к множеству координат молекулы-лиганда на этапе 29, так чтобы их средняя плотность соответствовала экспериментально наблюдаемой плотности растворителя, и они заполняли собой без взаимопересечений и пересечений с атомами молекулы-лиганда пространство вокруг нее. Положение молекул растворителя оптимизируют, как правило, в рамках пакетов молекулярной механики или молекулярной динамики вблизи межмолекулярного комплекса на этапе 30, а также вблизи его компонентов, взятых индивидуально, а именно вблизи молекулы-мишени на этапе 31 и молекулы-лиганда на этапе 32. На этапе 33 записывают на носитель информации в соответствующем формате координаты атомов межмолекулярного комплекса мишень-лиганд вместе с координатами атомов молекул растворителя, находящимися вблизи поверхности комплекса. Кроме того, на этапе 33 отдельно на носитель записывают в соответствующем формате координаты атомов молекулы-мишени вместе с координатами атомов молекул растворителя, находящимися вблизи ее поверхности, и координаты атомов молекулы-лиганда вместе с координатами атомов молекул растворителя, находящимися вблизи ее поверхности.Further, the intermolecular complex and its components are transformed in such a way as to take into account, when modeling, the influence of the solvent on the binding of the target molecule and the ligand molecule based on the model of explicit accounting of the solvent. For this, at
Исходя из структуры полученного межмолекулярного комплекса, состоящего из молекулы-мишени и молекулы-лиганда, а также молекул растворителя затем формируют (этап 3 на фиг.1) квантово-механические модели этого межмолекулярного комплекса и его компонентов с явным и неявным учетом растворителя, используемые в квантово-механическом моделировании. На фиг.3 представлена блок-схема, иллюстрирующая соответствующий изобретению способ формирования таких квантово-механических моделей и, соответственно, формирования входных файлов, используемых далее для моделирования связывания в межмолекулярном комплексе мишень-лиганд.Based on the structure of the obtained intermolecular complex, consisting of a target molecule and a ligand molecule, as well as solvent molecules, quantum mechanical models of this intermolecular complex and its components are then formed (
С помощью компьютерной программы на этапе 34 считывают из памяти компьютера координаты атомов межмолекулярного комплекса мишень-лиганд вместе с добавленными молекулами растворителя, а также считывают координаты атомов молекулы-мишени, вместе с добавленными к ней молекулами и координаты атомов молекулы-лиганда, вместе с добавленными к ней молекулами растворителя. Затем вычисляют расстояния от атомов молекулы-лиганда в межмолекулярном комплексе до каждого атома молекулы-мишени и растворителя. Для формирования модели межмолекулярного комплекса мишень-лиганд на этапе 35 проводят сортировку атомов этого комплекса на две группы. Это делают таким образом, чтобы в первую группу вошли все атомы молекулы-лиганда, а также атомы молекулы-мишени и молекулы растворителя, расстояния от которых до каждого из атомов молекулы-лиганда не превышают заданное значение, а во вторую группу включают все остальные атомы молекулы-мишени и все остальные молекулы растворителя. При этом, если хотя бы один атом какой-либо молекулы растворителя находится в пределах заданного расстояния от атомов молекулы-лиганда, то в первую группу атомов включаются все атомы этой молекулы растворителя. После этого на этом же этапе 35 начинают формировать с использованием координат атомов первой и второй групп входной файл для расчета межмолекулярного комплекса мишень-лиганд в растворителе с помощью соответствующей программы моделирования таким образом, что атомы первой группы моделируются методами квантовой механики, а атомы второй группы моделируются методами классической механики. При этом оператор полной энергии строится в виде суммы следующих операторов: оператора полной энергии для квантовой части, состоящей из атомов первой группы, оператора полной энергии для классической части, состоящей из атомов второй группы, и оператора взаимодействия между классической и квантовой частями.Using a computer program, at
Для формирования модели молекулы-мишени на этапе 36 проводят сортировку атомов молекулы-мишени и относящихся к ней молекул растворителя таким образом, что в первую группу атомов включают те же атомы молекулы-мишени, которые входят в первую группу атомов, сформированную на этапе 35. Кроме того, в первую группу включают также молекулы растворителя, которые находятся от атомов молекулы-мишени, включенных в первую группу, на расстоянии, не превышающем заданную величину, а во вторую группу включают все остальные атомы молекулы-мишени и все остальные молекулы растворителя. После этого на этом же этапе 36 начинают формировать с использованием координат атомов первой и второй групп входной файл для расчета молекулы-мишени в растворителе с помощью соответствующей программы моделирования таким образом, что атомы первой группы моделируются методами квантовой механики, а атомы второй группы моделируются методами классической механики.To form the model of the target molecule, at
Для формирования модели молекулы-лиганда на этапе 37 проводят сортировку атомов молекулы-лиганда и молекул растворителя таким образом, что в первую группу атомов включаются все атомы молекулы-лиганда, а также молекулы растворителя, которые находятся от атомов молекулы-лиганда на расстоянии, не превышающем заданную величину, а во вторую группу включают все остальные молекулы растворителя. После этого на этом же этапе 37 начинают формировать с использованием координат атомов первой и второй групп входной файл для расчета молекулы-лиганда в растворителе с помощью соответствующей программы моделирования таким образом, что атомы первой группы моделируются методами квантовой механики, а атомы второй группы моделируются методами классической механики.To form a model of a ligand molecule, at
В случае, когда молекула-мишень является белком, сортировку атомов на две группы (на этапе 35) в межмолекулярном комплексе проводят следующим образом. В первую группу атомов включают атомы молекулы-лиганда, атомы молекул растворителя, находящиеся на расстоянии, не превышающем заданное значение от атомов молекулы-лиганда, и атомы молекулы-мишени, которые составляют целые аминокислотные остатки, хотя бы один атом которых находится на расстоянии, не превышающем заданное значение от каждого атома молекулы-лиганда. Во вторую группу включают все остальные атомы молекулы-мишени и молекул растворителя. При построении модели молекулы-мишени, которая является белком, в первую группу атомов включают (на этапе 36) атомы молекулы-мишени, которые составляют целые аминокислотные остатки, отнесенные в первую группу атомов для межмолекулярного комплекса.In the case where the target molecule is a protein, the atoms are sorted into two groups (at step 35) in the intermolecular complex as follows. The first group of atoms includes atoms of the ligand molecule, atoms of the solvent molecules located at a distance not exceeding the specified value from the atoms of the ligand molecule, and the atoms of the target molecule, which make up the whole amino acid residues, at least one atom of which is at a distance, not exceeding the set value from each atom of the ligand molecule. The second group includes all other atoms of the target molecule and solvent molecules. When constructing a model of the target molecule, which is a protein, the atoms of the target molecule, which comprise the whole amino acid residues assigned to the first group of atoms for the intermolecular complex, are included in the first group of atoms (at step 36).
Для более корректного моделирования стыковки двух групп атомов, для которых обработка данных осуществляется в рамках квантового и классического методов, на этапах 38, 39 и 40 добавляют координаты дополнительных атомов во входные файлы для соответствующей программы моделирования межмолекулярного комплекса мишень-лиганд, молекулы-мишени и молекулы-лиганда соответственно. Эти дополнительные атомы расположены вблизи области пространства, где атомы первой и второй групп находятся на расстоянии друг от друга, не превышающем заданную величину.For a more correct simulation of the joining of two groups of atoms, for which the data are processed within the framework of the quantum and classical methods, add the coordinates of additional atoms to the input files for the corresponding simulation program of the intermolecular target – ligand complex, target molecule, and molecule at
Моделирование связывания компонентов в межмолекулярном комплексе мишень-лиганд можно выполнять также и другим образом так, что координаты атомов второй группы не включаются во входные файлы соответствующей программы моделирования межмолекулярного комплекса мишень-лиганд, молекулы-мишени и молекулы-лиганда, а атомы первой группы моделируются методами квантовой механики. При этом координаты добавленных дополнительно атомов включаются во входные файлы соответствующей программы моделирования так, что они вместе с атомами первой группы моделируются методами квантовой механики. При таком способе моделирования, когда у атомов первой группы, которые имели ковалентные связи с атомами второй группы, остаются ненасыщенные оборванные связи, необходимо восстановить или скомпенсировать потерю этих ковалентных связей. В этом случае при формировании модели межмолекулярного комплекса мишень-лиганд на этапе 41 и модели молекулы-мишени на этапе 42 добавляют дополнительные атомы к атомам первой группы таким образом, чтобы они образовывали новые ковалентные связи взамен оборванных ковалентных связей между атомами первой и второй групп.The binding of components in the target-ligand intermolecular complex can also be modeled in another way so that the coordinates of the atoms of the second group are not included in the input files of the corresponding program for modeling the intermolecular complex of the target-ligand, target molecules and ligand molecules, and the atoms of the first group are modeled by quantum mechanics. In this case, the coordinates of the additional atoms added are included in the input files of the corresponding simulation program so that they, together with the atoms of the first group, are modeled by the methods of quantum mechanics. With this modeling method, when atoms of the first group that have covalent bonds with atoms of the second group have unsaturated dangling bonds, it is necessary to restore or compensate for the loss of these covalent bonds. In this case, when forming the model of the intermolecular target – ligand complex in
В случае, когда молекула-мишень является белком, оборванные ковалентные связи N-концов основной цепи белка замыкаются группами -C(O)-(CH3), а оборванные ковалентные связи С-концов основной цепи белка замыкаются группами -N(H)-(CH3).In the case where the target molecule is a protein, the dangling covalent bonds of the N-ends of the main chain of the protein are closed by the groups -C (O) - (CH 3 ), and the dangling covalent bonds of the C-ends of the main chain of the protein are closed by the groups -N (H) - (CH 3 ).
В ходе формирования входных файлов для моделирования связывания в комплексе белок-лиганд на этапах 43, 44 и 45 определяют зарядовые состояния различных молекулярных групп межмолекулярного комплекса мишень-лиганд, молекулы-мишени и молекулы-лиганда в растворителе (как правило, это определяется физико-химическими свойствами этих молекулярных групп в растворителе или непосредственно в экспериментах). Согласно этому добавляют или убирают дополнительные атомы в соответствующих местах межмолекулярного комплекса мишень-лиганд на этапе 46, молекулы-мишени на этапе 47 и молекулы-лиганда на этапе 48. Когда растворителем является вода, требуемые зарядовые состояния различных молекулярных групп компонентов межмолекулярного комплекса мишень-лиганд, молекулы-мишени и молекулы-лиганда в растворителе получаются добавлением или убиранием дополнительных атомов водорода в соответствующих местах молекулы-мишени и молекулы-лиганда.During the formation of input files for modeling binding in the protein-ligand complex, steps 43, 44, and 45 determine the charge states of various molecular groups of the intermolecular target-ligand complex, target molecules, and ligand molecules in a solvent (as a rule, this is determined by physicochemical properties of these molecular groups in a solvent or directly in experiments). Accordingly, additional atoms are added or removed at appropriate locations in the target ligand intermolecular complex in
Далее на этапе 49 проводят определение полного заряда межмолекулярного комплекса мишень-лиганд, молекулы-мишени и молекулы-лиганда. Полный заряд межмолекулярного комплекса и его компонентов по отдельности, т.е. молекулы-мишени и молекулы-лиганда, получают простым сложением всех зарядов, которые были определены для отдельных молекулярных групп, входящих в состав рассматриваемых молекулярных систем. Полученные данные по полным зарядам моделей межмолекулярного комплекса мишень-лиганд, молекулы-мишени и молекулы-лиганда используются далее при формировании трех входных файлов для соответствующей программы моделирования связывания в комплексе наряду с данными по мультиплетности рассматриваемых молекулярных систем, координатами и типами их атомов.Next, at
В случае, когда растворителем является вода, для того чтобы более точно учесть в явном виде влияние растворителя на процесс связывания молекулы-мишени и молекулы-лиганда в каждый из трех входных файлов молекулы-мишени, молекулы-лиганда и их межмолекулярного комплекса необходимо добавить координаты атомов дополнительных молекул воды. Эти дополнительные молекулы воды вводятся в процесс моделирования для того, чтобы лучше воспроизвести образование и разрыв водородных связей, которые играют существенную роль в межмолекулярном комплексе мишень-лиганд, молекулы-мишени и молекулы-лиганда.In the case when the solvent is water, in order to more accurately take into account the explicit effect of the solvent on the binding of the target molecule and the ligand molecule, atom coordinates must be added to each of the three input files of the target molecule, ligand molecule, and their intermolecular complex additional water molecules. These additional water molecules are introduced into the modeling process in order to better reproduce the formation and breaking of hydrogen bonds, which play an essential role in the intermolecular complex of the target ligand, target molecule and ligand molecule.
На этапе 50 добавляются дополнительные молекулы воды к межмолекулярному комплексу так, чтобы они находились между молекулой-мишенью и молекулой-лигандом и образовывали с ними водородные связи.At
Добавление молекул воды к молекуле-мишени на этапе 51 и к молекуле-лиганду на этапе 52 осуществляют так, чтобы с их участием восстановить оборванные водородные связи, которые присутствовали в межмолекулярном комплексе между молекулой-мишенью и молекулой-лигандом и которые были оборваны при удалении молекулы-лиганда из молекулы-мишени. Кроме того, если молекулы воды располагались между молекулой-мишенью и молекулой-лигандом и были связаны с ними обеими водородными связями, эти молекулы воды добавляются дважды каждая и во входной файл для расчета молекулы-мишени на этапе 51, и во входной файл для расчета молекулы-лиганда на этапе 52 при моделировании компонент межмолекулярного комплекса по отдельности.The addition of water molecules to the target molecule in
Как правило, растворитель имеет значение диэлектрической проницаемости, отличное от значения диэлектрической проницаемости вакуума и значения диэлектрической проницаемости макромолекулы-мишени. Например, диэлектрическая проницаемость воды равна приблизительно 80 при комнатной температуре и нормальном давлении, в то время как диэлектрическая проницаемость растворенного в ней белка не превышает нескольких единиц, и при этом диэлектрическая проницаемость вакуума равна 1. В этом случае наличие растворителя вокруг рассматриваемых молекул существенно изменяет электрический потенциал и поле, которые создаются зарядами атомов вокруг молекул. Для того чтобы учесть это экранирующее влияние растворителя, как правило, недостаточно учесть явно некоторое количество молекул растворителя, и в этом случае требуется учесть растворитель в неявной модели, когда его экранирующее влияние учитывается путем введения в модель непрерывной среды с нужным значением диэлектрической проницаемости.Typically, the solvent has a dielectric constant different from the dielectric constant of the vacuum and the dielectric constant of the target macromolecule. For example, the dielectric constant of water is approximately 80 at room temperature and normal pressure, while the dielectric constant of the protein dissolved in it does not exceed several units, and the dielectric constant of vacuum is 1. In this case, the presence of a solvent around the molecules in question significantly changes the electric potential and field that are created by charges of atoms around molecules. In order to take into account this screening effect of the solvent, as a rule, it is not enough to explicitly take into account a certain number of solvent molecules, and in this case, it is necessary to take into account the solvent in the implicit model, when its screening effect is taken into account by introducing into the model a continuous medium with the desired dielectric constant.
В рамках неявной модели растворителя на этапе 53 во входные файлы для расчетов межмолекулярного комплекса, молекулы-мишени и молекулы-лиганда с помощью соответствующей программы моделирования молекулярных систем в растворителе включаются параметры растворителя в неявной модели. Для этого с использованием координат атомов молекулы-мишени, молекулы-лиганда и молекул растворителя, координаты которых включены в соответствующие входные файлы, формируют координаты точек, находящихся на поверхности, доступной растворителю. Эта поверхность охватывает молекулу-мишень, молекулу-лиганд и молекулы растворителя, в случае расчета межмолекулярного комплекса в растворителе, или охватывает только молекулу-мишень и молекулы растворителя, в случае расчета молекулы-мишени в растворителе, или охватывает только молекулу-лиганд и молекулы растворителя, в случае расчета молекулы-лиганда в растворителе. С помощью точек, находящихся на этих поверхностях, формируется математическая модель неявного учета растворителя.In the framework of the implicit solvent model, at
В предлагаемом изобретении рассматриваются три типа модели неявного учета растворителя.In the present invention, three types of implicit solvent accounting model are considered.
В первой из них в качестве математической модели неявного учета растворителя используют совокупность программных средств, реализующих решение уравнения Пуассона и описывающих взаимодействие молекулы-мишени и молекулы-лиганда с непрерывной средой, заполняющей все пространство вне поверхности, доступной растворителю и имеющей диэлектрическую проницаемость, равную диэлектрической проницаемости растворителя.In the first of them, as a mathematical model of the implicit accounting of the solvent, a set of software tools is used that implement the solution of the Poisson equation and describe the interaction of the target molecule and the ligand molecule with a continuous medium that fills the entire space outside the surface accessible to the solvent and having a dielectric constant equal to dielectric constant solvent.
При использовании растворителя с большим значением диэлектрической проницаемости растворителя (например, вода имеет диэлектрическую проницаемость около 80 при комнатной температуре) в качестве математической модели неявного учета растворителя используют совокупность программных средств, реализующих решение уравнений, описывающих взаимодействие молекулы-мишени и молекулы-лиганда с непрерывным проводником, заполняющим все пространство вне поверхности, доступной растворителю.When using a solvent with a high dielectric constant of the solvent (for example, water has a dielectric constant of about 80 at room temperature), a set of software tools that implement the solution of equations describing the interaction of a target molecule and a ligand molecule with a continuous conductor are used as a mathematical model of implicit solvent accounting filling all the space outside the surface accessible to the solvent.
При использовании растворителя, характеризуемого отличными от нуля диэлектрической проницаемостью и проводимостью, в качестве математической модели неявного учета растворителя используют совокупность программных средств, реализующих решение уравнения Пуассона-Больцмана. Это уравнение описывает взаимодействие молекулы-мишени и молекулы-лиганда с непрерывной средой, имеющей отличную от нуля диэлектрическую проницаемость и отличную от нуля проводимость и заполняющей все пространство вне поверхности, доступной растворителю.When using a solvent characterized by non-zero permittivity and conductivity, a set of software tools that implement the solution of the Poisson-Boltzmann equation is used as a mathematical model for implicit accounting of the solvent. This equation describes the interaction of a target molecule and a ligand molecule with a continuous medium having a non-zero dielectric constant and non-zero conductivity and filling the entire space outside the surface accessible to the solvent.
Формирование файлов, описывающих модели для квантово-механического расчета межмолекулярного комплекса мишень-лиганд, молекулы-мишени и молекулы-лиганда в растворителе, заканчивается на этапе 54, и соответствующие входные файлы для квантово-механического расчета записываются на носитель информации.The generation of files describing the models for the quantum-mechanical calculation of the target-ligand intermolecular complex, the target molecule, and the ligand molecule in the solvent is completed at
Эти файлы используются, как правило, в зависимости от выбранного метода расчета в двух вариантах квантово-механического моделирования. В первом варианте моделирования расчет межмолекулярного комплекса, молекулы-мишени, молекулы-лиганда в растворителе проводят так, что первая группа атомов комплекса, молекулы-мишени и молекулы-лиганда (описанная выше) рассчитывается методами квантовой механики, а вторая - классической механики. Во втором варианте моделирования расчет межмолекулярного комплекса, молекулы-мишени, молекулы-лиганда в растворителе проводят так, что первая группа атомов рассчитывается методами квантовой механики, а вторая не включается в моделирование.These files are used, as a rule, depending on the chosen calculation method in two versions of quantum-mechanical modeling. In the first version of the simulation, the calculation of the intermolecular complex, the target molecule, the ligand molecule in the solvent is carried out so that the first group of atoms of the complex, target molecule and ligand molecule (described above) is calculated by quantum mechanics, and the second by classical mechanics. In the second version of the simulation, the calculation of the intermolecular complex, the target molecule, the ligand molecule in the solvent is carried out so that the first group of atoms is calculated by quantum mechanics, and the second is not included in the simulation.
Далее описывается процесс квантово-механического моделирования взаимодействия молекулы-лиганда и молекулы-мишени с учетом растворителя (этап 4 на фиг.1) и вычисления энергетических величин, характеризующих связывание молекулы-мишени и молекулы-лиганда (этап 5 на фиг.1). На фиг.4 представлена блок-схема, иллюстрирующая соответствующий изобретению способ квантово-механического моделирования межмолекулярного взаимодействия между молекулой-лигандом и молекулой-мишенью с учетом растворителя, включающего вычисление энтальпии, энтропии и свободной энергии связывания лиганда и мишени.The following describes the process of quantum-mechanical modeling of the interaction of a ligand molecule and a target molecule, taking into account the solvent (
Входные файлы, в которых записана информация о структуре и свойствах межмолекулярного комплекса, молекулы-мишени и молекулы-лиганда, считываются с носителя информации на этапе 55. В этих входных файлах содержится информация о координатах и типах всех атомов рассматриваемых молекулярных систем, их полный заряд и мультиплетность, координаты и тип атомов молекул растворителя, добавленных в явной модели к межмолекулярному комплексу и его компонентам, параметры растворителя в неявной модели. Кроме того, во входных файлах содержится информация о параметрах оптимизационного процесса, а именно метод и параметры квантово-механического моделирования, тип оптимизационной процедуры, пределы самосогласования и минимизации.The input files, which contain information on the structure and properties of the intermolecular complex, target molecules, and ligand molecules, are read from the storage medium at
На этапе 56 могут быть выбраны различные методы квантово-механического моделирования полной энергии молекулярных систем. При подходе, когда часть атомов межмолекулярного комплекса, молекулы-мишени и молекулы-лиганда рассчитывается в рамках квантово-механического приближения, а другая часть атомов рассчитывается в рамках классического приближения, используют различные комбинации классических молекулярно-механических и молекулярно-динамических методов, с одной стороны, и квантово-механических методов, с другой стороны. Последние могут варьироваться от строгих неэмпирических методов и методов функционала плотности [1-3] до более быстрых, однако, менее точных полуэмпирических методов [4-7]. Такой подход, получивший широкую известность под названием QM/MM, реализован в настоящее время в виде ряда прикладных пакетов программ [8].At
Кроме того, возможен и другой подход, в котором часть атомов межмолекулярного комплекса, молекулы-мишени и молекулы-лиганда рассчитывается в рамках квантово-механического приближения, а другая часть атомов полностью исключается из процесса моделирования. Для того чтобы более точно воспроизвести энергетические характеристики связывания в межмолекулярном комплексе, при таком подходе приходится брать для квантово-механического моделирования как можно большие участки молекулы-мишени, описывающие место связывания с молекулой-лигандом при минимальном влиянии краевых эффектов. При этом наиболее перспективными методами квантово-механического моделирования являются относительно быстрые в расчетах полуэмпирические методы, которые в последнее время реализованы в ряде прикладных пакетов программ с ускоренным счетом [9]. Однако применение для такого вида моделирования более точных, но более медленных неэмпирических методов и методов функционала плотности также возможно.In addition, another approach is possible in which a part of the atoms of the intermolecular complex, the target molecule and the ligand molecule is calculated in the framework of the quantum-mechanical approximation, and the other part of the atoms is completely excluded from the modeling process. In order to more accurately reproduce the energy characteristics of binding in the intermolecular complex, with this approach it is necessary to take for quantum mechanical modeling as large sections of the target molecule as possible that describe the binding site with the ligand molecule with minimal influence of edge effects. In this case, the most promising methods of quantum-mechanical modeling are relatively quick calculations of semi-empirical methods, which have recently been implemented in a number of applied software packages with accelerated counting [9]. However, the use of more accurate, but slower non-empirical methods and density functional methods for this type of modeling is also possible.
В начале оптимизационной процедуры на этапах 57, 58 и 59 проводят определение варьируемых параметров межмолекулярного комплекса мишень-лиганд, молекулы-мишени, молекулы-лиганда и относящихся к этим системам молекул растворителя, а именно проводят определение варьируемых координат атомов, при изменении которых будет находиться минимум полной энергии каждой из молекулярных систем.At the beginning of the optimization procedure, at
Затем на этапе 60 с помощью соответствующей программы моделирования полной энергии молекулярной системы, основанной или на комбинации квантово-механического и классического приближения или основанной только на квантово-механическом приближении, находят минимум полной энергии межмолекулярного комплекса мишень-лиганд и растворителя при варьировании положений всех или некоторых определенных атомов комплекса и растворителя. После этого записывают на носитель информации найденные новые координаты атомов и полную энергию системы, состоящей из межмолекулярного комплекса мишень-лиганд и растворителя, и соответствующих координат атомов.Then, at
Аналогично на этапе 61 находят минимум полной энергии молекулы-мишени и растворителя при варьировании положений всех или части атомов молекулы-мишени и растворителя, и проводят запись на носитель информации найденные новые координаты атомов и полную энергию системы, состоящей из молекулы-мишени и растворителя, и соответствующих координат атомов.Similarly, at
Наконец на этапе 62 находят минимум полной энергии молекулы-лиганда и растворителя при варьировании положений всех или части атомов молекулы-мишени и растворителя, и проводят запись на носитель информации найденные новые координаты атомов и полную энергию системы, состоящей из молекулы-лиганда и растворителя, и соответствующих координат атомов.Finally, at
Используя полученные полные энергии межмолекулярного комплекса мишень-лиганд и растворителя, молекулы-мишени и растворителя, а также молекулы-лиганда и растворителя, на этапе 63 вычисляют энтальпию связывания молекулы-лиганда с молекулой-мишенью в растворителе. При этом возможны два случая расчета энтальпии.Using the obtained total energies of the intermolecular complex of the target ligand and solvent, the target molecule and solvent, as well as the ligand molecule and solvent, the enthalpy of binding of the ligand molecule to the target molecule in the solvent is calculated in
Первый случай реализуется, когда в процессе связывания молекулы-лиганда с молекулой-мишенью соблюдается баланс молекул растворителя, то есть если сумма молекул растворителя, включенных в расчет молекулы-мишени, и молекул растворителя, включенных в расчет молекулы-лиганда, равна числу молекул растворителя, включенных в расчет межмолекулярного комплекса мишень-лиганд. В этом случае на этапе 63 энтальпия связывания ΔHсвяз. молекулы-мишени и молекулы-лиганда вычисляется как разность между полной энергией межмолекулярного комплекса мишень-лиганд в растворителе, с одной стороны, и суммой полных энергий молекулы-мишени в растворителе и молекулы-лиганда в растворителе, с другой стороны, согласно формуле:The first case is realized when, in the process of binding a ligand molecule to a target molecule, the balance of solvent molecules is observed, that is, if the sum of the solvent molecules included in the calculation of the target molecule and the solvent molecules included in the calculation of the ligand molecule is equal to the number of solvent molecules, included in the calculation of the intermolecular complex of the target ligand. In this case, at
ΔHсвяз.=Екомплекса_Nмол.раств.-(Емишени_Lмол.раств.+Елиганда_Mмол.раств.),ΔH bond = E complex_Nmol. - (E target_Lmol. + E ligand_Mmol. ),
где Екомплекса_Nмол.раств. - полная энергия комплекса мишень-лиганд, связанного с N молекулами растворителя, Емишени_Lмол.раств. - полная энергия комплекса мишень-лиганд, связанного с L молекулами растворителя, Елиганда_Mмол.раств - полная энергия комплекса мишень-лиганд, связанного с M молекулами растворителя. В случае соблюдения баланса молекул растворителя N=L+M.where E complex_Nmol.rast. is the total energy of the target ligand complex bound to N solvent molecules, E of the target_Lmol. is the total energy of the target ligand complex bound to L solvent molecules, E ligand_Mol. solutions is the total energy of the target ligand complex bound to M solvent molecules. If the balance of solvent molecules is N = L + M.
Второй случай реализуется, когда в процессе связывания молекулы-лиганда с молекулой мишенью не соблюдается баланс молекул растворителя, то есть если сумма молекул растворителя, включенных в расчет молекулы-мишени, и молекул растворителя, включенных в расчет молекулы-лиганда, не равна числу молекул растворителя, включенных в расчет межмолекулярного комплекса мишень-лиганд. В этом случае на этапе 63 энтальпия связывания ΔHсвяз. молекулы-мишени и молекулы-лиганда также вычисляется как разность между полной энергией межмолекулярного комплекса мишень-лиганд в растворителе, с одной стороны, и суммой полных энергий молекулы-мишени в растворителе и молекулы-лиганда в растворителе, с другой стороны. Однако при расчете энтальпии связывания ΔHсвяз. на этом этапе следует учесть энергию, которую необходимо затратить, чтобы удалить из растворителя то количество молекул растворителя, которое необходимо добавить в рассматриваемую систему для соблюдения баланса по числу молекул растворителя в процессе связывания молекулы-лиганда с молекулой-мишенью, согласно формулеThe second case is realized when, during the binding of the ligand molecule to the target molecule, the balance of the solvent molecules is not observed, that is, if the sum of the solvent molecules included in the calculation of the target molecule and the solvent molecules included in the calculation of the ligand molecule is not equal to the number of solvent molecules included in the calculation of the intermolecular target-ligand complex. In this case, at
ΔHсвяз.=Екомплекса_Nмол.раств.+K*Eмол.раств.-(Емишени_Lмол.раств.+Елиганда_Mмол.раств.),ΔH bond = E complex_Nmol . + K * E mol. --- (E target_Lmol. + E ligand_Mmol. ),
где Екомплекса_Nмол.раств. - полная энергия комплекса мишень-лиганд, связанного с N молекулами растворителя, Емишени_Lмол.раств. - полная энергия комплекса мишень-лиганд, связанного с L молекулами растворителя, Елиганда_Mмол.раств - полная энергия комплекса мишень-лиганд, связанного с M молекулами растворителя, Eмол.раств -энергия удаления одной молекулы воды из растворителя, рассчитанная в том же квантово-механическом приближении, что и полные энергии межмолекулярного комплекса, молекулы-мишени и молекулы-лиганда. В случае несоблюдения баланса молекул растворителя, то есть когда N=L+M-K, для соблюдения энергетического баланса в формуле, по которой рассчитывается энтальпия связывания молекулы-мишени и молекулы-лиганда, необходимо учесть также энергию К*Eмол.раств.where E complex_Nmol.rast. is the total energy of the target ligand complex bound to N solvent molecules, E of the target_Lmol. is the total energy of the target ligand complex bound to L solvent molecules, E ligand_Mol. solutions is the total energy of the target ligand complex bound to M solvent molecules, E mol solution is the energy of removal of one water molecule from the solvent calculated in the same quantum -mechanical approximation as the full energies of the intermolecular complex, the target molecule and the ligand molecule. If the balance of solvent molecules is not observed, that is, when N = L + MK, in order to maintain the energy balance in the formula by which the enthalpy of binding of the target molecule and the ligand molecule is calculated, it is also necessary to take into account the K * E molar solution energy .
Расчет энтропии связывания молекулы-лиганда с молекулой-мишенью в растворителе проводят в рамках используемого квантово-механического приближения для тех же моделей межмолекулярного комплекса, молекулы-мишени и молекулы-лиганда, используя те же входные файлы, которые были использованы в расчетах полных энергий этих молекулярных систем. Эта энтропия связывания определяется колебательными частотами молекул, участвующих в рассматриваемом процессе. Для вычисления колебательных частот на этапах 64, 65 и 66 для межмолекулярного комплекса, молекулы-мишени и молекулы-лиганда рассчитываются силовые постоянные или вторые производные полных энергий этих молекулярных систем по всем координатам атомов в точках соответствующих минимумов (глобальных или локальных). Из этих величин составляется матрица (матрица Гессе), и колебательные частоты находятся затем путем решения задачи на собственные значения матрицы Гессе. По значениям этих частот на этапе 67 рассчитывают составляющую энтропии (по формулам, например, в [10]), связанную с потерей колебательных степеней свободы при переходе от свободных состояний молекулы-мишени и молекулы-лиганда в растворителе к их межмолекулярному комплексу. Энтропия связывания, обусловленная потерей колебательных степеней свободы ΔSсвяз._колебат., вычисляется по формулеThe calculation of the entropy of binding of a ligand molecule to a target molecule in a solvent is carried out within the framework of the used quantum-mechanical approximation for the same models of the intermolecular complex, target molecule, and ligand molecule using the same input files that were used in calculating the total energies of these molecular systems. This binding entropy is determined by the vibrational frequencies of the molecules involved in the process under consideration. To calculate the vibrational frequencies at
ΔSсвяз._колебат=Sкомплекса_Nмол.раств.-(Sмишени_Lмол.раств.+Sлиганда_Mмол.раств.),ΔS bond_oscillation = S complex_Nmol . - (S target_Lmol. + S ligand_Mmol. ),
при соблюдении баланса молекул растворителя, и по формулеsubject to the balance of solvent molecules, and according to the formula
ΔSсвяз._колебат=Sкомплекса_Nмол.раств.+K*Sмол.раств.-(Sмишени_Lмол.раств.+Sлиганда_Mмол.раств.), при не соблюдении баланса молекул растворителя.ΔS bond_oscillation = S complex_N molar solution + K * S molar solution- (S target_L molar solution + S ligand_M molar solution ), without observing the balance of solvent molecules.
В изменение энтропии при связывании молекулы-лиганда с молекулой-мишенью дает вклад и то, что эти молекулы при связывании теряют каждая три поступательных и три вращательных степени свободы, которыми они обладают в свободном состоянии. Эта часть энтропии вычисляется на этапе 68 по формуле Сакура-Титрода, и для этого используются только координаты и атомные веса атомов молекулы-мишени, молекулы-лиганда и их межмолекулярного комплекса (см., например, [11]). При этом атомные веса атомов однозначно определяются их типом (т.е. положением в Таблице Д.И. Менделеева), который записан в исходных файлах, считанных с носителя информации на этапе 55 (фиг.4). При связывании сравнительно небольших молекул-лигандов (обычно это молекулы с атомным весом, не превышающим 500 дальтон) с макромолекулами-мишенями, такими как протеины, молекулу-мишень можно считать неподвижной, и изменение энтропии, рассчитываемое на этапе 68, будет определяться только характеристиками молекулы-лиганда.The change in entropy upon binding of a ligand molecule to a target molecule also contributes to the fact that, upon binding, these molecules lose each of the three translational and three rotational degrees of freedom that they possess in a free state. This part of the entropy is calculated at
На этапе 69, используя величины, рассчитанные на этапах 67 и 68, вычисляют полное изменение энтропии при связывании молекулы-лиганда с молекулой-мишенью как сумму изменений энтропии, полученных на этапах 67 и 68.In
Процесс связывания молекулы-лиганда с молекулой-мишенью происходит в растворителе. Каждая из этих молекул, будучи помещенной в растворитель, создает в нем полость, расталкивая молекулы растворителя. Этот процесс требует затраты определенной свободной энергии, которая зависит от свойств растворителя. Эта свободная энергия называется энергией кавитации, и она зависит только от свойств растворителя и формы молекулы, помещаемой в растворитель. В настоящее время известны некоторые способы расчета кавитационной энергии растворения (см., например, работу [12] и приведенные в ней ссылки). Поскольку при связывании молекулы-лиганда с молекулой-мишенью и образовании межмолекулярного комплекса изменяется форма полостей, в которых находятся рассматриваемые молекулы, то при этом будет изменяться и кавитационная свободная энергия. Ее изменение ΔGкав вычисляется на этапе 70, и результат, будучи сложенным на этапе 71 с результатами расчетов энтальпии связывания ΔHсвяз, полученной на этапе 63 и энтропийного вклада -TΔSсвяз, вычисленного на этапе 69, дает значение полной свободной энергии связывания молекулы-лиганда с молекулой-мишенью в растворителе согласно формулеThe process of binding a ligand molecule to a target molecule occurs in a solvent. Each of these molecules, when placed in a solvent, creates a cavity in it, pushing apart the solvent molecules. This process requires the cost of a certain free energy, which depends on the properties of the solvent. This free energy is called cavitation energy, and it depends only on the properties of the solvent and the form of the molecule placed in the solvent. Currently, several methods are known for calculating the cavitation energy of dissolution (see, for example, [12] and the references therein). Since when the ligand molecule is bound to the target molecule and the formation of the intermolecular complex, the shape of the cavities in which the molecules are located changes, the cavitation free energy will also change. Kav its change ΔG is calculated in
ΔGсвяз.=ΔHсвяз.-TΔSсвяз+ΔGкав ΔG bond = ΔH bond -TΔS the connected + ΔG Kav
В соответствии с настоящим изобретением вычисление энтальпии связывания молекулы-мишени и молекулы-лиганда (этап 63 на фиг.4) можно проводить, используя другой метод, при котором полные энергии молекулы-мишени, молекулы-лиганда и их межмолекулярного комплекса рассчитывают не в точке минимума, а как средние значения полных энергий, полученных для ряда конфигураций межмолекулярного комплекса мишень-лиганд. При этом координаты атомов молекулы-мишени, молекулы-лиганда и их межмолекулярного комплекса, соответствующие каждой из таких конфигураций, могут быть получены в рамках молекулярно-динамического моделирования. На фиг.5 представлена блок-схема, иллюстрирующая способ молекулярно-динамического формирования координат атомов молекулы-мишени, молекулы-лиганда и межмолекулярного комплекса мишень-лиганд для набора конфигураций межмолекулярного комплекса, а также способ расчета энтальпии связывания молекулы-мишени с молекулой-лигандом, на основе средних значений полных энергий, полученных для набора этих конфигураций.In accordance with the present invention, the enthalpy of binding of the target molecule and the ligand molecule (
Исходными данными для формирования входных файлов для набора конфигураций межмолекулярного комплекса, молекулы-мишени и молекулы-лиганда являются считываемые на этапе 72 с носителя информации координаты атомов молекулы-мишени, молекулы-лиганда и их межмолекулярного комплекса, которые можно получить из базы данных PDB или с помощью различных программ-построителей молекулярных структур. Кроме того, если используется явная модель растворителя, исходными данными являются координаты атомов молекул растворителя, которые вводятся на этапе 73, аналогично тому, как это осуществлялось ранее на этапах 27, 28 и 29. Если используется неявная модель растворителя, которая вводится на этапе 74, аналогично вышеописанному этапу 53, координаты атомов молекул растворителя явным образом не включаются в моделирование.The initial data for the formation of input files for a set of configurations of the intermolecular complex, target molecule, and ligand molecule are the coordinates of atoms of the target molecule, ligand molecule, and their intermolecular complex, which can be obtained from the PDB database or from using various molecular structure builders. In addition, if an explicit solvent model is used, the initial data are the atomic coordinates of the solvent molecules that are entered in
Процедура молекулярно-динамического формирования входных файлов с координатами атомов молекулы-мишени, молекулы-лиганда и межмолекулярного комплекса мишень-лиганд для ряда конфигураций с явной моделью растворителя включает следующие этапы.The procedure for molecular-dynamic formation of input files with the coordinates of the atoms of the target molecule, the ligand molecule and the intermolecular target-ligand complex for a number of configurations with an explicit solvent model includes the following steps.
Используя координаты атомов межмолекулярного комплекса, молекулы-мишени и молекулы-лиганда, а также молекул растворителя (этапы 26, 27 и 30 на фиг.2) и, если это необходимо, вводя дополнительные атомы для установления нужного заряда межмолекулярного комплекса мишень-лиганд (этапы 46, 49 на фиг.3), проводят молекулярно-динамическое моделирование комплекса мишень-лиганд на этапе 75 в рамках явной модели растворителя. При этом путем решения уравнений Ньютона или Лагранжа при учете теплового движения всех взаимодействующих друг с другом атомов молекулы-мишени и молекулы-лиганда с учетом наличия молекул растворителя определяют состояние молекулярной системы, при котором она достигает теплового равновесия. Затем определяют траектории движения всех атомов системы после достижения ими теплового равновесия, когда средние значения наблюдаемых величин (например, энергия взаимодействия молекулы-лиганда с молекулой-мишенью) перестают меняться со временем (обычно это длины траекторий по времени около одной наносекунды), и записывают на этапе 76 на носитель информации координаты всех атомов взаимодействующих молекулы-мишени, молекулы-лиганда и молекул растворителя через определенные промежутки времени заданное количество раз для заданного набора конфигураций межмолекулярного комплекса мишень-лиганд.Using the coordinates of the atoms of the intermolecular complex, the target molecule and the ligand molecule, as well as the solvent molecules (
Используя координаты атомов молекулы-мишени, а также молекул растворителя (этапы 17, 28 и 31 на фиг.2) и, если это необходимо, вводя дополнительные атомы для установления нужного заряда молекулы-мишени (этапы 47, 49 на фиг.3), проводят на этапе 77 молекулярно-динамическое моделирование молекулы-мишени в рамках явной модели растворителя. При этом путем решения уравнений Ньютона или Лагранжа при учете теплового движения всех взаимодействующих друг с другом атомов молекулы-мишени с учетом наличия молекул растворителя определяют состояние молекулярной системы, при котором она достигает теплового равновесия. Затем определяют траектории движения всех атомов системы после достижения их теплового равновесия и записывают на этапе 78 на носитель информации координаты всех атомов взаимодействующих молекулы-мишени и молекул растворителя через определенные промежутки времени заданное количество раз для заданного набора конфигураций молекулы-мишени.Using the coordinates of the atoms of the target molecule, as well as the solvent molecules (
Используя координаты атомов молекулы-лиганда, а также молекул растворителя (этапы 24, 29 и 32 на фиг.2) и, если это необходимо, вводя дополнительные атомы для установления нужного заряда молекулы-лиганда (этапы 48, 49 на фиг.3), проводят на этапе 79 молекулярно-динамическое моделирование в рамках явной модели растворителя. При этом путем решения уравнений Ньютона или Лагранжа при учете теплового движения всех взаимодействующих друг с другом атомов молекулы-лиганда с учетом наличия молекул растворителя на этапе 79 определяют состояние молекулярной системы, при котором она достигает теплового равновесия. Затем определяют траектории движения всех атомов системы после достижения их теплового равновесия и записывают на этапе 80 на носитель информации координаты всех атомов взаимодействующих молекулы-лиганда и молекул растворителя через определенные промежутки времени заданное количество раз для заданного набора конфигураций молекулы-лиганда.Using the coordinates of the atoms of the ligand molecule, as well as solvent molecules (
Процедура молекулярно-динамического формирования входных файлов с координатами атомов молекулы-мишени, молекулы-лиганда и межмолекулярного комплекса мишень-лиганд для ряда конфигураций с неявной моделью растворителя включает следующие этапы.The molecular dynamics procedure for generating input files with atomic coordinates of a target molecule, a ligand molecule, and an intermolecular target-ligand complex for a number of configurations with an implicit solvent model includes the following steps.
Используя координаты атомов межмолекулярного комплекса молекулы-мишени и молекулы-лиганда (этап 26 на фиг.2) и, если это необходимо, вводя дополнительные атомы для установления нужного заряда межмолекулярного комплекса мишень-лиганд (этапы 46, 49 на фиг.3), проводят молекулярно-динамическое моделирование в рамках неявной модели растворителя. Растворитель в этом случае учитывается с помощью неявной модели, как описано выше (этап 53 на фиг.3) в рамках решения уравнений Пуассона, Пуассона-Больцмана, уравнения для непрерывного проводника или иным способом, учитывающим влияние растворителя без использования координат молекул растворителя. Затем аналогично тому, как это было сделано в рамках явной модели растворителя, путем решения уравнений Ньютона или Лагранжа при учете теплового движения всех взаимодействующих друг с другом атомов молекулы-мишени и молекулы-лиганда на этапе 75 определяют состояние молекулярной системы, при котором она достигает теплового равновесия. Затем определяют траектории движения всех атомов системы после достижения их теплового равновесия и записывают на этапе 76 на носитель информации координаты всех атомов взаимодействующих молекулы-мишени, молекулы-лиганда и молекул растворителя через определенные промежутки времени заданное количество раз для заданного набора конфигураций межмолекулярного комплекса мишень-лиганд.Using the coordinates of the atoms of the intermolecular complex of the target molecule and the ligand molecule (
Используя координаты атомов молекулы-мишени и, если это необходимо, вводя дополнительные атомы для установления нужного заряда молекулы-мишени (этапы 47, 49 на фиг.2), проводят молекулярно-динамическое моделирование в рамках неявной модели растворителя. Растворитель в этом случае учитывается с помощью неявной модели (этап 53 на фиг.3) в рамках решения уравнений Пуассона, Пуассона-Больцмана, уравнения для непрерывного проводника или иным способом, учитывающим влияние растворителя без использования координат молекул растворителя. Затем аналогично тому, как это было сделано в рамках явной модели растворителя, путем решения уравнений Ньютона или Лагранжа при учете теплового движения всех взаимодействующих друг с другом атомов молекулы-мишени с учетом наличия молекул растворителя на этапе 77 определяют состояние молекулярной системы, при котором она достигает теплового равновесия. Затем определяют траектории движения всех атомов системы после достижения их теплового равновесия и записывают на этапе 78 на носитель информации координаты всех атомов взаимодействующих молекулы-мишени и молекул растворителя через определенные промежутки времени заданное количество раз для заданного набора конфигураций молекулы-мишени.Using the coordinates of the atoms of the target molecule and, if necessary, introducing additional atoms to establish the desired charge of the target molecule (
Используя координаты атомов молекулы-лиганда и, если это необходимо, вводя дополнительные атомы для установления нужного заряда молекулы-лиганда (этапы 47, 49 на фиг.3), проводят молекулярно-динамическое моделирование в рамках неявной модели растворителя. Растворитель в этом случае учитывается с помощью неявной модели (этап 53 на фиг.3) в рамках решения уравнений Пуассона, Пуассона-Больцмана, уравнения для непрерывного проводника или иным способом, учитывающим влияние растворителя без использования координат молекул растворителя. Затем аналогично тому, как это было сделано в рамках явной модели растворителя, путем решения уравнений Ньютона или Лагранжа при учете теплового движения всех взаимодействующих друг с другом атомов молекулы-лиганда с учетом наличия молекул растворителя на этапе 79 определяют состояние молекулярной системы, при котором она достигает теплового равновесия. Затем определяют траектории движения всех атомов системы после достижения их теплового равновесия и записывают на этапе 80 на носитель информации координаты всех атомов взаимодействующих молекулы-лиганда и молекул растворителя через определенные промежутки времени заданное количество раз для заданного набора конфигураций молекулы-лиганда.Using the coordinates of the atoms of the ligand molecule and, if necessary, introducing additional atoms to establish the desired charge of the ligand molecule (
Далее для каждого набора координат межмолекулярного комплекса мишень-лиганд в явной или неявной модели растворителя, полученного на этапе 76, проводят на этапе 81 разбиение всех атомов на группы аналогично тому, как это осуществлялось ранее (этап 35 на фиг.3).Next, for each coordinate set of the intermolecular target – ligand complex in the explicit or implicit model of the solvent obtained in
Для каждого набора координат молекулы-мишени в растворителе, полученного на этапе 78, проводят разбиение всех атомов на группы по способу 82, аналогичному способу 36.For each coordinate set of the target molecule in the solvent obtained in
Для каждого набора координат молекулы-лиганда в растворителе, полученного по способу 80, проводят на этапе 83 разбиение всех атомов на группы аналогично тому, как это осуществлялось ранее (этап 37 на фиг.3).For each set of coordinates of the ligand molecule in the solvent obtained by
Для каждой конфигурации межмолекулярного комплекса мишень-лиганд, то есть для каждого полученного в молекулярно-динамическом моделировании набора его координат, формируют на этапе 84 входной файл для квантово-механического моделирования межмолекулярного комплекса мишень-лиганд в растворителе, как описано выше (этап 4 на фиг.1 и этап 56 на фиг.4).For each configuration of the target-ligand intermolecular complex, that is, for each set of its coordinates obtained in molecular dynamics modeling, an input file is generated at
Аналогично для каждой конфигурации молекулы-мишени, то есть для каждого полученного в молекулярно-динамическом моделировании набора ее координат, формируют на этапе 85 входной файл для квантово-механического моделирования молекулы-мишени в растворителе, как описано выше (этап 4 на фиг.1 и этап 56 на фиг.4).Similarly, for each configuration of the target molecule, that is, for each set of its coordinates obtained in molecular dynamics modeling, an input file is generated in
Для каждой конфигурации молекулы-лиганда, то есть для каждого полученного в молекулярно-динамическом моделировании набора ее координат, формируют на этапе 86 входной файл для квантово-механического моделирования молекулы-лиганда в растворителе, как описано выше (этап 4 на фиг.1 и этап 56 на фиг.4).For each configuration of the ligand molecule, that is, for each set of its coordinates obtained in molecular dynamics modeling, an input file is generated at
Для каждого входного файла, сформированного на этапе 84, то есть для каждой конфигурации межмолекулярного комплекса мишень-лиганд, с помощью выбранного на этапе 87 метода моделирования на этапе 88 проводят расчет полной энергии межмолекулярного комплекса мишень-лиганд в растворителе без оптимизации пространственного строения комплекса. Затем на этапе 89 вычисляют среднее значение полной энергии межмолекулярного комплекса мишень-лиганд в растворителе по всему выбранному набору конфигураций этой молекулярной системы.For each input file generated in
Для каждого входного файла, сформированного на этапе 85, то есть для каждой конфигурации молекулы-мишени, с помощью выбранного на этапе 87 метода моделирования на этапе 90 проводят расчет полной энергии молекулы-мишени в растворителе без оптимизации ее пространственного строения. Затем на этапе 91 вычисляют среднее значение полной энергии молекулы-мишени в растворителе по всему выбранному набору конфигураций этой молекулярной системы.For each input file generated in
Для каждого входного файла, сформированного на этапе 86, то есть для каждой конфигурации молекулы-лиганда, с помощью выбранного на этапе 87 метода моделирования на этапе 92 проводят расчет полной энергии молекулы-лиганда в растворителе без оптимизации ее пространственного строения. Затем на этапе 93 вычисляют среднее значение полной энергии молекулы-лиганда в растворителе по всему выбранному набору конфигураций этой молекулярной системы.For each input file generated in
Используя полученные средние значения полных энергий межмолекулярного комплекса мишень-лиганд в растворителе, молекулы-мишени в растворителе и молекулы-лиганда в растворителе, полученные на этапах 89, 91 и 93 соответственно, на этапе 94 вычисляется энтальпия связывания молекулы-лиганда с молекулой-мишенью в растворителе как разность между средним значением полной энергии межмолекулярного комплекса мишень-лиганд в растворителе, с одной стороны, и суммой средних значений полных энергий молекулы-мишени в растворителе и молекулы-лиганда в растворителе, с другой стороны. Далее вычисляется энтропия связывания молекулы-лиганда с молекулой-мишенью в растворителе и свободная энергия связывания молекулы-лиганда с молекулой-мишенью в растворителе (этапы 69 и 71 на фиг.4).Using the obtained average values of the total energies of the target-ligand intermolecular complex in the solvent, the target molecules in the solvent, and the ligand molecules in the solvent obtained in
Приведенный выше способ моделирования связывания молекул-лигандов с молекулами-мишенями методами квантовой механики с учетом влияния растворителя был осуществлен авторами настоящего изобретения для ряда межмолекулярных комплексов белков и лигандов, для которых экспериментально были известны энергетические характеристики связывания, а именно энтальпия связывания. В соответствии с заявленным способом для этих тестовых комплексов было проведено вычисление энтальпии связывания белок-лиганд. Путем сравнения полученных результатов с соответствующими экспериментальными величинами была дана первоначальная оценка точности заявленного способа моделирования.The above method of modeling the binding of ligand molecules to target molecules by quantum mechanics, taking into account the influence of a solvent, was carried out by the authors of the present invention for a number of intermolecular complexes of proteins and ligands for which the binding energy characteristics, namely binding enthalpy, were experimentally known. In accordance with the claimed method, the protein-ligand binding enthalpy was calculated for these test complexes. By comparing the obtained results with the corresponding experimental values, an initial assessment of the accuracy of the claimed modeling method was given.
Для проведения тестового моделирования были выбраны восемь комплексов белков с лигандами, для которых были известны не только экспериментальные значения энтальпии связывания, но и структуры, полученные с помощью рентгеноструктурного анализа и занесенные в базу данных PDB (Protein Data Bank) [7]. В таблице 1 представлен список исследованных комплексов. В этой таблице приведены названия этих комплексов согласно базе данных PDB, латинские названия соответствующих белков и лигандов, экспериментальные значения энтальпий связывания для каждого комплекса, а также ссылки на работы, из которых эти данные были получены. На фиг.6 приведены структурные формулы и оптимизированные в рамках квантовой механики структуры лигандов соответствующих комплексов.For test modeling, eight protein complexes with ligands were selected for which not only the experimental values of the binding enthalpy were known, but also the structures obtained by X-ray diffraction analysis and entered into the PDB database (Protein Data Bank) [7]. Table 1 presents a list of the studied complexes. This table shows the names of these complexes according to the PDB database, the Latin names of the corresponding proteins and ligands, the experimental values of the binding enthalpies for each complex, as well as links to the works from which these data were obtained. Figure 6 shows the structural formulas and the structures of the ligands of the corresponding complexes optimized within the framework of quantum mechanics.
Комплексы белок-лиганд с экспериментально известными значениями энтальпии связывания, которые были выбраны как тестовые системы для моделирования связывания в системе белок-лиганд методами квантовой механикиTable 1
Protein-ligand complexes with experimentally known binding enthalpy values that were selected as test systems for modeling binding in the protein-ligand system by quantum mechanics
Как видно из приведенной таблицы 1 и из фиг.6, выбранные комплексы содержат лиганды, которые представляют собой различные по химическому составу и свойствам органические соединения. Среди них есть углеводы (системы 1, 2, 6 и 7 по нумерации таблицы 1), гетероциклические соединения (системы 3 и 4 по нумерации таблицы 1), ароматическое соединение (система 5 по нумерации таблицы 1) и олигопептид (система 8 по нумерации таблицы 1). Некоторые из этих лигандов отрицательно заряжены, некоторые нейтральны, число атомов в них колеблется от 20 атомов до 94. Экспериментальные значения энтальпий связывания изменяются в выбранном ряду комплексов от -2,7 до -28,6 ккал/моль. Два выбранных комплекса (системы 3 и 4 по нумерации таблицы 1) содержат одинаковые лиганды и разные белки, другие два комплекса (системы 6 и 7 по нумерации таблицы 1) содержат разные лиганды и одинаковые белки. Таким образом, выбранный ряд межмолекулярных комплексов белок-лиганд представлял собой достаточно широкий ряд систем, представляющий собой интерес при тестировании заявленного метода моделирования.As can be seen from the above table 1 and figure 6, the selected complexes contain ligands, which are organic compounds with different chemical composition and properties. Among them are carbohydrates (
Исходные структуры комплексов, а именно декартовы координаты их атомов, были взяты из базы данных PDB. Практически все исходные структуры белков и лигандов содержали только координаты тяжелых (C, N, O, S) атомов. Водородные атомы были добавлены к структурам белков всех комплексов с помощью программы REDUCE [19] на первом этапе построения моделей комплексов. Водородные атомы были добавлены к структурам лигандов всех комплексов с помощью пакета Materials Studio Visualizer, предоставляемого компанией Accelrys [20].The initial structures of the complexes, namely, the Cartesian coordinates of their atoms, were taken from the PDB database. Almost all of the initial structures of proteins and ligands contained only the coordinates of heavy (C, N, O, S) atoms. Hydrogen atoms were added to the protein structures of all complexes using the REDUCE program [19] at the first stage of building complex models. Hydrogen atoms were added to the ligand structures of all complexes using the Materials Studio Visualizer package provided by Accelrys [20].
В данном случае учет влияния растворителя проводился в рамках явной модели воды, однако в настоящем моделировании не проводилось добавление молекул воды в молекулярной механике или в молекулярной динамике. Положения молекул воды, связанных с комплексом и его компонентами, были взяты из экспериментальных данных (PDB данные рентгеноструктурного анализа) о структурированных в комплексе молекулах воды.In this case, the influence of the solvent was taken into account within the framework of an explicit water model; however, in the present simulation, no water molecules were added in molecular mechanics or in molecular dynamics. The positions of water molecules associated with the complex and its components were taken from experimental data (PDB data of X-ray diffraction analysis) on water molecules structured in the complex.
Для каждого комплекса была проведена сортировка атомов на две группы согласно способу, предложенному в заявленном изобретении. Эта процедура была выполнена с помощью программы LigEnv [21], разработанной в компании Алгодайн. Для каждого комплекса в первую группу атомов включили атомы лиганда и атомы белка, которые составляли целые аминокислотные остатки, хотя бы один атом которых находился на расстоянии, не превышающем заданное значение от каждого атома лиганда. Кроме того, в первую группу включили атомы молекул воды, которые присутствовали во входных данных, полученных из базы данных PDB, каждый из которых находился на расстоянии, не превышающем заданное значение от атомов лиганда. Во вторую группу включили все остальные атомы белка и молекул воды. При построении модели белка в первую группу атомов включили атомы белка, отнесенные в первую группу атомов для межмолекулярного комплекса. Для моделирования энтальпии связывания во всех выбранных комплексах был выбран подход, при котором атомы белка, лиганда и их комплекса вместе с молекулами воды, относящиеся к первым группам, моделировались методами квантовой механики, а атомы вторых групп исключались из моделирования. При таком способе моделирования, как уже говорилось, во-первых, необходимо было выбирать достаточно большие модели белка, адекватно описывающие место связывания лиганда, а следовательно, для ускорения счета был выбран полуэмпирический квантово-механический метод расчета PM3 [22]. Этот метод наряду с достаточно высокой скоростью счета дает удовлетворительную точность при расчете полной энергии молекулярных систем, имеющих водородные связи. Во вторых, при таком подходе необходимо было вводить ряд дополнительных атомов, которые восстанавливали оборванные ковалентные связи атомов белков при разбиении их на группы. Оборванные ковалентные связи N-концов основных цепей белков замыкались группами -C(O)-(CH3), а оборванные ковалентные связи С-концов основных цепей белков замыкались группами -N(H)-(CH3). Дополнительно добавленные атомы при этом включались наряду с атомами первой группы в моделирование методами квантовой механики. В качестве оптимизируемых параметров выбирались координаты атомов лигандов, молекул воды и боковых цепей белков. Для поддержания трехмерной структуры белка, взятой из эксперимента, координаты тяжелых атомов (C, N, O) основных цепей белков и координаты добавленных атомов полагались как не оптимизируемые параметры.For each complex, atoms were sorted into two groups according to the method proposed in the claimed invention. This procedure was performed using the LigEnv program [21], developed by Algodine. For each complex, the first group of atoms included ligand atoms and protein atoms, which made up whole amino acid residues, at least one atom of which was at a distance not exceeding a specified value from each ligand atom. In addition, the first group included atoms of water molecules that were present in the input data obtained from the PDB database, each of which was at a distance not exceeding a specified value from the ligand atoms. The second group included all other atoms of the protein and water molecules. When constructing the protein model, the protein atoms included in the first group of atoms for the intermolecular complex were included in the first group of atoms. To model the enthalpy of binding in all selected complexes, an approach was chosen in which the atoms of the protein, ligand, and their complex, together with water molecules belonging to the first groups, were modeled by quantum mechanics, and the atoms of the second groups were excluded from the simulation. With this modeling method, as was already mentioned, firstly, it was necessary to select sufficiently large protein models that adequately describe the ligand binding site, and, therefore, the semiempirical quantum-mechanical method for calculating PM3 was chosen to speed up the counting [22]. This method, along with a sufficiently high counting rate, provides satisfactory accuracy in calculating the total energy of molecular systems with hydrogen bonds. Secondly, with this approach, it was necessary to introduce a number of additional atoms, which restored dangling covalent bonds of protein atoms when they were divided into groups. The dangling covalent bonds of the N-ends of the main chains of the proteins were closed by the groups -C (O) - (CH 3 ), and the dangling covalent bonds of the C-ends of the main chains of the proteins were closed by the groups -N (H) - (CH 3 ). The additionally added atoms were included along with the atoms of the first group in the simulation by quantum mechanics. The coordinates of ligand atoms, water molecules, and side chains of proteins were chosen as optimized parameters. To maintain the three-dimensional structure of the protein taken from the experiment, the coordinates of the heavy atoms (C, N, O) of the main chains of the proteins and the coordinates of the added atoms were considered as not optimized parameters.
В ходе формирования входных данных для моделирования определялись зарядовые состояния различных молекулярных групп белков и лигандов в воде при известных значениях pH. Согласно этому были добавлены или убраны дополнительные протоны в соответствующих кислотных или основных аминогруппах белка. Путем суммирования зарядовых состояний кислотных и основных аминогрупп определялся полный заряд моделей белков, лигандов и их межмолекулярных комплексов.During the formation of the input data for modeling, the charge states of various molecular groups of proteins and ligands in water were determined at known pH values. Accordingly, additional protons in the corresponding acidic or basic amino groups of the protein have been added or removed. By summing the charge states of acidic and basic amino groups, the total charge of protein models, ligands, and their intermolecular complexes was determined.
На фиг.7 представлена оптимизированная структура построенной таким образом модели одного из исследованных комплексов. Структуры всех остальных моделей, в общем случае, выглядят аналогично и для облегчения восприятия материала опускаются.Figure 7 presents the optimized structure of the thus constructed model of one of the studied complexes. The structures of all other models, in the general case, look similar and are omitted to facilitate the perception of the material.
В ходе моделирования было показано, что особое внимание необходимо уделять моделированию воды как растворителю, учитываемому явным образом. Были предложены два способа учета разрыва и образования водородных связей при переходе от комплекса к его компонентам и участия в этом процессе молекул воды. Соответственно, были рассмотрены два способа добавления молекул воды при переходе от комплекса к его компонентам. Условно эти способы были названы как подходы W1 и W2.During the simulation, it was shown that special attention should be paid to modeling water as a solvent, which is explicitly taken into account. Two methods have been proposed for taking into account the breaking and formation of hydrogen bonds during the transition from the complex to its components and the participation of water molecules in this process. Accordingly, two methods for adding water molecules during the transition from the complex to its components were considered. Conventionally, these methods have been named as approaches W1 and W2.
Согласно подходу W1, молекулы воды, положение которых было взято из эксперимента из базы данных PDB, связанные в комплексе с белком, рассчитывались при моделировании индивидуальных компонентов комплекса вместе с белком. Молекулы воды, положение которых было взято из эксперимента из базы данных PDB, связанные в комплексе с лигандом, рассчитывались при моделировании индивидуальных компонентов комплекса вместе с лигандом. Молекулы воды, связанные в комплексе одновременно и с белком, и с лигандом и образующие с ними мостики с водородными связями, учитывались при расчете по отдельности белка и лиганда два раза.According to the W1 approach, water molecules, the position of which was taken from the experiment from the PDB database, bound in a complex with a protein, were calculated by modeling individual components of the complex together with the protein. Water molecules, the position of which was taken from the experiment from the PDB database, linked in a complex with a ligand, were calculated by modeling the individual components of the complex together with the ligand. Water molecules bound in the complex simultaneously with the protein and the ligand and forming bridges with hydrogen bonds with them were taken into account when calculating the protein and ligand separately twice.
Согласно подходу W2, молекулы воды, положение которых было взято из эксперимента, учитывались также способом, аналогичным способу W1. Кроме этого, в этом случае дополнительные молекулы воды добавлялись и к белку, и к лиганду в тех местах, где в комплексе были водородные связи между белком и лигандом, так, чтобы заменить порванные водородные связи при переходе от межмолекулярного комплекса к его компонентам.According to the W2 approach, water molecules, the position of which was taken from the experiment, were also taken into account in a way similar to W1. In addition, in this case, additional water molecules were added to both the protein and the ligand in those places where the complex had hydrogen bonds between the protein and the ligand, so as to replace the broken hydrogen bonds during the transition from the intermolecular complex to its components.
Схематичное представление этих двух способов W1 и W2 учета молекул воды явным образом представлено на фиг.8 и 9 соответственно.A schematic representation of these two methods of accounting for water molecules W1 and W2 is explicitly presented in FIGS. 8 and 9, respectively.
Согласно приведенным схемам, вычисление энтальпии связывания белка и лиганда в комплексе согласно способу W1 производился согласно формулеAccording to the above schemes, the calculation of the enthalpy of binding of protein and ligand in the complex according to method W1 was carried out according to the formula
ΔHсвяз (W1)=ΔHLP-(ΔHP[nW(P), kW(LP)]+ΔHL[mW(L), kW(LP)])+k·ΔHW,ΔH bond (W1) = ΔH LP - (ΔH P [nW (P), kW (LP)] + ΔH L [mW (L), kW (LP)] ) + k · ΔH W ,
Здесь ΔHLP - рассчитанная энергия комплекса белок-лиганд (LP), взятого вместе со всеми молекулами воды, взаимодействующими с комплексом. ΔHP[nW(P),kW(LP)] - рассчитанная энергия белка (P), взятого вместе со всеми (n+k) молекулами воды, взаимодействующими с ним (см. фиг.8), ΔHL[mW(L),kW(LP)] - рассчитанная энергия лиганда (L), взятого вместе со всеми (m+k) молекулами воды, взаимодействующими с ним (см. фиг.8). k·ΔHW - рассчитанная энергия k молекул воды W(LP) (см. фиг.8), которая должна быть добавлена к сумме для поддержания энергетического баланса. ΔHW - это энергия молекулы воды, которая рассчитывается с учетом удаления ее из капли воды. В данном случае рассчитанная энергия ΔHW=-53,43 ккал/моль.Here ΔH LP is the calculated energy of the protein-ligand (LP) complex, taken together with all water molecules interacting with the complex. ΔH P [nW (P), kW (LP)] is the calculated energy of the protein (P) taken together with all (n + k) water molecules interacting with it (see Fig. 8), ΔH L [mW (L ), kW (LP)] is the calculated energy of the ligand (L) taken together with all (m + k) water molecules interacting with it (see Fig. 8). k · ΔH W is the calculated energy k of water molecules W (LP) (see Fig. 8), which must be added to the sum to maintain the energy balance. ΔH W is the energy of a water molecule, which is calculated taking into account its removal from a drop of water. In this case, the calculated energy ΔH W = -53.43 kcal / mol.
Вычисление энтальпии связывания белка и лиганда в комплексе согласно способу W2 выполнялось согласно формулеThe calculation of the enthalpy of binding of protein and ligand in the complex according to method W2 was performed according to the formula
ΔHbind (W2)=ΔHLP - (ΔHP[nW(P), kW(LP), qW(PHB)]+ΔHL[mW(L), kW(LP), tW(LHB)])+(k+q+t)ΔHW.ΔH bind (W2) = ΔH LP - (ΔH P [nW (P), kW (LP), qW (PHB)] + ΔH L [mW (L), kW (LP), tW (LHB)] ) + ( k + q + t) ΔH W.
Здесь ΔHLP - рассчитанная энергия комплекса белок-лиганд (LP), взятого вместе со всеми молекулами воды, взаимодействующими с комплексом. ΔHP[nW(P), kW(LP), qW(PHB)] - рассчитанная энергия белка (P), взятого вместе со всеми молекулами (n+k+q) воды, взаимодействующими с ним (см. фиг.9), ΔHL[mW(L), kW(LP), tW(LHB)] - рассчитанная энергия лиганда (L), взятого вместе со всеми (m+k+t) молекулами воды, взаимодействующими с ним (см. фиг.9). (k+q+t)ΔHW - рассчитанная энергия (k+q+t) молекул воды W(LP), W(PHB) и W(LHB) (см. фиг.9), которая должна быть добавлена к сумме для поддержания энергетического баланса.Here ΔH LP is the calculated energy of the protein-ligand (LP) complex, taken together with all water molecules interacting with the complex. ΔH P [nW (P), kW (LP), qW (PHB)] is the calculated energy of the protein (P) taken together with all water molecules (n + k + q) interacting with it (see Fig. 9) , ΔH L [mW (L), kW (LP), tW (LHB)] is the calculated energy of the ligand (L) taken together with all (m + k + t) water molecules interacting with it (see Fig. 9 ) (k + q + t) ΔH W is the calculated energy (k + q + t) of the water molecules W (LP), W (PHB) and W (LHB) (see Fig. 9), which should be added to the sum for maintaining energy balance.
Полученные в приближениях W1 и W2 согласно заявленному изобретению энтальпии связывания белков и лигандов для комплексов, взятых как тестовые системы (см. таблицу 1, системы 1-8), приведены в таблице 2 вместе с соответствующими экспериментальными данными и отклонениями вычисленных от экспериментальных величин.The enthalpies of binding of proteins and ligands obtained in approximations W1 and W2 according to the claimed invention for complexes taken as test systems (see table 1, systems 1-8) are shown in table 2 together with the corresponding experimental data and deviations calculated from the experimental values.
Как видно из этой таблицы, при обоих способах учета воды явным образом было получено достаточно разумное согласие вычисленных и экспериментальных данных по энтальпии связывания в комплексах белок-лиганд. Среднеквадратичное отклонение (RMS) вычисленных для всех комплексов энтальпий связывания в подходе W1 составило 7,0 ккал/моль, аналогичное среднеквадратичное отклонение, полученное для метода W2, составило 1,85 ккал/моль. Последняя точность вычисления энтальпии связывания является достаточно высокой и сравнима с точностью существующих экспериментальных методов измерения энтальпии связывания в комплексах белок-лиганд.As can be seen from this table, for both methods of water accounting, quite reasonable agreement was obtained between the calculated and experimental data on the enthalpy of binding in protein-ligand complexes. The standard deviation (RMS) calculated for all complexes of binding enthalpies in the W1 approach was 7.0 kcal / mol, the similar standard deviation obtained for the W2 method was 1.85 kcal / mol. The latter accuracy in calculating the binding enthalpy is quite high and comparable with the accuracy of existing experimental methods for measuring the binding enthalpy in protein-ligand complexes.
Рассчитанные энтальпии связывания белков и лигандов для комплексов 1-8 согласно таблице 1table 2
The calculated enthalpies of binding of proteins and ligands for complexes 1-8 according to table 1
Список используемой литературыBibliography
1. Mulholland A.J.; Lyne P.D.; Richards W.G. Proteins: Struct Funct Genet 1997, 27, 9-25.1. Mulholland A.J .; Lyne P.D .; Richards W.G. Proteins:
2. Mulholland A.J.; Lyne P.D.; Karplus M., Ab initio QM/MM study of the citrate synthase mechanism. A low-barrier hydrogen bond is not involved, J. Am. Chem. Soc. 2000, 122, 534-535.2. Mulholland A.J .; Lyne P.D .; Karplus M., Ab initio QM / MM study of the citrate synthase mechanism. A low-barrier hydrogen bond is not involved, J. Am. Chem. Soc. 2000, 122, 534-535.
3. Lyne P.D.; Hodoscek M.; Karplus M., A hybrid QM-MM potential employing Hartree-Fock of Density functional methods in the quantum region, J. Phys. Chem. A, 1999, 103, 3462-3471.3. Lyne P.D .; Hodoscek M .; Karplus M., A hybrid QM-MM potential employing Hartree-Fock of Density functional methods in the quantum region, J. Phys. Chem. A, 1999, 103, 3462-3471.
4. Lewis J.P., Carter C.W., Jr, Hermans J., Pan W., Lee T.-S., Yand W., Active species for the ground-state complex of cytidine deaminase: a linear-scaling quantum mechanical investigation, J. Am. Chem. Soc. 1998, 120, 5407-5410.4. Lewis JP, Carter CW, Jr, Hermans J., Pan W., Lee T.-S., Yand W., Active species for the ground-state complex of cytidine deaminase: a linear-scaling quantum mechanical investigation, J . Am. Chem. Soc. 1998, 120, 5407-5410.
5. York D.M., Lee T.-S., Yang W., Quantum mechanical treatment of biological macromolecules in solution using linear-scaling electronic structure methods, Phys. Rev. Lett. 1998, 80, 5011-5014.5. York D.M., Lee T.-S., Yang W., Quantum mechanical treatment of biological macromolecules in solution using linear-scaling electronic structure methods, Phys. Rev. Lett. 1998, 80, 5011-5014.
6. Lee T.-S., York D.M., Yang W., Linear-scaling semiempirical quantum calculations for macromolecules, J. Chem. Phys. 1996, 105, 2744-2750.6. Lee T.-S., York D.M., Yang W., Linear-scaling semiempirical quantum calculations for macromolecules, J. Chem. Phys. 1996, 105, 2744-2750.
7. H.M. Berman, J. Westbrook, Z. Feng, G. Gilliland, T.N. Bhat, H. Weissig, I.N. Shindyalov, P.E. Bourne, Nucleic Acids Research 28 (2000) 235-242, http://www.rcsb.org/pdb.7. H.M. Berman, J. Westbrook, Z. Feng, G. Gilliland, T.N. Bhat, H. Weissig, I.N. Shindyalov, P.E. Bourne, Nucleic Acids Research 28 (2000) 235-242, http://www.rcsb.org/pdb.
8. Murphy R.B.; Philipp D.M.; Friesner R.A. J. Comp. Chem. 2000, 21, 1442-1457.8. Murphy R.B .; Philipp D.M .; Friesner R.A. J. Comp. Chem. 2000, 21, 1442-1457.
9. Stewart J. J. P. J Mol Struct (Theochem) 1997, 401, 195-205.9. Stewart J. J. P. J. Mol Struct (Theochem) 1997, 401, 195-205.
10. B. Tidor, M. Karplus, The contribution of vibrational entropy to molecular association, J.Mol.Biol. 238 (1994) 405-414.10. B. Tidor, M. Karplus, The contribution of vibrational entropy to molecular association, J. Mol. Biol. 238 (1994) 405-414.
11. Sonja Schwartzl et al. J. Comput. Chem. 23 (2002) 1143-1149.11. Sonja Schwartzl et al. J. Comput. Chem. 23 (2002) 1143-1149.
12. R.M. Levy, E. Gallicchio, Ann. Rev. Phys. Chem. 49 (1998) 531.12. R.M. Levy, E. Gallicchio, Ann. Rev. Phys. Chem. 49 (1998) 531.
13. Fukada H.; Sturtevant J.M.; Quiocho F.A. J. Biol. Chem. 1983, 258, 13193-13198.13. Fukada H .; Sturtevant J.M .; Quiocho F.A. J. Biol. Chem. 1983, 258, 13193-13198.
14. Schwarz F.P.; Ahmed H.; Bianchet M.A., Amzel L.M.; Vasta G.R. Biochem 1998, 37, 5867-5877.14. Schwarz F.P .; Ahmed H .; Bianchet M.A., Amzel L.M .; Vasta G.R.
15. Hyre D.E.; Trong I.L.; Freitag S.; Stenkamp R.E.; Stayton P.S. Prot. Sci. 2000, 9, 878-885.15. Hyre D.E .; Trong I.L .; Freitag S .; Stenkamp R.E .; Stayton P.S. Prot. Sci. 2000, 9, 878-885.
16. Holdgate G.A.; Tunnicliffe A.; Ward W.H.; Weston S.A.; Rosenbrock G.; Barth P.T.; Taylor I.W.; Paupti,t R.A.; Timms D. Biochem 1997, 36, 9663-9673.16. Holdgate G.A .; Tunnicliffe A .; Ward W.H .; Weston S.A .; Rosenbrock G .; Barth P.T .; Taylor I.W .; Paupti, t R.A .;
17. Klotz I.M. Ligand-Receptor Energetics/ a guide for the perplexed, John Wiley & Sons, New York, Chichester, Weinheim, Brisbane, Singapore, Toronto, 1997, p.77.17. Klotz I.M. Ligand-Receptor Energetics / a guide for the perplexed, John Wiley & Sons, New York, Chichester, Weinheim, Brisbane, Singapore, Toronto, 1997, p. 77.
18. Henriques D.A.; Ladbury J.E.; Jackson R.M. Prot. Sci. 2000, 9, 1975-1985.18. Henriques D.A .; Ladbury J.E .; Jackson R.M. Prot. Sci. 2000, 9, 1975-1985.
19. Word J.M.; J. Mol. Biol. 1999, 285, 1733-1745.19. Word J.M .; J. Mol. Biol. 1999, 285, 1733-1745.
20. Materials Studio Visualizer, Materials Studio Release 2.2, San Diego: Accelrys Inc. 2002, http://www.accelrys.com/mstudio/visualizer.html.20. Materials Studio Visualizer, Materials Studio Release 2.2, San Diego: Accelrys Inc. 2002, http://www.accelrys.com/mstudio/visualizer.html.
21. Vlasov P. LigEnv: program for construction of a model represented an active site of protein-ligand complex from PDB molecular structure, Algodign, LLC, Moscow, 2002.21. Vlasov P. LigEnv: program for construction of a model represented an active site of protein-ligand complex from PDB molecular structure, Algodign, LLC, Moscow, 2002.
22. Stewart J.J.P. J. Comput. Chem. 1989, 10, 2, 209-264.22. Stewart J.J.P. J. Comput. Chem. 1989, 10, 2, 209-264.
Claims (30)
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2003128413/09A RU2265244C2 (en) | 2003-09-22 | 2003-09-22 | Method for modeling and predicting linking of ligand molecules with target molecules by quantum mechanics methods with consideration of solvent effect |
AU2003302159A AU2003302159A1 (en) | 2003-09-22 | 2003-12-24 | Method of modeling and predicting binding of ligand molecules to target molecules by methods of quantum mechanics taking effect of solvent into account |
PCT/RU2003/000578 WO2005029351A1 (en) | 2003-09-22 | 2003-12-24 | Method of modeling and predicting binding of ligand molecules to target molecules by methods of quantum mechanics taking effect of solvent into account |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2003128413/09A RU2265244C2 (en) | 2003-09-22 | 2003-09-22 | Method for modeling and predicting linking of ligand molecules with target molecules by quantum mechanics methods with consideration of solvent effect |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2003128413A RU2003128413A (en) | 2005-07-10 |
RU2265244C2 true RU2265244C2 (en) | 2005-11-27 |
Family
ID=34374506
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2003128413/09A RU2265244C2 (en) | 2003-09-22 | 2003-09-22 | Method for modeling and predicting linking of ligand molecules with target molecules by quantum mechanics methods with consideration of solvent effect |
Country Status (3)
Country | Link |
---|---|
AU (1) | AU2003302159A1 (en) |
RU (1) | RU2265244C2 (en) |
WO (1) | WO2005029351A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2457536C2 (en) * | 2007-11-26 | 2012-07-27 | ТУЗОВА Алла Павловна | Method of selecting model of system under investigation based on calculated entropy potentials of events thereof and apparatus for realising said method |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016103336A1 (en) | 2014-12-24 | 2016-06-30 | 富士通株式会社 | Interaction energy calculation method, calculation device, and program |
CN109859806B (en) * | 2019-01-17 | 2023-09-22 | 中山大学 | Absolute free energy perturbation method for predicting drug-target binding strength |
CN115116553B (en) * | 2021-03-19 | 2024-12-13 | 本源量子计算科技(合肥)股份有限公司 | Molecular parameter configuration method, device, medium and electronic device |
CN114487625B (en) * | 2021-12-17 | 2025-06-06 | 深圳晶泰科技有限公司 | Method for obtaining charge parameters, method and device for molecular mechanics simulation results |
WO2023108622A1 (en) * | 2021-12-17 | 2023-06-22 | 深圳晶泰科技有限公司 | Method for obtaining charge parameter, method for obtaining molecular dynamics simulation result, and device |
CN117976036B (en) * | 2024-03-29 | 2024-05-31 | 苏州元脑智能科技有限公司 | Composite structure prediction method, device, electronic device and storage medium |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5495423A (en) * | 1993-10-25 | 1996-02-27 | Trustees Of Boston University | General strategy for vaccine and drug design |
RU2132853C1 (en) * | 1994-09-20 | 1999-07-10 | Нексстар Фармасьютикалс, Инк. | Method of identification of components from mixture, component obtained in identification, method of preparing mixture and method of combined preparing catalyzing nucleic acid and component |
WO2001018627A2 (en) * | 1999-09-06 | 2001-03-15 | National University Of Singapore | Method and apparatus for computer automated detection of protein and nucleic acid targets of a chemical compound |
US6230102B1 (en) * | 1997-04-04 | 2001-05-08 | Massachusetts Institute Of Technology | Computer system and process for identifying a charge distribution which minimizes electrostatic contribution to binding at binding between a ligand and a molecule in a solvent and uses thereof |
-
2003
- 2003-09-22 RU RU2003128413/09A patent/RU2265244C2/en not_active IP Right Cessation
- 2003-12-24 AU AU2003302159A patent/AU2003302159A1/en not_active Abandoned
- 2003-12-24 WO PCT/RU2003/000578 patent/WO2005029351A1/en active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5495423A (en) * | 1993-10-25 | 1996-02-27 | Trustees Of Boston University | General strategy for vaccine and drug design |
RU2132853C1 (en) * | 1994-09-20 | 1999-07-10 | Нексстар Фармасьютикалс, Инк. | Method of identification of components from mixture, component obtained in identification, method of preparing mixture and method of combined preparing catalyzing nucleic acid and component |
US6230102B1 (en) * | 1997-04-04 | 2001-05-08 | Massachusetts Institute Of Technology | Computer system and process for identifying a charge distribution which minimizes electrostatic contribution to binding at binding between a ligand and a molecule in a solvent and uses thereof |
WO2001018627A2 (en) * | 1999-09-06 | 2001-03-15 | National University Of Singapore | Method and apparatus for computer automated detection of protein and nucleic acid targets of a chemical compound |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2457536C2 (en) * | 2007-11-26 | 2012-07-27 | ТУЗОВА Алла Павловна | Method of selecting model of system under investigation based on calculated entropy potentials of events thereof and apparatus for realising said method |
Also Published As
Publication number | Publication date |
---|---|
AU2003302159A1 (en) | 2005-04-11 |
WO2005029351A1 (en) | 2005-03-31 |
RU2003128413A (en) | 2005-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Santos et al. | Integrating molecular docking and molecular dynamics simulations | |
Siebenmorgen et al. | Computational prediction of protein–protein binding affinities | |
Reif et al. | New interaction parameters for charged amino acid side chains in the GROMOS force field | |
Surana et al. | Molecular modeling: Novel techniques in food and nutrition development | |
Samways et al. | Water molecules at protein–drug interfaces: computational prediction and analysis methods | |
Onufriev et al. | Exploring protein native states and large‐scale conformational changes with a modified generalized born model | |
US8036867B2 (en) | Method and apparatus for analysis of molecular configurations and combinations | |
Nikitina et al. | Semiempirical calculations of binding enthalpy for protein–ligand complexes | |
Mura et al. | An introduction to biomolecular simulations and docking | |
Li et al. | Progress in developing Poisson-Boltzmann equation solvers | |
Schmitt-Monreal et al. | Density-based many-body expansion as an efficient and accurate quantum-chemical fragmentation method: application to water clusters | |
Allen et al. | Development and validation of the quantum mechanical bespoke protein force field | |
Lagorce et al. | Dg-ammos: A new tool to generate 3d conformation of small molecules using d istance g eometry and a utomated m olecular m echanics o ptimization for in silico s creening | |
Mondal et al. | Exploring the effectiveness of binding free energy calculations | |
Nikitina et al. | Mixed implicit/explicit solvation models in quantum mechanical calculations of binding enthalpy for protein–ligand complexes | |
RU2265244C2 (en) | Method for modeling and predicting linking of ligand molecules with target molecules by quantum mechanics methods with consideration of solvent effect | |
Barros et al. | Recent developments in multiscale free energy simulations | |
JP2001515249A (en) | Modeling interactions using atomic parameters including anisotropic dipole polarizability | |
Procacci | Relative binding free energy between chemically distant compounds using a bidirectional nonequilibrium approach | |
Habgood | Bioactive focus in conformational ensembles: a pluralistic approach | |
ES2710209T3 (en) | Method for determining a binding site and a binding energy by simulations of mixed explicit solvents | |
Zheng et al. | Fragmentation method for computing quantum mechanics and molecular mechanics gradients for force matching: validation with hydration free energy predictions using adaptive force matching | |
Rao et al. | Quantum‐Enabled Drug Discovery Process | |
Zhu et al. | Effective Volume Correction for Lennard-Jones Static Potential Matching on Coarse-Graining Small Molecules | |
RU2265243C2 (en) | Methods for modeling inter-molecular interaction and method for predicting connection of ligand molecule with target molecule based on said methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20080923 |