EA047854B1 - METHODS OF NON-INVASIVE PRENATAL TESTING OF FETAL ANOMALIES - Google Patents
METHODS OF NON-INVASIVE PRENATAL TESTING OF FETAL ANOMALIES Download PDFInfo
- Publication number
- EA047854B1 EA047854B1 EA202191891 EA047854B1 EA 047854 B1 EA047854 B1 EA 047854B1 EA 202191891 EA202191891 EA 202191891 EA 047854 B1 EA047854 B1 EA 047854B1
- Authority
- EA
- Eurasian Patent Office
- Prior art keywords
- dna
- fragments
- cfdna
- probes
- cfdna fragments
- Prior art date
Links
Abstract
Настоящее изобретение относится к способу обнаружения генетических и/или геномных аномалий в смешанном образце, включающему этапы биохимического и in silico обогащения подмножества внеклеточных фрагментов ДНК, происходящих из смешанного образца. В изобретении применяют пул длинных ДНК-зондов для обогащения представляющих интерес последовательностей в смешанном образце с последующим массовым параллельным секвенированием и основанным на применении компьютера анализом обогащенной субпопуляции для выявления риска генетических и/или геномных аномалий в указанной субпопуляции смешанного образца. Основанная на применении компьютера часть способа не требует обязательного выравнивания по эталонному геному или калибровочных значений с применением эталонных образцов. Способ также включает набор для осуществления изобретения.The present invention relates to a method for detecting genetic and/or genomic abnormalities in a mixed sample, comprising the steps of biochemical and in silico enrichment of a subset of extracellular DNA fragments derived from the mixed sample. The invention utilizes a pool of long DNA probes to enrich sequences of interest in the mixed sample, followed by massively parallel sequencing and computer-based analysis of the enriched subset to identify the risk of genetic and/or genomic abnormalities in said subset of the mixed sample. The computer-based portion of the method does not require mandatory alignment to a reference genome or calibration values using reference samples. The method also includes a kit for implementing the invention.
Description
Область техникиField of technology
Настоящее изобретение относится к области биологии, медицины и химии, в частности к области молекулярной биологии и более конкретно к области молекулярной диагностики.The present invention relates to the field of biology, medicine and chemistry, in particular to the field of molecular biology and more specifically to the field of molecular diagnostics.
Уровень техникиState of the art
Обнаружение внеклеточной фетальной ДНК (cffDNA) в материнской плазме в значительной степени способствовало развитию неинвазивных пренатальных тестов. Однако большинство разработанных тестов для обнаружения у плода анеуплоидии и микроделеций основаны на единичных нормализованных значениях, полученных на основе информации о глубине прочтения. Хотя эти тесты можно рассматривать как значительное улучшение по сравнению с существующими способами, их клиническая чувствительность не превышает 99%. Особенно в том случае, если доля cffDNA в материнском кровотоке ниже 4%, даже с технологией секвенирования следующего поколения (NGS), которая имеет высокую чувствительность, получение достаточной точности для неинвазивного пренатального тестирования (НИПТ, NIPT) является сложной задачей.The detection of cell-free fetal DNA (cffDNA) in maternal plasma has greatly facilitated the development of non-invasive prenatal testing. However, most of the tests developed for the detection of fetal aneuploidies and microdeletions are based on single normalized values derived from read depth information. Although these tests can be considered as a significant improvement over existing methods, their clinical sensitivity does not exceed 99%. Especially when the proportion of cffDNA in the maternal bloodstream is below 4%, even with next-generation sequencing (NGS) technology, which has high sensitivity, achieving sufficient accuracy for non-invasive prenatal testing (NIPT) is challenging.
Краткое описание изобретенияBrief description of the invention
Согласно настоящему изобретению, предложен способ двойного обогащения фрагментов внеклеточной ДНК (вкДНК, cfDNA), происходящих из плаценты, в смешанном биологическом образце, содержащем внеклеточную фетальную и материнскую ДНК, с применением биохимических и in silico подходов, которые увеличивают отношение сигнал/шум за счет применения длинных зондов захвата, анализа размера фрагментов, применения горячих точек неслучайной фрагментации (HSNRF) и новой концепции в биоинформатике. Указанный способ обеспечивает высокочувствительное неинвазивное обнаружение аномалий у плода за счет применения информации, полученной в результате обогащения фрагментов внеклеточной фетальной ДНК в пренатальном образце с применением длинных ДНК-зондов, которые захватывают фрагменты внеклеточной ДНК и/или обогащают в отношении HSNRF.According to the present invention, a method is provided for double enrichment of cell-free DNA (cfDNA) fragments originating from the placenta in a mixed biological sample containing cell-free fetal and cell-free maternal DNA using biochemical and in silico approaches that increase the signal-to-noise ratio by using long capture probes, fragment size analysis, hot spots of non-random fragmentation (HSNRF) and a new concept in bioinformatics. The method provides highly sensitive non-invasive detection of fetal abnormalities by using information obtained from enrichment of cell-free fetal DNA fragments in a prenatal sample using long DNA probes that capture cell-free DNA fragments and/or enrich for HSNRF.
В настоящем изобретении также предложен новый основанный на применении компьютера способ, который упорядочивает наблюдаемые данные (прочтения секвенирования) в значимые структуры, которые улучшают отношение сигнал/шум при анализе образцов внеклеточной ДНК, содержащих смесь фрагментов вкДНК. В способе согласно настоящему изобретению множество последовательностей ДНК группируют таким образом, что степень гомологии между указанными последовательностями ДНК является максимальной, если они действительно происходят из одной и той же структуры, и минимальной в противном случае. Конкретные паттерны последовательностей идентифицируют в указанных данных и применяют для их распределения в заданные представляющие интерес области. Указанный способ можно применять для обнаружения конкретных структур в данных о последовательности ДНК без необходимости получения каких-либо предварительных знаний, таких как выравнивание на эталонном геноме человека и/или калибровочные значения с применением эталонных образцов, и указанный способ применяют в настоящей заявке для неинвазивного пренатального обнаружения хромосомных аномалий у плода, таких как анеуплоидии, микроделеции, микродупликации и точечные мутации.The present invention also provides a novel computer-based method that organizes observed data (sequencing reads) into meaningful patterns that improve the signal-to-noise ratio when analyzing cell-free DNA samples containing a mixture of cfDNA fragments. In the method of the present invention, a plurality of DNA sequences are grouped in such a way that the degree of homology between said DNA sequences is maximized if they actually originate from the same structure, and minimized otherwise. Specific sequence patterns are identified in said data and used to distribute them into predetermined regions of interest. Said method can be used to detect specific patterns in DNA sequence data without the need for any prior knowledge, such as alignment to a human reference genome and/or calibration values using reference samples, and said method is used herein for non-invasive prenatal detection of chromosomal abnormalities in the fetus, such as aneuploidies, microdeletions, microduplications, and point mutations.
Таким образом, в первом аспекте настоящее изобретение относится к способу обнаружения генетических/геномных аномалий у плода в смешанном образце, содержащем материнскую и фетальную вкДНК, причем указанный способ включает следующие этапы:Thus, in a first aspect, the present invention relates to a method for detecting genetic/genomic abnormalities in a fetus in a mixed sample containing maternal and fetal cfDNA, said method comprising the following steps:
(i) получение смеси вкДНК от индивидуума;(i) obtaining a mixture of cfDNA from an individual;
(ii) приготовление библиотеки секвенирования из вкДНК;(ii) preparation of a sequencing library from cfDNA;
(iii) обогащение библиотеки вкДНК с применением длинных ДНК-зондов;(iii) enrichment of the cfDNA library using long DNA probes;
(iv) секвенирование обогащенной библиотеки вкДНК;(iv) sequencing of the enriched cfDNA library;
(v) осуществление статистического анализа для определения риска хромосомных и/или других генетических аномалий в фетальной ДНК;(v) performing statistical analysis to determine the risk of chromosomal and/or other genetic abnormalities in fetal DNA;
при этом риск хромосомной и/или другой генетической аномалии в фетальной ДНК классифицируют на основе способа двойного обогащения, включающего геномную гибридизацию и основанный на применении компьютера способ, который увеличивает отношение сигнал/шум в указанном анализе.wherein the risk of chromosomal and/or other genetic abnormality in fetal DNA is classified based on a double enrichment method comprising genomic hybridization and a computer-based method that increases the signal-to-noise ratio in said assay.
Способ, в котором обогащенные фрагменты подвергают процедуре, включает этапы:The method in which the enriched fragments are subjected to the procedure includes the steps of:
(i) группирование секвенированных прочтений, которые могут быть спарены на основе нуклеотидных паттернов, то есть но не ограничиваясь указанным, степени перекрывания с точки зрения нуклеотидного состава;(i) grouping sequenced reads that can be paired based on nucleotide patterns, i.e., but not limited to, the degree of overlap in terms of nucleotide composition;
(ii) группирование и/или аннотация по меньшей мере подмножества множества секвенированных прочтений на основе нуклеотидных паттернов, то есть но не ограничиваясь указанным, сходства последовательности по меньшей мере 20 наиболее удаленных от середины последовательности нуклеотидов;(ii) grouping and/or annotating at least a subset of the plurality of sequenced reads based on nucleotide patterns, i.e., but not limited to, sequence similarity of at least the 20 outermost nucleotides of the sequence;
(iii) сопоставление заданных нуклеотидных последовательностей с прочтениями согласно (i) и (ii);(iii) matching the given nucleotide sequences with the reads according to (i) and (ii);
(iv) удаление повторяющихся секвенированных прочтений;(iv) removal of duplicate sequenced reads;
(v) применение информации, полученной на этапах (i)-(iv), для осуществления статистического анализа по определению риска хромосомной и/или другой генетической аномалии в фетальной ДНК.(v) using the information obtained in steps (i) to (iv) to perform a statistical analysis to determine the risk of chromosomal and/or other genetic abnormalities in the fetal DNA.
В другом аспекте согласно настоящему изобретению предложен набор для осуществления указанного изобретения. В одном варианте реализации набор содержит:In another aspect, the present invention provides a kit for implementing the invention. In one embodiment, the kit comprises:
a) зонды, которые гибридизуются по меньшей мере с одним участком во фрагментах нуклеиновойa) probes that hybridize to at least one site in nucleic acid fragments
- 1 047854 кислоты, при этом по меньшей мере один указанный участок частично или полностью охватывает фрагмент нуклеиновой кислоты, где находится горячая точка неслучайной фрагментации (HSNRF), и, необязательно,- 1 047 854 acids, wherein at least one of the said regions partially or completely covers a nucleic acid fragment where a hot spot of non-random fragmentation (HSNRF) is located, and, optionally,
b) реагенты и/или программное обеспечение для осуществления изобретения и обнаружения генетических и/или геномных аномалий в образце.b) reagents and/or software for implementing the invention and detecting genetic and/or genomic abnormalities in a sample.
Краткое описание фигурBrief description of the figures
На фиг. 1 показан эксперимент проверки концепции, в котором 92 образца с диплоидным набором хромосом и четыре образца с трисомией по 21-й хромосоме были классифицированы с применением указанного способа.Figure 1 shows a proof-of-concept experiment in which 92 diploid samples and four trisomy 21 samples were classified using this method.
На фиг. 2 показан эксперимент проверки концепции, в котором 91 нормальный образец и два случая синдрома делеции хромосомы 22q11.2 были классифицированы в отношении микроделеции (синдром делеции хромосомы 22q11.2) с применением указанного способа.Figure 2 shows a proof-of-concept experiment in which 91 normal samples and two cases of chromosome 22q11.2 deletion syndrome were classified for microdeletion (chromosome 22q11.2 deletion syndrome) using this method.
На фиг. 3 показана ядерная оценка плотности распределения размеров фрагментов из репрезентативной выборки с применением (А) всех фрагментов и (В) только фрагментов, выбранных указанным способом.Fig. 3 shows a kernel density function of the fragment sizes from a representative sample using (A) all fragments and (B) only fragments selected in this manner.
Подробное описание изобретенияDetailed description of the invention
Согласно первому аспекту настоящего изобретения в настоящей заявке раскрыт способ обнаружения хромосомной аномалии в смешанном образце, включающий этапы:According to a first aspect of the present invention, the present application discloses a method for detecting a chromosomal abnormality in a mixed sample, comprising the steps of:
(a) получение биологического образца, который содержит смесь фрагментов внеклеточной ДНК (вкДНК), (b) приготовление библиотеки секвенирования из фрагментов вкДНК, (c) гибридизация одного или более зондов по меньшей мере с одним или более фрагментами вкДНК, (d) выделение из библиотеки фрагментов вкДНК, которые связываются с зондами, (e) секвенирование фрагментов вкДНК из библиотеки, которые связываются с зондами, (f) применение информации о размере, начале и/или конце каждого или подмножества обогащенных фрагментов вкДНК согласно этапам (с-е) для выбора фракции фрагментов вкДНК, гибридизованных с указанными одним или более зондами.(a) obtaining a biological sample that contains a mixture of cell-free DNA (cfDNA) fragments, (b) preparing a sequencing library from the cfDNA fragments, (c) hybridizing one or more probes to at least one or more cfDNA fragments, (d) isolating from the library cfDNA fragments that bind to the probes, (e) sequencing the cfDNA fragments from the library that bind to the probes, (f) using information about the size, start and/or end of each or a subset of enriched cfDNA fragments according to steps (c-e) to select a fraction of cfDNA fragments hybridized to the one or more probes.
при этом этап (f) связан с вычислением нескольких статистических тестов.where step (f) involves calculating several statistical tests.
Таким образом, настоящее изобретение относится к способу обнаружения генетических/геномных аномалий у плода в смешанном образце, содержащем материнскую и фетальную вкДНК, причем способ включает следующие этапы:Thus, the present invention relates to a method for detecting genetic/genomic abnormalities in a fetus in a mixed sample containing maternal and fetal cfDNA, the method comprising the following steps:
(i) получение смеси вкДНК от индивидуума; (ii) приготовление библиотеки секвенирования из вкДНК; (iii) обогащение библиотеки вкДНК с применением длинных ДНК-зондов; (iv) секвенирование обогащенной библиотеки вкДНК;(i) obtaining a mixture of cfDNA from an individual; (ii) preparing a sequencing library from the cfDNA; (iii) enriching the cfDNA library using long DNA probes; (iv) sequencing the enriched cfDNA library;
(v) осуществление статистического анализа для определения риска хромосомной и/или другой генетической аномалии в фетальной ДНК.(v) performing statistical analysis to determine the risk of chromosomal and/or other genetic abnormalities in fetal DNA.
В настоящей заявке HSNRF определяют как геномную область, содержащую на расстоянии менее 300 пар оснований (п.о.) (предпочтительно менее 200 п.о., более предпочтительно менее 100 п.о.) предпочтительные сайты, различающие два типа тканей, присутствующих в смеси вкДНК, и где указанные предпочтительные сайты присутствуют в областях HSNRF с большей частотой, чем в других областях, не относящихся к HSNRF. В настоящей заявке предпочтительные сайты называют геномными основаниями, в которых частота нахождения конечной точки прочтения достоверно различается (р-значение по меньшей мере менее 0.05) между двумя типами тканей, присутствующими в смеси вкДНК.In the present application, HSNRF is defined as a genomic region containing, within a distance of less than 300 base pairs (bp) (preferably less than 200 bp, more preferably less than 100 bp), preferential sites that differentiate two tissue types present in a cfDNA mixture, and wherein said preferential sites are present in HSNRF regions with a higher frequency than in other non-HSNRF regions. In the present application, preferential sites are referred to as genomic bases in which the frequency of the read endpoint is significantly different (p-value of at least less than 0.05) between the two tissue types present in the cfDNA mixture.
В настоящей заявке смесь фрагментов нуклеиновой кислоты выделяют предпочтительно из образца, взятого из эукариотического организма, предпочтительно примата, более предпочтительно человека.In the present application, the mixture of nucleic acid fragments is preferably isolated from a sample taken from a eukaryotic organism, preferably a primate, more preferably a human.
В контексте настоящего изобретения выражения фрагменты нуклеиновой кислоты и фрагментированные нуклеиновые кислоты можно применять как взаимозаменяемые.In the context of the present invention, the expressions nucleic acid fragments and fragmented nucleic acids can be used interchangeably.
В одном варианте реализации зонды представляют собой длинные молекулы ДНК и:In one embodiment, the probes are long DNA molecules and:
(i) длина каждого зонда составляет от 100 до 500 пар оснований, (ii) каждый денатурированный зонд имеет 5'-конец и 3'-конец, (iii) предпочтительно каждый зонд связывается с HSNRF на расстоянии не менее 10 пар оснований как на 5'-конце, так и на 3'-конце, от областей, несущих вариации числа копий (CNV), сегментные дупликации или повторяющиеся последовательности ДНК, и (iv) GC-состав (гуанин-цитозиновый) в каждом зонде составляет от 19 до 80%.(i) the length of each probe is from 100 to 500 base pairs, (ii) each denatured probe has a 5' end and a 3' end, (iii) preferably each probe binds to HSNRF at a distance of at least 10 base pairs at both the 5' end and the 3' end from regions bearing copy number variations (CNVs), segmental duplications or repetitive DNA sequences, and (iv) the GC content (guanine-cytosine) in each probe is from 19 to 80%.
Применяемый в настоящей заявке термин длинные ДНК-зонды относится к зондам с размером в диапазоне от 100 до 500 п.о.As used in this application, the term long DNA probes refers to probes with a size in the range of 100 to 500 bp.
В одном варианте реализации зонды имеют размер в диапазоне от 150 до 250 п.о. В другом варианте реализации зонды имеют размер в диапазоне от 160 до 180 п.о.In one embodiment, the probes have a size in the range of 150 to 250 bp. In another embodiment, the probes have a size in the range of 160 to 180 bp.
В одном варианте реализации способа согласно настоящему изобретению, длинные ДНК-зонды охватывают HSNRF.In one embodiment of the method according to the present invention, long DNA probes span HSNRF.
В другом варианте реализации способа согласно настоящему изобретению, обогащенная библиоте- 2 047854 ка вкДНК включает HSNRF.In another embodiment of the method according to the present invention, the enriched cfDNA library comprises HSNRF.
В предпочтительном варианте реализации способа согласно изобретению, фрагменты нуклеиновой кислоты представляют собой циркулирующую вкДНК или РНК.In a preferred embodiment of the method according to the invention, the nucleic acid fragments are circulating cfDNA or RNA.
В одном варианте реализации образец представляет собой образец материнской плазмы, содержащий внеклеточную материнскую ДНК и внеклеточную фетальную ДНК (cffDNA).In one embodiment, the sample is a maternal plasma sample containing cell-free maternal DNA and cell-free fetal DNA (cffDNA).
Настоящее изобретение также можно применять с множеством биологических образцов. По существу любой биологический образец, содержащий генетический материал, например РНК или ДНК и, в частности, вкДНК, можно применять в качестве образца в настоящем изобретении. В одном варианте реализации источником образца ДНК является образец плазмы, содержащий вкДНК. В частности, для пренатального тестирования образец ДНК содержит фетальную ДНК (например, cffDNA). В одном варианте реализации для НИПТ образец представляет собой смешанный образец, который содержит как материнскую ДНК, так и фетальную ДНК (например, cffDNA), как, например, образец материнской плазмы, полученный из материнской периферической крови. Обычно для смешанных образцов материнской/фетальной ДНК образец представляет собой образец плазмы матери, хотя можно применять другие источники ткани, содержащие как материнскую ДНК, так и фетальную ДНК. Применяемый в настоящей заявке термин смешанный образец относится к смеси, по меньшей мере, двух биологических образцов, происходящих из разных источников, например, образцов материнской/фетальной ДНК.The present invention can also be used with a variety of biological samples. Essentially any biological sample containing genetic material, such as RNA or DNA, and in particular cfDNA, can be used as a sample in the present invention. In one embodiment, the source of the DNA sample is a plasma sample containing cfDNA. In particular, for prenatal testing, the DNA sample contains fetal DNA (e.g., cffDNA). In one embodiment, for NIPT, the sample is a mixed sample that contains both maternal DNA and fetal DNA (e.g., cffDNA), such as a maternal plasma sample obtained from maternal peripheral blood. Typically, for mixed maternal/fetal DNA samples, the sample is a maternal plasma sample, although other tissue sources containing both maternal DNA and fetal DNA can be used. As used herein, the term mixed sample refers to a mixture of at least two biological samples originating from different sources, such as maternal/fetal DNA samples.
В зависимости от условий биологический образец включает эмбриональную ДНК и материнскую ДНК, происходящую из опухоли ДНК и не происходящую из опухоли ДНК, ДНК патогена или ДНК хозяина и ДНК, происходящую из трансплантированного органа, и ДНК, происходящую от хозяина.Depending on the conditions, the biological sample includes fetal DNA and maternal DNA, tumor-derived DNA and non-tumor-derived DNA, pathogen DNA or host DNA, and DNA originating from a transplanted organ and DNA originating from the host.
Таким образом, в контексте неинвазивной диагностики образец представляет собой смешанный образец, где указанный смешанный образец выбран из группы, содержащей (i) эмбриональную ДНК и материнскую ДНК, (ii) происходящую из опухоли ДНК и происходящую из опухоли ДНК, (iii) ДНК патогена и ДНК хозяина и (iv) ДНК, происходящую из трансплантированного органа, и ДНК, происходящую от хозяина.Thus, in the context of non-invasive diagnostics, the sample is a mixed sample, wherein said mixed sample is selected from the group comprising (i) fetal DNA and maternal DNA, (ii) tumor-derived DNA and tumor-derived DNA, (iii) pathogen DNA and host DNA, and (iv) DNA originating from a transplanted organ and DNA originating from the host.
Материнскую плазму можно получить из образца периферической цельной крови беременного субъекта, и плазму можно получить стандартными способами. Всего 1-4 мл плазмы достаточно для обеспечения подходящего материала ДНК для анализа в соответствии со способом, описанным в настоящем изобретении. Затем тотальную вкДНК можно экстрагировать из образца с применением стандартных методик, неограничивающие примеры которых включают протокол QIAsymphony (QIAGEN), подходящий для выделения cffDNA, или любой другой ручной или автоматический способ экстракции, подходящий для выделения внеклеточной ДНК.Maternal plasma can be obtained from a peripheral whole blood sample of a pregnant subject, and the plasma can be obtained using standard methods. A total of 1-4 ml of plasma is sufficient to provide suitable DNA material for analysis according to the method described in the present invention. Total cfDNA can then be extracted from the sample using standard techniques, non-limiting examples of which include the QIAsymphony protocol (QIAGEN) suitable for the isolation of cffDNA, or any other manual or automated extraction method suitable for the isolation of cell-free DNA.
В контексте настоящего изобретения термин субъект относится к животным, предпочтительно млекопитающим и, более предпочтительно, человеку. Упомянутый в настоящей заявке субъект является беременным субъектом и, следовательно, предпочтительно субъектом женского пола. Беременный субъект может находиться на любом сроке беременности. Субъект может забеременеть естественным путем или с помощью искусственных способов. Применяемый в настоящей заявке термин субъект также относится к субъекту, страдающему опухолью или у которого есть подозрение на наличие опухоли. Вышеуказанный субъект может быть подвергнут трансплантации органа или быть инфицированным патогеном после трансплантации или независимо от трансплантата.In the context of the present invention, the term subject refers to animals, preferably mammals and more preferably humans. The subject referred to in the present application is a pregnant subject and therefore preferably a female subject. A pregnant subject may be at any stage of pregnancy. The subject may become pregnant naturally or by artificial means. The term subject as used in the present application also refers to a subject suffering from a tumor or suspected of having a tumor. The above-mentioned subject may have undergone an organ transplant or be infected with a pathogen after transplantation or independently of the transplant.
Для подготовки биологических образцов, как правило, ДНК экстрагируют стандартными способами, известными в данной области техники, неограничивающим примером которых является протокол QIAsymphony (QIAGEN).To prepare biological samples, DNA is typically extracted using standard methods known in the art, a non-limiting example of which is the QIAsymphony protocol (QIAGEN).
После выделения вкДНК образца применяют для конструирования библиотеки секвенирования, чтобы сделать образец совместимым с технологией последующего секвенирования, такой как секвенирование следующего поколения (NGS). Обычно это включает лигирование адаптеров на концах фрагментов вкДНК с последующей амплификацией. Наборы для приготовления библиотек для секвенирования коммерчески доступны или могут быть разработаны.Once cfDNA has been isolated, the sample is used to construct a sequencing library to make the sample compatible with subsequent sequencing technology such as next-generation sequencing (NGS). This typically involves ligating adapters to the ends of cfDNA fragments followed by amplification. Sequencing library preparation kits are commercially available or can be developed.
Предпочтительно в способе согласно настоящему изобретению первый и второй фрагменты нуклеиновой кислоты выбраны из групп, содержащих:Preferably, in the method according to the present invention, the first and second nucleic acid fragments are selected from the groups comprising:
i) эмбриональную ДНК и материнскую ДНК, ii) происходящую из опухоли ДНК и не происходящую из опухоли ДНК, iii) ДНК патогена и ДНК хозяина, iv) ДНК, происходящую из трансплантированного органа, и ДНК, происходящую от хозяина.i) fetal DNA and maternal DNA, ii) tumor-derived DNA and non-tumor-derived DNA, iii) pathogen DNA and host DNA, iv) transplanted organ-derived DNA and host-derived DNA.
В контексте настоящего изобретения термины плод и эмбрион применяют взаимозаменяемо.In the context of the present invention, the terms fetus and embryo are used interchangeably.
В одном варианте реализации способа выбор фракции фрагментов вкДНК, гибридизующихся с одним или более зондами, охватывающими области HSNRF, включает следующие этапы:In one embodiment of the method, selecting a fraction of cfDNA fragments hybridizing to one or more probes spanning the HSNRF regions comprises the following steps:
(i) отнесение фрагментов вкДНК к первому и второму кластерному распределению, (ii) обнаружение горячих точек неслучайной фрагментации (HSNRF) с применением фрагментов вкДНК первого кластерного распределения, (iii) отнесение фрагментов вкДНК из второго кластерного распределения к третьему кластеру, (iv) объединение фрагментов вкДНК первого кластерного распределения с фрагментами вкДНК(i) assignment of cfDNA fragments to the first and second cluster distributions, (ii) detection of hot spots of non-random fragmentation (HSNRF) using cfDNA fragments of the first cluster distribution, (iii) assignment of cfDNA fragments from the second cluster distribution to the third cluster, (iv) merging cfDNA fragments of the first cluster distribution with cfDNA fragments
- 3 047854 третьего кластерного распределения.- 3 047854 third cluster distribution.
Применяемый в данной заявке термин кластерное распределение относится к подмножеству (группе) фрагментов вкДНК, обладающих определенными свойствами, такими как, но не ограничиваясь указанным, длина фрагмента или последовательность фрагмента. В контексте настоящего изобретения кластерное распределение основано на размере и последовательности фрагментов, приписанной каждой группе.As used in this application, the term cluster distribution refers to a subset (group) of cfDNA fragments having certain properties, such as, but not limited to, fragment length or fragment sequence. In the context of the present invention, cluster distribution is based on the size and sequence of fragments assigned to each group.
В одном варианте реализации первое кластерное распределение содержит фрагменты вкДНК, имеющие длину, меньшую или равную 120 п.о., или 125 п.о., или 130 п.о., или 135 п.о., или 140 п.о., или 145 п.о., или 150 п.о., или 155 п.о., и второе кластерное распределение содержит фрагменты вкДНК, имеющие длину более 120 п.о., или 125 п.о., или 130 п.о., или 135 п.о., или 140 п.о., или 145 п.о., или 150 п.о., или 155 п.о., соответственно.In one embodiment, the first cluster distribution comprises cfDNA fragments having a length less than or equal to 120 bp, or 125 bp, or 130 bp, or 135 bp, or 140 bp, or 145 bp, or 150 bp, or 155 bp, and the second cluster distribution comprises cfDNA fragments having a length greater than 120 bp, or 125 bp, or 130 bp, or 135 bp, or 140 bp, or 145 bp, or 150 bp, or 155 bp, respectively.
В другом варианте реализации третий кластер включает выбор фрагментов вкДНК из второго кластера, концы которых перекрываются с HSNRF, обнаруженной на этапе (ii), описанном выше.In another embodiment, the third cluster comprises selecting fragments of cfDNA from the second cluster whose ends overlap with the HSNRF detected in step (ii) above.
В одном варианте реализации предпочтительно зонды охватывают горячую точку сайта неслучайной фрагментации (HSNRF), так что только 5'-конец фрагментированной нуклеиновой кислоты захватывается зондом.In one embodiment, preferably the probes span a hot spot of a non-random fragmentation site (HSNRF) such that only the 5' end of the fragmented nucleic acid is captured by the probe.
В другом варианте реализации зонды охватывают сайт HSNRF, так что только 3'-конец внеклеточных нуклеиновых кислот, происходящих из HSNRF, может связываться с зондом.In another embodiment, the probes span the HSNRF site such that only the 3' end of extracellular nucleic acids derived from HSNRF can bind to the probe.
В другом предпочтительном варианте реализации зонды охватывают оба сайта HSNRF, связанные с фрагментированной нуклеиновой кислотой, так что зонд захватывает как 5'-, так и 3'-конец внеклеточной нуклеиновой кислоты, связанной с данным сайтом HSNRF.In another preferred embodiment, the probes span both HSNRF sites associated with the fragmented nucleic acid, such that the probe captures both the 5' and 3' ends of the extracellular nucleic acid associated with a given HSNRF site.
В другом варианте реализации применяют комбинации вышеперечисленного.In another embodiment, combinations of the above are used.
В идеальном случае, в способе согласно настоящему изобретению, зонды, которые применяют для обогащения вкДНК, представляют собой двухцепочечные фрагменты ДНК, и (i) длина каждого зонда составляет 100-500 пар оснований, (ii) каждый зонд имеет 5'-конец и 3'-конец, (iii) предпочтительно каждый зонд связывается с HSNRF на расстоянии не менее 10 пар оснований, как на 5'-конце, так и на 3'конце, от областей, несущих вариации числа копий (CNV), сегментные дупликации или повторяющиеся последовательности ДНК, и (iv) GC-состав в каждом зонде составляет от 19 до 80%.Ideally, in the method of the present invention, the probes used to enrich cfDNA are double-stranded DNA fragments and (i) the length of each probe is 100-500 base pairs, (ii) each probe has a 5' end and a 3' end, (iii) preferably each probe binds to HSNRF at a distance of at least 10 base pairs, at both the 5' end and the 3' end, from regions bearing copy number variations (CNVs), segmental duplications or repetitive DNA sequences, and (iv) the GC content in each probe is from 19 to 80%.
В целом, этап гибридизации, предпочтительно с зондами, как описано выше, может быть проведен до создания библиотеки секвенирования или после создания библиотеки.In general, the hybridization step, preferably with probes as described above, can be performed before the sequencing library is generated or after the library is generated.
Представляющая(е) интерес область(и) на представляющей(их) интерес хромосоме(ах), где находится HSNRF, обогащает(ют)ся путем гибридизации пула зондов с библиотекой секвенирования с последующим выделением тех последовательностей из библиотеки секвенирования, которые связываются с зондами. В одном варианте реализации зонд охватывает сайт HSNRF, так что только 5'-конец фрагментированных внеклеточных нуклеиновых кислот захватывается зондом. В другом варианте реализации зонд охватывает сайт HSNRF, так что только 3'-конец фрагментированных внеклеточных нуклеиновых кислот, происходящих из HSNRF, может связываться с зондом. В другом предпочтительном варианте реализации зонд охватывает оба сайта HSNRF, связанных с фрагментированной нуклеиновой кислотой, так что зонд захватывает как 5'-, так и 3'-конец внеклеточной нуклеиновой кислоты, связанной с данным сайтом HSNRF.The region(s) of interest on the chromosome(s) of interest where the HSNRF is located is/are enriched by hybridizing a pool of probes to a sequencing library and then isolating those sequences from the sequencing library that bind to the probes. In one embodiment, the probe spans an HSNRF site such that only the 5' end of the fragmented extracellular nucleic acids is captured by the probe. In another embodiment, the probe spans an HSNRF site such that only the 3' end of the fragmented extracellular nucleic acids derived from the HSNRF can bind to the probe. In another preferred embodiment, the probe spans both HSNRF sites associated with the fragmented nucleic acid such that the probe captures both the 5' and 3' ends of the extracellular nucleic acid bound to the HSNRF site.
Чтобы облегчить выделение желаемых обогащенных последовательностей (HSNRF), обычно последовательности зондов модифицируют таким образом, чтобы последовательности, которые гибридизуются с зондами, можно было отделить от последовательностей, которые не гибридизуются с зондами. Обычно это достигается путем фиксации зондов на подложке. Это позволяет физически отделить те последовательности, которые связывают зонды, от тех последовательностей, которые не связывают зонды. В одном варианте реализации каждая последовательность в пуле зондов может быть помечена биотином, и затем этот пул может быть связан с гранулами, покрытыми биотин-связывающим веществом, таким как стрептавидин или авидин. В предпочтительном варианте реализации зонды метят биотином и связывают с магнитными гранулами, покрытыми стрептавидином, что позволяет разделить их за счет применения магнитных свойств гранул. Однако среднему специалисту в данной области будет понятно, что в данной области существуют другие системы аффинного связывания, которые можно применять вместо системы биотин-стрептавидин/авидин. Например, можно применять систему на основе антител, в которой зонды метят антигеном, и затем они связываются с гранулами, покрытыми антителами. Более того, зонды могут включать на одном конце маркер последовательности и могут быть связаны с подложкой через комплементарную последовательность, которая гибридизуется с таким маркером последовательности. Кроме того, в дополнение к магнитным гранулам, могут применяться другие типы подложек, такие как полимерные гранулы и тому подобное.In order to facilitate the isolation of the desired enriched sequences (HSNRF), the probe sequences are typically modified such that the sequences that hybridize to the probes can be separated from the sequences that do not hybridize to the probes. This is typically accomplished by fixing the probes to a support. This allows for the physical separation of those sequences that bind the probes from those sequences that do not bind the probes. In one embodiment, each sequence in a pool of probes can be labeled with biotin, and the pool can then be bound to beads coated with a biotin-binding agent, such as streptavidin or avidin. In a preferred embodiment, the probes are labeled with biotin and bound to magnetic beads coated with streptavidin, allowing them to be separated by exploiting the magnetic properties of the beads. However, one of ordinary skill in the art will appreciate that other affinity binding systems exist in the art that can be used instead of the biotin-streptavidin/avidin system. For example, an antibody-based system can be used in which the probes are labeled with an antigen and then bind to the antibody-coated beads. Moreover, the probes can include a sequence marker at one end and can be bound to the support via a complementary sequence that hybridizes with such a sequence marker. Furthermore, in addition to magnetic beads, other types of supports can be used, such as polymer beads and the like.
В некоторых вариантах реализации элементы библиотеки секвенирования, которые связываются с пулом зондов, полностью комплементарны зондам. В других вариантах реализации элементы библиотеки секвенирования, которые связываются с пулом зондов, частично комплементарны зондам. Например, при определенных обстоятельствах желательно применять и анализировать данные, полученные из фрагментов ДНК, которые являются продуктами процесса обогащения, но не обязательно принадлежатIn some embodiments, the sequencing library members that bind to the probe pool are fully complementary to the probes. In other embodiments, the sequencing library members that bind to the probe pool are partially complementary to the probes. For example, in certain circumstances, it is desirable to use and analyze data obtained from DNA fragments that are products of an enrichment process, but do not necessarily belong to
- 4 047854 интересующим областям генома (например, такие фрагменты ДНК могут связываться с зондами благодаря частичной гомологии (частичная комплементарность), и при секвенировании будут давать очень низкое покрытие по всему геному в координатах, отличных от зондов).- 4 047854 regions of interest in the genome (for example, such DNA fragments may bind to probes due to partial homology (partial complementarity), and when sequenced will give very low coverage across the genome at coordinates other than the probes).
После обогащения представляющей(их) интерес последовательности (последовательностей) с применением зондов и формирования таким образом библиотеки ДНК, обогащенной сайтами HSNRF, элементы обогащенной библиотеки HSNRF элюируют с твердой подложки, амплифицируют и секвенируют с применением стандартных способов, известных в данной области техники.After enrichment of the sequence(s) of interest using probes, thereby generating a DNA library enriched in HSNRF sites, members of the enriched HSNRF library are eluted from the solid support, amplified, and sequenced using standard methods known in the art.
Обычно применяют секвенирование следующего поколения (NGS), хотя также можно применять другие технологии секвенирования, которые обеспечивают очень точные вычисления в дополнение к информации о последовательности. Соответственно, другие способы точных вычислений, такие как цифровая полимеразная цепная реакция (ПЦР), секвенирование отдельных молекул, нанопоровое секвенирование и микрочипы также можно применять вместо NGS.Next-generation sequencing (NGS) is typically used, although other sequencing technologies that provide very precise calculations in addition to sequence information can also be used. Accordingly, other methods of precise calculations such as digital polymerase chain reaction (PCR), single-molecule sequencing, nanopore sequencing, and microarrays can also be used instead of NGS.
В одном варианте реализации способа обогащенный образец секвенируют с применением способа секвенирования спаренных концов, предпочтительно способа секвенирования 2x75 п.о., чтобы обеспечить сбор данных о начальных/конечных положениях секвенированного фрагмента как с 5'-, так и с 3'конца, а также для получения достаточной информации о секвенировании фрагмента, чтобы обеспечить de novo выравнивание/самовыравнивание.In one embodiment of the method, the enriched sample is sequenced using a paired-end sequencing method, preferably a 2x75 bp sequencing method, to ensure that data on the start/end positions of the sequenced fragment is collected from both the 5' and 3' end, and to obtain sufficient sequencing information on the fragment to ensure de novo alignment/self-alignment.
В другом варианте реализации секвенированные фрагменты группируют по размеру на основе степени перекрывания или отсутствия перекрывания их спаренных концов.In another embodiment, the sequenced fragments are grouped by size based on the degree of overlap or lack of overlap of their paired ends.
Изобретение относится к способу, в котором фрагмент нуклеиновой кислоты, который должен быть обнаружен, присутствует в смеси в концентрации ниже, чем фрагмент нуклеиновой кислоты из того же генетического локуса, но другого происхождения. Это означает, что, если выбран конкретный локус, например, материнская копия будет присутствовать 100 раз, а копия от плода только один раз, в растворе содержащем выделенную вкДНК. В случае вкДНК, происходящей из плода, компонент смешанного образца, происходящий из плода, может иметь диапазон возможных значений. Например, диапазон фетального материала в смешанном образце может быть от 2 до 30%. Часто фрагменты, происходящие от плода, составляют приблизительно 10% от общей ДНК смешанного образца. Что еще более важно, в некоторых композициях смешанных образцов компонент фетальной ДНК в образце может составлять менее 5%. В частности, в некоторых композициях образцов материал, происходящий из плода, составляет 3% или менее от всего образца.The invention relates to a method in which the nucleic acid fragment to be detected is present in the mixture at a concentration lower than the nucleic acid fragment from the same genetic locus but of a different origin. This means that if a specific locus is selected, for example, the maternal copy will be present 100 times and the fetal copy only once, in a solution containing the isolated cfDNA. In the case of cfDNA originating from the fetus, the component of the mixed sample originating from the fetus may have a range of possible values. For example, the range of fetal material in the mixed sample may be from 2 to 30%. Often, fetal fragments make up approximately 10% of the total DNA of the mixed sample. More importantly, in some compositions of mixed samples, the fetal DNA component of the sample may be less than 5%. In particular, in some compositions of samples, the material originating from the fetus makes up 3% or less of the total sample.
Настоящий способ особенно подходит для анализа таких низких концентраций целевой вкДНК. В способе, согласно настоящему изобретению, фрагмент нуклеиновой кислоты, который подложит обнаружению или происхождение которого должно быть определено, и фрагмент нуклеиновой кислоты из того же генетического локуса, но другого происхождения, присутствуют в смеси в соотношении, выбранном из группы: 1:2, 1:4, 1:10, 1:20, 1:50, 1:100, 1:200, 1:500, 1:1000, 1:2000 и 1:5000. Соотношения следует понимать как приблизительные отношения, что подразумевает отклонения плюс/минус 30%, 20% или 10%. Специалист в данной области техники знает, что такие отношения не будут иметь точных числовых значений, указанных выше. Эти отношения являются отношением количества молекул, специфичных для локуса, для редкого типа к количеству молекул локуса для распространенного типа.The present method is particularly suitable for the analysis of such low concentrations of target cfDNA. In the method according to the present invention, the nucleic acid fragment which is to be detected or the origin of which is to be determined and the nucleic acid fragment from the same genetic locus but of a different origin are present in a mixture in a ratio selected from the group: 1:2, 1:4, 1:10, 1:20, 1:50, 1:100, 1:200, 1:500, 1:1000, 1:2000 and 1:5000. The ratios are to be understood as approximate ratios, which implies deviations of plus/minus 30%, 20% or 10%. A person skilled in the art knows that such ratios will not have the exact numerical values specified above. These ratios are the ratio of the number of locus-specific molecules for a rare type to the number of locus molecules for a common type.
В одном варианте реализации зонды обеспечивают в форме, которая позволяет им связываться с подложкой, такой как биотинилированные зонды. В другом варианте реализации зонды обеспечивают вместе с подложкой, такие как биотинилированные зонды, которые обеспечивают совместно с магнитными гранулами, покрытыми стрептавидином.In one embodiment, the probes are provided in a form that allows them to bind to a support, such as biotinylated probes. In another embodiment, the probes are provided together with a support, such as biotinylated probes that are provided together with magnetic beads coated with streptavidin.
В отдельном варианте реализации GC-состав этих или других зондов составляет от 10 до 70%, предпочтительно от 15 до 60%, более предпочтительно от 20 до 50%.In a particular embodiment, the GC content of these or other probes is from 10 to 70%, preferably from 15 to 60%, more preferably from 20 to 50%.
В описанном способе результат может быть объединен с дополнительными статистическими тестами из группы, включающей t-критерий Стьюдента, двумерный непараметрический бутстреп-тест, стратифицированный пермутационный тест и тест на пропорции размеров фрагментов.In the described method, the result can be combined with additional statistical tests from a group including Student's t-test, two-dimensional nonparametric bootstrap test, stratified permutation test and fragment size proportion test.
В одном варианте реализации способ дополнительно включает этап объединения статистических тестов, выбранных из группы, включающей, но не ограничивающейся указанным, t-критерий Стьюдента, двумерный непараметрический бутстреп-тест, стратифицированный пермутационный тест, ANOVA, любые тесты на пропорции и/или регрессионную модель.In one embodiment, the method further comprises the step of combining statistical tests selected from the group including, but not limited to, a Student's t-test, a bivariate nonparametric bootstrap test, a stratified permutation test, ANOVA, any tests of proportions, and/or a regression model.
В контексте настоящего изобретения термин частично относится к области (участку) из 10, 20, 30 или 40 оснований фрагмента нуклеиновой кислоты от 5'-конца или от 3'-конца. Следовательно, применяемый в данной заявке термин полностью относится к области (участку), которая охватывает 100% фрагмента нуклеиновой кислоты. Согласно способу настоящего изобретения зонды гибридизуются по меньшей мере с одним участком внутри фрагмента нуклеиновой кислоты. Однако зонды также могут быть нацелены на более чем один участок в одном и том же фрагменте нуклеиновой кислоты.In the context of the present invention, the term partially refers to a region (section) of 10, 20, 30 or 40 bases of a nucleic acid fragment from the 5'-end or from the 3'-end. Therefore, the term used in this application refers entirely to a region (section) that covers 100% of the nucleic acid fragment. According to the method of the present invention, the probes hybridize to at least one site within the nucleic acid fragment. However, the probes can also target more than one site in the same nucleic acid fragment.
В одном аспекте данной заявки раскрыты зонды для применения в способе согласно настоящему изобретению.In one aspect of this application, probes for use in the method of the present invention are disclosed.
В другом аспекте данной заявки раскрыт способ для применения при диагностики и/или скрининге генетической аномалии в образце.In another aspect of this application, a method is disclosed for use in diagnosing and/or screening a genetic abnormality in a sample.
- 5 047854- 5 047854
В одном варианте реализации генетическая аномалия выбрана из группы, включающей, но не ограничивающейся указанным:In one embodiment, the genetic abnormality is selected from the group including, but not limited to:
(a) анеуплоидии хромосом 13, 18, 21 и/или X, Y;(a) aneuploidies of chromosomes 13, 18, 21 and/or X, Y;
(b) структурные аномалии, включая, но не ограничиваясь указанным, изменения числа копий, в том числе микроделеции и микродупликации, вставки, делеции, транслокации и мутации небольшого размера, в том числе точечные мутации.(b) structural abnormalities, including, but not limited to, copy number changes, including microdeletions and microduplications, insertions, deletions, translocations, and small mutations, including point mutations.
В одном варианте реализации способ применяют для обнаружения эпигенетических аномалий, включая, но не ограничиваясь указанным, модификации ДНК и гистонов. Применяемый в данной заявке термин эпигенетические аномалии относится к изменениям экспрессии гена с изменением или без изменения последовательности ДНК. Соответственно, этот термин включает анеуплоидии, микроделеции, микродупликации и точечные мутации, а также изменения эпигенетических модификаций, таких как метилирование нуклеотидов в ДНК, или модификаций гистонов, таких как ацетилирование или деацетилирование гистонов, метилирование, убиквитилирование, фосфорилирование, сумоилирование и т.д.In one embodiment, the method is used to detect epigenetic abnormalities, including but not limited to DNA and histone modifications. As used herein, the term epigenetic abnormalities refers to changes in gene expression with or without a change in DNA sequence. Accordingly, this term includes aneuploidies, microdeletions, microduplications, and point mutations, as well as changes in epigenetic modifications such as nucleotide methylation in DNA, or histone modifications such as histone acetylation or deacetylation, methylation, ubiquitination, phosphorylation, sumoylation, etc.
В соответствии с другим аспектом настоящего изобретения в данной заявке раскрыт способ двойного обогащения фрагментов, происходящих из плаценты, в смеси внеклеточной ДНК (вкДНК), включающий следующие этапы:According to another aspect of the present invention, this application discloses a method for double enrichment of placenta-derived fragments in a cell-free DNA (cfDNA) mixture, comprising the following steps:
(a) получение биологического образца, который содержит смесь фрагментов внеклеточной ДНК (вкДНК), (b) приготовление библиотеки секвенирования из фрагментов вкДНК, (c) гибридизацию библиотеки вкДНК с множеством зондов, причем указанные зонды предпочтительно охватывают по меньшей мере одну HSNRF, (d) выделение фрагментов вкДНК из библиотеки, которые связываются с зондами, (e) секвенирование фрагментов вкДНК из библиотеки, которые связываются с зондами, (f) удаление повторяющихся секвенированных прочтений, (g) отбор коротких фрагментов вкДНК, (h) обнаружение HSNRF в коротких фрагментах вкДНК, (i) отбор длинных фрагментов вкДНК, концы которых перекрываются с HSNRF, (j) сопоставление выбранных фрагментов вкДНК из (g) и (i) с последовательностями зонда.(a) obtaining a biological sample that contains a mixture of cell-free DNA (cfDNA) fragments, (b) preparing a sequencing library from the cfDNA fragments, (c) hybridizing the cfDNA library to a plurality of probes, wherein said probes preferably span at least one HSNRF, (d) isolating cfDNA fragments from the library that bind to the probes, (e) sequencing the cfDNA fragments from the library that bind to the probes, (f) removing duplicate sequenced reads, (g) selecting short cfDNA fragments, (h) detecting HSNRF in the short cfDNA fragments, (i) selecting long cfDNA fragments whose ends overlap with the HSNRF, (j) matching the selected cfDNA fragments from (g) and (i) to probe sequences.
В одном варианте реализации короткие фрагменты вкДНК имеют длину меньше или равную 120 п.о., или 125 п.о., или 130 п.о., или 135 п.о., или 140 п.о., или 145 п.о., или 150 п.о., или 155 п.о., и длинные фрагменты вкДНК имеют длину выше, чем 120 п.о., или 125 п.о., или 130 п.о., или 135 п.о., или 140 п.о. или 145 п.о., или 150 п.о., или 155 п.о., соответственно.In one embodiment, the short cfDNA fragments have a length less than or equal to 120 bp, or 125 bp, or 130 bp, or 135 bp, or 140 bp, or 145 bp, or 150 bp, or 155 bp, and the long cfDNA fragments have a length greater than 120 bp, or 125 bp, or 130 bp, or 135 bp, or 140 bp, or 145 bp, or 150 bp, or 155 bp, respectively.
В другом варианте реализации фрагменты вкДНК с этапа (j) применяют для обнаружения анеуплоидии у плода в неинвазивном пренатальном диагностическом тесте.In another embodiment, the cfDNA fragments from step (j) are used to detect aneuploidy in a fetus in a non-invasive prenatal diagnostic test.
В другом варианте реализации фрагменты вкДНК с этапа (j) применяют для обнаружения микроделеции/микродупликации у плода в неинвазивном пренатальном диагностическом тесте.In another embodiment, the cfDNA fragments from step (j) are used to detect a microdeletion/microduplication in a fetus in a non-invasive prenatal diagnostic test.
В другом варианте реализации фрагменты вкДНК с этапа (j) применяют для обнаружения у плода вставок, делеций, транслокаций и мутаций небольшого размера, включая точечные мутации.In another embodiment, the cfDNA fragments from step (j) are used to detect insertions, deletions, translocations, and small mutations, including point mutations, in the fetus.
В другом аспекте настоящее изобретение обеспечивает набор для осуществления способов согласно настоящему изобретению, содержащий:In another aspect, the present invention provides a kit for performing the methods of the present invention, comprising:
a) зонды, которые гибридизуются по меньшей мере с одним участком во фрагменте нуклеиновой кислоты, причем указанный по меньшей мере один участок частично или полностью охватывает фрагмент нуклеиновой кислоты и, необязательно,a) probes that hybridize to at least one region in a nucleic acid fragment, wherein said at least one region partially or completely encompasses the nucleic acid fragment and, optionally,
b) реагенты и/или программное обеспечение для осуществления способа определения и/или обнаружения.b) reagents and/or software for implementing the determination and/or detection method.
В другом аспекте, в настоящей заявке раскрыт набор для осуществления неинвазивного теста для применения в способе согласно настоящему изобретению, при этом набор включает:In another aspect, the present application discloses a kit for performing a non-invasive test for use in the method of the present invention, wherein the kit comprises:
a) зонды, которые гибридизуются по меньшей мере с одним участком во фрагментах нуклеиновой кислоты, причем указанный по меньшей мере один участок предпочтительно охватывает по меньшей мере одну HSNRF, и, необязательно,a) probes that hybridize to at least one region in nucleic acid fragments, said at least one region preferably encompassing at least one HSNRF, and, optionally,
b) реагенты и/или программное обеспечение для осуществления способа, описанного в аспектах и вариантах реализации настоящего изобретения.b) reagents and/or software for performing the method described in aspects and embodiments of the present invention.
В одном варианте реализации набор содержит контейнер, состоящий из пула зондов, программного обеспечения и инструкций для осуществления способа.In one embodiment, the kit comprises a container consisting of a pool of probes, software, and instructions for performing the method.
В дополнение к пулу зондов набор может содержать (i) один или более компонентов для выделения вкДНК из биологического образца, (ii) один или более компонентов для приготовления и обогащения библиотеки секвенирования (например, праймеры, адаптеры, буферы, линкеры, модифицирующие ДНК ферменты, ферменты лигирования, зонды, полимеразные ферменты и т.п.), (iii) один или более компонентов для амплификации и/или секвенирования обогащенной библиотеки, и/или (iv) программное обеспечение для осуществления статистического анализа.In addition to the probe pool, the kit may contain (i) one or more components for isolating cfDNA from a biological sample, (ii) one or more components for preparing and enriching a sequencing library (e.g., primers, adapters, buffers, linkers, DNA modifying enzymes, ligation enzymes, probes, polymerase enzymes, etc.), (iii) one or more components for amplifying and/or sequencing the enriched library, and/or (iv) software for performing statistical analysis.
Соответственно, в другом варианте реализации настоящего изобретения предпочтительно, чтобы фрагмент, который необходимо обнаружить или определить, имел меньший размер, чем второй фраг- 6 047854 мент. В зависимости от ткани происхождения ожидают разные размеры фрагментов в участках расположения HSNRF. Поскольку клетки каждой ткани дифференцированы для выполнения определенных функций, то ожидают, что для каждого типа ткани будут наблюдать разные паттерны генетической активности. Поскольку активация гена зависит от третичной структуры ДНК, разные ткани будут иметь несколько разные конформации, что приводит к разным сайтам расщепления и, следовательно, разным размерам фрагментов. Например, было продемонстрировано, что внеклеточная ДНК плацентарного происхождения, вероятно, будет иметь меньший размер по сравнению с внеклеточной ДНК материнского происхождения.Accordingly, in another embodiment of the present invention, it is preferred that the fragment to be detected or determined has a smaller size than the second fragment. Depending on the tissue of origin, different fragment sizes are expected at the HSNRF locations. Since the cells of each tissue are differentiated to perform specific functions, different patterns of genetic activity are expected for each tissue type. Since gene activation depends on the tertiary structure of DNA, different tissues will have slightly different conformations, which leads to different cleavage sites and, therefore, different fragment sizes. For example, it has been demonstrated that cell-free DNA of placental origin is likely to be smaller in size compared to cell-free DNA of maternal origin.
ПримерыExamples
Следующие далее примеры иллюстрируют настоящее изобретение, их не следует рассматривать как дополнительное ограничение.The following examples illustrate the present invention and should not be construed as further limiting.
Пример 1. Сбор образцов и приготовление библиотеки.Example 1. Sample collection and library preparation.
Объяснена общая методология двойного обогащения фрагментов ДНК, происходящих из плаценты, в смешанном биологическом образце, содержащем внеклеточную фетальную и материнскую ДНК, для целей неинвазивной пренатальной диагностики. В этом примере описаны способы сбора и обработки образца материнской плазмы (содержащей материнскую и фетальную ДНК). Тот же подход можно применять в других клинически применимых случаях, таких как, но не ограничиваясь указанным, онкология, генетическая мутация, трансплантация и оценка патогенной нагрузки. В другом аспекте тот же подход можно применять для обнаружения эпигенетических модификаций.A general methodology for double enrichment of placenta-derived DNA fragments in a mixed biological sample containing cell-free fetal and maternal DNA is explained for non-invasive prenatal diagnostics. In this example, methods for collecting and processing a maternal plasma sample (containing maternal and fetal DNA) are described. The same approach can be applied to other clinically applicable cases such as, but not limited to, oncology, genetic mutation, transplantation, and pathogen load assessment. In another aspect, the same approach can be applied to detect epigenetic modifications.
Сбор образцов.Collection of samples.
Образцы плазмы были получены анонимно у беременных женщин после 10-й недели беременности. Протоколы, применяемые для сбора образцов, были одобрены соответствующим комитетом по биоэтике, и от всех участников было получено информированное согласие.Plasma samples were obtained anonymously from pregnant women after the 10th week of pregnancy. The protocols used for sample collection were approved by the relevant bioethics committee and informed consent was obtained from all participants.
Экстракция образца.Sample extraction.
Внеклеточную ДНК экстрагировали из плазмы каждого индивидуума с применением ручного или автоматического способа экстракции, подходящего для выделения внеклеточной ДНК, такого как, но не ограничиваясь указанным, протокол QIAsymphony, подходящего для выделения внеклеточной ДНК (QIAGEN).Cell-free DNA was extracted from the plasma of each individual using a manual or automated extraction method suitable for the isolation of cell-free DNA, such as, but not limited to, the QIAsymphony protocol suitable for the isolation of cell-free DNA (QIAGEN).
Приготовление библиотеки секвенирования.Preparation of sequencing library.
Выделенную внеклеточную ДНК из образцов материнской плазмы применяли для построения библиотеки секвенирования. Первоначально 5'- и 3'-липкие концы были восстановлены, в то время как 5'концы были фосфорилированы. Продукты реакции очищали с применением гранул AMPure XP (Beckman Coulter). Затем к обоим концам ДНК лигировали адаптеры для секвенирования с последующей очисткой с применением гранул AMPure XP (Beckman Coulter). Одноцепочечные разрывы удаляли в реакционной смеси с полимеразой и затем очищали с применением гранул AMPure XP (Beckman Coulter). Амплификацию библиотеки проводили с применением другого фермента полимеразы (Koumbaris et al. (2016) Clinical Chemistry 62 (6): 848-855). Конечные продукты библиотеки очищали с применением гранул AMPure XP (Beckman Coulter) и измеряли спектрофотометрически.Isolated cell-free DNA from maternal plasma samples was used to construct a sequencing library. Initially, the 5' and 3' overhangs were repaired while the 5' ends were phosphorylated. The reaction products were purified using AMPure XP beads (Beckman Coulter). Sequencing adapters were then ligated to both ends of the DNA followed by purification using AMPure XP beads (Beckman Coulter). Single-strand breaks were removed in the polymerase reaction mixture and then purified using AMPure XP beads (Beckman Coulter). The library was amplified using a different polymerase enzyme (Koumbaris et al. (2016) Clinical Chemistry 62 (6): 848-855). The final library products were purified using AMPure XP beads (Beckman Coulter) and measured spectrophotometrically.
Пример 2. Конструирование и приготовление зонда.Example 2. Design and preparation of the probe.
В этом примере описано приготовление специальных зондов для обнаружения HSNRF. Геномные целевые локусы, применяемые для конструирования зондов, были выбраны на основе их GC-состава и расстояния от них до повторяющихся элементов (минимум 50 п.о.). Размер зондов может варьировать. В одном варианте реализации способа зонды имеют размер от 100 до 500 п.о. и их генерируют с помощью основанного на ПЦР подхода. Зонды получали с помощью симплексной ГЩР с применением стандартной полимеразы Taq, праймеров, предназначенных для амплификации локусов-мишеней, и нормальной ДНК, применяемой в качестве матрицы. В предпочтительном варианте реализации зонд охватывает сайт HSNRF, таким образом, что только 5'-конец фрагментированной нуклеиновой кислоты захватывается зондом. В другом варианте реализации зонд охватывает сайт HSNRF, так что только 3'-конец внеклеточных нуклеиновых кислот, происходящих из HSNRF, может связываться с зондом. В другом предпочтительном варианте реализации зонд охватывает оба сайта HSNRF, связанные с фрагментированной нуклеиновой кислотой, так что зонд захватывает как 5'-, так и 3'-конец внеклеточной нуклеиновой кислоты, связанной с данным сайтом HSNRF.This example describes the preparation of specific probes for the detection of HSNRF. The genomic target loci used to construct the probes were selected based on their GC content and their distance from repeat elements (minimum 50 bp). The probes can vary in size. In one embodiment of the method, the probes are between 100 and 500 bp in size and are generated using a PCR-based approach. The probes were prepared by simplex PCR using standard Taq polymerase, primers designed to amplify the target loci, and normal DNA as a template. In a preferred embodiment, the probe spans the HSNRF site such that only the 5' end of the fragmented nucleic acid is captured by the probe. In another embodiment, the probe spans the HSNRF site such that only the 3' end of extracellular nucleic acids derived from HSNRF can bind to the probe. In another preferred embodiment, the probe spans both HSNRF sites associated with the fragmented nucleic acid, such that the probe captures both the 5' and 3' ends of the extracellular nucleic acid associated with a given HSNRF site.
Пример 3. Г ибридизация и амплификация зонда.Example 3. Hybridization and probe amplification.
В этом примере описан способ целевого захвата нуклеиновых кислот путем гибридизации с применением зондов, причем данные зонды предпочтительно охватывают HSNRF, с последующим количественным определением захваченных последовательностей с помощью секвенирования следующего поколения (NGS).This example describes a method for targeted capture of nucleic acids by hybridization using probes, wherein the probes preferably span HSNRF, followed by quantification of the captured sequences using next generation sequencing (NGS).
Биотинилирование зонда.Biotinylation of the probe.
Зонды были подготовлены для гибридизации, начиная с тупого конца, с последующей очисткой. Затем их лигировали с помощью адаптера биотина и очищали. Зонды денатурировали перед иммобилизацией на магнитных гранулах, покрытых стрептавидином.Probes were prepared for blunt-end hybridization followed by purification. They were then ligated with a biotin adapter and purified. Probes were denatured before immobilization on streptavidin-coated magnetic beads.
- 7 047854- 7 047854
Гибридизация зондов.Hybridization of probes.
Амплифицированные библиотеки смешивали с блокирующими олигонуклеотидами, ДНК Cot-1, ДНК спермы лосося, гибридизационным буфером, блокирующим агентом и денатурировали. За денатурацией следовала 30-минутная инкубация при 37°C. Затем полученную смесь добавляли к биотинилированным зондам и инкубировали в течение 12-48 ч при 60-70°C. После инкубации обогащенные библиотеки промывали, как описано ранее, и элюировали ДНК путем нагревания. Элюированные продукты амплифицировали с применением адаптерных праймеров с внешней связью. Обогащенные амплифицированные продукты объединяли эквимолярно и секвенировали на подходящей платформе.The amplified libraries were mixed with blocking oligonucleotides, Cot-1 DNA, salmon sperm DNA, hybridization buffer, blocking agent and denatured. Denaturation was followed by 30 min incubation at 37°C. The resulting mixture was then added to the biotinylated probes and incubated for 12-48 h at 60-70°C. After incubation, the enriched libraries were washed as described previously and the DNA was eluted by heating. The eluted products were amplified using externally linked adapter primers. The enriched amplified products were pooled equimolarly and sequenced on an appropriate platform.
Пример 4. Биоинформационный анализ.Example 4. Bioinformatics analysis.
Авторы настоящего изобретения разработали основанный на применении компьютера способ, который организовывает наблюдаемые данные (прочтения секвенирования) в структуры, которые позволяют выбирать подмножества секвенированных прочтений из обогащенного образца, чтобы увеличить отношение сигнал/шум в образце, содержащем смесь фрагментов внеклеточной ДНК (вкДНК). Способ согласно настоящему изобретению способ группирует и/или аннотирует множество последовательностей ДНК таким образом, чтобы степень гомологии между этими последовательностями ДНК была максимальной, если они действительно происходят из одной и той же группы, и минимальной в противном случае. Затем в указанных данных идентифицируют конкретные паттерны последовательностей и их применяют для их распределения в заданные представляющие интерес области. В настоящем изобретении способ применяют для неинвазивного обнаружения хромосомных аномалий у плода, таких как анеуплоидии, микроделеции и микродупликации в образце, содержащем смесь внеклеточной фетальной ДНК (cffDNA) и материнской ДНК.The inventors of the present invention have developed a computer-based method that organizes observed data (sequencing reads) into structures that allow subsets of sequenced reads to be selected from an enriched sample in order to increase the signal-to-noise ratio in a sample containing a mixture of cell-free DNA (cfDNA) fragments. The method according to the present invention groups and/or annotates a plurality of DNA sequences in such a way that the degree of homology between these DNA sequences is maximized if they actually originate from the same group and minimized otherwise. Specific sequence patterns are then identified in said data and used to assign them to specified regions of interest. In the present invention, the method is used for non-invasive detection of chromosomal abnormalities in a fetus, such as aneuploidies, microdeletions and microduplications in a sample containing a mixture of cell-free fetal DNA (cffDNA) and maternal DNA.
В предпочтительном варианте реализации файлы FASTQ каждого образца не выравнивают против версии эталонного генома человека. Информацию о размере и/или классе фрагмента получают с применением длины отдельных прочтений (если она больше 150 п.о.) или информации о перекрывающихся последовательностях прочтений на спаренных концах.In a preferred embodiment, the FASTQ files of each sample are not aligned against a version of the human reference genome. Information about the fragment size and/or class is obtained using the length of individual reads (if greater than 150 bp) or information about the overlapping sequences of paired-end reads.
Идентичные прочтения удаляют, и осуществляют либо сборку de novo, либо сопоставление с заранее определенными мишенями коротких последовательностей.Identical reads are removed and either de novo assembly or alignment to pre-defined short sequence targets is performed.
Средний специалист в данной области техники оценит наличие многих легкодоступных и хорошо зарекомендовавших себя инструментов для осуществления сопоставления последовательностей.The average person skilled in the art will appreciate the many readily available and well-established tools for performing sequence matching.
Алгоритм представляет собой набор процедур обработки данных, математических и статистических моделей, организованных в виде серии шагов. Шаг алгоритма направлен на определение относительного числа копий представляющей интерес хромосомы и/или представляющей интерес субхромосомной области в обогащенном образце и его применяют для обнаружения полных или частичных хромосомных аномалий, таких как анеуплоидии хромосом 13, 18, 21, X, Y или любой другой хромосомы, а также синдромов микроделеции/микродупликации и других мутаций небольшого размера.The algorithm is a set of data processing procedures, mathematical and statistical models, organized as a series of steps. A step of the algorithm is aimed at determining the relative copy number of the chromosome of interest and/or the subchromosomal region of interest in the enriched sample and is used to detect complete or partial chromosomal abnormalities, such as aneuploidies of chromosomes 13, 18, 21, X, Y or any other chromosome, as well as microdeletion/microduplication syndromes and other small mutations.
Ключевой характеристикой способа является двойное обогащение образца по фетальной (плацентарной) фракции путем выбора подмножества обогащенных фрагментов, что приводит к увеличению отношения сигнал/шум (фетальная фракция к материнской фракции, например, пропорция фрагментов плацентарного происхождения). С этой целью разработанный способ идентифицирует и применяет фрагменты, с высокой вероятностью происходящие из плаценты. На фиг. 3 показано предполагаемое распределение по размерам фрагментов, выбранных заявленным способом, по сравнению с распределением по размерам всех фрагментов показательного образца, что демонстрирует обогащение более коротких фрагментов, которые в основном происходят из фетальных (плацентарных) тканей.The key feature of the method is the double enrichment of the sample for the fetal (placental) fraction by selecting a subset of enriched fragments, which leads to an increase in the signal-to-noise ratio (fetal fraction to maternal fraction, e.g., the proportion of fragments of placental origin). To this end, the developed method identifies and applies fragments that are highly likely to originate from the placenta. Fig. 3 shows the predicted size distribution of fragments selected by the claimed method compared to the size distribution of all fragments of the representative sample, demonstrating the enrichment of shorter fragments that are mainly derived from fetal (placental) tissues.
В одном варианте реализации способа обогащенный образец секвенируют с применением способа секвенирования 2x75 п.о. В указанном варианте реализации секвенированные фрагменты сгруппированы по размеру на основе степени перекрывания или отсутствия перекрывания прочтений их спаренных концов. Каждый фрагмент классифицируют, соответственно, на две группы: короткие (Группа 1) и длинные (Группа 2). Затем HSNRF идентифицируют, применяя сходство последовательностей, по крайней мере, 20 наиболее удаленных от середины последовательности нуклеотидов фрагментов в Группе 1. Фрагменты из Группы 2, концы которых перекрываются с идентифицированными HSNRF, затем применяют для создания Группы 3. Затем все фрагменты из Группы 1, и все фрагменты из Группы 3 оставляют для последующего анализа. Указанные фрагменты вкДНК Группы 1 меньше по размеру и обогащены внеклеточной фетальной ДНК. Указанные фрагменты вкДНК Группы 3 больше по размеру, но также обогащены внеклеточной фетальной ДНК, поскольку их концы перекрываются с HSNRF. Фрагменты вкДНК Группы 2, концы которых не перекрываются с HSNRF, имеют более высокую вероятность происхождения от матери и исключаются из всех последующих анализов. На фиг. 3 показано распределение по размеру выбранных заявленным способом фрагментов (Группа 1 и Группа 3) по сравнению с распределением по размеру всех фрагментов в типичном образце, что показывает обогащение фетальными (плацентарными) фрагментами вкДНК.In one embodiment of the method, the enriched sample is sequenced using a 2x75 bp sequencing method. In this embodiment, the sequenced fragments are grouped by size based on the degree of overlap or lack of overlap of their paired-end reads. Each fragment is classified into two groups, respectively: short (Group 1) and long (Group 2). HSNRFs are then identified using the sequence similarity of at least the 20 most distal nucleotides of the fragments in Group 1. Fragments from Group 2 whose ends overlap with the identified HSNRFs are then used to create Group 3. All of the fragments from Group 1 and all of the fragments from Group 3 are then retained for subsequent analysis. These Group 1 cfDNA fragments are smaller in size and enriched in cell-free fetal DNA. The reported Group 3 cfDNA fragments are larger in size but are also enriched in cell-free fetal DNA because their ends overlap with HSNRF. Group 2 cfDNA fragments whose ends do not overlap with HSNRF have a higher probability of maternal origin and are excluded from all subsequent analyses. Figure 3 shows the size distribution of the fragments selected by the claimed method (Group 1 and Group 3) compared to the size distribution of all fragments in a typical sample, demonstrating enrichment in fetal (placental) cfDNA fragments.
После сопоставления всех фрагментов из Группы 1 и Группы 3 с последовательностями зонда для каждого тестируемого образца вычисляют классификационную оценку путем сравнения количества оставшихся фрагментов на целевой хромосоме, например, хромосоме 21 (фиг. 1) и/или целевой субхромо-After matching all fragments from Group 1 and Group 3 to the probe sequences for each test sample, a classification score is calculated by comparing the number of remaining fragments on the target chromosome, e.g. chromosome 21 (Fig. 1) and/or the target subchromo-
Claims (6)
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP19156991.2 | 2019-02-13 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| EA047854B1 true EA047854B1 (en) | 2024-09-20 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20250361556A1 (en) | Varietal counting of nucleic acids for obtaining genomic copy number information | |
| JP7379418B2 (en) | Deep sequencing profiling of tumors | |
| JP5986572B2 (en) | Direct capture, amplification, and sequencing of target DNA using immobilized primers | |
| CN110536967A (en) | Reagents and methods for analyzing associated nucleic acids | |
| JP2024035109A (en) | Methods for accurate parallel detection and quantification of nucleic acids | |
| EP3649258A1 (en) | Target-enriched multiplexed parallel analysis for assessment of fetal dna samples | |
| EP4215619A1 (en) | Methods for sensitive and accurate parallel quantification of nucleic acids | |
| JP2024529674A (en) | Methods for simultaneous mutation detection and methylation analysis | |
| AU2020220365B2 (en) | Methods for noninvasive prenatal testing of fetal abnormalities | |
| EA047854B1 (en) | METHODS OF NON-INVASIVE PRENATAL TESTING OF FETAL ANOMALIES | |
| US20220127601A1 (en) | Method of determining the origin of nucleic acids in a mixed sample | |
| JP7762690B2 (en) | A highly sensitive method for accurate parallel quantification of mutant nucleic acids | |
| TW202526036A (en) | Highly sensitive methods for accurate parallel quantification of nucleic acids | |
| EA049972B1 (en) | METHOD FOR DETERMINING THE ORIGIN OF NUCLEIC ACIDS IN A MIXED SAMPLE |