CN116234917A - Dna分子组合物及其制备方法和使用方法 - Google Patents
Dna分子组合物及其制备方法和使用方法 Download PDFInfo
- Publication number
- CN116234917A CN116234917A CN202180066199.6A CN202180066199A CN116234917A CN 116234917 A CN116234917 A CN 116234917A CN 202180066199 A CN202180066199 A CN 202180066199A CN 116234917 A CN116234917 A CN 116234917A
- Authority
- CN
- China
- Prior art keywords
- dna molecule
- stranded dna
- inverted repeat
- double stranded
- repeat sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/713—Double-stranded nucleic acids or oligonucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/88—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microencapsulation, e.g. using amphiphile liposome vesicle
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/533—Physical structure partially self-complementary or closed having a mismatch or nick in at least one of the strands
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14121—Viruses as such, e.g. new isolates, mutants or their genomic sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14171—Demonstrated in vivo effect
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2820/00—Vectors comprising a special origin of replication system
- C12N2820/60—Vectors comprising a special origin of replication system from viruses
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本文提供了包含反向重复序列、表达盒和切口核酸内切酶的一个或多个限制性位点的双链DNA分子、其使用方法及其制备方法。
Description
相关申请
本发明申请主张2020年7月27日提交的美国序列号No.63/057,179专利申请和2021年1月20日提交的美国序列号No.63/139,486专利申请的优先权,以上每篇专利以其全部内容作为参考并入本文。
对电子提交的序列表的引用
本发明申请作为参考并入了与本发明申请一同提交的序列表,该序列表是标题为“14497-005-228_Seqlisting.txt”的文本文件,创建于2021年7月26日,大小为134千字节。
1.技术领域
本文提供了包含反向重复序列、表达盒和切口核酸内切酶的一个或多个限制性位点的双链DNA分子及其使用方法和制备方法。
2.背景技术
基因疗法旨在将基因引入靶细胞以治疗或预防疾病。通过提供具有活性基因产物(有时称为转基因)的转录盒,基因疗法的应用可以改善临床结局,因为基因产物可以导致积极功能影响的增加、消极功能影响的丧失或者另一种结局,如在患有癌症的患者中,可以具有溶瘤作用。可以经由多种方法实施患者靶细胞中修正基因的递送和表达,包括非病毒递送(例如,脂质体)或者包括使用工程化病毒和病毒基因递送载体的病毒递送方法。在可获得的病毒来源的载体,也称为病毒颗粒(例如,重组反转录病毒、重组慢病毒、重组腺病毒等)中,AAV系统作为基因疗法中的通用载体而流行。
然而,使用病毒颗粒作为基因递送载体存在一些主要缺陷。一个主要缺点在于对病毒生命周期和将转录盒包装成病毒颗粒的病毒蛋白质的依赖。因此,就转基因尺寸(例如,对于AAV,小于150,000Da的蛋白编码容量)或者存在特定病毒序列以确保有效复制和包装(例如,Rep-结合元件)的要求而言,病毒载体的使用具有限制,其反过来可以使表达盒不稳定。因此,可能需要不止一种病毒颗粒来递送大的转基因(例如,大于150,000Da的转基因编码蛋白,或者比约4.7Kb长的转基因)。两种或更多种AAV构建体的使用会提高AAV基因组重新激活的风险。此外,病毒Rep-结合元件或非结构蛋白1结合元件的使用可能会提高患者中载体移动的风险。
第二个缺点在于用于基因疗法的病毒颗粒通常来源于野生型病毒,所述群体亚组已在其寿命期间暴露于所述病毒。发现这些患者携带了中和抗体,其反过来可以阻碍基因疗法效力,如Snyder,Richard O.,and Philippe Moullier.Adeno-associated virus:methods and protocols.Totowa,NJ:Humana Press,2011中进一步描述的。对于剩余血清反应阴性患者,病毒载体的衣壳通常是免疫原性的,从而防止初始剂量不足或疗法减弱时病毒载体疗法向患者的再次施用。
照此,对于用于替代病毒颗粒的基于非病毒、无衣壳AAV的基因疗法的需要仍未满足,特别是需要递送大的转基因的疗法。此外,需要利用无衣壳AAV载体提高细胞核内的稳定性,从而与环形质粒DNA相比允许延长的表达。另外,由于这些病毒蛋白质或者编码它们的病毒DNA序列可以污染无衣壳病毒载体的分离的DNA,因此在不共存编码病毒复制机器的质粒或DNA序列(例如,AAV Rep基因)的情况下,对于在宿主细胞中产生这些无衣壳载体的方法的需要仍未满足。此外,对于具有改善的生产和/或表达性质的重组DNA载体的重要需求仍未满足。对于不引起抗-病毒(例如,病毒衣壳、toll样受体激活等)免疫应答,允许反复施用而无效力损失(例如,由于中和抗体)或者无转基因表达细胞损失的DNA-基载体的需要也仍未满足。
发明内容
在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列或其片段的顶部链5'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列或其片段的顶部链3'悬突;
在该方面的某些实施方案中,
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
其中所述第一切口和所述第四切口是顶部链上的两个产生的切口,其中所述第一切口是更接近于顶部链的5'端的切口,所述第四切口是更接近于顶部链的3'端的切口,并且其中所述第二切口和所述第三切口是底部链上的两个产生的切口,其中所述第三切口是更接近于底部链的5'端的切口,所述第二切口是更接近于底部链的3'端的切口。
在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列的底部链3'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列的底部链5'悬突;
在该方面的某些实施方案中,
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
其中所述第一切口和所述第四切口是顶部链上的两个产生的切口,其中所述第一切口是更接近于顶部链的5'端的切口,所述第四切口是更接近于顶部链的3'端的切口,并且其中所述第二切口和所述第三切口是底部链上的两个产生的切口,其中所述第三切口是更接近于底部链的5'端的切口,所述第二切口是更接近于底部链的3'端的切口。
在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列的顶部链5'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列的底部链5'悬突;
在该方面的某些实施方案中,
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
其中所述第一切口和所述第四切口是顶部链上的两个产生的切口,其中所述第一切口是更接近于顶部链的5'端的切口,所述第四切口是更接近于顶部链的3'端的切口,并且其中所述第二切口和所述第三切口是底部链上的两个产生的切口,其中所述第三切口是更接近于底部链的5'端的切口,所述第二切口是更接近于底部链的3'端的切口。
在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列的底部链3'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列的顶部链3'悬突。
在该方面的某些实施方案中,
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
其中所述第一切口和所述第四切口是顶部链上的两个产生的切口,其中所述第一切口是更接近于顶部链的5'端的切口,所述第四切口是更接近于顶部链的3'端的切口,并且其中所述第二切口和所述第三切口是底部链上的两个产生的切口,其中所述第三切口是更接近于底部链的5'端的切口,所述第二切口是更接近于底部链的3'端的切口。
在某些实施方案中,所述第一切口、所述第二切口、所述第三切口和/或所述第四切口位于所述反向重复序列内。在某些实施方案中,所述第一切口、所述第二切口、所述第三切口和/或所述第四切口位于所述反向重复序列外。
在某些实施方案中,所述双链DNA分子是分离的DNA分子。
在某些实施方案中,所述切口核酸内切酶的第一、第二、第三和第四限制性位点均为相同切口核酸内切酶的限制性位点。
在某些实施方案中,所述第一和所述第二反向重复序列是相同的。在某些实施方案中,所述第一和/或所述第二反向重复序列是细小病毒的ITR。在某些实施方案中,所述第一和/或所述第二反向重复序列是细小病毒的修饰的ITR。在具体的实施方案中,所述细小病毒是依赖细小病毒、博卡细小病毒、红系细小病毒、原细小病毒或者四细小病毒。在具体的实施方案中,所述修饰的ITR的核苷酸序列与细小病毒的ITR至少50%、60%、70%、80%、90%、95%、98%或至少99%相同。
在某些实施方案中,所述双链DNA分子是质粒。
在具体的实施方案中,所述质粒还包含细菌复制起点。
在具体的实施方案中,所述质粒还包含位于所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的限制性内切酶位点,其中所述第一反向重复序列、第二反向重复序列和所述第一和第二反向重复序列之间的区域中的任一个中均不存在所述限制性内切酶位点。在具体的实施方案中,用所述限制性内切酶切割导致产生了在有利于所述第一和/或第二反向重复序列的退火条件下在可检测水平不退火的单链悬突。在具体的实施方案中,所述质粒还包含编码限制性内切酶的开放阅读框。在具体的实施方案中,所述限制性内切酶的表达受诱导型启动子控制。
在一个方面,本文提供了制备具有发夹结构末端的DNA的方法,其中所述方法包括:
a.在导致所述双链DNA分子扩增的条件下培养包含前一段中所描述的双链DNA分子的宿主细胞;
b.从所述宿主细胞释放所述双链DNA分子;
c.将所述双链DNA分子与识别4个限制性位点的一种或多种切口核酸内切酶培育,从而导致产生4个切口;
d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;
e.将所述单链DNA悬突分子内退火并借此在步骤77.d所产生的DNA片段的两端产生发夹反向重复序列;
f.将步骤77.d所产生的双链DNA分子或片段与所述限制性内切酶培育并借此切割所述双链DNA分子或所述双链DNA分子的片段;和
g.将所述双链DNA分子的片段与核酸外切酶培育,借此消化除步骤77.e所产生的片段之外的双链DNA分子片段。
在具体的实施方案中,所述质粒还包含位于所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的切口核酸内切酶的第五和第六限制性位点,其中所述切口核酸内切酶的第五和第六限制性位点:a.位于相对链;和b.在所述双链DNA分子中产生断裂,从而所述断裂的单链悬突在有利于所述第一和/或第二反向重复序列退火的条件下在可检测水平分子间或分子内不退火。在具体的实施方案中,所述第五和第六切口相隔1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在具体的实施方案中,所述切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点均为相同切口核酸内切酶的靶标序列。在具体的实施方案中,所述质粒还包含识别切口核酸内切酶的第一、第二、第三、第四、第五和/或第六限制性位点的编码切口核酸内切酶的开放阅读框。在具体的实施方案中,所述切口核酸内切酶的表达受诱导型启动子控制。在某些实施方案中,识别切口核酸内切酶的第五和第六限制性位点的切口核酸内切酶为:Nt.BsmAI;Nt.BtsCI;N.ALwl;N.BstNBI;N.BspD6I;Nb.Mva1269I;Nb.BsrDI;Nt.BtsI;Nt.BsaI;Nt.Bpu10I;Nt.BsmBI;Nb.BbvCI;Nt.BbvCI;或Nt.BspQI。
在一个方面,本文提供了制备具有发夹结构末端的DNA的方法,其中所述方法包括:
a.在导致所述双链DNA分子扩增的条件下培养包含前一段中所描述的双链DNA分子的宿主细胞;
b.从所述宿主细胞释放所述双链DNA分子;
c.将所述双链DNA分子与识别第一、第二、第三和第四限制性位点的一种或多种切口核酸内切酶培育,从而导致产生4个切口;
d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;
e.将所述单链DNA悬突分子内退火并借此在步骤78.d所产生的DNA片段的两端产生发夹反向重复序列;
f.将所述双链DNA分子或步骤78.d所产生的片段与识别第五和第六限制性位点的一种或多种切口核酸内切酶培育,从而导致在所述双链DNA分子中产生断裂;和
g.将所述双链DNA分子的片段与核酸外切酶培育,借此消化除步骤78.e所产生的片段之外的双链DNA分子片段。
在某些实施方案中,所述切口核酸内切酶位点中的一种或多种是内源切口核酸内切酶的靶标序列。
在某些实施方案中,识别切口核酸内切酶的第一、第二、第三和/或第四限制性位点的切口核酸内切酶是Nt.BsmAI;Nt.BtsCI;N.ALwl;N.BstNBI;N.BspD6I;Nb.Mva1269I;Nb.BsrDI;Nt.BtsI;Nt.BsaI;Nt.Bpu10I;Nt.BsmBI;Nb.BbvCI;Nt.BbvCI;或Nt.BspQI。
在多个实施方案中,所述表达盒包含可操作性连接至转录单元的启动子。在某些实施方案中,所述转录单元包含开放阅读框。在某些实施方案中,所述表达盒还包含转录后调控元件。在某些实施方案中,所述表达盒还包含多腺苷酸化和终止信号。在某些实施方案中,所述表达盒的大小为至少4kb、至少4.5kb、至少5kb、至少5.5kb、至少6kb、至少6.5kb、至少7kb、至少7.5kb、至少8kb、至少8.5kb、至少9kb、至少9.5kb或者至少10kb。
在一个方面,本文提供了制备具有发夹结构末端的DNA分子的方法,其中所述方法包括:
a.在导致所述双链DNA分子扩增的条件下培养包含上述双链DNA分子的宿主细胞;
b.从所述宿主细胞释放所述双链DNA分子;
c.将所述双链DNA分子与识别4个限制性位点的一种或多种切口核酸内切酶培育,从而导致产生4个切口;
d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;
e.将所述单链DNA悬突分子内退火并借此在步骤76.d所产生的DNA片段的两端产生发夹反向重复序列;
在制备本文所描述的具有发夹结构末端的DNA分子的方法的某些实施方案中,所述方法还包括:h.用连接酶修复所述切口以形成环状DNA。
在制备本文所描述的具有发夹结构末端的DNA分子的方法的某些实施方案中,以其在实施方案中出现的顺序实施所述步骤。
在制备本文所描述的具有发夹结构末端的DNA分子的方法的某些实施方案中,所述具有发夹结构末端的DNA由两个发夹结构末端组成。
在制备本文所描述的具有发夹结构末端的DNA分子的方法的某些实施方案中,所述具有发夹结构末端的DNA是病毒基因组。在具体的实施方案中,所述病毒基因组是细小病毒基因组。在具体的实施方案中,所述细小病毒是依赖细小病毒、博卡细小病毒、红系细小病毒、原细小病毒或者四细小病毒。
在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述底部链的切口;
c.表达盒;
d.所述底部链的切口;和
e.第二发夹反向重复序列。
在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述顶部链的切口;
c.表达盒;
d.所述顶部链的切口;和
e.第二发夹反向重复序列。
在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述底部链的切口;
c.表达盒;
d.所述顶部链的切口;和
e.第二发夹反向重复序列。
在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述顶部链的切口;
c.表达盒;
d.所述底部链的切口;和
e.第二发夹反向重复序列。
在某些实施方案中,所述双链DNA分子是分离的DNA分子。
在某些实施方案中,所述第一和/或所述第二反向重复序列是细小病毒的ITR。在某些实施方案中,所述第一和所述第二反向重复序列是相同的。在某些实施方案中,所述第一和/或所述第二反向重复序列是细小病毒的修饰的ITR。在具体的实施方案中,所述细小病毒是依赖细小病毒、博卡细小病毒、红系细小病毒、原细小病毒或者四细小病毒。在具体的实施方案中,所述修饰的ITR的核苷酸序列与细小病毒的ITR至少50%、60%、70%、80%、90%、95%、98%或至少99%相同。
在多个实施方案中,所述表达盒包含可操作性连接至转录单元的启动子。在某些实施方案中,所述转录单元包含开放阅读框。在某些实施方案中,所述表达盒还包含转录后调控元件。在某些实施方案中,所述表达盒还包含多腺苷酸化和终止信号。在某些实施方案中,所述表达盒的大小为至少4kb、至少4.5kb、至少5kb、至少5.5kb、至少6kb、至少6.5kb、至少7kb、至少7.5kb、至少8kb、至少8.5kb、至少9kb、至少9.5kb或者至少10kb。
在某些实施方案中,保护所述双链DNA分子抵抗核酸外切酶降解。在具体的实施方案中,所述核酸外切酶是RecBCD核酸外切酶。
在某些实施方案中,所述双链DNA分子缺少至少一种复制-相关蛋白结合序列(“RABS”)。在某些实施方案中,所述双链DNA分子缺少复制-相关蛋白(“RAP”)编码序列。在某些实施方案中,所述双链DNA分子缺少病毒衣壳蛋白编码序列。在具体的实施方案中,所述第一反向重复序列缺少至少一种RABS。在具体的实施方案中,所述第二反向重复序列缺少至少一种RABS。在具体的实施方案中,所述第一反向重复序列的ITR封闭碱基对和所述第二反向重复序列的ITR封闭碱基对之间的DNA序列缺少至少一种RABS。在具体的实施方案中,所述第一反向重复序列缺少至少一种RABS并且所述第二反向重复序列缺少至少一种RABS。
在某些实施方案中,所述双链DNA分子缺少末端解析位点(TRS)。在具体的实施方案中,所述第一反向重复序列缺少TRS。在具体的实施方案中,所述第二反向重复序列缺少TRS。在具体的实施方案中,所述第一反向重复序列的ITR封闭碱基对和所述第二反向重复序列的ITR封闭碱基对之间的DNA序列缺少TRS。在具体的实施方案中,所述第一反向重复序列缺少TRS并且所述第二反向重复序列缺少TRS。
在某些实施方案中,当施用于宿主时,所述双链DNA分子的移动风险比具有至少一种RABS和/或具有TRS的对照DNA分子小100%、95%、90%、85%、80%、75%、70%、65%、60%、55%或50%。
在其中所述双链DNA分子缺少TRS的某些实施方案中,当施用于宿主时,所述双链DNA分子的移动风险比具有TRS的对照DNA分子小100%、95%、90%、85%、80%、75%、70%、65%、60%、55%或50%。
在其中所述双链DNA分子缺少至少一种RABS并且缺少TRS的某些实施方案中,当施用于宿主时,所述双链DNA分子的移动风险比具有至少一种RABS和TRS的对照DNA分子小100%、95%、90%、85%、80%、75%、70%、65%、60%、55%或50%。
在一个方面,本文提供了本文所描述的分离的双链DNA分子,其中所述分离的双链DNA分子不含所述双链DNA分子的片段。
在一个方面,本文提供了本文所描述的分离的双链DNA分子,其中所述双链DNA分子的片段不超过所述分离的双链DNA分子的1%、2%、3%、4%、5%、6%、7%、8%、9%或者10%。
在一个方面,本文提供了本文所描述的分离的双链DNA分子,其中所述分离的双链DNA分子不含非所述双链DNA分子片段的核酸污染物。
在一个方面,本文提供了本文所描述的分离的双链DNA分子,其中非所述双链DNA分子片段的核酸污染物小于所述分离的双链DNA分子的1%、2%、3%、4%、5%、6%、7%、8%、9%或者10%。
在一个方面,本文提供了本文所描述的分离的双链DNA分子,其中所述分离的双链DNA分子不含杆状病毒DNA。
在一个方面,本文提供了本文所描述的分离的双链DNA分子,其中所述杆状病毒DNA小于所述分离的双链DNA分子的1%、2%、3%、4%、5%、6%、7%、8%、9%或者10%。
在一个方面,本文提供了包含本文所描述的双链DNA分子的递送媒介物。在某些实施方案中,所述递送媒介物包含杂交体、脂质体或脂质纳米颗粒。
3.1说明性实施方案组1:
实施方案1.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列或其片段的顶部链5'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列或其片段的顶部链3'悬突;
实施方案2.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列的底部链3'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列的底部链5'悬突;
实施方案3.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列的顶部链5'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列的底部链5'悬突;
实施方案4.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列的底部链3'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列的顶部链3'悬突。
实施方案5.根据实施方案1至4中任一项所述的双链DNA分子,其中所述双链DNA分子是分离的DNA分子。
实施方案6.根据实施方案1至5中任一项所述的双链DNA分子,其中所述切口核酸内切酶的第一、第二、第三和第四限制性位点均为相同切口核酸内切酶的限制性位点。
实施方案7.根据实施方案1至5中任一项所述的双链DNA分子,其中所述第一和所述第二反向重复序列是相同的。
实施方案8.根据实施方案1至5中任一项所述的双链DNA分子,其中所述第一和/或所述第二反向重复序列是细小病毒的ITR。
实施方案9.根据实施方案1至5中任一项所述的双链DNA分子,其中所述第一和/或所述第二反向重复序列是细小病毒的修饰的ITR。
实施方案10.根据实施方案8或9所述的双链DNA分子,其中所述细小病毒是依赖细小病毒、博卡细小病毒、红系细小病毒、原细小病毒或者四细小病毒。
实施方案11.根据实施方案9所述的双链DNA分子,其中所述修饰的ITR的核苷酸序列与细小病毒的ITR至少50%、60%、70%、80%、90%、95%、98%或至少99%相同。
实施方案12.根据实施方案1或5所述的双链DNA分子,其中
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
其中所述第一切口和所述第四切口是顶部链上的两个产生的切口,其中所述第一切口是更接近于顶部链的5'端的切口,所述第四切口是更接近于顶部链的3'端的切口,并且其中所述第二切口和所述第三切口是底部链上的两个产生的切口,其中所述第三切口是更接近于底部链的5'端的切口,所述第二切口是更接近于底部链的3'端的切口。
实施方案13.根据实施方案2或5所述的双链DNA分子,其中
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
其中所述第一切口和所述第四切口是顶部链上的两个产生的切口,其中所述第一切口是更接近于顶部链的5'端的切口,所述第四切口是更接近于顶部链的3'端的切口,并且其中所述第二切口和所述第三切口是底部链上的两个产生的切口,其中所述第三切口是更接近于底部链的5'端的切口,所述第二切口是更接近于底部链的3'端的切口。
实施方案14.根据实施方案3或5所述的双链DNA分子,其中
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
其中所述第一切口和所述第四切口是顶部链上的两个产生的切口,其中所述第一切口是更接近于顶部链的5'端的切口,所述第四切口是更接近于顶部链的3'端的切口,并且其中所述第二切口和所述第三切口是底部链上的两个产生的切口,其中所述第三切口是更接近于底部链的5'端的切口,所述第二切口是更接近于底部链的3'端的切口。
实施方案15.根据实施方案4或5所述的双链DNA分子,其中
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
其中所述第一切口和所述第四切口是顶部链上的两个产生的切口,其中所述第一切口是更接近于顶部链的5'端的切口,所述第四切口是更接近于顶部链的3'端的切口,并且其中所述第二切口和所述第三切口是底部链上的两个产生的切口,其中所述第三切口是更接近于底部链的5'端的切口,所述第二切口是更接近于底部链的3'端的切口。
实施方案16.根据实施方案12至15中任一项所述的双链DNA分子,其中所述第一切口、所述第二切口、所述第三切口和/或所述第四切口位于所述反向重复序列内。
实施方案17.根据实施方案12至15中任一项所述的双链DNA分子,其中所述第一切口、所述第二切口、所述第三切口和/或所述第四切口位于所述反向重复序列外。
实施方案18.根据以上实施方案中任一项所述的双链DNA分子,其中所述双链DNA分子是质粒。
实施方案19.根据实施方案18所述的双链DNA分子,其中所述质粒还包含细菌复制起点。
实施方案20.根据实施方案18所述的双链DNA分子,其中所述质粒还包含位于所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的限制性内切酶位点,其中所述第一反向重复序列、第二反向重复序列和所述第一和第二反向重复序列之间的区域中的任一个中均不存在所述限制性内切酶位点。
实施方案21.根据实施方案20所述的双链DNA分子,其中用所述限制性内切酶切割导致产生了在有利于所述第一和/或第二反向重复序列退火的条件下在可检测水平不退火的单链悬突。
实施方案22.根据实施方案20所述的双链DNA分子,其中所述质粒还包含编码限制性内切酶的开放阅读框。
实施方案23.根据实施方案22所述的双链DNA分子,其中所述限制性内切酶的表达受诱导型启动子控制。
实施方案24.根据实施方案18所述的双链DNA分子,其中所述质粒还包含位于所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的切口核酸内切酶的第五和第六限制性位点,其中所述切口核酸内切酶的第五和第六限制性位点:
a.位于相对链;和
b.在所述双链DNA分子中产生断裂,从而所述断裂的单链悬突在有利于所述第一和/或第二反向重复序列退火的条件下在可检测水平分子间或分子内不退火。
实施方案25.根据实施方案24所述的双链DNA分子,其中所述第五和第六切口相隔1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。
实施方案26.根据实施方案24所述的双链DNA分子,其中所述切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点均为相同切口核酸内切酶的靶标序列。
实施方案27.根据以上实施方案中任一项所述的双链DNA分子,其中所述切口核酸内切酶位点中的一种或多种是内源切口核酸内切酶的靶标序列。
实施方案28.根据实施方案24至27中任一项所述的双链DNA分子,其中所述质粒还包含识别切口核酸内切酶的第一、第二、第三、第四、第五和/或第六限制性位点的编码切口核酸内切酶的开放阅读框。
实施方案29.根据实施方案28所述的双链DNA分子,其中所述切口核酸内切酶的表达受诱导型启动子控制。
实施方案30.根据实施方案1至29中任一项所述的双链DNA分子,其中识别切口核酸内切酶的第一、第二、第三和/或第四限制性位点的切口核酸内切酶是Nt.BsmAI;Nt.BtsCI;N.ALwl;N.BstNBI;N.BspD6I;Nb.Mva1269I;Nb.BsrDI;Nt.BtsI;Nt.BsaI;Nt.Bpu10I;Nt.BsmBI;Nb.BbvCI;Nt.BbvCI;或Nt.BspQI。
实施方案31.根据实施方案24所述的双链DNA分子,其中识别切口核酸内切酶的第五和第六限制性位点的切口核酸内切酶为:Nt.BsmAI;Nt.BtsCI;N.ALwl;N.BstNBI;N.BspD6I;Nb.Mva1269I;Nb.BsrDI;Nt.BtsI;Nt.BsaI;Nt.Bpu10I;Nt.BsmBI;Nb.BbvCI;Nt.BbvCI;或Nt.BspQI。
实施方案32.根据实施方案1至31中任一项所述的双链DNA分子,其中所述表达盒包含可操作性连接至转录单元的启动子。
实施方案33.根据实施方案32所述的双链DNA分子,其中所述转录单元包含开放阅读框。
实施方案34.根据实施方案32或33所述的双链DNA分子,其中所述表达盒还包含转录后调控元件。
实施方案35.根据实施方案32或33所述的双链DNA分子,其中所述表达盒还包含多腺苷酸化和终止信号。
实施方案36.根据实施方案32至35中任一项所述的双链DNA分子,其中所述表达盒的大小为至少4kb、至少4.5kb、至少5kb、至少5.5kb、至少6kb、至少6.5kb、至少7kb、至少7.5kb、至少8kb、至少8.5kb、至少9kb、至少9.5kb或者至少10kb。
实施方案37.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述底部链的切口;
c.表达盒;
d.所述底部链的切口;和
e.第二发夹反向重复序列。
实施方案38.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述顶部链的切口;
c.表达盒;
d.所述顶部链的切口;和
e.第二发夹反向重复序列。
实施方案39.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述底部链的切口;
c.表达盒;
d.所述顶部链的切口;和
e.第二发夹反向重复序列。
实施方案40.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述顶部链的切口;
c.表达盒;
d.所述底部链的切口;和
e.第二发夹反向重复序列。
实施方案41.根据实施方案37至40中任一项所述的双链DNA分子,其是分离的DNA分子。
实施方案42.根据实施方案37至41中任一项所述的双链DNA分子,其中所述第一和/或所述第二反向重复序列是细小病毒的ITR。
实施方案43.根据实施方案37至41中任一项所述的双链DNA分子,其中所述第一和所述第二反向重复序列是相同的。
实施方案44.根据实施方案37至41中任一项所述的双链DNA分子,其中所述第一和/或所述第二反向重复序列是细小病毒的修饰的ITR。
实施方案45.根据实施方案42或44所述的双链DNA分子,其中所述细小病毒是依赖细小病毒、博卡细小病毒、红系细小病毒、原细小病毒或者四细小病毒。
实施方案46.根据实施方案45所述的双链DNA分子,其中所述修饰的ITR的核苷酸序列与细小病毒的ITR至少50%、60%、70%、80%、90%、95%、98%或至少99%相同。
实施方案47.根据实施方案37至46中任一项所述的双链DNA分子,其中所述表达盒包含可操作性连接至转录单元的启动子。
实施方案48.根据实施方案47所述的双链DNA分子,其中所述转录单元包含开放阅读框。
实施方案49.根据实施方案47或48所述的双链DNA分子,其中所述表达盒还包含转录后调控元件。
实施方案50.根据实施方案47或48所述的双链DNA分子,其中所述表达盒还包含多腺苷酸化和终止信号。
实施方案51.根据实施方案37至50中任一项所述的双链DNA分子,其中所述表达盒的大小为至少4kb、至少4.5kb、至少5kb、至少5.5kb、至少6kb、至少6.5kb、至少7kb、至少7.5kb、至少8kb、至少8.5kb、至少9kb、至少9.5kb或者至少10kb。
实施方案52.根据实施方案37至51中任一项所述的双链DNA分子,其中保护所述双链DNA分子抵抗核酸外切酶降解。
实施方案53.根据实施方案52所述的双链DNA分子,其中所述核酸外切酶是RecBCD核酸外切酶。
实施方案54.根据以上实施方案中任一项所述的双链DNA分子,其中所述双链DNA分子缺少至少一种复制-相关蛋白结合序列(“RABS”)。
实施方案55.根据以上实施方案中任一项所述的双链DNA分子,其中所述双链DNA分子缺少复制-相关蛋白(“RAP”)编码序列。
实施方案56.根据以上实施方案中任一项所述的双链DNA分子,其中所述双链DNA分子缺少病毒衣壳蛋白编码序列。
实施方案57.根据以上实施方案中任一项所述的双链DNA分子,其中所述第一反向重复序列缺少至少一种RABS。
实施方案58.根据以上实施方案中任一项所述的双链DNA分子,其中所述第二反向重复序列缺少至少一种RABS。
实施方案59.根据以上实施方案中任一项所述的双链DNA分子,其中所述第一反向重复序列的ITR封闭碱基对和所述第二反向重复序列的ITR封闭碱基对之间的DNA序列缺少至少一种RABS。
实施方案60.根据以上实施方案中任一项所述的双链DNA分子,其中所述第一反向重复序列缺少至少一种RABS并且所述第二反向重复序列缺少至少一种RABS。
实施方案61.根据以上实施方案中任一项所述的双链DNA分子,其中所述双链DNA分子缺少末端解析位点(TRS)。
实施方案62.根据以上实施方案中任一项所述的双链DNA分子,其中所述第一反向重复序列缺少TRS。
实施方案63.根据以上实施方案中任一项所述的双链DNA分子,其中所述第二反向重复序列缺少TRS。
实施方案64.根据以上实施方案中任一项所述的双链DNA分子,其中所述第一反向重复序列的ITR封闭碱基对和所述第二反向重复序列的ITR封闭碱基对之间的DNA序列缺少TRS。
实施方案65.根据以上实施方案中任一项所述的双链DNA分子,其中所述第一反向重复序列缺少TRS并且所述第二反向重复序列缺少TRS。
实施方案66.根据实施方案53和56至64中任一项所述的双链DNA分子,其中当施用于宿主时,所述双链DNA分子的移动风险比具有至少一种RABS和/或具有TRS的对照DNA分子小100%、95%、90%、85%、80%、75%、70%、65%、60%、55%或50%。
实施方案67.根据实施方案53和56至64中任一项所述的双链DNA分子,其缺少TRS,其中当施用于宿主时,所述双链DNA分子的移动风险比具有TRS的对照DNA分子小100%、95%、90%、85%、80%、75%、70%、65%、60%、55%或50%。
实施方案68.根据实施方案53和56至64中任一项所述的双链DNA分子,其缺少至少一种RABS并且缺少TRS,其中当施用于宿主时,所述双链DNA分子的移动风险比具有至少一种RABS和TRS的对照DNA分子小100%、95%、90%、85%、80%、75%、70%、65%、60%、55%或50%。
实施方案69.根据实施方案5至67中任一项所述的分离的双链DNA分子,其中所述分离的双链DNA分子不含所述双链DNA分子的片段。
实施方案70.根据实施方案5至68中任一项所述的分离的双链DNA分子,其中所述双链DNA分子的片段不大于所述分离的双链DNA分子的1%、2%、3%、4%、5%、6%、7%、8%、9%或者10%。
实施方案71.根据实施方案5至69中任一项所述的分离的双链DNA分子,其中所述分离的双链DNA分子不含非所述双链DNA分子片段的核酸污染物。
实施方案72.根据实施方案5至70中任一项所述的分离的双链DNA分子,其中非所述双链DNA分子片段的核酸污染物小于所述分离的双链DNA分子的1%、2%、3%、4%、5%、6%、7%、8%、9%或者10%。
实施方案73.根据实施方案5至71中任一项所述的分离的双链DNA分子,其中所述分离的双链DNA分子不含杆状病毒DNA。
实施方案74.根据实施方案5至72中任一项所述的分离的双链DNA分子,其中所述杆状病毒DNA小于所述分离的双链DNA分子的1%、2%、3%、4%、5%、6%、7%、8%、9%或者10%。
实施方案75.递送媒介物,其包含根据实施方案37至73中任一项所述的双链DNA分子。
实施方案76.根据实施方案74所述的递送媒介物,其中所述递送媒介物包含杂交体、脂质体或脂质纳米颗粒。
实施方案77.制备具有发夹结构末端的DNA分子的方法,其中所述方法包括:
a.在导致所述双链DNA分子扩增的条件下培养包含根据实施方案1至35中任一项所述的双链DNA分子的宿主细胞;
b.从所述宿主细胞释放所述双链DNA分子;
c.将所述双链DNA分子与识别4个限制性位点的一种或多种切口核酸内切酶培育,从而导致产生4个切口;
d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;
e.将所述单链DNA悬突分子内退火并借此在步骤76.d所产生的DNA片段的两端产生发夹反向重复序列。
实施方案78.制备具有发夹结构末端的DNA的方法,其中所述方法包括:
a.在导致所述双链DNA分子扩增的条件下培养包含根据实施方案20所述的双链DNA分子的宿主细胞;
b.从所述宿主细胞释放所述双链DNA分子;
c.将所述双链DNA分子与识别4个限制性位点的一种或多种切口核酸内切酶培育,从而导致产生4个切口;
d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;
e.将所述单链DNA悬突分子内退火并借此在步骤77.d所产生的DNA片段的两端产生发夹反向重复序列;
f.将步骤d所产生的双链DNA分子或片段与所述限制性内切酶培育并借此切割所述双链DNA分子或所述双链DNA分子的片段;和
g.将所述双链DNA分子的片段与核酸外切酶培育,借此消化除步骤77.e所产生的片段之外的双链DNA分子片段。
实施方案79.制备具有发夹结构末端的DNA的方法,其中所述方法包括:
a.在导致所述双链DNA分子扩增的条件下培养包含根据实施方案24所述的双链DNA分子的宿主细胞;
b.从所述宿主细胞释放所述双链DNA分子;
c.将所述双链DNA分子与识别第一、第二、第三和第四限制性位点的一种或多种切口核酸内切酶培育,从而导致产生4个切口;
d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;
e.将所述单链DNA悬突分子内退火并借此在步骤78.d所产生的DNA片段的两端产生发夹反向重复序列;
f.将所述双链DNA分子或步骤78.d所产生的片段与识别第五和第六限制性位点的一种或多种切口核酸内切酶培育,从而导致在所述双链DNA分子中产生断裂;和
g.将所述双链DNA分子的片段与核酸外切酶培育,借此消化除步骤78.e所产生的片段之外的双链DNA分子片段。
实施方案80.根据实施方案76、77或78所述的方法,还包含:h.用连接酶修复所述切口以形成环状DNA。
实施方案81.根据实施方案76至79中任一项所述的方法,其中以其在实施方案中出现的顺序实施所述步骤。
实施方案82.根据实施方案76至80中任一项所述的方法,其中所述具有发夹结构末端的DNA由两个发夹结构末端组成。
实施方案83.根据实施方案76至81中任一项所述的方法,其中所述具有发夹结构末端的DNA是病毒基因组。
实施方案84.根据实施方案82所述的方法,其中所述病毒基因组是细小病毒基因组。
实施方案85.根据实施方案83所述的方法,其中所述细小病毒是依赖细小病毒、博卡细小病毒、红系细小病毒、原细小病毒或者四细小病毒。
3.2说明性实施方案组2:
实施方案1.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列的顶部链5'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列的顶部链3'悬突。
实施方案2.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列的底部链3'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列的底部链5'悬突;
实施方案3.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列的顶部链5'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列的底部链5'悬突;
实施方案4.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列的底部链3'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列的顶部链3'悬突。
实施方案5.根据实施方案1至4中任一项所述的DNA分子,其中所述DNA分子是分离的DNA分子。
实施方案6.根据实施方案1至5中任一项所述的DNA分子,其中所述切口核酸内切酶的第一、第二、第三和第四限制性位点均为相同切口核酸内切酶的限制性位点。
实施方案7.根据实施方案1至5中任一项所述的DNA分子,其中所述第一和所述第二反向重复序列是相同的。
实施方案8.根据实施方案1至5中任一项所述的DNA分子,其中所述第一和/或所述第二反向重复序列是细小病毒的ITR。
实施方案9.根据实施方案1至5中任一项所述的DNA分子,其中所述第一和/或所述第二反向重复序列是细小病毒的修饰的ITR。
实施方案10.根据实施方案8或9所述的DNA分子,其中所述细小病毒是依赖细小病毒、博卡细小病毒、红系细小病毒、原细小病毒或者四细小病毒。
实施方案11.根据实施方案9所述的DNA分子,其中所述修饰的ITR的核苷酸序列与细小病毒的ITR至少50%、60%、70%、80%、90%、95%、98%或至少99%相同。
实施方案12.根据实施方案1或5所述的DNA分子,其中
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内。
实施方案13.根据实施方案2或5所述的DNA分子,其中
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内。
实施方案14.根据实施方案3或5所述的DNA分子,其中
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内。
实施方案15.根据实施方案4或5所述的DNA分子,其中
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内。
实施方案16.根据实施方案12至15中任一项所述的DNA分子,其中所述切口位于所述反向重复序列内。
实施方案17.根据实施方案12至15中任一项所述的DNA分子,其中所述切口位于所述反向重复序列外。
实施方案18.根据以上实施方案中任一项所述的DNA分子,其中所述DNA分子是质粒。
实施方案19.根据实施方案18所述的DNA分子,其中所述质粒还包含细菌复制起点。
实施方案20.根据实施方案18所述的DNA分子,其中所述质粒还包含位于所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的限制性内切酶位点,其中所述第一反向重复序列、第二反向重复序列和所述第一和第二反向重复序列之间的区域中的任一个中均不存在所述限制性内切酶位点。
实施方案21.根据实施方案20所述的DNA分子,其中用所述限制性内切酶切割导致产生了在有利于所述第一和/或第二反向重复序列退火的条件下在可检测水平不退火的单链悬突。
实施方案22.根据实施方案20所述的DNA分子,其中所述质粒还包含编码限制性内切酶的开放阅读框。
实施方案23.根据实施方案22所述的DNA分子,其中所述限制性内切酶的表达受诱导型启动子控制。
实施方案24.根据实施方案18所述的DNA分子,其中所述质粒还包含位于所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的切口核酸内切酶的第五和第六限制性位点,其中所述切口核酸内切酶的第五和第六限制性位点:
a.位于相对链;和
b.在所述双链DNA分子中产生断裂,从而所述断裂的单链悬突在有利于所述第一和/或第二反向重复序列退火的条件下在可检测水平分子间或分子内不退火。
实施方案25.根据实施方案24所述的DNA分子,其中所述第五和第六切口相隔1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。
实施方案26.根据实施方案24所述的DNA分子,其中所述切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点均为相同切口核酸内切酶的靶标序列。
实施方案27.根据以上实施方案中任一项所述的DNA分子,其中所述切口核酸内切酶位点中的一种或多种是内源切口核酸内切酶的靶标序列。
实施方案28.根据实施方案24至27中任一项所述的DNA分子,其中所述质粒还包含识别切口核酸内切酶的第一、第二、第三、第四、第五和/或第六限制性位点的编码切口核酸内切酶的开放阅读框。
实施方案29.根据实施方案28所述的DNA分子,其中所述切口核酸内切酶的表达受诱导型启动子控制。
实施方案30.根据实施方案1至29中任一项所述的DNA分子,其中识别切口核酸内切酶的第一、第二、第三和/或第四限制性位点的切口核酸内切酶是Nt.BsmAI;Nt.BtsCI;N.ALwl;N.BstNBI;N.BspD6I;Nb.Mva1269I;Nb.BsrDI;Nt.BtsI;Nt.BsaI;Nt.Bpu10I;Nt.BsmBI;Nb.BbvCI;Nt.BbvCI;或Nt.BspQI。
实施方案31.根据实施方案24所述的DNA分子,其中识别切口核酸内切酶的第五和第六限制性位点的切口核酸内切酶为:Nt.BsmAI;Nt.BtsCI;N.ALwl;N.BstNBI;N.BspD6I;Nb.Mva1269I;Nb.BsrDI;Nt.BtsI;Nt.BsaI;Nt.Bpu10I;Nt.BsmBI;Nb.BbvCI;Nt.BbvCI;或Nt.BspQI。
实施方案32.根据实施方案1至26中任一项所述的DNA分子,其中所述表达盒包含可操作性连接至转录单元的启动子。
实施方案33.根据实施方案32所述的DNA分子,其中所述转录单元包含开放阅读框。
实施方案34.根据实施方案32或33所述的DNA分子,其中所述表达盒还包含转录后调控元件。
实施方案35.根据实施方案32或33所述的DNA分子,其中所述表达盒还包含多腺苷酸化和终止信号。
实施方案36.根据实施方案32至35中任一项所述的DNA分子,其中所述表达盒的大小为至少4kb、至少4.5kb、至少5kb、至少5.5kb、至少6kb、至少6.5kb、至少7kb、至少7.5kb、至少8kb、至少8.5kb、至少9kb、至少9.5kb或者至少10kb。
实施方案37.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述底部链的切口;
c.表达盒;
d.所述底部链的切口;和
e.第二发夹反向重复序列。
实施方案38.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述顶部链的切口;
c.表达盒;
d.所述顶部链的切口;和
e.第二发夹反向重复序列。
实施方案39.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述底部链的切口;
c.表达盒;
d.所述顶部链的切口;和
e.第二发夹反向重复序列。
实施方案40.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述顶部链的切口;
c.表达盒;
d.所述底部链的切口;和
e.第二发夹反向重复序列。
实施方案41.根据实施方案37至40中任一项所述的双链DNA分子,其中所述双链DNA分子是分离的DNA分子。
实施方案42.根据实施方案37至41中任一项所述的双链DNA分子,其中所述第一和/或所述第二反向重复序列是细小病毒的ITR。
实施方案43.根据实施方案37至41中任一项所述的双链DNA分子,其中所述第一和所述第二反向重复序列是相同的。
实施方案44.根据实施方案37至41中任一项所述的DNA分子,其中所述第一和/或所述第二反向重复序列是细小病毒的修饰的ITR。
实施方案45.根据实施方案42或44所述的DNA分子,其中所述细小病毒是依赖细小病毒、博卡细小病毒、红系细小病毒、原细小病毒或者四细小病毒。
实施方案46.根据实施方案45所述的DNA分子,其中所述修饰的ITR的核苷酸序列与细小病毒的ITR至少50%、60%、70%、80%、90%、95%、98%或至少99%相同。
实施方案47.根据实施方案37至46中任一项所述的DNA分子,其中所述表达盒包含可操作性连接至转录单元的启动子。
实施方案48.根据实施方案47所述的DNA分子,其中所述转录单元包含开放阅读框。
实施方案49.根据实施方案47或48所述的DNA分子,其中所述表达盒还包含转录后调控元件。
实施方案50.根据实施方案47或48所述的DNA分子,其中所述表达盒还包含多腺苷酸化和终止信号。
实施方案51.根据实施方案37至50中任一项所述的DNA分子,其中所述表达盒的大小为至少4kb、至少4.5kb、至少5kb、至少5.5kb、至少6kb、至少6.5kb、至少7kb、至少7.5kb、至少8kb、至少8.5kb、至少9kb、至少9.5kb或者至少10kb。
实施方案52.根据实施方案37至51中任一项所述的DNA分子,其中保护所述DNA分子抵抗核酸外切酶降解。
实施方案53.根据实施方案52所述的DNA分子,其中所述核酸外切酶是RecBCD核酸外切酶。
实施方案54.根据以上实施方案中任一项所述的DNA分子,其中所述DNA分子缺少复制(Rep)蛋白结合位点。
实施方案55.递送媒介物,其包含根据实施方案37至51中任一项所述的DNA分子。
实施方案56.根据实施方案55所述的递送媒介物,其中所述递送媒介物包含杂交体、脂质体或脂质纳米颗粒。
实施方案57.制备具有发夹结构末端的DNA分子的方法,其中所述方法包括:
a.在导致所述DNA分子扩增的条件下培养包含根据实施方案1至35中任一项所述的DNA分子的宿主细胞;
b.从所述宿主细胞释放所述DNA分子;
c.将所述DNA分子与识别4个限制性位点的一种或多种切口核酸内切酶培育,从而导致产生4个切口;
d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;
e.将所述单链DNA悬突分子内退火并借此在步骤d所产生的DNA片段的两端产生发夹反向重复序列。
实施方案58.制备具有发夹结构末端的DNA的方法,其中所述方法包括:
a.在导致所述质粒扩增的条件下培养包含根据实施方案20所述的质粒的宿主细胞;
b.从所述宿主细胞释放所述质粒;
c.将所述DNA分子与识别4个限制性位点的一种或多种切口核酸内切酶培育,从而导致产生4个切口;
d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;
e.将所述单链DNA悬突分子内退火并借此在步骤d所产生的DNA片段的两端产生发夹反向重复序列;
f.将所述质粒或步骤d所产生的片段与所述限制性内切酶培育并借此切割所述质粒或所述质粒的片段;和
g.将所述质粒的片段与核酸外切酶培育,借此消化除步骤e所产生的片段之外的质粒片段。
实施方案59.制备具有发夹结构末端的DNA的方法,其中所述方法包括:
a.在导致所述质粒扩增的条件下培养包含根据实施方案24所述的质粒的宿主细胞;
b.从所述宿主细胞释放所述质粒;
c.将所述DNA分子与识别第一、第二、第三和第四限制性位点的一种或多种切口核酸内切酶培育,从而导致产生4个切口;
d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;
e.将所述单链DNA悬突分子内退火并借此在步骤d所产生的DNA片段的两端产生发夹反向重复序列;
f.将所述质粒或步骤d所产生的片段与识别第五和第六限制性位点的一种或多种切口核酸内切酶培育,从而导致在所述双链DNA分子中产生断裂;和
g.将所述质粒的片段与核酸外切酶培育,借此消化除步骤e所产生的片段之外的质粒片段。
实施方案60.根据实施方案57、58或59所述的方法,还包含:h.用连接酶修复所述切口以形成环状DNA。
实施方案61.根据实施方案57至60中任一项所述的方法,其中以其在实施方案中出现的顺序实施所述步骤。
实施方案62.根据实施方案57至61中任一项所述的方法,其中所述具有发夹结构末端的DNA由两个发夹结构末端组成。
实施方案63.根据实施方案57至62中任一项所述的方法,其中所述具有发夹结构末端的DNA是病毒基因组。
实施方案64.根据实施方案63所述的方法,其中所述病毒基因组是细小病毒基因组。
实施方案65.根据实施方案64所述的方法,其中所述细小病毒是依赖细小病毒、博卡细小病毒、红系细小病毒、原细小病毒或者四细小病毒。
4.附图说明
图1显示了多种示例性发夹结构和发夹的结构元件。
图2A和2B显示了直链相互作用图,其显示了示例性链构象和悬突内的分子内作用力以及链之间的分子间作用力,图2C显示了图2A和图2B的预期退火结构。
图3显示了发夹的多种示例性布置和多个限制性位点的位置以及在发夹的第一茎中II型切口核酸内切酶的限制性位点。
图4显示了多种示例性发夹结构和人线粒体DNA OriL以及OriL来源的ITR的结构元件。
图5显示了示例性适体和适体ITR的发夹结构。
图6显示了构建体1以及在实施如实施例1所述的方法步骤之后DNA产物从构建体1的显象。
图7显示了构建体2以及在实施如实施例1所述的方法步骤之后DNA产物从构建体1的显象。
图8A-8C显示了如实施例2所述的多个复性/变性循环。
图9A-9B显示了如实施例3所述的构建体1的等温变性。
图10显示了荧光素酶从多种DNA载体量的表达水平。通过杂交体或脂质纳米颗粒,用不同浓度的DNA载体转染细胞。转染后48h确定荧光素酶活性。
图11A-11D显示了如6.5节(实施例5分裂和未分裂细胞中的表达)中所述的分裂和未分裂细胞中的荧光素酶表达。图11A和11B显示了分裂(11A)和未分裂(11B)细胞中非分泌的Turboluc(构建体1)的表达。对于非分泌的Turboluc(构建体1),分裂细胞中荧光素酶活性峰值在第2天,而在未分裂细胞中表达持续升高。图11C和11D显示了未分裂(11C)和分裂细胞(11D)中分泌的Turboluc(构建体2)的表达。对于分泌的Turboluc(构建体2),分裂细胞中荧光素酶活性峰值在第2天,而在未分裂细胞中表达升高,随后保持稳定9天。作为直接比较,还转染了等摩尔量的编码构建体2的完整环形质粒,并且如图11C和11D所示,通常记录了较低的荧光素酶活性,从而表明了具有折叠的ITR的纯化构建体2的核递送有所改善。
图12显示了发夹编码质粒的从头合成的载体构建策略。
图13显示了来源于AAV1的ITR的序列比对,其突出显示了序列修饰以对于不同的切口核酸内切酶识别位点产生识别位点。
图14显示了来源于AAV2的ITR的序列比对,其突出显示了序列修饰以对于不同的切口核酸内切酶识别位点产生识别位点。
图15显示了来源于AAV3的ITR的序列比对,其突出显示了序列修饰以对于不同的切口核酸内切酶识别位点产生识别位点。
图16显示了来源于AAV4左侧的ITR的序列比对,其突出显示了序列修饰以对于不同的切口核酸内切酶识别位点产生识别位点。
图17显示了来源于AAV4右侧的ITR的序列比对,其突出显示了序列修饰以对于不同的切口核酸内切酶识别位点产生识别位点。
图18显示了来源于AAV5的ITR的序列比对,其突出显示了序列修饰以对于不同的切口核酸内切酶识别位点产生识别位点。
图19显示了来源于AAV7左侧的ITR的序列比对,其突出显示了序列修饰以对于不同的切口核酸内切酶识别位点产生识别位点。
图20A和20B显示了琼脂糖凝胶,其显示了DNA构建体的成功连接和在分别用包封所连接的构建体和未连接的构建体以及亲代质粒的杂交体转染的未分裂的肝细胞中相应的荧光素酶表达。
图21显示了通过用等摩尔的量的包封在LNP或杂交体中的编码分泌的荧光素酶的具有发夹结构末端的DNA分子转染的未分裂细胞的荧光素酶随时间的表达。
图22显示了如实施例9所述,在通过脂质纳米颗粒、杂交体和jetprime递送的编码Cre重组酶的具有发夹结构末端的DNA转染72h后,RFP阳性彩色开关HEK293细胞的百分比。
图23A和23B显示了琼脂糖凝胶,其显示与其中将RBE替换为如图所示的相应序列的突变体相比,具有发夹结构末端的DNA从包含右侧和左侧ITR以及野生型AAV RBE的质粒的成功形成。图23B显示了用相应ITR序列转染的未分裂的肝细胞中的荧光素酶表达。
图24A和24B:显示了其它示例性克隆方法(图24A)以及可以通过实施如实施例11所述的方法步骤从中制备如本文所公开的具有发夹结构的反向重复序列DNA分子的质粒所得的图(图24B)。在该实施例中,将切口核酸内切酶的6个限制性位点置于左侧ITR的5'端区域和右侧ITR的3'端区域。
图25A和25B在琼脂糖凝胶上显示并显像了来自从图24B中所示的质粒起始的切口、变性/退火和核酸外切酶消化的产物以及所述转染产物的发光读数。
图26A和26B在琼脂糖凝胶上显示并显像了来自如实施例13所述的具有OriL来源的ITR的构建体的切口、变性/退火和核酸外切酶消化的产物以及在Hek293细胞上清液中分泌的turboluc的发光读数。
5.详细说明
本文提供了制备具有发夹结构末端的DNA分子的方法。本文还提供了使用具有发夹结构末端的DNA分子,包括(例如)将具有发夹结构末端的DNA分子用于基因疗法的方法。在下文5.2节中进一步描述了制备具有发夹结构末端的DNA分子的多种方法。在下文5.7节中描述了使用具有发夹结构末端的DNA分子的多种方法。在下文5.4节中提供了通过这些方法制备的具有发夹结构末端的DNA,并且所述具有发夹结构末端的DNA包括位于两个末端的发夹反向重复序列和表达盒,下文对其中的每一种进行详细说明。在一些实施方案中,具有发夹结构末端的DNA还包括一个或两个切口,如下文5.4节中进一步所提供的。下文5.4节中描述了发夹、发夹反向重复序列和发夹结构末端;下文5.3.1节中描述了形成发夹结构末端的反向重复序列;下文5.3.2和5.4节中描述了切口核酸内切酶的限制性位点;下文5.3.3和5.4节中描述了表达盒;并且下文5.5节中描述了具有发夹结构末端的DNA分子的功能性。照此,本发明公开以本文所提供的组分的任意组合或排列提供了具有发夹结构末端的DNA分子及其制备方法和使用方法。
本文还提供了在制备具有发夹结构末端的DNA分子的方法中所使用的亲代DNA分子,所述亲代DNA分子包括两个反向重复序列、切口核酸内切酶的两个或更多个限制性位点和表达盒,下文对其中的每一种进行详细说明。切口核酸内切酶的限制性位点的布置使得一旦通过切口核酸内切酶切口并变性,则形成具有反向重复序列的单链悬突,随后一旦退火,所述悬突折叠以形成发夹结构,每个步骤如5.2节中所述。在下文5.3.1节中描述了反向重复序列;在下文5.3.2节中描述了切口、切口核酸内切酶和切口核酸内切酶的限制性位点;在下文5.3.3节中描述了表达盒。照此,本发明公开以本文所提供的组分的任意组合或排列提供了在制备方法中使用的亲代DNA分子。
5.1定义
如本文所使用的,当用于表示DNA分子时,术语“分离的”旨在表示所提及的DNA分子不含在其天然、天生或合成环境中存在的至少一种组分。该术语包括从如在其天然、天生或合成环境中存在的一些或所有其它组分中除去的DNA分子。DNA分子的天然、天生或合成环境的组分包括天然、天生或合成环境中,所述DNA分子在该环境中的复制和维持所需的、所使用的或另外起作用的任何物质。DNA分子的天然、天生或合成环境的组分还包括(例如)细胞、细胞碎片、细胞器、蛋白、肽、氨基酸、脂质、多糖、除所提及的DNA分子外的核酸、盐、用于细胞培养的营养物和/或用于DNA合成的化学品。本发明公开的DNA分子可以部分、完全或基本不含从其天然、天生或合成环境中分离、合成产生、天然产生或重组产生的所有这些组分或任何其它组分。分离的DNA分子的具体实例包括部分纯的DNA分子和基本纯的DNA分子。
如本文所使用的,术语“递送媒介物”是指可以用于将一种或多种试剂施用或递送至细胞、组织或受试者,具体地人受试者的物质,所述物质具有或不具有要递送的试剂。递送媒介物可以优先地将试剂递送至特定亚型或特定类型的细胞。可以通过媒介物的性质或者通过缀合至递送媒介物、与递送媒介物结合或包含在递送媒介物中的部分实现通过所述递送媒介物所实现的选择性或优先递送,所述部分特异性地或优先地结合至特定亚型的细胞。递送媒介物还可以提高要递送的试剂的体内半衰期、与不使用递送媒介物的递送相比试剂的递送效率和/或要递送的试剂的生物利用度。递送媒介物的非限制性实例是杂交体、脂质体、脂质纳米颗粒、聚合物囊泡、天然/合成脂质的混合物、膜或脂质提取物、外来体、病毒颗粒、蛋白或蛋白质复合物、肽和/或多糖。
在本文中,如在短语如“A和/或B”中所使用的术语“和/或”旨在包括A和B两者;A或B;(单独的)A;和(单独的)B。同样地,如在短语如“A、B和/或C”中所使用的术语“和/或”旨在涵盖以下实施方案中的每一个:A、B和C;A、B或C;A或C;A或B;B或C;A和C;A和B;B和C;(单独的)A;(单独的)B;和(单独的)C。
5.2制备具有发夹结构末端的DNA分子的方法
在一个方面,本文提供了制备具有发夹结构末端的DNA分子的方法,其中所述方法包括:a.在导致所述DNA分子扩增的条件下培养包含如5.3节中所述的DNA分子的宿主细胞;b.从所述宿主细胞释放所述DNA分子;c.将所述DNA分子与识别4个限制性位点的一种或多种切口核酸内切酶培育,从而导致产生4个切口;d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;e.将所述单链DNA悬突分子内退火并借此在步骤d所产生的DNA片段的两端产生发夹反向重复序列。
在另一个方面,本文提供了制备具有发夹结构末端的DNA的方法,其中所述方法包括:a.在导致所述质粒扩增的条件下培养包含5.3.5节所述的质粒的宿主细胞;b.从所述宿主细胞释放所述质粒;c.将所述DNA分子与识别4个限制性位点的一种或多种切口核酸内切酶培育,从而导致产生4个切口;d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;e.将所述单链DNA悬突分子内退火并借此在步骤d所产生的DNA片段的两端产生发夹反向重复序列;f.将所述质粒或步骤d所产生的片段与所述限制性内切酶培育并借此切割所述质粒或所述质粒的片段;和g.将所述质粒的片段与核酸外切酶培育,借此消化除步骤e所产生的片段之外的质粒片段。
在另一个方面,本文提供了制备具有发夹结构末端的DNA的方法,其中所述方法包括:a.在导致所述质粒扩增的条件下培养包含如3.1节的实施方案24所述的DNA分子的宿主细胞;b.从所述宿主细胞释放所述质粒;c.将所述DNA分子与识别第一、第二、第三和第四限制性位点的一种或多种切口核酸内切酶培育,从而导致产生4个切口;d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;e.将所述单链DNA悬突分子内退火并借此在步骤d所产生的DNA片段的两端产生发夹反向重复序列;f.将所述质粒或步骤d所产生的片段与识别第五和第六限制性位点的一种或多种切口核酸内切酶培育,从而导致在所述双链DNA分子中产生断裂;和g.将所述质粒的片段与核酸外切酶培育,借此消化除步骤e所产生的片段之外的质粒片段。
在一个方面,本文提供了制备具有发夹结构末端的DNA分子的方法,其中所述方法包括:a.在导致所述DNA分子扩增的条件下培养包含如5.3节中所述的DNA分子的宿主细胞;b.从所述宿主细胞释放所述DNA分子;c.将所述DNA分子与识别向导核酸的4个靶标位点的一种或多种可编程切口酶培育,从而导致产生4个切口;d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;e.将所述单链DNA悬突分子内退火并借此在步骤d所产生的DNA片段的两端产生发夹反向重复序列。
在另一个方面,本文提供了制备具有发夹结构末端的DNA的方法,其中所述方法包括:a.在导致所述质粒扩增的条件下培养包含5.3.5节所述的质粒的宿主细胞;b.从所述宿主细胞释放所述质粒;c.将所述DNA分子与识别向导核酸的4个靶标位点的一种或多种可编程切口酶培育,从而导致产生4个切口;d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;e.将所述单链DNA悬突分子内退火并借此在步骤d所产生的DNA片段的两端产生发夹反向重复序列;f.将所述质粒或步骤d所产生的片段与所述限制性内切酶培育并借此切割所述质粒或所述质粒的片段;和g.将所述质粒的片段与核酸外切酶培育,借此消化除步骤e所产生的片段之外的质粒片段。
在另一个方面,本文提供了制备具有发夹结构末端的DNA的方法,其中所述方法包括:a.在导致所述质粒扩增的条件下培养包含如3.1节的实施方案24所述的DNA分子的宿主细胞;b.从所述宿主细胞释放所述质粒;c.将所述DNA分子与识别向导核酸的第一、第二、第三和第四靶标位点的一种或多种可编程切口酶培育,从而导致产生4个切口;d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;e.将所述单链DNA悬突分子内退火并借此在步骤d所产生的DNA片段的两端产生发夹反向重复序列;f.将所述质粒或步骤d所产生的片段与识别向导核酸的第五和第六靶标位点的可编程切口酶培育,从而导致在所述双链DNA分子中产生断裂;和g.将所述质粒的片段与核酸外切酶培育,借此消化除步骤e所产生的片段之外的质粒片段。在另一个实施方案中,本段的步骤f可以被以下步骤f替代:将所述质粒或步骤d所产生的片段与识别两个限制性位点的一种或多种切口核酸内切酶培育,从而导致在所述双链DNA分子中产生断裂。
在某些实施方案中,可以如以上段落中的步骤a和b中所提供的,通过培养包含所述DNA分子或所述质粒的宿主细胞并从所述宿主细胞释放所述DNA分子或质粒来提供包含侧接反向重复序列的表达盒的DNA分子(如5.3节所述)。作为另外一种选择,可以在无细胞体系合成或与无细胞和宿主细胞-基系统组合合成这些DNA分子。例如,具有多种尺寸和序列的DNA片段和质粒的化学合成是已知且在本领域中广泛使用的;可以化学合成片段,然后通过本领域中已知的任何方式连接或在宿主细胞中重组。在其它实施方案中,可以通过体外复制提供所述DNA分子或质粒。可使用多种方法进行体外复制,包括通过聚合酶链反应(PCR)扩增。用于复制具有多种尺寸的DNA片段或质粒的PCR方法是本领域熟知且广泛使用的,例如,如Molecular Cloning:ALaboratory Manual,第4版,by Michael Green andJoseph Sambrook,ISBN 978-1-936113-42-2(2012)中所述,该文献以其全部内容作为参考并入本文。在一些实施方案中,体外复制方法可以是等温DNA扩增。在一些实施方案中,可以用通过化学合成或PCR提供DNA分子的步骤替代步骤a和b。在其它实施方案中,可以用通过化学合成提供DNA分子替代步骤a、b、c和d。
在一个方面,本文所提供的方法可以用于制备包含表达盒的具有发夹结构末端的DNA分子,其中所述方法包括:a.提供如5.3节所述的双链DNA分子;b.在导致所述双链DNA分子切口的条件下将所述DNA分子与至少一种切口酶培育,借此产生至少两个化学计量DNA片段;c.使所述DNA片段变性;d.将所述DNA片段退火,其中至少一种DNA片段包含可以分子内退火的表达盒和单链DNA悬突并借此在所述DNA的两端产生发夹反向重复序列;e.将所述DNA片段与至少一种核酸外切酶培育,借此消化除步骤d所产生的包含表达盒的发夹结构末端片段外,步骤b所述的化学计量DNA片段。在具体的实施方案中,本段所述方法的步骤b产生了至少2、至少3、至少4、至少5、至少6或更多的化学计量片段。在其它实施方案中,本段所述方法的步骤b产生了至少两个化学计量DNA片段,其中所述包含表达盒的DNA片段与步骤a中所提供的DNA分子是化学计量等价的。在一些实施方案中,本段步骤e所产生的包含表达盒的水解耐受的发夹结构末端片段与步骤a中所提供的DNA分子大致上是化学计量等价的。
在一些实施方案中,本文所提供的方法可以用于制备包含表达盒的具有发夹结构末端的DNA分子,其中所述方法包括:a.提供如5.3节所述的双链DNA分子;b.在导致所述双链DNA分子切口的条件下将所述DNA分子与至少一种切口酶培育,借此产生至少两个化学计量DNA片段;c.使所述DNA片段变性为单链DNA;d.将包含表达盒的DNA片段的有义链和反义链退火,其中所述有义链和/或反义链包含可以分子内退火的单链DNA悬突并借此在包含表达盒的DNA片段的两端产生发夹反向重复序列;e.将所述DNA片段与至少一种核酸外切酶培育,借此消化除步骤d所产生的包含表达盒的发夹结构末端片段外,步骤b所述的化学计量DNA片段。
在一些实施方案中,本文所提供的方法可以用于制备包含表达盒的具有发夹结构末端的DNA分子,其中所述方法包括:a.提供如5.3节所述的双链DNA分子;b.在导致所述双链DNA分子切口的条件下将所述DNA分子与至少一种切口酶培育;c.将所述双链DNA变性,借此产生至少两个化学计量DNA片段;d.将所述DNA片段退火,其中至少一种DNA片段包含可以分子内退火的表达盒和单链DNA悬突并借此在所述DNA片段的两端产生发夹反向重复序列。
在另一个方面,本文所提供的方法可以用于制备具有发夹结构末端的DNA分子,其中所述方法包括至少一个釜(例如,容器、罐、孔、管,板或其它容器),其包含处于水性缓冲液中的如5.3节所述的双链DNA分子,向所述水性缓冲液中顺序加入(i)切口酶、(ii)变性剂(例如,碱)、(iii)退火剂(例如,酸)和(iv)核酸外切酶。通过一锅反应实施本文所提供的方法的能力可以提供至少一种其它优势,其中无需在方法步骤(i)至(iv)之间纯化任何中间体、污染物(例如,酶)或DNA消化副产物(即核苷酸、寡聚或单链DNA片段)便可以完成产生具有发夹结构末端的DNA分子的方法,借此提供与成本和生产失败风险相关的良好方法(例如,将纯化损失最小化、减少所需的起始材料、更紧密地控制工艺参数等)。
在其它实施方案中,本文所提供的方法可以用于产生具有发夹结构末端的DNA分子,其中所述方法包括a.在导致所述双链DNA分子切口的条件下,提供一个釜(例如,容器、罐、孔、管,板或其它容器),其包含如5.3节所述的双链DNA分子和至少一种切口酶,b.使DNA变性和退火(例如,通过改变温度、pH或缓冲液组成),和c.增添核酸外切酶而无需纯化任何中间体(例如,在步骤a和c之间)。在具体的实施方案中,本段所述方法中的釜:在步骤a中,包含至少一种双链DNA分子物质(例如,质粒或其衍生物)、至少一种切口酶物质和水性缓冲液,并且在步骤c中,包含水性缓冲液,其包含至少一种具有发夹结构末端的DNA物质、至少一种切口酶物质、至少一种核酸外切酶和DNA消化产物物质(例如,dNMP、二核苷酸和/或短寡聚核酸)。
在其它实施方案中,本文所提供的方法可以用于产生具有发夹结构末端的DNA分子,其中所述方法包括:a.在导致所述双链DNA分子切口的条件下在至少一种釜(例如,容器、罐、孔、管,板或其它容器)中提供如5.3节所述的双链DNA分子和至少一种切口酶,b.使所述DNA分子变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;c.将所述单链DNA悬突分子内退火并借此在步骤b所产生的DNA片段的两端产生发夹反向重复序列;d.向所述釜中添加核酸外切酶,借此消化除步骤c所产生的片段外,步骤b中的DNA分子的DNA片段。
在一些实施方案中,本文所提供的方法可以用于制备包含表达盒的具有发夹结构末端的DNA分子,其中所述方法包括:a.在导致所述双链DNA分子切口的条件下在至少一种釜(例如,容器、罐、孔、管,板或其它容器)中提供如5.3节所述的双链DNA分子和至少一种切口酶,借此产生至少两个化学计量DNA片段,b.使所述DNA片段变性;c.将所述DNA片段退火,其中至少一种DNA片段包含可以分子内退火的单链DNA悬突并借此在包含表达盒的DNA片段的两端产生发夹反向重复序列;d.向所述釜中添加至少一种核酸外切酶,借此消化除步骤c所产生的包含表达盒的具有发夹结构末端的DNA片段外,步骤a所述的DNA片段。在其它实施方案中,本段所述方法的步骤a产生了至少2、至少3、至少4、至少5、至少6或更多的化学计量片段。
在一些实施方案中,本文所提供的方法可以用于制备包含表达盒的具有发夹结构末端的DNA分子,其中所述方法包括:a.在至少一种釜(例如,容器、罐、孔、管,板或其它容器)中提供如5.3节所述的双链DNA分子,b.在导致所述双链DNA分子切口的条件下将至少一种切口酶添加至所述釜,借此产生至少两个化学计量DNA片段,c.使所述DNA片段变性;d.将所述DNA片段退火,其中至少一种DNA片段包含可以分子内退火的单链DNA悬突并借此在包含表达盒的DNA片段的两端产生发夹反向重复序列;e.向所述釜添加至少一种核酸外切酶,借此消化除步骤d所产生的包含表达盒的发夹结构末端片段外,步骤b的化学计量DNA片段。在具体的实施方案中,本段所述方法的釜在步骤a包含一种DNA分子物质,并且与步骤a中的DNA分子相比,在步骤b包含至少2、至少3、至少4、至少5、至少6或更多个化学计量片段,其中包含表达盒的片段与步骤a所提供的DNA分子化学计量等价。在具体的实施方案中,所述釜在本段所述方法的步骤b中包含与步骤a中的DNA分子相比至少2、至少3、至少4、至少5、至少6或更多的化学计量片段,其中所述包含表达盒的片段与步骤a中所提供的DNA分子化学计量等价。在非限制性实例中,所述釜在本段所述方法的步骤b中包含3种化学计量DNA片段;(i)两个缺少表达盒的片段和一个包含表达盒的片段,其中包含表达盒的片段与步骤a所提供的DNA分子化学计量等价。在其它具体的实施方案中,所述釜在本段所述方法的步骤e中包含一定量的与步骤a所提供的DNA分子相比化学计量等价的消化耐受的具有发夹结构末端的DNA分子。在具体的实施方案中,所述釜在本段所述方法的步骤e中包含至多一定量的与步骤a所提供的DNA分子相比大致化学计量等价的消化耐受的具有发夹结构末端的DNA分子。在一些实施方案中,所述釜在段落中的所述方法的步骤e中包含至多一定量的与步骤a所提供的DNA分子相比大致化学计量等价的消化耐受的具有发夹结构末端的DNA分子,其中所述DNA分子的总质量按约存在于所述包含表达盒的具有发夹结构末端的DNA分子中的核苷酸除以存在于步骤a所提供的DNA分子中的核苷酸之比降低。在具体的实施方案中,所述釜在本段所述方法的步骤e中包含一定量的与步骤a所提供的DNA分子的表达盒相比大致化学计量等价的消化耐受的具有发夹结构末端的DNA分子。
在一些实施方案中,本文所提供的方法可以用于制备包含表达盒的具有发夹结构末端的DNA分子,其中所述方法包括:a.在导致所述DNA分子扩增的条件下培养包含如5.3节中所述的DNA分子的宿主细胞;b.从所述宿主细胞释放所述DNA分子;c.将所述DNA分子增添至至少一个釜(例如,容器、罐、孔、管,板或其它容器);d.在导致所述双链DNA分子切口的条件下将至少一种切口酶添加至所述釜,借此产生至少两个化学计量DNA片段;e.使所述DNA片段变性;f.将所述DNA片段退火,其中至少一种DNA片段包含表达盒和可以分子内退火的单链DNA悬突并借此在所述DNA片段的两端产生发夹反向重复序列;g.向所述釜添加至少一种核酸外切酶,借此消化除步骤f所产生的包含表达盒的发夹结构末端片段外,步骤f的化学计量DNA片段。在具体的实施方案中,所述釜在本段所述方法的步骤g中包含一定量的与步骤c所提供的DNA分子相比大致化学计量等价的消化耐受的具有发夹结构末端的DNA分子。
在一些实施方案中,本文所提供的方法可以用于制备包含表达盒的具有发夹结构末端的DNA分子,其中所述方法包括:a.在导致所述质粒扩增的条件下培养包含如5.3.5节所述的质粒的宿主细胞;b.从所述宿主细胞释放所述质粒;c.将所述质粒增添至至少一个釜(例如,容器、罐、孔、管,板或其它容器);d.在导致所述质粒切口的条件下将至少一种切口酶添加至所述釜,借此产生至少两个化学计量DNA片段;e.使所述DNA片段变性;f.将所述DNA片段退火,其中至少一种DNA片段包含表达盒和可以分子内退火的单链DNA悬突并借此在所述DNA片段的两端产生发夹反向重复序列;g.向所述釜添加至少一种核酸外切酶,借此消化除步骤f所产生的包含表达盒的发夹结构末端片段外,步骤f的化学计量DNA片段。在具体的实施方案中,所述釜在本段所述方法的步骤g中包含一定量的与步骤c所提供的质粒相比大致化学计量等价的消化耐受的具有发夹结构末端的DNA分子。
出于说明性目的,在所述方法中列出了方法步骤的顺序。在某些实施方案中,所述方法步骤以如本文所描述的出现顺序进行。在一些实施方案中,可以以不同于如本文所描述的出现顺序实施所述方法步骤。具体地,在一些实施方案中,可以以其出现顺序或以本文所描述的从a至e或从a至g按字母所列的顺序实施制备具有发夹结构末端的DNA分子的方法的步骤。作为另外一种选择,可以不以如本文所描述的出现顺序实施制备具有发夹结构末端的DNA分子的方法的步骤。在一个实施方案中,当宿主细胞天然表达,工程化表达,另外含有一种或多种切口核酸内切酶时,可以在步骤b(从宿主细胞释放质粒)之前实施步骤c(将所述DNA分子与识别4个限制性位点,从而导致产生4个切口的一种或多种切口核酸内切酶一起培育)。在另一个实施方案中,可以在步骤d(变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段)之前或者在步骤c(将所述DNA分子与一种或多种切口核酸内切酶培育)之前实施步骤f(将所述质粒或步骤d所产生的片段与限制性内切酶培育或者将所述质粒或步骤d所产生的片段与一种或多种切口核酸内切酶培育)。另外,可以将一个或多个步骤合并成一个步骤,实施所有单独步骤的动作。在某些实施方案中,当宿主细胞天然表达,工程化表达,另外含有一种或多种切口核酸内切酶时,步骤a(培养宿主细胞)可以与步骤c(将所述DNA分子与一种或多种切口核酸内切酶培育)组合。在其它实施方案中,可以通过与步骤f和c中所列举的切口核酸内切酶或限制性内切酶一起培育将步骤f(将所述质粒或步骤d所产生的片段与限制性内切酶培育或者将所述质粒或步骤d所产生的片段与一种或多种切口核酸内切酶培育)与步骤c(将所述DNA分子与一种或多种切口核酸内切酶培育)组合。因此,本发明公开提供了根据现有技术,可以以不同组合和排列实施的步骤。
可以在所有方法步骤之前,在所述方法步骤之后或者在任何方法步骤之间,将其它步骤添加至本文所提供的方法。在一个实施方案中,本文所提供的方法还包括步骤h.用连接酶修复所述切口以形成环状DNA。在另一个实施方案中,在本文所描述的所有其它方法步骤之后实施用连接酶修复切口以形成环状DNA的步骤h。
如下文5.3.1和5.4节中进一步所描述的,通过切口核酸内切酶的限制性位点之间的悬突性质确定在所述DNA分子末端所形成的发夹结构。因此,根据5.3.1和5.4节,通过设计性质,包括切口核酸内切酶的限制性位点之间的悬突的序列和结构性质,所述方法可以用于产生1、2或更多个发夹结构末端。在一个实施方案中,所述方法产生了包含1个发夹结构末端的具有发夹结构末端的DNA。在另一个实施方案中,所述方法产生了由1个发夹结构末端组成的具有发夹结构末端的DNA。在另一个实施方案中,所述方法产生了包含2个发夹结构末端的具有发夹结构末端的DNA。在其它实施方案中,所述方法产生了由2个发夹结构末端组成的具有发夹结构末端的DNA。
本文所提供的方法可以用于产生包含人工序列、天然DNA序列或具有天然DNA序列和人工序列两者的序列的DNA分子。在一个实施方案中,所述方法产生了包含人工序列的具有发夹结构末端的DNA分子。在另一个实施方案中,所述方法产生了包含天然序列的具有发夹结构末端的DNA分子。在另一个实施方案中,所述方法产生了包含天然序列和人工序列两者的具有发夹结构末端的DNA分子。在某些实施方案中,所述方法产生了包含病毒末端反向重复(ITR)的具有发夹结构末端的DNA分子。在另一个实施方案中,所述方法产生了包含缺少RABS的发夹反向重复序列的具有发夹结构末端的DNA分子。在另一个实施方案中,所述方法产生了包含两个发夹结构末端重复的具有发夹结构末端的DNA分子,其中两个发夹反向重复序列缺少RABS。在另一个实施方案中,所述方法产生了包含两个发夹反向重复序列的具有发夹结构末端的DNA分子,其中两个发夹反向重复序列缺少TRS。在其它实施方案中,所述方法产生了包含两个发夹反向重复序列的具有发夹结构末端的DNA分子,其中两个发夹反向重复序列缺少RABS和TRS。在另一个实施方案中,所述方法产生了包含两个发夹反向重复序列的具有发夹结构末端的DNA分子,其中两个发夹反向重复序列缺少启动子活性(例如,P5启动子活性)和转录活性(例如,转录起始位点[TSS])。在另一个实施方案中,所述方法产生了包含两个发夹反向重复序列的具有发夹结构末端的DNA分子,其中两个发夹反向重复序列缺少RABS、启动子活性(例如,P5启动子活性)、转录活性(例如,转录起始位点[TSS])和TRS。在另一个实施方案中,所述方法产生了包含两个发夹反向重复序列的具有发夹结构末端的DNA分子,其中两个发夹反向重复序列缺少RABS。在其它实施方案中,所述方法产生了包含病毒基因组的具有发夹结构末端的DNA分子。在一些实施方案中,所述病毒基因组是在表达盒中包含一个或多个非病毒基因的工程化病毒基因组。在某些实施方案中,所述病毒基因组是工程化病毒基因组,其中已敲除了一个或多个病毒基因。在一些具体的实施方案中,所述病毒基因组是工程化病毒基因组,其中敲除了复制-相关蛋白(“RAP”,即Rep或NS1)基因、衣壳(Cap)基因或者RAP和Cap基因两者。在其它实施方案中,所述病毒基因组是细小病毒基因组。在其它实施方案中,所述细小病毒是依赖细小病毒、博卡细小病毒、红系细小病毒、原细小病毒或者四细小病毒。
下文更详细地描述了在本文所提供的多种方法中实施的步骤。在5.2.1节中描述了宿主细胞和宿主细胞培养的实施方案;在5.2.2节中描述了从宿主细胞释放DNA分子的步骤的实施方案;在5.2.3节中描述了使DNA分子变性的步骤的实施方案;在5.2.5节中描述了退火步骤的实施方案;在5.2.4节中描述了将DNA分子与切口核酸内切酶或限制性内切酶培育的步骤的实施方案;在5.2.6节中描述了与核酸外切酶培育的步骤的实施方案;和在5.2.7节中描述了连接步骤的实施方案。照此,本发明公开提供了包含本文所描述的步骤的多种实施方案的排列与组合的方法。
5.2.1宿主细胞和宿主细胞的培养
本发明公开提供可以培养多种宿主细胞以扩增所述DNA分子的方法。用于本文所提供的方法的宿主细胞可以是真核宿主细胞、原核宿主细胞或者任何能够复制或扩增重组DNA分子的可转化的生物。在一些实施方案中,所述宿主细胞可以是微生物宿主细胞。在其它实施方案中,所述宿主细胞可以是宿主微生物细胞,其选自细菌、酵母、真菌或适用于复制或扩增DNA分子的任何多种其它微生物细胞。细菌宿主细胞可以是选自下列的任何物种的细胞:大肠杆菌(Escherichia coli)、产酸克雷伯氏菌(Klebsiella oxytoca)、产琥珀酸厌氧螺菌(Anaerobiospirillum succiniciproducens)、产琥珀酸放线杆菌(Actinobacillus succinogenes)、产琥珀酸曼海姆氏菌(Mannheimiasucciniciproducens)、菜豆根瘤菌(Rhizobium etli)、枯草芽孢杆菌(Bacillussubtilis)、乳发酵短杆菌(Corynebacterium glutamicum)、氧化葡糖杆菌(Gluconobacteroxydans)、运动发酵单胞菌(Zymomonas mobilis)、乳酸乳球菌(Lactococcus lactis)、植物乳杆菌(Lactobacillus plantarum)、天蓝色链霉菌(Streptomyces coelicolor)、丙酮丁醇梭菌(Clostridium acetobutylicum)、荧光假单胞菌(Pseudomonas fluorescens)和恶臭假单胞菌(Pseudomonas putida)。酵母或真菌宿主细胞可以是选自下列的任何物种的细胞:酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomycespombe)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromycesmarxianus)、土曲霉(Aspergillus terreus)、黑曲霉(Aspergillus niger)、巴斯德毕赤氏酵母(Pichia pastoris)、少根根霉(Rhizopus arrhizus)、米根霉(Rhizobus oryzae)等。大肠杆菌(E.coli)是特别有用的宿主细胞,因为它是充分表征的微生物细胞并且广泛应用于分子克隆。其它特别有用的宿主细胞包括酵母,如酿酒酵母(Saccharomycescerevisiae)。应理解任何本领域中已知且适合的微生物宿主细胞均可以用于扩增DNA分子。
类似地,用于本文所提供的方法的真核宿主细胞可以是能够复制或扩增重组DNA分子的任何本领域已知并使用的真核细胞。在一些实施方案中,用于本文所提供的方法的宿主细胞可以是哺乳动物宿主细胞。在其它实施方案中,宿主细胞可以是人或非人哺乳动物宿主细胞。在其它实施方案中,宿主细胞可以是昆虫宿主细胞。一些广泛使用的非人哺乳动物宿主细胞包括CHO、小鼠骨髓瘤细胞系(例如,NS0、SP2/0)、大鼠骨髓瘤细胞系(例如,YB2/0)和BHK。一些广泛使用的人宿主细胞包括HEK293及其衍生物、HT-1080、PER.C6和Huh-7。在某些实施方案中,所述宿主细胞选自HeLa、NIH3T3、Jurkat、HEK293、COS、CHO、Saos、SF9、SF21、High 5、NS0、SP2/0、PC12、YB2/0、BHK、HT-1080、PER.C6和Huh-7。
可以培养宿主细胞,如在本领域中已知并培养的各种宿主细胞。如在本领域中已知并实践的,不同宿主细胞的培养条件和培养基可以是不同的。例如,可以在37℃,以多至300rpm的搅拌速度并且在进行或不进行强制通气的情况下培养细菌或其它微生物宿主细胞。最优地,一般可以在25至30℃,在不搅拌或以多至150rpm的搅拌速度搅拌并且进行或不进行强制通气的情况下,培养一些昆虫宿主细胞。最优地,可以在37℃,在不搅拌或以多至150rpm的搅拌速度搅拌并且进行或不进行强制通气的情况下,培养一些哺乳动物宿主细胞。另外,如本领域中已知并实践的方式,可以通过检验宿主细胞在多种条件下的生长曲线来确定培养多种宿主细胞的条件。一些广泛使用的宿主细胞培养基和培养条件描述于Molecular Cloning:A Laboratory Manual,第4版,by Michael Green and JosephSambrook,ISBN 978-1-936113-42-2(2012),该文献以其全部内容作为参考并入本文。
5.2.2从宿主细胞释放DNA分子
可以通过如本领域中已知并实践的多种方法从宿主细胞释放DNA分子。例如,可以通过物理、机械、酶促、化学或者通过物理、机械、酶促和化学作用的组合破碎宿主细胞来释放DNA分子。在一些实施方案中,可以通过使所述细胞经受细胞胞溶试剂溶液来从所述宿主细胞释放DNA分子。细胞胞溶试剂包括去污剂,如triton、SDS、吐温、NP-40和/或CHAPS。在其它实施方案中,可以通过使宿主细胞经受渗透性差,例如,使所述宿主细胞经受低渗溶液来从宿主细胞释放DNA分子。在其它实施方案中,可以通过使所述宿主细胞经受高或低pH溶液来从所述宿主细胞释放DNA分子。在某些实施方案中,可以通过使所述宿主细胞经受酶处理,例如,溶菌酶处理来从所述宿主细胞释放DNA分子。在一些其它实施方案中,可以通过使宿主细胞经受去污剂、渗透压、高或低pH和/或酶(例如,溶菌酶)的任意组合来从所述宿主细胞释放DNA分子。
作为另外一种选择,可以通过对宿主细胞施加物理作用力来从所述宿主细胞释放DNA分子。在一个实施方案中,通过对宿主细胞直接施加作用力,例如,通过使用韦林搅拌器和Polytron来从所述宿主细胞释放DNA分子。韦林搅拌器使用高速转动叶片破碎细胞,并且Polytron将组织吸入含有转动叶片的长轴。在另一个实施方案中,可以通过对宿主细胞施加剪切应力或剪切力来从所述宿主细胞释放DNA分子。多种均质机可以用于迫使宿主细胞通过狭窄空间,借此剪切细胞膜。在一些实施方案中,可以通过基于液体的均质作用从所述宿主细胞释放DNA分子。在一个具体实施方案中,可以通过使用Dounce均质机来从所述宿主细胞释放DNA分子。在一个具体实施方案中,可以通过使用Potter-Elvehjem均质机来从所述宿主细胞释放DNA分子。在另一个具体实施方案中,可以通过使用法式压碎器从所述宿主细胞释放DNA分子。从宿主细胞释放DNA分子的其它物理作用力包括手动研磨,例如,使用研钵及研杵。在手动研磨中,通常将宿主细胞冷冻,例如,在液氮中冷冻,然后使用研钵及研杵挤压,在此期间细胞壁的纤维素及其它多糖的拉伸强度可破碎宿主细胞。
另外,可以通过使所述细胞经受冻融循环来从所述宿主细胞释放DNA分子。在一些实施方案中,冷冻宿主细胞混悬液,然后融化部分该等冻融循环。在一些实施方案中,可以通过向宿主细胞施加1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20次冻融循环来从所述宿主细胞释放DNA分子。
用于从宿主细胞释放DNA分子的上述方法互不排斥。因此,本发明公开提供可以通过在本5.2.2节中所提供的DNA释放方法的任意组合从所述宿主细胞释放DNA分子的方法。
5.2.3使DNA分子变性
可以通过如本领域中已知并实践的多种方法使DNA分子变性。使DNA分子变性的步骤可以将DNA分子从双链DNA(dsDNA)分离为单链DNA(ssDNA)。在分离两条DNA链时,可以提高温度直至DNA解开并且将两条链保持在一起的氢键减弱并最终断裂。双链DNA断裂为单链的过程被称为DNA变性(DNA denaturation或DNA denaturing)。
在一些实施方案中,使DNA分子变性的步骤可以将dsDNA分子的一个或多个节段的两条DNA链分开,同时将所述DNA分子的其它节段保持为dsDNA。在一些实施方案中,使DNA分子变性的步骤可以将dsDNA分子的一个或多个节段的所有DNA链分成ssDNA链。在一些其它实施方案中,使DNA分子变性的步骤可以在DNA(例如,5.3节中所述的DNA分子)的顶部和底部链上在切口核酸内切酶的第一和第二限制性位点之间的节段处将dsDNA分成ssDNA,同时将DNA分子的其它部分保持为dsDNA,借此在第一和第二限制性位点之间产生悬突。在某些实施方案中,使DNA分子变性的步骤可以在DNA(例如,5.3节中所述的DNA分子)的顶部和底部链上在切口核酸内切酶的第三和第四限制性位点之间的节段处将dsDNA分成ssDNA,同时将DNA分子的其它部分保持为dsDNA,借此在第三和第四限制性位点之间产生悬突。在其它实施方案中,使DNA分子变性的步骤可以在DNA(例如,5.3节中所述的DNA分子)的顶部和底部链上在切口核酸内切酶的第一和第二限制性位点之间以及第三和第四限制性位点之间的节段处将dsDNA分成ssDNA,同时将DNA分子的其它部分保持为dsDNA,借此(1)使所述DNA分子断裂成两个子代DNA分子和(2)在所述第一和第二限制性位点之间产生悬突并且在第三和第四限制性位点之间产生悬突。在一个实施方案中,切口核酸内切酶的第一和第二限制性位点之间的悬突可以是顶部链5'悬突。在另一个实施方案中,切口核酸内切酶的第一和第二限制性位点之间的悬突可以是底部链3'悬突。在另一个实施方案中,切口核酸内切酶的第三和第四限制性位点之间的悬突可以是顶部链3'悬突。在其它实施方案中,切口核酸内切酶的第三和第四限制性位点之间的悬突可以是底部链5'悬突。在一些实施方案中,使DNA分子变性的步骤可以以本文所提供的实施方案的任意组合分离所述DNA分子。
基于切口核酸内切酶的限制性位点之间的距离,所述悬突的长度可以是不同的。在一个实施方案中,悬突的长度和/或序列可以是相同的。在另一个实施方案中,悬突的长度和/或序列可以是不同的。在一些实施方案中,顶部链5'悬突可以是至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29、至少30、至少31、至少32、至少33、至少34、至少35、至少36、至少37、至少38、至少39、至少40、至少41、至少42、至少43、至少44、至少45、至少46、至少47、至少48、至少49、至少50、至少51、至少52、至少53、至少54、至少55、至少56、至少57、至少58、至少59、至少60、至少61、至少62、至少63、至少64、至少65、至少66、至少67、至少68、至少69、至少70、至少71、至少72、至少73、至少74、至少75、至少76、至少77、至少78、至少79、至少80、至少81、至少82、至少83、至少84、至少85、至少86、至少87、至少88、至少89、至少90、至少91、至少92、至少93、至少94、至少95、至少96、至少97、至少98、至少99或至少100个核苷酸长。在其它实施方案中,顶部链5'悬突可以为约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约51、约52、约53、约54、约55、约56、约57、约58、约59、约60、约61、约62、约63、约64、约65、约66、约67、约68、约69、约70、约71、约72、约73、约74、约75、约76、约77、约78、约79、约80、约81、约82、约83、约84、约85、约86、约87、约88、约89、约90、约91、约92、约93、约94、约95、约96、约97、约98、约99、约100或更多个核苷酸长。在某些实施方案中,底部链3'悬突可以是至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29、至少30、至少31、至少32、至少33、至少34、至少35、至少36、至少37、至少38、至少39、至少40、至少41、至少42、至少43、至少44、至少45、至少46、至少47、至少48、至少49、至少50、至少51、至少52、至少53、至少54、至少55、至少56、至少57、至少58、至少59、至少60、至少61、至少62、至少63、至少64、至少65、至少66、至少67、至少68、至少69、至少70、至少71、至少72、至少73、至少74、至少75、至少76、至少77、至少78、至少79、至少80、至少81、至少82、至少83、至少84、至少85、至少86、至少87、至少88、至少89、至少90、至少91、至少92、至少93、至少94、至少95、至少96、至少97、至少98、至少99或至少100个核苷酸长。在其它实施方案中,底部链3'悬突可以为约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约51、约52、约53、约54、约55、约56、约57、约58、约59、约60、约61、约62、约63、约64、约65、约66、约67、约68、约69、约70、约71、约72、约73、约74、约75、约76、约77、约78、约79、约80、约81、约82、约83、约84、约85、约86、约87、约88、约89、约90、约91、约92、约93、约94、约95、约96、约97、约98、约99、约100或更多个核苷酸长。在其它实施方案中,顶部链3'悬突可以为至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29、至少30、至少31、至少32、至少33、至少34、至少35、至少36、至少37、至少38、至少39、至少40、至少41、至少42、至少43、至少44、至少45、至少46、至少47、至少48、至少49、至少50、至少51、至少52、至少53、至少54、至少55、至少56、至少57、至少58、至少59、至少60、至少61、至少62、至少63、至少64、至少65、至少66、至少67、至少68、至少69、至少70、至少71、至少72、至少73、至少74、至少75、至少76、至少77、至少78、至少79、至少80、至少81、至少82、至少83、至少84、至少85、至少86、至少87、至少88、至少89、至少90、至少91、至少92、至少93、至少94、至少95、至少96、至少97、至少98、至少99或至少100个核苷酸长。在其它实施方案中,顶部链3'悬突可以为约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约51、约52、约53、约54、约55、约56、约57、约58、约59、约60、约61、约62、约63、约64、约65、约66、约67、约68、约69、约70、约71、约72、约73、约74、约75、约76、约77、约78、约79、约80、约81、约82、约83、约84、约85、约86、约87、约88、约89、约90、约91、约92、约93、约94、约95、约96、约97、约98、约99、约100或更多个核苷酸长。在一些实施方案中,底部链5'悬突可以为至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29、至少30、至少31、至少32、至少33、至少34、至少35、至少36、至少37、至少38、至少39、至少40、至少41、至少42、至少43、至少44、至少45、至少46、至少47、至少48、至少49、至少50、至少51、至少52、至少53、至少54、至少55、至少56、至少57、至少58、至少59、至少60、至少61、至少62、至少63、至少64、至少65、至少66、至少67、至少68、至少69、至少70、至少71、至少72、至少73、至少74、至少75、至少76、至少77、至少78、至少79、至少80、至少81、至少82、至少83、至少84、至少85、至少86、至少87、至少88、至少89、至少90、至少91、至少92、至少93、至少94、至少95、至少96、至少97、至少98、至少99或至少100个核苷酸长。在其它实施方案中,底部链5'悬突可以为约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约51、约52、约53、约54、约55、约56、约57、约58、约59、约60、约61、约62、约63、约64、约65、约66、约67、约68、约69、约70、约71、约72、约73、约74、约75、约76、约77、约78、约79、约80、约81、约82、约83、约84、约85、约86、约87、约88、约89、约90、约91、约92、约93、约94、约95、约96、约97、约98、约99、约100或更多个核苷酸长。
如本领域中已知并实践的,可以通过热、通过改变DNA分子环境中的pH、通过提高盐浓度或者通过这些及其它已知方式的任意组合使所述DNA分子变性。本发明公开提供可以通过使用在DNA的顶部和底部链上的第一和第二限制性位点之间和/或第三和第四限制性位点之间的节段处,将dsDNA选择性分离成ssDNA,同时将所述DNA分子的其它部分保持为dsDNA的变性条件的方法使所述DNA分子变性。在一些实施方案中,所述变性将dsDNA完全分离成ssDNA。可以通过控制变性条件和/或控制所述DNA分子经受所述变性条件的时间来实施将dsDNA分离成ssDNA的这种选择性分离。在一个实施方案中,所述DNA分子在以下温度下变性:至少70℃、至少71℃、至少72℃、至少73℃、至少74℃、至少75℃、至少76℃、至少77℃、至少78℃、至少79℃、至少80℃、至少81℃、至少82℃、至少83℃、至少84℃、至少85℃、至少86℃、至少87℃、至少88℃、至少89℃、至少90℃、至少91℃、至少92℃、至少93℃、至少94℃或至少95℃。在另一个实施方案中,所述DNA分子在以下温度下变性:约70℃、约71℃、约72℃、约73℃、约74℃、约75℃、约76℃、约77℃、约78℃、约79℃、约80℃、约81℃、约82℃、约83℃、约84℃、约85℃、约86℃、约87℃、约88℃、约89℃、约90℃、约91℃、约92℃、约93℃、约94℃或约95℃。在一个具体实施方案中,所述DNA分子在约90℃的温度下变性。
除了通过热变性外,可以通过添加多种化学试剂,如胍、甲酰胺、水杨酸钠、二甲基亚砜、丙二醇和脲使部分或全部本文所提供的DNA分子经历变性过程。这些化学变性剂通过与先前存在的含氮碱基对竞争氢键供体和受体降低解链温度并且允许等温变性。在一些实施方案中,化学试剂能够在室温下诱导变性。在一些具体的实施方案中,碱性试剂(例如,NaOH)可以用于通过改变pH和除去给质子氢键来使DNA变性。在其它实施方案中,本文所提供的使DNA分子化学变性的方法可以是与热诱导变性相比,对于DNA稳定性而言更加温和的程序。在其它实施方案中,本文所提供的使DNA分子化学变性和复性(例如,改变pH)的方法可以比加热法速度更快。在一些实施方案中,可以在细菌中使本发明公开的DNA复制并切口,并且在从细菌释放(例如,碱溶胞步骤)期间同时变性。
在一个实施方案中,所述DNA分子在以下pH变性:至少10、至少10.1、至少10.2、至少10.3、至少10.4、至少10.5、至少10.6、至少10.7、至少10.8、至少10.9、至少11、至少11.1、至少11.2、至少11.3、至少11.4、至少11.5、至少11.6、至少11.7、至少11.8、至少11.9、至少12、至少12.1、至少12.2、至少12.3、至少12.4、至少12.5、至少13、至少13.5或至少14。在另一个实施方案中,所述DNA分子在以下pH下变性:约10、约10.1、约10.2、约10.3、约10.4、约10.5、约10.6、约10.7、约10.8、约10.9、约11、约11.1、约11.2、约11.3、约11.4、约11.5、约11.6、约11.7、约11.8、约11.9、约12、约12.1、约12.2、约12.3、约12.4、约12.5、约13、约13.5或约14。在另一个实施方案中,所述DNA分子在以下盐浓度变性:至少1M、至少1.5M、至少2M、至少2.5M、至少3M、至少3.5M或至少4M的盐。在其它实施方案中,所述DNA分子在以下盐浓度变性:约1M、约1.5M、约2M、约2.5M、约3M、约3.5M或约4M的盐。在某些实施方案中,使所述DNA分子经受变性条件至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19或至少20分钟。在其它实施方案中,使所述DNA分子经受变性条件约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19或约20分钟。在一些实施方案中,可以通过如本文所提供的变性条件和变性持续时间的任意组合使所述DNA分子变性。
可以确定使DNA分子在DNA的顶部和底部链上的第一和第二限制性位点之间和第三和第四限制性位点之间的节段选择性变性,同时将所述DNA分子的其它部分保持为dsDNA的方法步骤的变性条件。可以根据要选择性变性的DNA节段的性质确定这些选择性变性条件。DNA双螺旋的稳定性与DNA节段的长度以及G/C含量百分比相关。本发明公开提供可以通过要选择性变性的DNA节段序列或所得的悬突序列确定选择性变性条件。例如,对于要选择性变性的DNA序列,选择性变性温度可以大致确定为Tm=2℃×A-T对个数+4℃×G-C对个数。其它更准确的计算Tm的方法也未本领域已知并使用,例如,如Freier SM等人,ProcNatl Acad Sci,83,9373-9377(1986);Breslauer KJ等人,Proc Natl Acad Sci,83,3746-3750(1986);Panjkovich,A.and Melo,F.Bioinformatics 21:711-722(2005);Panjkovich,A等人,Nucleic Acids Res 33:W570-W572(2005)中所述,所有参考文献以其全部内容作为参考并入本文。
所述悬突可以包括多种DNA序列。在一个实施方案中,所述悬突包括反向重复序列或其片段(例如、至少50%、60%、70%、75%、80%、85%、90%、95%或99%的反向重复序列)。在另一个实施方案中,所述悬突包括病毒反向重复序列或其片段(例如,至少50%、60%、70%、75%、80%、85%、90%、95%或99%的病毒反向重复序列)。在另一个实施方案中,所述悬突包括5.3.1、5.3.2、5.3.3和5.4节中所述的序列的任何实施方案或由其组成。在其它实施方案中,所述悬突包括5.3.1和5.4节中所述的序列中的任一种或者由其组成。在一些实施方案中,所述悬突不包括如5.3.4节所述的一条或多条病毒复制相关序列(例如,RABS、RBE或TRS)。在一些实施方案中,所述悬突不包括如5.3.4节所述的一条或多条转录活性相关序列(例如,TSSs或CpG基序)。
5.2.4将DNA分子与一种或多种切口核酸内切酶或限制性内切酶培育
本发明公开提供了用于将DNA分子与如3和5.2节所述的一种或多种切口核酸内切酶或限制性内切酶培育的一种或多种方法步骤。不受理论束缚,切口核酸内切酶识别DNA分子中的切口核酸内切酶的限制性位点并且仅在位于切口核酸内切酶的限制性位点内部或外部的位点上的dsDNA的一条链上切割(例如,水解单一DNA链的磷酸二酯键),借此在dsDNA中产生切口。另一方面,限制性内切酶识别限制性内切酶的限制性位点并且切割dsDNA的两条链,借此在特异性限制性位点处或附近切割DNA分子。
在本文所提供的组合物和方法的多种实施方案中,切口核酸内切酶可以是甲基化-依赖性的、甲基化-敏感的或者甲基化-不敏感的。本文提供了在本领域中已知并实践的多种切口核酸内切酶。在一些实施方案中,本文所提供的组合物和方法的切口核酸内切酶可以是非5-甲基胞嘧啶依赖的天然存在的切口核酸内切酶,其包括Nb.Bsml、Nb.BbvCI、Nb.BsrDI、Nb.Btsl、Nt.BbvCI、Nt.Alwl、Nt.CviPII、Nt.BsmAI、Nt.Alwl和Nt.BstNBI。还可以利用IIs型限制性内切酶(例如,Alwl、BpulOI、BbvCI、Bsal、BsmBI、BsmAI、Bsml、BspOJ、Mlyl、Mval269l和Sapl等)将本文所提供的组合物和方法的切口核酸内切酶工程化,制备切口核酸内切酶的方法可见于以下参考文献,例如,US 7,081,358;US 7,011,966;US 7,943,303;US 7,820,424、WO201804514,以上所有专利以其全部内容作为参考并入本文。
作为另外一种选择,可编程切口酶可以代替切口核酸内切酶用于本文所提供的组合物和方法。这种可编程切口酶包括(例如)Cas9或其功能等价形式(如激烈热球菌(Pyrococcus furiosus Argonaute)(PfAgo)或者Cpfl)。Cas9含有两个催化域,RuvC和HNH。使那些结构域其中之一失活将产生可以替代切口核酸内切酶用于本文所提供的方法和组合物的可编程切口酶。在Cas9中,可以通过在位置D10处进行氨基酸替换(例如,D10A)使RuvC结构域失活,并且可以通过在位置H840处(例如,H840A)或者对应于其它Cas9等价蛋白中的此类氨基酸的位置处进行氨基酸替换使HNH结构域失活。这种可编程切口酶还可以是Argonaute或II型CRISPR/Cas核酸内切酶,其包括两种组分:切割靶标DNA的切口酶(例如,D10A Cas9切口酶或其变体或直系同源物)和向导核酸,例如,将所述切口酶靶向或编程至靶标DNA中特异位点的向导DNA或RNA(gDNA或gRNA)(参见,例如,Hsu等人,NatureBiotechnology 2013 31:827-832,以上文献以其全部内容作为参考并入本文)。还可以通过以下方式制备可编程切口酶:将位点特异性DNA结合结构域(靶向域),如DNA结合蛋白的DNA结合结构域(例如,限制性核酸内切酶、转录因子、在非随机位置结合至DNA的蛋白中的锌-指或另一种结构域)与切口核酸内切酶融合,从而其作用于特异性、非随机位点。根据以上内容可见,从切口酶内或融合至切口酶的靶向域或者从将切口酶引导至特异性、非随机位点(可以通过改变所述靶向域或向导分子对所述位点编程)的向导分子(gDNA或gRNA)产生通过可编程切口酶的可编程切割。这些可编程切口酶可见于以下参考文献,例如,US 7,081,358和WO2010021692A,以上专利以其全部内容作为参考并入本文。
适合的向导核酸(例如,gDNA或gRNA)序列和适合于向导核酸的靶标位点是本领域中已知且广泛使用的。向导核酸(例如,gDNA或gRNA)是识别感兴趣的靶标DNA区域并且将可编程切口酶(例如,Cas核酸酶)引导至该区域用于编辑的特异性核酸(例如,gDNA或gRNA)序列。向导核酸(例如,gDNA或gRNA)通常由两个部分组成:靶标核酸,与靶标DNA互补的15-20个核苷酸序列,和支架核酸,其用作可编程切口酶(例如,Cas核酸酶)的结合支架。适合于向导核酸的靶标位点必须具有两个组分:与可编程切口酶中靶标核酸互补的序列,和相邻的前间区序列邻近基序(PAM)。PAM用作可编程切口酶(例如,Cas核酸酶)的结合信号。多种PAM是在本领域中已知、鉴定并且使用的,例如,如以下中所讨论的:Daniel Gleditzsch等人,RNA Biol.16(4):504–517(2019年4月);Ryan T.Leenay等人,Mol Cell.62(1):137–147(2016年4月7日),以上两篇文献以其全部内容作为参考并入本文。靶向AAV2 ITR的一级茎序列的示例性gRNA和gDNA序列包括表1中所列内容。
表1:示例性切口核酸内切酶以及它们相应的限制性位点
本领域中已知并使用的多种切口核酸内切酶可以用于本文所提供的方法。用于所述方法的切口核酸内切酶的实施方案提供的切口核酸内切酶和一些切口核酸内切酶的相应限制性位点的示例性列表描述于限制性内切酶数据库(Restriction Enzyme Database,在本领域中已知为REBASE),其在www.rebase.neb.com/cgi-bin/azlist?nick可用并且以其全部内容作为参考并入本文。在一个实施方案中,识别第一、第二、第三和/或第四限制性位点的切口核酸内切酶全部针对相同切口核酸内切酶的靶标序列。在另一个实施方案中,切口核酸内切酶的第一、第二、第三和第四限制性位点是两种不同的切口核酸内切酶的靶标序列,包括布置两种不同的切口核酸内切酶靶标序列的4个位点的所有可能组合(例如,第一切口核酸内切酶的第一限制性位点和第二切口核酸内切酶的其余位点、第一切口核酸内切酶的第一和第二限制性位点和第二切口核酸内切酶的其余位点等)。在另一个实施方案中,切口核酸内切酶的第一、第二、第三和第四限制性位点是3种不同的切口核酸内切酶的靶标序列,包括布置3种不同的核酸内切酶靶标序列的4个位点的所有可能组合。在其它实施方案中,切口核酸内切酶的第一、第二、第三和第四限制性位点是4种不同的切口核酸内切酶的靶标序列。在一些实施方案中,所述切口核酸内切酶可以是选自表2中所列内容中的任一种。
表2:示例性切口核酸内切酶以及它们相应的限制性位点:
多种切口核酸内切酶切割dsDNA的一条链的条件对于本文所提供的多种切口核酸内切酶是已知的,包括温度、盐浓度、pH、缓冲剂、特定去污剂的存在或不存在和实现所期望的切口DNA分子的百分比的培育持续时间。可在多个切口核酸内切酶厂家的网站或产品目录中得知该等条件,例如,New England BioLabs。本发明公开提供根据如本领域中已知并实践的培育条件实施将DNA分子与一种或多种切口核酸内切酶培育的步骤。在一些实施方案中,将DNA分子与一种或多种切口核酸内切酶培育的步骤根据本领域中已知的方法优化的培育条件而得。
在本领域中已知并使用的多种限制性内切酶可以用于本文所提供的方法。用于所述方法的限制性内切酶的实施方案提供的限制性内切酶和限制性内切酶的相应限制性位点的示例性列表见New England Biolabs的产品目录,其在neb.com/products/restriction-endonucleases可得并且以其全部内容作为参考并入本文。多种限制性内切酶切割dsDNA的条件对于本文所提供的多种限制性内切酶是已知的,包括温度、盐浓度、pH、缓冲剂、特定去污剂的存在或不存在和实现所期望的切口DNA分子的百分比的培育持续时间。可在多个限制性内切酶厂家的网站或产品目录中得知该等条件,例如,New EnglandBioLabs。本发明公开提供根据如本领域中已知并实践的培育条件实施将DNA分子与限制性内切酶培育的步骤。
5.2.5退火
实施本文所提供的方法中的退火步骤以使ssDNA悬突分子内选择性退火并借此在通过如上所述的变性步骤(5.2.3节)所产生的DNA片段(例如,来自5.3和5.4节)的一端产生具有发夹结构的反向重复序列。在某些实施方案中,实施本文所提供的方法中的退火步骤以使ssDNA悬突分子内选择性退火并借此在通过如上所述的变性步骤(5.2.3节)所产生的DNA片段(例如,来自5.3和5.4节)的两端产生具有发夹结构的反向重复序列。不受理论束缚或另外不受理论限制,由于ssDNA悬突内的分子内互补序列使得ssDNA悬突的分子内退火在热力学和/或动力学上相对于ssDNA悬突的分子间退火有利,因此实现了ssDNA悬突的这种选择性分子内退火。
不受理论束缚或另外不受理论限制,已认识到悬突的特定长度和/或序列可以使ssDNA悬突的分子内退火在热力学和/或动力学上相对于ssDNA悬突的分子间退火有利。例如,在图2A-C中展示了显示悬突内分子内作用力和链之间的分子间作用力的直链相互作用图以及所得结构。通过焓(ΔH)和熵(ΔS)以及其它因素确定ssDNA悬突退火的热力学和动力学。本发明人认识到由于从游离ssDNA悬突到分子内退火悬突的移动自由度损失小于从游离ssDNA悬突到分子间退火悬突的移动自由度损失,因此分子内退火的熵损失小于分子内退火中的熵损失。另一方面,由于分子内退火悬突中的互补核苷酸对个数小于分子间退火悬突中的互补核苷酸对个数(因此沃森-克里克和Hoogsteen型氢键较少),因此分子内退火的焓增可以小于分子内退火中的焓增。本发明公开提供具有特定长度、互补核苷酸对个数和G-C和A-T对百分比的ssDNA悬突,从而所述悬突的分子内退火的自由能增加(ΔG=ΔH-TΔS)大于分子间退火,借此使得分子内退火相对于分子间退火在热力学上有利。本发明人进一步认识到由于ssDNA悬突内的核苷酸在分子运动中彼此接触的概率高于接触另一个ssDNA悬突的核苷酸的概率,因此ssDNA悬突的分子内退火的动力学可以高于分子间退火。本发明公开提供即使分子内退火相对于分子间退火在热力学上不利,但是ssDNA悬突的分子内退火的优良动力学仍可以相对于分子间退火悬突导致形成分子内退火悬突。
可以在多种温度实施退火步骤以使分子内退火相对于分子间退火有利。在一个实施方案中,ssDNA悬突在以下温度退火:至少15℃、至少16℃、至少17℃、至少18℃、至少19℃、至少20℃、至少21℃、至少22℃、至少23℃、至少24℃、至少25℃、至少26℃、至少27℃、至少28℃、至少29℃、至少30℃、至少31℃、至少32℃、至少33℃、至少34℃、至少35℃、至少36℃、至少37℃、至少38℃、至少39℃、至少40℃、至少41℃、至少42℃、至少43℃、至少44℃、至少45℃、至少46℃、至少47℃、至少48℃、至少49℃、至少50℃、至少51℃、至少52℃、至少53℃、至少54℃、至少55℃、至少56℃、至少57℃、至少58℃、至少59℃或至少60℃。在另一个实施方案中,ssDNA悬突在以下温度退火:约15℃、约16℃、约17℃、约18℃、约19℃、约20℃、约21℃、约22℃、约23℃、约24℃、约25℃、约26℃、约27℃、约28℃、约29℃、约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃、约42℃、约43℃、约44℃、约45℃、约46℃、约47℃、约48℃、约49℃、约50℃、约51℃、约52℃、约53℃、约54℃、约55℃、约56℃、约57℃、约58℃、约59℃或约60℃。在一个具体实施方案中,ssDNA悬突在至少25℃的温度退火。在另一个具体的实施方案中,ssDNA悬突在约25℃的温度退火。在另一个具体实施方案中,ssDNA悬突在室温下退火。
另外,可以将退火步骤实施多个持续时间以使分子内退火相对于分子间退火有利。在某些实施方案中,ssDNA悬突退火至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29、至少30、至少31、至少32、至少33、至少34、至少35、至少36、至少37、至少38、至少39或至少40分钟。在其它实施方案中,ssDNA悬突退火约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39或约40分钟。在一个具体实施方案中,ssDNA悬突退火至少20分钟。在另一个具体的实施方案中,ssDNA悬突退火约20分钟。
在一些实施方案中,可以通过将温度降低至所计算的有义和反义序列对的解链温度以下来实现退火。解链温度取决于具体的核苷酸碱基含量和正在使用的溶液的特征,例如,盐浓度。如本领域中已知并实践的,任何给定序列和溶液组合的解链温度是易于计算的。
在一些实施方案中,可以通过降低变性化学试剂的量以允许有义和反义序列对之间相互作用来完成等温退火。DNA序列变性所需的变性化学试剂的最小浓度可以取决于具体的核苷酸碱基含量和正在使用的溶液的特征,例如,温度或盐浓度。如本领域中已知并实践的,任何给定序列和溶液组合不导致变性的化学变性剂的浓度是易于识别的。如本领域中已知并实践的,化学变性剂的浓度同样易于改变。例如,可以通过透析或切向流过滤降低脲的量或者可以通过加入酸或碱来改变pH。
分子内退火的退火温度和退火持续时间与ssDNA悬突的长度、互补核苷酸对数目和G-C和A-T对的百分比,以及ssDNA悬突的序列(互补核苷酸对的布置)相关。在某些实施方案中,本文所提供的方法所提供的ssDNA悬突的长度包含如5.2.3节所述的任何数目的核苷酸。在某些实施方案中,本文所提供的方法所提供的ssDNA悬突包含至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29、至少30、至少31、至少32、至少33、至少34、至少35、至少36、至少37、至少38、至少39、至少40、至少41、至少42、至少43、至少44、至少45、至少46、至少47、至少48、至少49或至少50个分子内互补核苷酸对。在一些实施方案中,本文所提供的方法所提供的ssDNA悬突包含约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49或约50个分子内互补核苷酸对。在一些实施方案中,本文所提供的方法所提供的ssDNA悬突在分子内互补核苷酸对中包含至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%或至少90%的G-C对。在某些实施方案中,本文所提供的方法所提供的ssDNA悬突在分子内互补核苷酸对中包含约50%、约51%、约52%、约53%、约54%、约55%、约56%、约57%、约58%、约59%、约60%、约61%、约62%、约63%、约64%、约65%、约66%、约67%、约68%、约69%、约70%、约71%、约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%或约90%的G-C对。
另外,发明人认识到与悬突浓度相关的DNA分子的浓度可以影响悬突的分子内退火和分子间退火的平衡和动力学。不受理论束缚或其他限制,当悬突浓度过高时,悬突中分子间接触的概率提高,并且分子间接触的动力学优势相对于如以上所讨论的在低浓度观察到的分子内接触有所降低。
如以上所讨论的,在一些实施方案中,分子内相互作用可以以较快的速率发生,而分子间相互作用以较慢的速率发生。在一些实施方案中,涉及3个或更多个分子(例如,3条不同的链)的碱基对相互作用以最慢的速率发生。在一些实施方案中,分子内相互作用相对于分子间相互作用的动力学速率取决于每种分子的浓度。在一些实施方案中,当DNA链浓度较低时,分子内相互作用在动力学角度而言更快,或者分子内作用力较大。
单个观察,形成IR或ITR的每个互补结构域的绝对自由能可以是不同的,从而导致在链从变性状态向退火状况转变时,产生可以较早局部折叠的IR或ITR区。局部折叠结构域的存在(例如,如本节(5.3.1节)和5.4节中其它处所述的,如AAV2ITR中与之相同的中央发夹或支链发夹)可以减少与其它链配对可用的碱基的量,并因此可以降低分子间退火或杂交的可能性,并且将分子间退火过程中的平衡态转变为分子内退火或ITR形成过程中的平衡态。
因此,本发明公开提供了可以在多种浓度实施退火步骤以使分子内退火相对于分子间退火有利。在一些实施方案中,对于DNA分子,ssDNA悬突在以下浓度退火:不大于1、不大于2、不大于3、不大于4、不大于5、不大于6、不大于7、不大于8、不大于9、不大于10、不大于11、不大于12、不大于13、不大于14、不大于15、不大于16、不大于17、不大于18、不大于19、不大于20、不大于21、不大于22、不大于23、不大于24、不大于25、不大于26、不大于27、不大于28、不大于29、不大于30、不大于31、不大于32、不大于33、不大于34、不大于35、不大于36、不大于37、不大于38、不大于39、不大于40、不大于41、不大于42、不大于43、不大于44、不大于45、不大于46、不大于47、不大于48、不大于49、不大于50、不大于55、不大于60、不大于65、不大于70、不大于75、不大于80、不大于85、不大于90、不大于95、不大于100、不大于110、不大于120、不大于130、不大于140、不大于150、不大于160、不大于170、不大于180、不大于190、不大于200、不大于210、不大于220、不大于230、不大于240、不大于250、不大于260、不大于270、不大于280、不大于290、不大于300、不大于325、不大于350、不大于375、不大于400、不大于425、不大于450、不大于475、不大于500、不大于550、不大于600、不大于650、不大于700、不大于750、不大于800、不大于850、不大于900、不大于950、不大于1000ng/μl。在某些实施方案中,对于DNA分子,ssDNA悬突在以下浓度退火:约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95、约100、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约210、约220、约230、约240、约250、约260、约270、约280、约290、约300、约325、约350、约375、约400、约425、约450、约475、约500、约550、约600、约650、约700、约750、约800、约850、约900、约950、约1000ng/μl。
类似地,本发明公开提供了可以在多种摩尔浓度实施退火步骤以使分子内退火相对于分子间退火有利。在一些实施方案中,对于DNA分子,ssDNA悬突在以下浓度退火:不大于1、不大于2、不大于3、不大于4、不大于5、不大于6、不大于7、不大于8、不大于9、不大于10、不大于11、不大于12、不大于13、不大于14、不大于15、不大于16、不大于17、不大于18、不大于19、不大于20、不大于21、不大于22、不大于23、不大于24、不大于25、不大于26、不大于27、不大于28、不大于29、不大于30、不大于31、不大于32、不大于33、不大于34、不大于35、不大于36、不大于37、不大于38、不大于39、不大于40、不大于41、不大于42、不大于43、不大于44、不大于45、不大于46、不大于47、不大于48、不大于49、不大于50、不大于55、不大于60、不大于65、不大于70、不大于75、不大于80、不大于85、不大于90、不大于95、不大于100、不大于110、不大于120、不大于130、不大于140、不大于150、不大于160、不大于170、不大于180、不大于190、不大于200、不大于210、不大于220、不大于230、不大于240、不大于250、不大于260、不大于270、不大于280、不大于290、不大于300、不大于325、不大于350、不大于375、不大于400、不大于425、不大于450、不大于475、不大于500、不大于550、不大于600、不大于650、不大于700、不大于750、不大于800、不大于850、不大于900、不大于950、不大于1000nM。在某些实施方案中,对于DNA分子,ssDNA悬突在以下浓度退火:约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95、约100、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约210、约220、约230、约240、约250、约260、约270、约280、约290、约300、约325、约350、约375、约400、约425、约450、约475、约500、约550、约600、约650、约700、约750、约800、约850、约900、约950、约1000nM。在一些其它实施方案中,ssDNA悬突在以下浓度退火:不大于1、不大于2、不大于3、不大于4、不大于5、不大于6、不大于7、不大于8、不大于9、不大于10、不大于11、不大于12、不大于13、不大于14、不大于15、不大于16、不大于17、不大于18、不大于19、不大于20μM。在其它实施方案中,ssDNA悬突在以下浓度退火:约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20μM。在一个具体实施方案中,对于DNA分子,ssDNA悬突在约10nM的浓度退火。在另一个具体的实施方案中,对于DNA分子,ssDNA悬突在约20nM的浓度退火。在另一个具体实施方案中,对于DNA分子,ssDNA悬突在约30nM的浓度退火。在其它具体实施方案中,对于DNA分子,ssDNA悬突在约40nM的浓度退火。在另一个具体实施方案中,对于DNA分子,ssDNA悬突在约50nM的浓度退火。在另一个具体的实施方案中,对于DNA分子,ssDNA悬突在约60nM的浓度退火。在一个具体实施方案中,对于DNA分子,ssDNA悬突在约10ng/μl的浓度退火。在另一个具体的实施方案中,对于DNA分子,ssDNA悬突在约20ng/μl的浓度退火。在另一个具体实施方案中,对于DNA分子,ssDNA悬突在约30ng/μl的浓度退火。在其它具体实施方案中,对于DNA分子,ssDNA悬突在约40ng/μl的浓度退火。在一个具体实施方案中,对于DNA分子,ssDNA悬突在约50ng/μl的浓度退火。在另一个具体的实施方案中,对于DNA分子,ssDNA悬突在约60ng/μl的浓度退火。在另一个具体实施方案中,对于DNA分子,ssDNA悬突在约70ng/μl的浓度退火。在一个具体实施方案中,对于DNA分子,ssDNA悬突在约80ng/μl的浓度退火。在另一个具体的实施方案中,对于DNA分子,ssDNA悬突在约90ng/μl的浓度退火。在另一个具体实施方案中,对于DNA分子,ssDNA悬突在约100ng/μl的浓度退火。
在一些实施方案中,对于本文所提供的方法所提供的ssDNA悬突包含表3中所列的任何序列。
表3:ssDNA悬突序列和退火后的相应结构。
在一些实施方案中,在2、3、4、5、10或20次变性/复性(例如,如5.2.3节所述的变性和如本节(5.2.5节)所述的重退火)循环后,本文所提供的DNA分子的结构是相同的。可以通过在最小能量处或附近的结构整体来描述DNA结构。在某些实施方案中,在2、3、4、5、10或20次变性/复性循环后,整体DNA结构是相同的。在一个实施方案中,在2、3、4、5、10或20次变性/复性循环后,从本文所提供的ITR或IR所形成的折叠发夹结构是相同的。在另一个实施方案中,在2、3、4、5、10或20次变性/复性循环后,折叠发夹的整体结构是相同的。
5.2.6与核酸外切酶培育
本发明公开提供了与如第3节所述的核酸外切酶培育的步骤。核酸外切酶从DNA分子末端(外切)切割核苷酸。核酸外切酶可以沿5'至3方向、沿3'至5'方向或者沿两个方向切割核苷酸。在某些实施方案中,用于本文所提供的方法的核酸外切酶切割核苷酸且无序列特异性。在一些实施方案中,如第3节所提供的,用于本文所提供的方法的核酸外切酶消化包含通过识别并切割第五和第六限制性位点的一个或多个切口核酸内切酶或者通过切割质粒或质粒片段的限制性内切酶所产生的末端的DNA片段。
在本领域中已知并使用的多种核酸外切酶可以用于本文所提供的方法。用于所述方法的限制性内切酶的实施方案提供的核酸外切酶的示例性列表见New England Biolabs的产品目录,其在neb.com/products/dna-modifying-enzymes-and-cloning-technologies/nucleases可得并且以其全部内容作为参考并入本文。对于本文所提供的多种核酸外切酶,多种核酸外切酶消化DNA分子的条件是已知的,包括温度、盐浓度、pH、缓冲试剂、特定去污剂的存在或不存在和培育持续时间,以实现所期望的消化百分比。可在多个限制性内切酶厂家的网站或产品目录中得知该等条件,例如,New England BioLabs。本发明公开提供根据如本领域中已知并实践的培育条件实施培育DNA分子与限制性内切酶的步骤。
培育核酸外切酶的步骤选择性消化具有一个或多个末端的DNA分子,同时使具有发夹结构末端的DNA分子完整。如根据5.2.5和5.4节的描述可知,具有发夹结构末端的DNA分子包含0、1、2或更多个切口。在一些实施方案中,用于本文所提供的方法的核酸外切酶可以是选择性消化具有一个或多个末端的DNA分子的核酸外切酶,同时使环形ssDNA/dsDNA分子或包含一个或多个切口但无末端的DNA分子结构完整。在一个实施方案中,用于本文所提供的方法的核酸外切酶可以是核酸外切酶V(RecBCD)。在一个实施方案中,用于本文所提供的方法的核酸外切酶可以是核酸外切酶VIII或者截短的核酸外切酶VIII。核酸外切酶V(RecBCD)、核酸外切酶VIII和截短的核酸外切酶VIII包含本段描述的选择性。在某些实施方案中,用于本文所提供的方法的核酸外切酶可以是选择性消化DNA分子的直链部分的核酸外切酶,其从一个或多个切口起始,但是不能进行通过折叠发夹,从而在发夹终止消化并留下ssDNA。在某些实施方案中,用于在一个或多个切口和/或双链断裂起始的核酸外切酶可以是T7核酸外切酶。本领域中使用的和本文所提供的其它适合的核酸外切酶也是已知的,例如,如多个核酸外切酶厂商,包括New England BioLabs的网站或产品目录中所述的。
在一些实施方案中,在核酸外切酶处理后,本发明公开的DNA分子基本不含任何原核主链序列。在一些实施方案中,主链是指非涵盖位于两个ITR之间的表达盒的序列的部分质粒序列。在一些实施方案中,主链是指非涵盖位于两个ITR之间的表达盒的序列的部分载体序列。在一些实施方案中,本发明公开的分离的DNA分子100%不含、99%不含、98%不含、97%不含、96%不含、95%不含、94%不含、93%不含、92%不含、91%不含或者90%不含亲代质粒的原核主链序列。
5.2.7用连接酶修复切口
本发明公开提供了用如第3节所述的连接酶修复切口的任选的步骤。DNA连接酶通过形成一个或多个新的共价键催化DNA分子的两个末端连接。例如,常用的T4 DNA连接酶催化DNA中并列的5'磷酸酯和3'羟基末端之间的磷酸二酯键的形成。通过连接酶催化来连接两个DNA分子的新的共价键的形成被称为“连接”。在某些实施方案中,用于本文所提供的方法的DNA连接酶连接核苷酸且无序列特异性。在一些实施方案中,用于本文所提供的方法的DNA连接酶连接位于第5.4节所述的DNA分子的一个切口处的两个末端,借此修复所述一个切口。在一些实施方案中,用于本文所提供的方法的DNA连接酶连接位于5.4节中所述的DNA分子的两个切口处的两个末端,借此修复两个切口。在一些实施方案中,用于本文所提供的方法的DNA连接酶连接位于5.4节中所述的DNA分子的所有切口处的两个末端,借此修复DNA分子的所有切口。当5.4节所述的DNA分子形成环状DNA时,在5.4节所述的DNA分子的所有切口已被修复。如5.4节所述,在一些实施方案中,5.4节所述的DNA分子包含两个切口。在某些实施方案中,5.4节所述的DNA分子包含两个切口。在其它实施方案中,5.4节所述的DNA分子包含一个切口。在其它实施方案中,5.4节所述的DNA分子包含一个切口。
在一些实施方案中,可以根据如本领域中已知并实践的培育条件实施用连接酶修复切口的步骤。
在本领域中已知并使用的多种连接酶可以用于本文所提供的方法。用于所述方法的连接酶的实施方式提供的连接酶的示例性列表见New England Biolabs的产品目录,其在neb.com/products/dna-modifying-enzymes-and-cloning-technologies/dna-ligases/dna-ligases可得并且以其全部内容作为参考并入本文。对于本文所提供的多种连接酶,多种连接酶消化DNA分子的条件是已知的,包括温度、盐浓度、pH、缓冲试剂、特定去污剂的存在或不存在和培育持续时间,以实现所期望的消化百分比。可在多个限制性内切酶厂家的网站或产品目录中得知该等条件,例如,New England BioLabs。连接条件与要连接的两个DNA末端的运动自由度相关。当可以使两个DNA末端接近或者可以具有更高的彼此接近概率时,例如,通过两末端退火至共有DNA链,可以增强连接。在一个实施方案中,本节(5.2.7节)所提供的方法步骤用连接酶修复切口以形成环状DNA,其中在5.4节所述的DNA分子的任何切口处的两个DNA末端退火至共有DNA链。在一些实施方案中,根据如本领域中已知并实践的培育条件实施用连接酶修复切口的步骤。
在某些实施方案中,本5.2节所提供的方法可以用于以大规模、高得率和/或高纯度产生本文所描述的具有发夹结构末端的DNA分子。在某些实施方案中,可以在单一反应容器中实现大规模、高得率和/或高纯度。在某些实施方案中,大规模为至少1mg、10mg、100mg、1g、10g、100g、1kg或至少10kg。在某些实施方案中,高得率为至少50%、60%、70%、80%、90%、95%、98%或至少99%的得率(比较用作输入的质粒拷贝数和作为产物的具有发夹结构末端的DNA分子的个数)。在某些实施方案中,高纯度是指基于本文所提供的方法,作为产物的具有发夹结构末端的DNA分子具有至少50%、60%、70%、80%、90%、95%、98%或至少99%的纯度。
5.3所述方法中所使用的DNA分子
本发明公开提供了用于如以上第3节中所述的本文所提供的方法的DNA分子的多个方面和实施方案。在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节中所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节中所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述或者如图2A和2C中所示),则所述切口导致产生包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节中所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节中所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述或者如图2B和2C中所示),则切口导致产生包含所述第二反向重复序列的顶部链3'悬突。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。
在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第一和第二靶标位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶的切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节中所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第三和第四靶标位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶的切口导致产生包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第一和第二靶标位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶的切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节中所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第三和第四靶标位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述或者如图2A和2C中所示),则通过可编程切口酶的切口导致产生包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第一和第二靶标位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶的切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节中所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第三和第四靶标位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶的切口导致产生包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第一和第二靶标位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶的切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节中所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第三和第四靶标位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述或者如图2B和2C中所示),则通过可编程切口酶的切口导致产生包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。在一个实施方案中,本段和之前3段中的可编程切口酶的第一、第二、第三和第四靶标位点全部相同。在另一个实施方案中,本段和之前3段中的可编程切口酶的第一、第二、第三和第四靶标位点中的3个是相同的。在另一个实施方案中,本段和之前3段中的可编程切口酶的第一、第二、第三和第四靶标位点中的2个是相同的。在其它实施方案中,本段和之前3段中的可编程切口酶的第一、第二、第三和第四靶标位点全部不同。
本文所提供的DNA分子包括如第3节和本节(第5.3节)之前段落中所述的多种特性或者具有多个实施方案,所述特性和实施方案进一步描述于以下多个小节:反向重复序列,包括所述第一反向重复序列和/或所述第二反向重复序列的实施方案描述于5.3.1节,限制性内切酶、切口核酸内切酶及其各个的限制性位点的实施方案描述于5.3.2和5.2.4节,可编程切口酶及其靶标位点的实施方案描述于5.2.4节,表达盒的实施方案描述于5.3.3节,质粒和载体的实施方案描述于5.3.5节,包含小于4个切口核酸内切酶的限制性位点的DNA分子的实施方案描述于5.3.6节。照此,本发明公开提供了包含DNA分子的多种实施方案和本文所描述的DNA分子的特性的实施方案的任何排列与组合的DNA分子。在其它实施方案中,ITR、表达盒、切口核酸内切酶或限制性内切酶的限制性位点以及可编程切口酶及其靶标位点中的布置可以是如5.2.3、5.2.4、5.2.5、5.3.1、5.3.2、5.3.3、5.3.6和5.4节中所述的任何布置。
在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一病毒复制缺陷型反向重复序列(例如,如5.3.1节和5.3.4节所述),其中将切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4、5.3.2和5.3.4节中所述),则所述切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节中所述);和iii)第二病毒复制缺陷型反向重复序列(例如,如5.3.1节和5.3.4节所述),其中将切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则切口导致产生包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突。在某些实施方案中,所述顶部链5'悬突包含所述第一病毒复制缺陷型反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二病毒复制缺陷型反向重复序列。在某些实施方案中,所述顶部链5'悬突包含第一病毒复制缺陷型反向重复序列,并且所述顶部链3'悬突包含第二病毒复制缺陷型反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一病毒复制缺陷型反向重复序列(例如,如5.3.1和5.3.4节所述),其中将切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而所述切口导致产生了包含所述第一反向重复序列或其片段(例如,如5.2.3、5.2.4和5.3.2节中所述);ii)表达盒(例如,如5.3.3节中所述);和iii)第二病毒复制缺陷型反向重复序列(例如,如5.3.1节和5.3.4节所述),其中将切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述或如图2A和2C所示),则切口导致产生包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突。在某些实施方案中,所述底部链3'悬突包含所述第一病毒复制缺陷型反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二病毒复制缺陷型反向重复序列。在某些实施方案中,所述底部链3'悬突包含第一病毒复制缺陷型反向重复序列,并且所述底部链5'悬突包含第二病毒复制缺陷型反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一病毒复制缺陷型反向重复序列(例如,如5.3.1节和5.3.4节所述),其中将切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节中所述);和iii)第二病毒复制缺陷型反向重复序列(例如,如5.3.1节和5.3.4节所述),其中将切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则切口导致产生包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突。在某些实施方案中,所述顶部链5'悬突包含所述第一病毒复制缺陷型反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二病毒复制缺陷型反向重复序列。在某些实施方案中,所述顶部链5'悬突包含第一病毒复制缺陷型反向重复序列,并且所述底部链5'悬突包含第二病毒复制缺陷型反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一病毒复制缺陷型反向重复序列(例如,如5.3.1和5.3.4节所述),其中将切口核酸内切酶的第一和第二限制性位点邻近所述第一反向重复序列布置在相对链上,从而切口导致产生了如5.2.3、5.2.4和5.3.2节中所述的底部链;ii)表达盒(例如,如5.3.3节中所述);和iii)第二病毒复制缺陷型反向重复序列(例如,如5.3.1节和5.3.4节所述),其中将切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述或者如图2B和2C所示),则切口导致产生包含第二反向重复序列的顶部链3'悬突。在某些实施方案中,所述底部链3'悬突包含所述第一病毒复制缺陷型反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二病毒复制缺陷型反向重复序列。在某些实施方案中,所述底部链3'悬突包含第一病毒复制缺陷型反向重复序列,并且所述顶部链3'悬突包含第二病毒复制缺陷型反向重复序列。
本文所提供的DNA分子可以是处于其天然环境中的DNA分子或者分离的DNA分子。在某些实施方案中,所述DNA分子是处于其天然环境中的DNA分子。在一些实施方案中,所述DNA分子是分离的DNA分子。在一个实施方案中,所述分离的DNA分子可以是具有至少10%、至少11%、至少12%、至少13%、至少14%、至少15%、至少16%、至少17%、至少18%、至少19%、至少20%、至少21%、至少22%、至少23%、至少24%、至少25%、至少26%、至少27%、至少28%、至少29%、至少30%、至少31%、至少32%、至少33%、至少34%、至少35%、至少36%、至少37%、至少38%、至少39%、至少40%、至少41%、至少42%、至少43%、至少44%、至少45%、至少46%、至少47%、至少48%、至少49%、至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的纯度的DNA分子。在另一个实施方案中,所述分离的DNA分子可以是具有约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%、约20%、约21%、约22%、约23%、约24%、约25%、约26%、约27%、约28%、约29%、约30%、约31%、约32%、约33%、约34%、约35%、约36%、约37%、约38%、约39%、约40%、约41%、约42%、约43%、约44%、约45%、约46%、约47%、约48%、约49%、约50%、约51%、约52%、约53%、约54%、约55%、约56%、约57%、约58%、约59%、约60%、约61%、约62%、约63%、约64%、约65%、约66%、约67%、约68%、约69%、约70%、约71%、约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的纯度的DNA分子。就纯度而言,在5.3.7节中进一步描述了本文所提供的分离的DNA分子的其它实施方案,其可以与本段中所提供的实施方案的任何适合的组合进行组合。
由于所述DNA分子可以完全工程化(例如,合成产生或重组产生),则本文所提供的DNA分子,包括第3节和本5.3节中提供的DNA分子,可以缺少如5.3.4节中进一步描述的某些序列或特征。
5.3.1反向重复序列
第3节和本节(5.3.1节)中提供的ITR或IR可以在5.4节中提供的具有发夹结构末端的DNA分子中形成具有发夹结构的ITR,例如,通过实施第3、5.2.3、5.2.4和5.2.5节中所述的方法步骤。因此,在一些实施方案中,第3节和本节(5.3.1节)中提供的ITR或IR可以以任意组合包含第3节和第5.4节中提供的IR或ITR的任何实施方案和本节(5.3.1节)中提供的其它实施方案。
细胞中大部分DNA包含以沃森-克里克碱基配对接合的两条链,其多价螯合大部分功能性基团并且限制结构和功能多样性。尽管这对于具有存储遗传信息功能的分子而言是所期望的性质,但是已进化出单链病毒来利用线性单链DNA(ssDNA)的分子内相互作用以形成增加另一层功能复杂性的二级结构。一个主要影响因素是这些ssDNA病毒基因组仅由一条向后折叠在自身上形成发夹结构的链组成。
单链DNA分子的二级结构可以是基于初始DNA序列,在组成核苷酸之间形成的互补碱基配对模式的表示。表示为4字母串(一个字母代表一种核苷酸物质)的序列是由通常假设形成具有以受热力学相互作用控制的最小自由能的不同二级结构的核苷酸组成的单链。
“反向重复序列”或“IR”是指包含回文序列区的单链核酸序列。这种回文区在如以下进一步描述的相同链上包含核苷酸序列及其反向互补序列,即如以下进一步描述的“回文序列”。在变性状态下(表示在其中碱基之间的疏水性堆叠吸引力被破坏的条件下),IR核酸序列以无规卷曲状态存在(例如,在高温下、化学试剂的存在、高pH等)。随着该等状态变得更偏向生理学,所述IR可以折叠成其最外层区域通过碱基配对非共价保持在一起的二级结构。在一些实施方案中,IR可以是ITR。在某些实施方案中,IR包含ITR。在一些实施方案中,IR可以是具有发夹结构的反向重复序列。在某些实施方案中,一旦折叠到自身上,反向重复序列可以产生发夹环(也称为茎环),其中当DNA链折叠并与相同链的另一部分形成碱基对时,产生未配对的单链DNA环。一旦折叠,反向重复序列可以包含1、2、3、4、5、6、7、8、9或10个这种发夹环结构。
“反向末端重复序列”、“末端重复序列”、“TR”或“ITR”是指位于单链DNA分子末端或附近的反向重复序列区域或者位于dsDNA分子的单链悬突处或其中的反向重复序列。由于ITR中的回文序列,ITR可以折叠到自身上。在一个实施方案中,ITR位于或邻近ssDNA的一个末端。在另一个实施方案中,ITR位于或邻近dsDNA的一个末端。在另一个实施方案中,两个ITR分别位于或邻近ssDNA的两个各自的末端。在其它实施方案中,两个ITR分别位于或邻近dsDNA的两个各自的末端。在一些实施方案中,ssDNA或dsDNA的非ITR部分与ITR是异源的。在某些实施方案中,ssDNA或dsDNA的非ITR部分与ITR是同源的。在变性状态下(表示在其中碱基之间的疏水性堆叠吸引力被破坏的条件下),包含ITR的核酸序列以无规卷曲状态存在(例如,在高温下、化学试剂的存在、高pH等)。在一些实施方案中,由于条件变得更适合于如5.2.5节所述的退火,ITR可以在自身上折叠成通过碱基配对非共价保持在一起的结构,尽管dsDNA的异源非ITR部分保持完整或者ssDNA分子的异源非ITR部分可以与包含异源DNA分子的反向互补序列的第二ssDNA分子杂交。所产生的两条杂交DNA链的复合物涵盖了3个不同的区域,共价连接至双链DNA区的第一折叠单链ITR,所述双链DNA区反过来共价连接至第二折叠单链ITR。在某些实施方案中,ITR序列可以在第3、5.2.4和5.3.2节中所述的切口核酸内切酶的限制性位点之一开始并且在dsDNA之前的最后一个碱基处结束。在一个实施方案中,与线性双链DNA分子相反,在DNA分子的任一端,存在于顶部链和底部链的5'和3'末端的ITR可以折叠并彼此面对(例如,3'至5'、5'至3'或反之亦然)并因此在核酸双螺旋的任一端不暴露游离的5'或3'末端。在一些实施方案中,当ITR折叠到自身上时,折叠的ITR中的dsDNA可以紧邻DNA分子的非ITR部分的dsDNA,从而产生侧接dsDNA的切口,或者在其它实施方案中,折叠的ITR中的dsDNA可以是除DNA分子的非ITR部分的dsDNA外的一个或多个核苷酸,从而产生侧接dsDNA的“ssDNA缺口”。侧接非ITR DNA序列的两个ITR被称为“ITR对”。在一些实施方案中,当ITR采取其折叠状态时,它耐受核酸外切酶消化(例如,核酸外切酶V),例如,在37℃耐受超过一小时。
可以通过侧接切口的碱基对或ssDNA缺口之间的堆叠相互作用(例如,同轴堆叠)进一步稳定折叠成其二级结构的ITR的末端碱基和DNA杂交的双螺旋的末端碱基之间的边界并且这些相互作用是序列-依赖性的。就类似切口的结构而言,可以在两个构象之间存在平衡,其中第一构象非常接近于完整双螺旋的结构,其中侧接切口的碱基对之间的堆叠是保守的,而其它构象与切口位点处堆叠的完全丧失相对应,因此引起DNA扭结。已知切口分子在聚丙烯酰胺和琼脂糖凝胶电泳期间比相同尺寸的完整分子移动稍慢。在一些情况下,高温增强了这种延迟。据信切口的堆叠/直和未堆叠/弯曲构象之间的快速平衡直接影响DNA分子在凝胶电泳期间的移动性,从而导致具有切口的DNA分子的差异延迟特征。
不受理论束缚,据信细胞蛋白可以识别双链断裂时的平行5'和3'末端,并且可以接合并处理这些末端,其会对细胞中DNA的命运造成不良影响。因此,ITR可以防止在如第3和5.4节以及本节(5.3.1节)所提供的其两端之一或两者处具有ITR的表达盒过早、不希望的降解。
通过将切口核酸内切酶的第一和第二限制性位点置于相对链上并邻近反向重复序列并随后将反向重复序列的顶部链与底部链分离,所产生的悬突可以向后折叠到自身上并形成含有切口核酸内切酶的至少一个限制性位点的双链末端。在一些实施方案中,折叠的ITR类似病毒ITR的二级结构构象。在一个实施方案中,ITR位于底部链的5'和3'末端两者上(例如,左ITR和右ITR)。在另一个实施方案中,ITR位于顶部链的5'和3'末端两者上。在另一个实施方案中,一个ITR位于顶部链的5'末端,并且其它ITR位于底部链的相反端(例如,左ITR位于顶部链的5'末端并且右ITR位于底部链的5'末端)。在另一个实施方案中,一个ITR位于顶部链的3'末端,并且另一个ITR位于底部链的3'末端。
在一些方面,本发明公开提供了包含回文序列的DNA分子。“回文序列”或者“回文结构”是可以在有利于分子内退火的条件下向后折叠以在自互补区中形成dsDNA延伸的自互补DNA序列。在一些实施方案中,回文序列包含当正向读时与互补链上反向读时相同的多核苷酸的邻接延伸。在一个实施方案中,回文序列包含当正向读时与互补链上反向读时相同的多核苷酸延伸,其中这种延伸被非回文多核苷酸的一个或多个延伸打断。在另一个实施方案中,回文序列包含当正向读时与互补链上反向读时50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的多核苷酸延伸。在另一个实施方案中,回文序列包含当正向读时与互补链上反向读时50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的多核苷酸延伸,其中这种延伸被非回文多核苷酸的一个或多个延伸打断。编码一个或多个回文序列的ssDNA可以向后折叠到自身上以形成包含二级结构(例如,发夹环或三向结)的双链碱基对。
在适当的条件下,例如,如第5.2.3、5.2.4和5.2.5节所述,本节(5.3.1节)中提供的IR或ITR可以折叠并形成如本节(5.3.1节)和5.4节所述的发夹结构,包括茎、一级茎(primary stem)、环、转折点(turning points)、凸起、分支、分支环、内环和/或5.4节描述的结构特征的任意组合或排列。
在一个实施方案中,本文所提供的方法和组合物的IR或ITR包含一个或多个回文序列。在一些实施方案中,本文所描述的IR或ITR包含回文序列或结构域,除形成一级茎结构域外,它们可以形成分支发夹结构。在一些实施方案中,IR或ITR包含可以形成任何数目的分支发夹结构的回文序列。在某些具体的实施方案中,IR或ITR包含可以形成1至30个,或者1至30个的任何子范围的分支发夹结构的回文序列。在一些具体的实施方案中,IR或ITR包含可以形成1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个分支发夹结构的回文序列。在一些实施方案中,IR或ITR包含可以形成导致产生三向结结构域(T形)的两个分支发夹结构的序列。在一些实施方案中,IR或ITR包含可以形成导致产生四向结结构域(或十字形结构)的3个分支发夹结构的序列。在一些实施方案中,IR或ITR包含可以形成非T形发夹结构,例如,U形发夹结构的序列。在一些实施方案中,IR或ITR包含可以形成中断的U形发夹结构,包括一系列凸起和碱基对错配的序列。在一些实施方案中,分支发夹结构全部具有相同长度的茎和/或环。在一些实施方案中,一个分支发夹结构小于其它分支发夹结构(例如,截短)。图1显示了发夹结构和发夹结构的结构元件的一些示例实施方案。
“发夹封闭碱基对”是指未配对的环序列后的第一碱基对。某些茎环序列具有优选的封闭碱基对(例如,AAV2 ITR中的GC)。在一个实施方案中,茎环序列包含G-C对作为封闭碱基对。在另一个实施方案中,茎环序列包含C-G对作为封闭碱基对。
“ITR封闭碱基对”是指在折叠ITR中形成碱基对的第一和最后一个核苷酸。末端碱基对通常是最邻近DNA分子的非ITR序列(例如,表达框)的一级茎结构域的核苷酸对。ITR封闭碱基对可以是任何类型的碱基对(例如,CG、AT、GC或TA)。在一个实施方案中,ITR封闭碱基对是G-C碱基对。在另一个实施方案中,ITR封闭碱基对是A-T碱基对。在另一个实施方案中,ITR封闭碱基对是C-G碱基对。在其它实施方案中,ITR封闭碱基对是T-A碱基对。
本发明公开提供根据本领域中已知并实践的,可以计算预测DNA二级结构。可以以一些方式表示DNA二级结构:花体图、图示法、点-括号表示法、环形图、弧形图、山形图、点图等。在环形图中,通过环形表示主链,并且通过环形内部的圆弧表示碱基对。在弧形图中,作为直线绘制DNA主链并且通过弧形连接每个碱基对的核苷酸。环形图和弧形图两者能够鉴定二级结构的相似性和差异。
用于DNA二级结构预测的多种方法之一使用了最近邻模型并且使与DNA结构有关的总自由能最小化。通过来自碱基对堆叠、发夹、凸起、内环和多分支环的个体能量贡献之和估计最小自由能。这些元素的能量贡献具有序列和长度依赖性并且已通过实验确定。例如,可以通过图显示结构来显示序列向茎环和子茎的分离。在线性相互作用图中,在纵坐标上显示每个残基,并且半椭圆形线连接互相配对的碱基(例如,图2A和B)。
在一些实施方案中,ITR促进细胞核中核酸分子的长期存活。在一些实施方案中,ITR促进细胞核中核酸分子的永久存活(例如,细胞的整个寿命周期)。在一些实施方案中,ITR促进细胞核中核酸分子的稳定性。在一些实施方案中,ITR抑制或防止细胞核中核酸分子的降解。
在某些实施方案中,IR或ITR可以包含任何病毒ITR。在其它实施方案中,IR或ITR可以包含可以形成在重复序列的最远顶点或转折点不暴露5'或3'末端的回文发夹结构的合成回文序列。
在一些实施方案中,从ITR封闭碱基对的一个核苷酸延伸至ITR封闭碱基对的其它核苷酸的单链ITR序列在生理条件下具有在-10kcal/mol至-100kcal/mol的范围内的去折叠吉布斯自由能(ΔG)。在一个实施方案中,在前句中所提及的去折叠吉布斯自由能(ΔG)不大于-10(表示≤-10,包括(例如)-20、-30等)、不大于-11、不大于-12、不大于-13、不大于-14、不大于-15、不大于-16、不大于-17、不大于-18、不大于-19、不大于-20、不大于-21、不大于-22、不大于-23、不大于-24、不大于-25、不大于-26、不大于-27、不大于-28、不大于-29、不大于-30、不大于-31、不大于-32、不大于-33、不大于-34、不大于-35、不大于-36、不大于-37、不大于-38、不大于-39、不大于-40、不大于-41、不大于-42、不大于-43、不大于-44、不大于-45、不大于-46、不大于-47、不大于-48、不大于-49、不大于-50、不大于-51、不大于-52、不大于-53、不大于-54、不大于-55、不大于-56、不大于-57、不大于-58、不大于-59、不大于-60、不大于-61、不大于-62、不大于-63、不大于-64、不大于-65、不大于-66、不大于-67、不大于-68、不大于-69、不大于-70、不大于-71、不大于-72、不大于-73、不大于-74、不大于-75、不大于-76、不大于-77、不大于-78、不大于-79、不大于-80、不大于-81、不大于-82、不大于-83、不大于-84、不大于-85、不大于-86、不大于-87、不大于-88、不大于-89、不大于-90、不大于-91、不大于-92、不大于-93、不大于-94、不大于-95、不大于-96、不大于-97、不大于-98、不大于-99或不大于-100kcal/mol。在另一个实施方案中,在前句中所提及的去折叠吉布斯自由能(ΔG)为约-10(表示≤-10,包括(例如)-20、-30等)、约-11、约-12、约-13、约-14、约-15、约-16、约-17、约-18、约-19、约-20、约-21、约-22、约-23、约-24、约-25、约-26、约-27、约-28、约-29、约-30、约-31、约-32、约-33、约-34、约-35、约-36、约-37、约-38、约-39、约-40、约-41、约-42、约-43、约-44、约-45、约-46、约-47、约-48、约-49、约-50、约-51、约-52、约-53、约-54、约-55、约-56、约-57、约-58、约-59、约-60、约-61、约-62、约-63、约-64、约-65、约-66、约-67、约-68、约-69、约-70、约-71、约-72、约-73、约-74、约-75、约-76、约-77、约-78、约-79、约-80、约-81、约-82、约-83、约-84、约-85、约-86、约-87、约-88、约-89、约-90、约-91、约-92、约-93、约-94、约-95、约-96、约-97、约-98、约-99或约-100kcal/mol。在一些实施方案中,从ITR封闭碱基对的一个核苷酸延伸至ITR封闭碱基对的其它核苷酸的ITR序列在生理条件下具有在-26kcal/mol至-95kcal/mol的范围内的去折叠吉布斯自由能(ΔG)。在一些实施方案中,从ITR封闭碱基对的一个核苷酸延伸至ITR封闭碱基对的其它核苷酸的ITR序列有助于ITR序列在生理条件下去折叠的全部吉布斯自由能(ΔG)。
在一些实施方案中,在折叠状态,单链IR或ITR具有约50%至98%的整体沃森-克里克自互补性。在一个实施方案中,在折叠状态,单链IR或ITR具有下列整体沃森-克里克自互补性:约50%、约51%、约52%、约53%、约54%、约55%、约56%、约57%、约58%、约59%、约60%、约61%、约62%、约63%、约64%、约65%、约66%、约67%、约68%、约69%、约70%、约71%、约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%。在另一个实施方案中,在折叠状态,单链IR或ITR具有下列整体沃森-克里克自互补性:至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%。在一些实施方案中,在折叠状态,IR或ITR具有约60%至98%的整体沃森克里克互补性。在一些实施方案中,单链IR或ITR具有约60-95%的整体GC含量。在某些实施方案中,单链IR或ITR具有下列整体GC含量:至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%。在其它实施方案中,单链IR或ITR具有下列整体GC含量:约60%、约61%、约62%、约63%、约64%、约65%、约66%、约67%、约68%、约69%、约70%、约71%、约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%或约95%。在一些实施方案中,单链IR具有约60-91%的整体GC含量。
表4列出了折叠自由能、GC含量、互补百分比、示例性ITR的长度,并且表5列出了表4中ITR的序列。
表4:折叠自由能、GC含量、互补百分比、示例性ITR长度。
表5:表4中的ITR序列
用于本文所提供的方法和组合物的DNA分子可以包含多种来源的IR或ITR。在一个实施方案中,DNA分子中的IR或ITR是病毒ITR。“病毒ITR”包括包含至少一个最小必需复制起点的任何病毒末端重复或合成序列和包含回文发夹结构的区域。在一个实施方案中,所述病毒ITR来源于细小病毒科。在另一个实施方案中,来源于细小病毒科的病毒ITR包含“最小必需复制起点”,所述最小必需复制起点包含至少一个病毒复制相关蛋白结合序列(“RABS”)。RABS是指通过细小病毒科基因Rep和/或NS1编码的病毒DNA复制相关蛋白(“RAP”)或其同工型可以结合的DNA序列。在一些实施方案中,RABS是Rep结合序列(“RBS”)。在一些实施方案中,RABS包含Rep结合序列(“RBS”),Rep可以结合至ITR内的两个元件。它可以结合至ITR茎结构中的核苷酸序列(即Rep蛋白识别用于病毒核酸分子复制的核苷酸序列)。这种RBS也被称为RBE(Rep-结合元件)。Rep还可以结合至核苷酸序列。其形成包含位于ITR内的内部发夹的单一尖端的小回文,借此稳定Rep和ITR之间的结合。这种RBS也被称为RBE'。在另一个实施方案中,来源于细小病毒科的病毒ITR包含RABS,所述RABS包含复制相关病毒蛋白NS1可以结合的NS1-结合元件(“NSBE”)。在另一个实施方案中,RABS是复制相关病毒蛋白NS1可以结合的NS1-结合元件(“NSBE”)。在一些实施方案中,病毒ITR来源于细小病毒科并且包含末端解析位点(“TRS'”),病毒DNA复制相关蛋白NS1和/或Rep在此位点可以在TRS上位于序列内实施核酸内切切口。在另一个实施方案中,病毒ITR包含至少一个RBS或NSBE和至少一个TRS。在基于病毒或重组RAP(即Rep或NS1)的病毒基因组生产的背景中,ITR介导复制和病毒包装。如本发明人意外发现和本文所提供的,可以无需Rep或NS1蛋白产生具有类似于病毒ITR的ITR的双螺旋线性DNA载体,并因此对于DNA复制不依赖于RABS或TRS序列。因此,可以任选地在本文所公开的核苷酸序列中编码RABS和TRS,但不是必需的,并且对于ITR设计提供了灵活性。在一个实施方案中,用于本文所提供的方法和组合物的ITR不包含至少一个RABS(例如,1个RABS、2个RABS或者大于2个RABS)。在另一个实施方案中,用于本文所提供的方法和组合物的ITR不包含任何RABS。在另一个实施方案中,用于本文所提供的方法和组合物的ITR不包含至少一个RBS。在另一个实施方案中,用于本文所提供的方法和组合物的ITR不包含任何RBS。在另一个实施方案中,用于本文所提供的方法和组合物的ITR不包含RBE。在另一个实施方案中,用于本文所提供的方法和组合物的ITR不包含RBE'。在另一个实施方案中,用于本文所提供的方法和组合物的ITR不包含RBE和RBE'。在另一个实施方案中,用于本文所提供的方法和组合物的ITR不包含NSBE。在另一个实施方案中,用于本文所提供的方法和组合物的ITR不包含TRS。在其它实施方案中,用于本文所提供的方法和组合物的ITR不包含至少一个RABS(例如,1个RABS、2个RABS或者大于2个RABS)并且不包含TRS。在其它实施方案中,用于本文所提供的方法和组合物的ITR不包含任何RABS并且不包含TRS。在其它实施方案中,用于本文所提供的方法和组合物的ITR包含RBS(即RBE和/或RBE')、TRS或RBS(即RBE和/或RBE')和TRS两者。在其它实施方案中,用于本文所提供的方法和组合物的ITR包含NBSE、TRS或NBSE和TRS两者。
“ITR对”是指单一DNA分子内的2个ITR。在一些实施方案中,ITR对中的2个ITR均来源于具有跨过它们整个长度的反向互补序列的野生型病毒ITR(例如,AAV2 ITR)。可以认为ITR是野生型序列,即使它具有不同于典型天然存在的序列的一个或多个核苷酸,只要所述变化不影响所述序列的性质和整体立体结构。在一些实施方案中,本发明公开提供一个或多个核苷酸的插入、缺失或取代可以产生切口核酸内切酶的限制性位点,且不改变病毒ITR的整体立体结构。在一些方面,改变的核苷酸代表保守序列变化。在某些实施方案中,本文所提供的ITR序列可以与典型序列具有至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性(如(例如)以默认设置使用BLAST所测量的),并且也具有切口核酸内切酶的限制性位点,从而3D结构在几何空间中形状相同。在其它实施方案中,本文所提供的ITR序列可以与典型序列具有约95%、约96%、约97%、约98%或约99%的序列同一性(如(例如)以默认设置使用BLAST所测量的),并且也具有切口核酸内切酶的限制性位点,从而3D结构在几何空间中形状相同。
在一些实施方案中,用于本文所提供的方法和组合物的DNA分子包含wt-ITR对。在某些具体的实施方案中,用于本文所提供的方法和组合物的DNA分子包含选自如表6所示的组的wt-ITR对。表6显示了来自相同血清型或不同血清型,或者不同细小病毒的示例性ITR,包括AAV血清型1(AAV1)、AAV血清型2(AAV2)、AAV血清型3(AAV3)、AAV血清型4(AAV4)、AAV血清型5(AAV5)、AAV血清型6(AAV6)、AAV血清型7(AAV7)、AAV血清型8(AAV8)、AAV血清型9(AAV9)、AAV血清型10(AAV10)、AAV血清型11(AAV11)或AAV血清型12(AAV12);AAVrh8、AAVrhlO、AAV-DJ和AAV-DJ8基因组(例如,NCBI:NC 002077;NC 001401;NC001729;NC001829;NC006152;NC 006260;NC 006261)、来自恒温动物的ITR(禽AAV(AAAV)、牛AAV(BAAV)、犬、马和羊AAV)、来自B19细小病毒的ITR(GenBank登录号No.:NC 000883)、来自小鼠的微小病毒(MVM)(GenBank登录号No.NC 001510);鹅:鹅细小病毒(GenBank登录号No.NC001701);蛇:蛇细小病毒1(GenBank登录号No.NC 006148)。
表6:示例性ITR序列
在一些实施方案中,用于本文所提供的方法和组合物的DNA分子包含完整或部分细小病毒基因组。细小病毒基因组是线性的,尺寸为3.9-6.3kb,并且通过可以折叠到发夹-样结构的末端重复包裹编码区,所述末端重复是不同的(异源端粒,例如,HBoV)或者相同的(同源端粒,例如,AAV2)。在一个实施方案中,用于本文所提供的方法和组合物的DNA分子在DNA分子的2个末端包含2个不同的ITR。在另一个实施方案中,用于本文所提供的方法和组合物的DNA分子在DNA分子的2个末端包含2个相同的ITR。在另一个实施方案中,用于本文所提供的方法和组合物的DNA分子包含对应于2个HBoV ITR的位于DNA分子2个末端的2个不同的ITR。在其它实施方案中,用于本文所提供的方法和组合物的DNA分子包含对应于AAV2ITR的位于DNA分子2个末端的2个相同的ITR。
在某些实施方案中,本文所提供的DNA分子中的ITR可以是AAV ITR。在其它实施方案中,所述ITR可以是非AAV ITR。在一个实施方案中,本文所提供的DNA分子中的ITR可以来源于AAV ITR或非AAV TR。在一些具体的实施方案中,所述ITR可以来源于细小病毒科的任一种,其涵盖了细小病毒和依赖病毒属(例如,犬细小病毒、牛细小病毒、小鼠细小病毒、猪细小病毒、人细小病毒B-19)。在其它具体的实施方案中,所述ITR可以来源于用作SV40复制起点的SV40发夹。细小病毒科病毒由2个亚科组成:感染脊椎动物的细小病毒亚科和感染无脊椎动物的浓核病毒亚科。照此,在一个实施方案中,ITR可以来源于细小病毒亚科中的任一种。在另一个实施方案中,ITR可以来源于浓核病毒亚科中的任一种。
与T形AAV ITR相比,人红病毒属B19具有可以折叠至具有少量未配对核苷酸的长线性双螺旋中的不完整回文结构结尾的ITR,从而产生一系列高度保守、错配的小凸起。在一些实施方案中,任何细小病毒ITR可以用作用于本文所提供的DNA分子的ITR(例如,野生型或修饰的ITR)或者可以起到用于修饰、掺入本文所提供的DNA分子中的模板ITR的作用。在一些具体的实施方案中,所述DNA分子的ITR所来源的细小病毒是依赖病毒属、红系细小病毒或者博卡细小病毒。在其它具体的实施方案中,本文所提供的DNA分子的ITR来源于AAV、B19或HBoV。在某些实施方案中,对于本文所提供的DNA分子所选的AAV ITR的血清型可以基于血清型的组织趋性。AAV2具有宽组织趋性、AAV1优先靶向神经元和骨骼肌,并且AAV5优先靶向神经元、视网膜色素上皮细胞和光感受器。AAV6优先靶向骨骼肌和肺。AAV8优先靶向肝、骨骼肌、心脏和胰腺组织。AAV9优先靶向肝、骨胳和肺组织。在一个实施方案中,本文所提供的DNA分子的ITR或修饰的ITR基于AAV2 ITR。在一个实施方案中,本文所提供的DNA分子的ITR或修饰的ITR基于AAV1 ITR。在一个实施方案中,本文所提供的DNA分子的ITR或修饰的ITR基于AAV5 ITR。在一个实施方案中,本文所提供的DNA分子的ITR或修饰的ITR基于AAV6 ITR。在一个实施方案中,本文所提供的DNA分子的ITR或修饰的ITR基于AAV8 ITR。在一个实施方案中,本文所提供的DNA分子的ITR或修饰的ITR基于AAV9 ITR。
在一个实施方案中,用于本文所提供的方法和组合物的DNA分子包含一个或多个非AAV ITR。在其它实施方案中,这种非AAV ITR可以来源于哺乳动物基因组中存在的发夹序列。在一个具体实施方案中,这种非AAV ITR可以来源于线粒体基因组中存在的发夹序列,包括OriL发夹序列(SEQ ID NO:30:5'CTTCTCCCGCCGCCGGGAAAAAAGGCGGGAGAAGCCCCGGCAGGTTTGAA'3),其采用茎环结构并且参与起始线粒体DNA的DNA合成(参见Fuste等人,Molecular Cell,37,67–78,2010年1月15日,其以其全部内容作为参考并入本文)。在另一个具体的实施方案中,用于本文所提供的方法和组合物的DNA分子包含来源于OriL序列的ITR,所述OriL序列镜像,从而在发夹顶点形成具有2个自互补回文区和12-核苷酸环的T形结。在一个实施方案中,用于本文所提供的方法和组合物的DNA分子包含来源于维持OriL发夹环的OriL序列的ITR,然后是未配对的凸起和富含GC的茎。图2显示了来源于线粒体OriL的ITR的一些示例性实施方案。
在一个实施方案中,用于本文所提供的方法和组合物的DNA分子包含来源于适体的一个或多个非AAV ITR。类似于病毒ITR,适体由折叠成立体结构的ssDNA组成并且具有以高亲合力和特异性识别生物学靶标的能力。可以通过指数富集的配体系统进化(SELEX)产生DNA适体。例如,先前已表明一些适体可以靶向人细胞核(参见Shen等人,ACS Sens.2019,4,6,1612–1618,以上文献以其全部内容作为参考并入本文)。在一个实施方案中,用于本文所提供的方法和组合物的DNA分子包含靶向适体ITR的核或它们的衍生物,其中所述适体特异性结合核蛋白。在一些实施方案中,适体ITR折叠成可以含有,如发夹、内环以及凸起和茎区的二级结构。图3显示了适体或ITR所来源的一些示例性实施方案。
在一些具体的实施方案中,用于本文所提供的方法和组合物的DNA分子以任意组合包含一个或多个AAV2 ITR,人红病毒属B19 ITR、鹅细小病毒ITR和/或它们的衍生物。在其它具体的实施方案中,用于本文所提供的方法和组合物的DNA分子以任意组合包含选自AAV2 ITR、人红病毒属B19 ITR、鹅细小病毒ITR和它们衍生物的2个ITR。在一些具体的实施方案中,用于本文所提供的方法和组合物的DNA分子以任意组合包含一个或多个AAV2 ITR、人红病毒属B19 ITR、鹅细小病毒ITR和/或其衍生物,其中不考虑其ITR的回文区相对于表达盒是处于5'和3'ITR方向性的径直、反向或任何可能组合,所述ITR保持功能性(如WO2019143885中所述,该专利以其全部内容作为参考并入本文)。
在一些实施方案中,如本节(5.3.1节)所述,除了允许发夹二级结构形成的多种回文序列之外,本文所提供的DNA分子中的修饰的IR或ITR是包含核酸内切酶的限制性位点的合成IR序列,如5'-GAGTC-3'。
在某些实施方案中,本文所提供的DNA分子中的IR或ITR可以是与本节(5.3.1节)中所述的IR或ITR序列具有多种序列同源性的IR或ITR。在其它实施方案中,本文所提供的DNA分子中的IR或ITR可以是与本节(5.3.1节)所述的多种ITR来源的已知的IR或ITR序列具有多种序列同源性的IR或ITR(例如,病毒ITR、线粒体ITR、人工或合成ITR,如适体等)。在一个实施方案中,本段所提供的这种同源性可以是至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的同源性。在另一个实施方案中,本段所提供的这种同源性可以是约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的同源性。
在一些实施方案中,本文所提供的DNA分子中的IR或ITR可以以多种排列与组合包含本节(5.3.1节)中所述的任何一个或多个特征。
5.3.2限制性内切酶、切口核酸内切酶及其各自的限制性位点;可编程切口酶及其靶标位点
为本文所提供的DNA分子提供了如5.2.4节所述的切口核酸内切酶、限制性内切酶和/或其各自的限制性位点的多种实施方案。在一些实施方案中,如第3节和本节(5.3节)所述的DNA分子提供的切口核酸内切酶的第一、第二、第三和第四限制性位点可以全部是相同切口核酸内切酶的靶标序列。在一些实施方案中,如第3节和本节(5.3节)所述的DNA分子提供的切口核酸内切酶的第一、第二、第三和第四限制性位点可以是4种不同切口核酸内切酶的靶标序列。在其它实施方案中,切口核酸内切酶的第一、第二、第三和第四限制性位点是两种不同切口核酸内切酶的靶标序列,包括布置两种不同切口核酸内切酶靶标序列的4个位点的所有可能组合(例如,第一切口核酸内切酶的第一限制性位点和第二切口核酸内切酶的其它位点、第一切口核酸内切酶的第一和第二限制性位点和第二切口核酸内切酶的其它位点等)。在某些实施方案中,切口核酸内切酶的第一、第二、第三和第四限制性位点是3种不同切口核酸内切酶的靶标序列,包括布置3种不同切口核酸内切酶靶标序列的4个位点的所有可能组合。在一些实施方案中,切口核酸内切酶和切口核酸内切酶的限制性位点可以是选自5.2.4节所述位点中的任一种,包括表2。在其它实施方案中,切口核酸内切酶的第一、第二、第三和第四限制性位点中的每一个可以是选自5.2.4节所述的任何切口核酸内切酶的位点,包括表2。
表7至表16显示了具有相同切口核酸内切酶(通过切口核酸内切酶物种分组)的2个反向平行识别位点的示例性修饰的AAV ITR序列。图13至图19显示了ITR修饰序列和AAV1、AAV2、AAV3、AAV4左、AAV4右、AAV5和AAV7的野生型的相应比对。
表7:具有切口核酸内切酶的反向平行识别位点Nb.BvCI的示例性AAV来源的ITR:
表8:具有切口核酸内切酶反向平行识别位点Nb.BsmI的示例性AAV来源的ITR:
表9:具有切口核酸内切酶反向平行识别位点Nb.BsrDI的示例性AAV来源的ITR:
表10:具有切口核酸内切酶反向平行识别位点Nb.BssSi的示例性AAV来源的ITR:
表11:具有切口核酸内切酶反向平行识别位点Nb.BtsI的示例性AAV来源的ITR:
表12:具有切口核酸内切酶反向平行识别位点Nt.AlwI的示例性AAV来源的ITR:
表13:具有切口核酸内切酶反向平行识别位点Nt.BbvCI的示例性AAV来源的ITR:
表14:具有切口核酸内切酶反向平行识别位点Nt.BsmAI的示例性AAV来源的ITR:
表15:具有切口核酸内切酶反向平行识别位点Nt.BspQI的示例性AAV来源的ITR:
表16:具有切口核酸内切酶反向平行识别位点Nt.BstNBI的示例性AAV来源的ITR:
表17:切口酶靶标的反向互补序列
可以以多种构造布置切口核酸内切酶的第一、第二、第三和第四限制性位点。在一些实施方案中,切口核酸内切酶的第一和第二限制性位点相隔至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29、至少30、至少31、至少32、至少33、至少34、至少35、至少36、至少37、至少38、至少39、至少40、至少41、至少42、至少43、至少44、至少45、至少46、至少47、至少48、至少49、至少50、至少51、至少52、至少53、至少54、至少55、至少56、至少57、至少58、至少59、至少60、至少61、至少62、至少63、至少64、至少65、至少66、至少67、至少68、至少69、至少70、至少71、至少72、至少73、至少74、至少75、至少76、至少77、至少78、至少79、至少80、至少81、至少82、至少83、至少84、至少85、至少86、至少87、至少88、至少89、至少90、至少91、至少92、至少93、至少94、至少95、至少96、至少97、至少98、至少99、至少100、至少105、至少110、至少115、至少120、至少125、至少130、至少135、至少140、至少145、至少150、至少155、至少160、至少165、至少170、至少175、至少180、至少185、至少190、至少195或至少200个核苷酸。在其它实施方案中,切口核酸内切酶的第一和第二限制性位点相隔约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约51、约52、约53、约54、约55、约56、约57、约58、约59、约60、约61、约62、约63、约64、约65、约66、约67、约68、约69、约70、约71、约72、约73、约74、约75、约76、约77、约78、约79、约80、约81、约82、约83、约84、约85、约86、约87、约88、约89、约90、约91、约92、约93、约94、约95、约96、约97、约98、约99、约100、约105、约110、约115、约120、约125、约130、约135、约140、约145、约150、约155、约160、约165、约170、约175、约180、约185、约190、约195或约200个核苷酸。
类似地,在某些实施方案中,切口核酸内切酶的第三和第四限制性位点相隔至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29、至少30、至少31、至少32、至少33、至少34、至少35、至少36、至少37、至少38、至少39、至少40、至少41、至少42、至少43、至少44、至少45、至少46、至少47、至少48、至少49、至少50、至少51、至少52、至少53、至少54、至少55、至少56、至少57、至少58、至少59、至少60、至少61、至少62、至少63、至少64、至少65、至少66、至少67、至少68、至少69、至少70、至少71、至少72、至少73、至少74、至少75、至少76、至少77、至少78、至少79、至少80、至少81、至少82、至少83、至少84、至少85、至少86、至少87、至少88、至少89、至少90、至少91、至少92、至少93、至少94、至少95、至少96、至少97、至少98、至少99、至少100、至少105、至少110、至少115、至少120、至少125、至少130、至少135、至少140、至少145、至少150、至少155、至少160、至少165、至少170、至少175、至少180、至少185、至少190、至少195或至少200个核苷酸。在其它实施方案中,切口核酸内切酶的第三和第四限制性位点相隔约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约51、约52、约53、约54、约55、约56、约57、约58、约59、约60、约61、约62、约63、约64、约65、约66、约67、约68、约69、约70、约71、约72、约73、约74、约75、约76、约77、约78、约79、约80、约81、约82、约83、约84、约85、约86、约87、约88、约89、约90、约91、约92、约93、约94、约95、约96、约97、约98、约99、约100、约105、约110、约115、约120、约125、约130、约135、约140、约145、约150、约155、约160、约165、约170、约175、约180、约185、约190、约195或约200个核苷酸。
本发明公开提供第3、5.2(包括5.2.3)和5.3(包括5.3.1)节中所述的悬突可以是由通过切口核酸内切酶在第一和第二限制性位点的切口和如第3和5.2(包括5.2.3)节所述的变性而产生的悬突。因此,在一些实施方案中,由在第一和第二限制性位点处切口所产生的悬突可以与第一和第二限制性位点相隔的长度(核苷酸数目)具有相同长度,如本节(5.3.2节)前段所述。由于切口核酸内切酶可以切割切口核酸内切酶限制性位点内部或外部的DNA,因此在某些实施方案中,由在第一和第二限制性位点处切口所产生的悬突可以比第一和第二限制性位点的间隔长或短至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或至少30个核苷酸。在其它实施方案中,由在第一和第二限制性位点切口所产生的悬突可以比第一和第二限制性位点的间隔长或短约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29或约30个核苷酸。
类似地,本发明公开提供第3、5.2(包括5.2.3)和5.3(包括5.3.1)节中所述的悬突可以是由通过切口核酸内切酶在第三和第四限制性位点的切口和如第3和5.2(包括5.2.3)节所述的变性而产生的悬突。因此,在一些实施方案中,由在第三和第四限制性位点处切口所产生的悬突可以与第三和第四限制性位点相隔的长度(核苷酸数目)具有相同长度,如本节(5.3.2节)前段所述。由于切口核酸内切酶可以切割切口核酸内切酶限制性位点内部或外部的DNA,因此在某些实施方案中,由在第三和第四限制性位点处切口所产生的悬突可以比第三和第四限制性位点的间隔长或短至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或至少30个核苷酸。在其它实施方案中,由在第三和第四限制性位点切口所产生的悬突可以比第三和第四限制性位点的间隔长或短约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29或约30个核苷酸。
如根据第3和5.4节以及本节(5.3节)中的描述可知,本文所提供的DNA分子包含表达盒。在一些实施方案中,表达盒位于在一端的切口核酸内切酶的第一和第二限制性位点和在另一端的切口核酸内切酶的第三和第四限制性位点之间。在其它实施方案中,表达盒位于通过实施如第3和5.2节所述的方法步骤a至d(包括5.2.3节所述的变性步骤以提供2个ssDNA悬突)所产生的DNA分子的dsDNA节段内。在某些实施方案中,切口核酸内切酶的第一、第二、第三和第四限制性位点的布置使得本段所述的dsDNA节段的长度为至少0.2kb、至少0.3kb、至少0.4kb、至少0.5kb、至少0.6、至少kb、至少0.7kb、至少0.8kb、至少0.9kb、至少1kb、至少1.5kb、至少2kb、至少2.5kb、至少3kb、至少3.5kb、至少4kb、至少4.5kb、至少5kb、至少5.5kb、至少6kb、至少6.5kb、至少7kb、至少7.5kb、至少8kb、至少8.5kb、至少9kb、至少9.5kb或至少10kb。在其它实施方案中,切口核酸内切酶的第一、第二、第三和第四限制性位点的布置使得本段所述的dsDNA节段的长度为约0.2kb、约0.3kb、约0.4kb、约0.5kb、约0.6、约kb、约0.7kb、约0.8kb、约0.9kb、约1kb、约1.5kb、约2kb、约2.5kb、约3kb、约3.5kb、约4kb、约4.5kb、约5kb、约5.5kb、约6kb、约6.5kb、约7kb、约7.5kb、约8kb、约8.5kb、约9kb、约9.5kb或约10kb。
如5.2.4节所述,与切口核酸内切酶培育将导致产生对应于切口核酸内切酶的第一限制性位点的第一切口,对应于切口核酸内切酶的第二限制性位点的第二切口,对应于切口核酸内切酶的第三限制性位点的第三切口,和/或对应于切口核酸内切酶的第四限制性位点的第四切口。本发明公开提供所述第一、第二、第三和/或第四切口可以位于相对于反向重复序列的多个位置。在一个实施方案中,第一切口位于距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸内。在另一个实施方案中,第一切口位于距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸内。在另一个实施方案中,第二切口位于距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸内。在其它实施方案中,第二切口位于距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸内。在一个实施方案中,第三切口位于距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸内。在另一个实施方案中,第三切口位于距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸内。在另一个实施方案中,第四切口位于距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸内。在其它实施方案中,第四切口位于距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸内。在一些实施方案中,第一、第二、第三和第四切口中的任一个或者任意组合位于所述反向重复序列内。在某些实施方案中,第一、第二、第三和第四切口中的任一个或者任意组合位于所述反向重复序列外。在一些其它实施方案中,所述第一、第二、第三和第四切口可以以任意组合或排列在它们自身中、在其中任一个和反向重复序列之间和/或在其中任一个和表达盒之间具有任何相对位置,如本节(5.3.2节)所述。在一些其它实施方案中,切口核酸内切酶的第一、第二、第三和第四限制性位点可以以任意组合或排列在它们自身中、在其中任一个和反向重复序列之间和/或在其中任一个和表达盒之间具有任何相对位置,如本节(5.3.2节)所述。
5.3.3表达盒
如根据第3和5.4节以及本节(5.3节)的描述可知,本文所提供的DNA分子包含表达盒。“表达盒”是含有指导细胞机器制备RNA和蛋白的序列或其它信息的核酸分子或核酸分子的一部分。在一些实施方案中,表达盒包含启动子序列。在某些实施方案中,表达盒包含转录单元。在一些其它实施方案中,表达盒包含可操作性连接至转录单元的启动子。在一个实施方案中,转录单元包含开放阅读框(ORF)。在本节(5.3.3节)最后一段中进一步描述了与本文所提供的方法和组合物一起使用的ORF的实施方案。所述表达盒还可以包含指导细胞机器制备RNA和蛋白的特性。在一个实施方案中,表达盒包含转录后调控元件。在另一个实施方案中,表达盒还包含多腺苷酸化和/或终止信号。在另一个实施方案中,表达盒包含本领域中已知并且用于调节(促进、抑制和/或打开/关闭ORF表达)的调控元件。这些调控元件包括(例如)5'-未翻译区(UTR)、3'-UTR或者5'UTR和3'UTR两者。在一些其它实施方案中,表达盒以任意组合或排列包含本节(5.3.3节)中提供的任何一种或多种特性。
所述表达盒可以在其ORF中包含蛋白编码序列(有义链)。作为另外一种选择,表达盒可以包含蛋白编码ORF的互补序列(反义链)和用于细胞机器产生有义链DNA/RNA和相应蛋白的调控组件和/或其它信号。在一些实施方案中,表达盒包含无内含子的蛋白序列。在其它实施方案中,表达盒包含具有内含子的蛋白序列,其通过转录和剪接除去。表达盒还可以包含多种数目的ORF或转录单元。在一个实施方案中,表达盒包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个ORF。在另一个实施方案中,表达盒包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个转录单元。
表达盒还可以包含一个或多个转录调控元件、一个或多个转录后调控元件或者一个或多个转录调控元件和一个或多个转录后调控元件两者。这些调控元件是允许、促使或调节核酸分子的功能调控,包括核酸或其衍生物之一(例如,mRNA)向宿主细胞或生物的复制、重复、转录、剪接、翻译、稳定性和/或转运的任何序列。这些调控元件包括(但不限于)启动子、增强子、多腺苷酸化信号、翻译终止密码子、核糖体结合元件、转录终止子、选择标志物、复制起点等。
在一些实施方案中,所述表达盒包含增强子。基于本发明公开文本,可以使用本领域技术人员已知的任何增强子序列。在一些实施方案中,增强子序列可以是人肌动蛋白、人肌球蛋白、人血红蛋白、人肌肉肌酸或者病毒增强子,如CMV、HA、RSV或EBV中的一种。在某些具体的实施方案中,所述增强子可以是旱獭HBV转录后调控元件(Woodchuck HBV Post-transcriptional regulatory element,WPRE)、来源于人脱脂蛋白A1前体(ApoAI)的内含子/外显子序列、1型人T细胞白血病病毒(HTLV-1)长末端重复(LTR)的未翻译的R-U5结构域、剪接增强子、合成兔β-球蛋白内含子、AAV的P5启动子或其任意组合。
如上所述,所述表达盒可以包含启动子以控制感兴趣的蛋白的表达。启动子包括起始可操作性连接的核苷酸序列的转录的任何核苷酸序列。启动子可以是组成型、诱导型或抑制型。启动子可以来源于包括病毒、细菌、真菌、植物、昆虫和动物的来源。启动子可以是同源启动子(例如,来源于相同基因来源)或者异源启动子(例如,来源于不同基因来源)。在一些实施方案中,启动子可以是来自猿猴病毒40(SV40)的启动子、小鼠乳腺瘤病毒(MMTV)启动子、人类免疫缺陷性病毒(HIV)启动子,如牛免疫缺陷病毒(BIV)长末端重复(LTR)启动子、莫洛尼病毒启动子、禽白血病病毒(ALV)启动子、巨细胞病毒(CMV)启动子,如CMV立即早期启动子(CMV-IE)、爱泼斯坦巴尔病毒(EBV)启动子或者劳氏肉瘤病毒(RSV)启动子。在其它实施方案中,启动子可以是来自人基因的启动子,如人肌动蛋白、人肌球蛋白、人血红蛋白、人肌肉肌酸或者人金属硫蛋白。在其它实施方案中,启动子还可以是天然或合成的组织特异性启动子,如肌肉或皮肤特异性启动子。
如上所述,表达盒可以包含多腺苷酸化、终止信号或者多腺苷酸化和终止信号两者。基于本发明公开文本,可以使用本领域技术人员已知的任何多腺苷酸化信号。在一些实施方案中,多腺苷酸化信号可以是SV40多腺苷酸化信号、AAV2多腺苷酸化信号(bp 4411-4466,NC_001401)、来自单纯疱疹病毒胸苷激酶基因的多腺苷酸化信号、LTR多腺苷酸化信号、牛生长激素(bGH)多腺苷酸化信号、人生长激素(hGH)多腺苷酸化信号或者人β-球蛋白多腺苷酸化信号。
所述表达盒可以具有多种尺寸以容纳具有多种长度的一条或多条ORF。在某些实施方案中,表达盒的尺寸为至少0.2kb、至少0.3kb、至少0.4kb、至少0.5kb、至少0.6、至少kb、至少0.7kb、至少0.8kb、至少0.9kb、至少1kb、至少1.5kb、至少2kb、至少2.5kb、至少3kb、至少3.5kb、至少4kb、至少4.5kb、至少5kb、至少5.5kb、至少6kb、至少6.5kb、至少7kb、至少7.5kb、至少8kb、至少8.5kb、至少9kb、至少9.5kb、至少10kb、至少15kb、至少20kb、至少25kb、至少30kb、至少35kb、至少40kb、至少45kb、至少50kb、至少55kb、至少60kb、至少65kb、至少70kb、至少75kb或至少80kb。在一个具体实施方案中,所述表达盒为至少4.5kb。在另一个具体的实施方案中,所述表达盒为至少4.6kb。在另一个具体实施方案中,所述表达盒为至少4.7kb。在其它具体实施方案中,所述表达盒为至少4.8kb。在一个具体实施方案中,所述表达盒为至少4.9kb。在另一个具体的实施方案中,所述表达盒为至少5kb。在其它实施方案中,表达盒的尺寸为约0.2kb、约0.3kb、约0.4kb、约0.5kb、约0.6、约kb、约0.7kb、约0.8kb、约0.9kb、约1kb、约1.5kb、约2kb、约2.5kb、约3kb、约3.5kb、约4kb、约4.5kb、约5kb、约5.5kb、约6kb、约6.5kb、约7kb、约7.5kb、约8kb、约8.5kb、约9kb、约9.5kb、约10kb、约15kb、约20kb、约25kb、约30kb、约35kb、约40kb、约45kb、约50kb、约55kb、约60kb、约65kb、约70kb、约75kb或约80kb。在一个具体实施方案中,所述表达盒为约4.5kb。在另一个具体的实施方案中,所述表达盒为约4.6kb。在另一个具体实施方案中,所述表达盒为约4.7kb。在其它具体实施方案中,所述表达盒为约4.8kb。在一个具体实施方案中,所述表达盒为约4.9kb。在另一个具体的实施方案中,所述表达盒为约5kb。所述表达盒还可以包含多个数目的感兴趣的基因(“转基因”)。在一个实施方案中,表达盒包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个转基因。在一些具体的实施方案中,所述表达盒包含一个转基因。在一些实施方案中,所述转基因是重组基因。在一些其它实施方案中,所述转基因包含cDNA序列(例如,所述转基因中无内含子)。
在一些实施方案中,本文所提供的DNA分子不具有衣壳化AAV载体的尺寸限制,因此能够递送大型表达盒以提供有效的转基因。在某些实施方案中,本文所提供的DNA分子包含等于或大于任何天然AAV基因组尺寸的表达盒。
所述表达盒可以相对于反向重复序列具有多个位置。在一些实施方案中,所述表达盒与反向重复序列相隔至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29、至少30、至少31、至少32、至少33、至少34、至少35、至少36、至少37、至少38、至少39、至少40、至少41、至少42、至少43、至少44、至少45、至少46、至少47、至少48、至少49、至少50、至少51、至少52、至少53、至少54、至少55、至少56、至少57、至少58、至少59、至少60、至少61、至少62、至少63、至少64、至少65、至少66、至少67、至少68、至少69、至少70、至少71、至少72、至少73、至少74、至少75、至少76、至少77、至少78、至少79、至少80、至少81、至少82、至少83、至少84、至少85、至少86、至少87、至少88、至少89、至少90、至少91、至少92、至少93、至少94、至少95、至少96、至少97、至少98、至少99或至少100个核苷酸。在某些实施方案中,所述表达盒与反向重复序列相隔至少0.2kb、至少0.3kb、至少0.4kb、至少0.5kb、至少0.6、至少0.7kb、至少0.8kb、至少0.9kb、至少1kb、至少1.5kb或至少2kb。在其它实施方案中,所述表达盒与反向重复序列相隔约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约51、约52、约53、约54、约55、约56、约57、约58、约59、约60、约61、约62、约63、约64、约65、约66、约67、约68、约69、约70、约71、约72、约73、约74、约75、约76、约77、约78、约79、约80、约81、约82、约83、约84、约85、约86、约87、约88、约89、约90、约91、约92、约93、约94、约95、约96、约97、约98、约99或约100个核苷酸。在其它实施方案中,所述表达盒与反向重复序列相隔约0.2kb、约0.3kb、约0.4kb、约0.5kb、约0.6、约0.7kb、约0.8kb、约0.9kb、约1kb、约1.5kb或约2kb。在一个实施方案中,本段中的反向重复序列是如第3和5.3(包括5.3.1)节所述的第一反向重复序列。在另一个实施方案中,本段中的反向重复序列是如第3和5.3(包括5.3.1)节所述的第二反向重复序列。在另一个实施方案中,本段中的反向重复序列是如第3和5.3(包括5.3.1)节所述的第一和第二反向重复序列两者。
在一个方面,本文提供了双链DNA分子,其在有义链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的有义链与反义链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第一反向重复序列的有义链5'悬突;ii)有义表达盒;和iii)第二反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与反义链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第二反向重复序列的有义链3'悬突。
在另一个方面,本文提供了双链DNA分子,其在有义链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的有义链与反义链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第一反向重复序列的反义链3'悬突;ii)有义表达盒;和iii)第二反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的有义链与反义链分离,则所述切口导致产生包含所述第二反向重复序列的反义链5'悬突。
在另一个方面,本文提供了双链DNA分子,其在有义链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的有义链与反义链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第一反向重复序列的有义链5'悬突;ii)有义表达盒;和iii)第二反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的有义链与反义链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第二反向重复序列的反义链5'悬突。
在另一个方面,本文提供了双链DNA分子,其在有义链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的有义链与反义链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第一反向重复序列的反义链3'悬突;ii)有义表达盒;和iii)第二反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的有义链与反义链分离(例如,如5.2.3、5.2.4和5.3.2节中所述或者如图2B和2C所示),则所述切口导致产生包含所述第二反向重复序列的有义链3'悬突。
在一个方面,本文提供了双链DNA分子,其在有义链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第一和第二靶标位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的有义链与反义链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶的切口导致产生包含所述第一反向重复序列的有义链5'悬突;ii)有义表达盒;和iii)第二反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第三和第四靶标位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的有义链与反义链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶切口导致产生包含所述第二反向重复序列的有义链3'悬突。
在另一个方面,本文提供了双链DNA分子,其在有义链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第一和第二靶标位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的有义链与反义链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶的切口导致产生包含所述第一反向重复序列的反义链3'悬突;ii)有义表达盒;和iii)第二反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第三和第四靶标位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的有义链与反义链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶切口导致产生包含所述第二反向重复序列的反义链5'悬突。
在另一个方面,本文提供了双链DNA分子,其在有义链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第一和第二靶标位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的有义链与反义链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶的切口导致产生包含所述第一反向重复序列的有义链5'悬突;ii)有义表达盒;和iii)第二反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第三和第四靶标位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的有义链与反义链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶切口导致产生包含所述第二反向重复序列的反义链5'悬突。
在另一个方面,本文提供了双链DNA分子,其在有义链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第一和第二靶标位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的有义链与反义链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶的切口导致产生包含所述第一反向重复序列的反义链3'悬突;ii)有义表达盒;和iii)第二反向重复序列(例如,如5.3.1节所述),其中将可编程切口酶的向导核酸的第三和第四靶标位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的有义链与反义链分离(例如,如5.2.3、5.2.4和5.3.2节中所述或者如图2B和2C所示),则通过可编程切口酶切口导致产生包含所述第二反向重复序列的有义链3'悬突。
表达盒还可以包含一个或多个转录调控元件、一个或多个转录后调控元件或者一个或多个转录调控元件和一个或多个转录后调控元件两者。这些调控元件是允许、促使或调节核酸分子的功能调控,包括核酸或其衍生物之一(例如,mRNA)向宿主细胞或生物的复制、重复、转录、剪接、翻译、稳定性和/或转运的任何序列。这些调控元件包括(但不限于)启动子、增强子、多腺苷酸化信号、翻译终止密码子、核糖体结合元件、转录终止子、选择标志物和/或复制起点。
所述表达盒可以具有多种尺寸以容纳具有多种长度的一条或多条ORF。在某些实施方案中,表达盒的尺寸为至少2kb、至少2.5kb、至少3kb、至少3.5kb、至少4kb、至少4.5kb、至少5kb、至少5.5kb、至少6kb、至少6.5kb、至少7kb、至少7.5kb、至少8kb、至少8.5kb、至少9kb、至少9.5kb、至少10kb、至少15kb、至少20kb、至少25kb、至少30kb、至少35kb、至少40kb、至少45kb、至少50kb、至少55kb、至少60kb、至少65kb、至少70kb、至少75kb或至少80kb。在一个具体实施方案中,所述表达盒为至少7.5kb。在另一个具体的实施方案中,所述表达盒为至少7.6kb。在另一个具体实施方案中,所述表达盒为至少7.7kb。在其它具体实施方案中,所述表达盒为至少7.8kb。在一个具体实施方案中,所述表达盒为至少7.9kb。在另一个具体的实施方案中,所述表达盒为至少8kb。在其它实施方案中,表达盒的尺寸为约2kb、约2.5kb、约3kb、约3.5kb、约4kb、约4.5kb、约5kb、约5.5kb、约6kb、约6.5kb、约7kb、约7.5kb、约8kb、约8.5kb、约9kb、约9.5kb、约10kb、约15kb、约20kb、约25kb、约30kb、约35kb、约40kb、约45kb、约50kb、约55kb、约60kb、约65kb、约70kb、约75kb或约80kb。在一个具体实施方案中,所述表达盒为约7.5kb。在另一个具体的实施方案中,所述表达盒为约7.6kb。在另一个具体实施方案中,所述表达盒为约7.7kb。在其它具体实施方案中,所述表达盒为约7.8kb。在一个具体实施方案中,所述表达盒为约7.9kb。在另一个具体的实施方案中,所述表达盒为约8kb。所述表达盒还可以包含多个数目的感兴趣的基因(“转基因”)。在一个实施方案中,表达盒包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个转基因。在一些具体的实施方案中,所述表达盒包含一个转基因。在一些实施方案中,所述转基因是重组基因。在一些其它实施方案中,所述转基因包含cDNA序列(例如,所述转基因中无内含子)。
另外,所述表达盒可以包含至少4000个核苷酸、至少5000个核苷酸、至少10,000个核苷酸、至少20,000个核苷酸、至少30,000个核苷酸、至少40,000个核苷酸或至少50,000个核苷酸。在一些实施方案中,表达盒可以包含从约4000至约10,000个核苷酸、从约10,000至约50,000个核苷酸或者大于50,000个核苷酸的任何范围。在一些实施方案中,表达盒可以包含长度在约500至约50,000个核苷酸的范围内的转基因。在一些实施方案中,表达盒可以包含长度在约500至约75,000个核苷酸的范围内的转基因。在一些实施方案中,表达盒可以包含长度在约500至约10,000个核苷酸的范围内的转基因。在一些实施方案中,表达盒可以包含长度在约1000至约10,000个核苷酸的范围内的转基因。在一些实施方案中,表达盒可以包含长度在约500至约5,000个核苷酸的范围内的转基因。在一些实施方案中,本文所提供的DNA分子不具有衣壳化AAV载体的尺寸限制,因此能够递送大型表达盒以提供有效的转基因。在某些实施方案中,本文所提供的DNA分子包含等于或大于任何天然AAV基因组尺寸的表达盒。
所述表达盒可以相对于反向重复序列具有多个位置。在一些实施方案中,所述表达盒与反向重复序列相隔至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29、至少30、至少31、至少32、至少33、至少34、至少35、至少36、至少37、至少38、至少39、至少40、至少41、至少42、至少43、至少44、至少45、至少46、至少47、至少48、至少49、至少50、至少51、至少52、至少53、至少54、至少55、至少56、至少57、至少58、至少59、至少60、至少61、至少62、至少63、至少64、至少65、至少66、至少67、至少68、至少69、至少70、至少71、至少72、至少73、至少74、至少75、至少76、至少77、至少78、至少79、至少80、至少81、至少82、至少83、至少84、至少85、至少86、至少87、至少88、至少89、至少90、至少91、至少92、至少93、至少94、至少95、至少96、至少97、至少98、至少99或至少100个核苷酸。在某些实施方案中,所述表达盒与反向重复序列相隔至少0.2kb、至少0.3kb、至少0.4kb、至少0.5kb、至少0.6、至少kb、至少0.7kb、至少0.8kb、至少0.9kb、至少1kb、至少1.5kb或至少2k。在其它实施方案中,所述表达盒与反向重复序列相隔约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约51、约52、约53、约54、约55、约56、约57、约58、约59、约60、约61、约62、约63、约64、约65、约66、约67、约68、约69、约70、约71、约72、约73、约74、约75、约76、约77、约78、约79、约80、约81、约82、约83、约84、约85、约86、约87、约88、约89、约90、约91、约92、约93、约94、约95、约96、约97、约98、约99或约100个核苷酸。在其它实施方案中,所述表达盒与反向重复序列相隔约0.2kb、约0.3kb、约0.4kb、约0.5kb、约0.6、约kb、约0.7kb、约0.8kb、约0.9kb、约1kb、约1.5kb或约2kb。在一个实施方案中,本段中的反向重复序列是如第3和5.3(包括5.3.1)节所述的第一反向重复序列。在另一个实施方案中,本段中的反向重复序列是如第3和5.3(包括5.3.1)节所述的第二反向重复序列。在另一个实施方案中,本段中的反向重复序列是如第3和5.3(包括5.3.1)节所述的第一和第二反向重复序列两者。
如以上本节(5.3.3节)所描述的,表达盒可以包含一个或多个ORF。在一个实施方案中,ORF是人基因的ORF,其中已知人基因中的基因突变引起疾病。在另一个实施方案中,ORF是人基因的ORF,其中已知人基因中的基因突变引起遗传病。在另一个实施方案中,所述ORF编码治疗性蛋白。在其它实施方案中,所述ORF编码酶。在某些实施方案中,所述ORF编码代谢酶。在一些实施方案中,所述ORF编码酶,其中所述酶替换或补充人体中缺陷酶的功能。在一个实施方案中,ORF编码抗体。在另一个实施方案中,ORF编码治疗性抗体。在其它实施方案中,ORF编码细胞因子。在另一个实施方案中,ORF编码RNA。在一个实施方案中,ORF编码调控性RNA。在另一个实施方案中,ORF编码反义RNA。在另一个实施方案中,ORF编码siRNA。在其它实施方案中,ORF编码shRNA。在一个实施方案中,ORF编码miRNA。在另一个实施方案中,ORF编码piRNA(PIWI-相互作用RNA)。在一些实施方案中,所述表达盒以多种排列与组合包含本节(5.3.3节)中描述的任何一个或多个特性。
本节(5.3.3节)中所述的关于切口核酸内切酶和/或切口核酸内切酶的限制性位点的多种实施方案另外提供了被可编程切口酶替换的切口核酸内切酶和被可编程切口酶的靶标位点替换的限制性位点。已在5.2.4节中提供了本段和本节(5.3.3节)中的可编程切口酶及其靶标位点。
5.3.4本文所提供的DNA分子中缺少的病毒DNA序列特性
如第3、5.2、5.3.1、5.3.2、5.3.3、5.3.5、5.3.6和5.4节中进一步描述的,可以合成或重组产生具有或不具有某些序列元件或特性的所提供的DNA分子。照此,某些适合和所期望的序列特性或元件可以包括在本文所提供的DNA分子中或者不包括在本文所提供的DNA分子中。本文还提供了通过使用5.3所述的DNA分子,应用5.2所述的方法制备包括或不包括所述序列特性或元件的这种DNA分子的相应方法,其可以产生5.4中所描述的多种DNA分子。
如第3、5.3.1、5.5和6节中所述,本文所提供的DNA分子可以不包括的这些DNA序列元件或特性可以是病毒复制相关蛋白结合序列(“RABS”),其是指通过细小病毒科基因Rep或NS1编码的病毒DNA复制相关蛋白(“RAP”)或其同工型可以结合的DNA序列。在一些实施方案中,RABS是Rep结合序列(“RBS”)。Rep可以结合至ITR内的2个元件。它可以结合至ITR茎结构中的核苷酸序列(即Rep蛋白识别用于病毒核酸分子复制的核苷酸序列)。这种RBS也被称为RBE(Rep-结合元件)。Rep还可以结合至核苷酸序列,其形成包含位于ITR内的内部发夹结构的单一尖端的小回文,借此稳定Rep和ITR之间的结合。这种RBS也被称为RBE'。在其它实施方案中,RABS是复制相关病毒蛋白NS1可以结合的NS1-结合元件(“NSBE”)。在一些实施方案中,Rep可以结合至ITR茎结构中的核苷酸序列(即Rep或NS1蛋白识别(用于病毒核酸分子复制)的核苷酸序列)和/或核苷酸序列的Rep和/或NS1蛋白之间的特异性相互作用位点。RABS可以是5个核苷酸至300个核苷酸的序列。在包括本节5.3.4在内的本文所提供的DNA分子的一些实施方案中,RABS可以是至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少55、至少60、至少65、至少70、至少75、至少80、至少85、至少90、至少95、至少100、至少105、至少110、至少115、至少120、至少125、至少130、至少135、至少140、至少145、至少150、至少155、至少160、至少165、至少170、至少175、至少180、至少185、至少190、至少195、至少200、至少205、至少210、至少215、至少220、至少225、至少230、至少235、至少240、至少245、至少250、至少255、至少260、至少265、至少270、至少275、至少280、至少285、至少290、至少295、至少300、至少305、至少310、至少315、至少320、至少325、至少330、至少335、至少340、至少345、至少350、至少355、至少360、至少365、至少370、至少375、至少380、至少385、至少390、至少395或至少400个核苷酸的序列。在一些其它实施方案中,RABS可以是约5、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95、约100、约105、约110、约115、约120、约125、约130、约135、约140、约145、约150、约155、约160、约165、约170、约175、约180、约185、约190、约195、约200、约205、约210、约215、约220、约225、约230、约235、约240、约245、约250、约255、约260、约265、约270、约275、约280、约285、约290、约295、约300、约305、约310、约315、约320、约325、约330、约335、约340、约345、约350、约355、约360、约365、约370、约375、约380、约385、约390、约395或约400个核苷酸的序列。在一些其它实施方案中,缺少本段所描述的RABS的DNA分子的任何实施方案可以与包括第3、5.2、5.3、5.4和6节在内的本文所提供的任何方法或DNA分子组合。
作为另外一种选择,本文所提供的DNA分子,包括第3、5.2、5.3、5.4和6节中的DNA分子,可以通过使存在于具有突变、插入和/或缺失(包括部分缺失或截短)的DNA分子中的RABS序列功能性失活缺少功能性RABS,从而RABS不可再用作Rep蛋白或NS1蛋白的识别和/或结合位点。照此,在包括第3、5.2、5.3、5.4和6节在内的本文所提供的DNA分子的一些实施方案中,所述DNA分子包含功能性失活的RABS。可以通过测量并将Rep或NS1蛋白与包含功能性失活的RABS的DNA分子之间的结合与Rep或NS1蛋白与包含野生型(wt)RBS或NSBE序列的参考分子(例如,相同DNA分子,但是具有wt RBS或wt NSBE序列)之间的结合相比较来评价这种功能性失活。可以通过分子生物学领域中已知并使用的任何结合测量确定这种结合,例如,染色质免疫沉淀(ChIP)测定、DNA电泳迁移率变动分析(EMSA)、DNA下拉测定(Pull-down assay)或微板捕获和检测测定,如Matthew J.Guille&G.Geoff Kneale,MolecularBiotechnology 8:35–52(1997);Bipasha Dey等人.,Mol Cell Biochem.2012年6月;365(1-2):279-99中进一步描述的,两篇参考文献均以其全部内容作为参考并入本文。在一个实施方案中,与RAP和参考DNA分子中的野生型RBS或NSBE(例如,相同DNA分子,但是具有野生型RBS或NSBE序列)之间的结合相比,RAP和所述DNA分子中的功能性失活的RABS之间的结合为至多0.001%、至多0.01%、至多0.1%、至多1%、至多1.5%、至多2%、至多2.5%、至多3%、至多3.5%、至多4%、至多4.5%、至多5%、至多5.5%、至多6%、至多6.5%、至多7%、至多7.5%、至多8%、至多8.5%、至多9%、至多9.5%或者至多10%。在另一个实施方案中,与RAP和参考DNA分子中的野生型RABS(例如,相同DNA分子,但是具有wt RBS或NSBE序列)之间的结合相比,RAP和所述DNA分子中的功能性失活的RABS之间的结合为约0.001%、约0.01%、约0.1%、约1%、约1.5%、约2%、约2.5%、约3%、约3.5、约4%、约4.5%、约5%、约5.5%、约6%、约6.5%、约7%、约7.5%、约8%、约8.5%、约9%、约9.5%或约10%。在另一个实施方案中,与RAP和参考DNA分子中的野生型RABS(例如,相同DNA分子,但是具有wt RBS或NSBE序列)之间的结合相比,RAP和所述DNA分子中的功能性失活的RABS之间的结合为0.001%、0.01%、0.1%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、5.5%、6%、6.5%、7%、7.5%、8%、8.5%、9%、9.5%或10%。
此外,包括第3、5.2、5.3、5.4和6节在内的本文所提供的DNA分子可以通过经由突变、插入和/或缺失(包括部分缺失或截短),从而使RAP或病毒衣壳编码序列不再可以功能表达Rep蛋白、NS1蛋白或病毒衣壳蛋白来使存在于所述DNA分子中的Rep蛋白、NS1或病毒衣壳编码序列功能失活,以缺少功能性RAP或病毒衣壳编码序列。可以(例如)通过使用突变、插入和/或缺失以改变Rep蛋白、NS1蛋白或病毒衣壳编码序列的开放阅读框,通过使用突变、插入和/或缺失以除去起始密码子,通过使用突变、插入和/或缺失以除去启动子或转录起始位点,通过使用突变、插入和/或缺失以除去RNA聚合酶结合位点,通过使用突变、插入和/或缺失以除去核糖体识别或结合位点,或者本领域中已知并使用的其它方式实现这种功能性失活突变、插入或缺失。
在一个实施方案中,所述DNA分子包含通过突变失活的RBS。在一个实施方案中,所述DNA分子包含通过RBS中1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20、21、22、23、24、25、26、27、28、29、10、31、32、33、34、35、36、37、38、39或者40个核苷酸的突变失活的RBS。在另一个实施方案中,所述DNA分子包含通过RBS中1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、10%、31%、32%、33%、34%、35%、36%、37%、38%、39%或者40%的核苷酸的突变失活的RBS。在其它实施方案中,所述DNA分子包含通过RBS中1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20、21、22、23、24、25、26、27、28、29、10、31、32、33、34、35、36、37、38、39或者40个核苷酸的缺失失活的RBS。在另一个实施方案中,所述DNA分子包含通过RBS中1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、10%、31%、32%、33%、34%、35%、36%、37%、38%、39%或者40%的核苷酸的缺失失活的RBS。在一些实施方案中,前句中的缺失是内部缺失、来自5'末端的缺失或者来自3'末端的缺失。在一些实施方案中,本段的缺失可以是内部缺失、来自5'末端的缺失和/或来自3'末端的缺失的任意组合。在某些实施方案中,所述DNA分子包含通过整个RBS序列的缺失失活的RBS。在一些其它实施方案中,所述DNA分子包含通过RBS序列的部分缺失失活的RBS。
在一个实施方案中,所述DNA分子包含通过突变失活的NBSE。在一个实施方案中,DNA分子包含通过NSBE中1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20、21、22、23、24、25、26、27、28、29、10、31、32、33、34、35、36、37、38、39或者40个核苷酸的突变失活的NSBE。在另一个实施方案中,所述DNA分子包含通过NSBE中1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、10%、31%、32%、33%、34%、35%、36%、37%、38%、39%或者40%的核苷酸的突变失活的NSBE。在其它实施方案中,DNA分子包含通过NSBE中1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20、21、22、23、24、25、26、27、28、29、10、31、32、33、34、35、36、37、38、39或者40个核苷酸的缺失失活的NSBE。在另一个实施方案中,所述DNA分子包含通过NSBE中1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、10%、31%、32%、33%、34%、35%、36%、37%、38%、39%或者40%的核苷酸的缺失失活的NSBE。在一些实施方案中,前句中的缺失是内部缺失、来自5'末端的缺失或者来自3'末端的缺失。在一些实施方案中,本段的缺失可以是内部缺失、来自5'末端的缺失和/或来自3'末端的缺失的任意组合。在某些实施方案中,所述DNA分子包含通过整个NSBE序列的缺失失活的NSBE。在一些其它实施方案中,所述DNA分子包含通过NSBE序列的部分缺失失活的NSBE。
类似地,本文所提供的DNA分子的任何特定区域(包括5.3和5.4节)或者本文所提供的方法中所使用的DNA分子的任何特定区域(包括5.2节)可以包括或不包括DNA序列元件或特性。在一个实施方案中,所述DNA分子缺少Rep蛋白编码序列。在一个实施方案中,所述DNA分子缺少NS1蛋白编码序列。在另一个实施方案中,所述DNA分子缺少病毒衣壳蛋白编码序列。在一些实施方案中,所述表达盒缺少Rep蛋白编码序列。在一些实施方案中,所述表达盒缺少NS1蛋白编码序列。在某些实施方案中,所述表达盒缺少病毒衣壳蛋白编码序列。在其它实施方案中,所述DNA分子缺少RABS。在另一个实施方案中,所述第一反向重复序列缺少RABS。在一个实施方案中,所述第二反向重复序列缺少RABS。在另一个实施方案中,所述第一反向重复序列的ITR封闭碱基对和所述第二反向重复序列的ITR封闭碱基对之间的DNA序列缺少RABS。RABS的缺少可以是一个RABS的缺少、2个RABS的缺少、大于2个RABS的缺少或者任何RABS的缺少。在一个实施方案中,所述DNA分子包含功能性失活的Rep蛋白编码序列。在一个实施方案中,所述DNA分子包含功能性失活的Rep蛋白编码序列。在一个实施方案中,所述DNA分子包含功能性失活的NS1蛋白识别序列。在一个实施方案中,所述DNA分子包含功能性失活的NS1蛋白编码序列。在另一个实施方案中,所述DNA分子包含功能性失活的病毒衣壳蛋白编码序列。在一些实施方案中,所述表达盒包含功能性失活的Rep蛋白编码序列。在一些实施方案中,所述表达盒包含功能性失活的NS1蛋白编码序列。在某些实施方案中,所述表达盒包含功能性失活的病毒衣壳蛋白编码序列。在其它实施方案中,所述DNA分子包含功能性失活的RABS。在另一个实施方案中,所述第一反向重复序列包含功能性失活的RABS。在一个实施方案中,所述第二反向重复序列包含功能性失活的RABS。在另一个实施方案中,所述第一反向重复序列的ITR封闭碱基对和所述第二反向重复序列的ITR封闭碱基对之间的DNA序列包含功能性失活的RABS。据考虑1、2或更多个RABS或者全部RABS可以是功能性失活的。
另外,来自本文所提供的DNA分子的任何特定区域(包括5.3和5.4节)或者本文所提供的方法中所使用的DNA分子的任何特定区域(包括5.2节)的任意组合的DNA序列元件或特性可以是功能性失活的。在一个实施方案中,所述第一反向重复序列包含功能性失活的RABS并且所述第二反向重复序列包含功能性失活的RABS。在另一个实施方案中,所述第一反向重复序列包含功能性失活的RABS,并且所述第一反向重复序列的ITR封闭碱基对和所述第二反向重复序列的ITR封闭碱基对之间的DNA序列包含功能性失活的RABS。在其它实施方案中,所述第二反向重复序列包含功能性失活的RABS,并且所述第一反向重复序列的ITR封闭碱基对和所述第二反向重复序列的ITR封闭碱基对之间的DNA序列包含功能性失活的RABS。在另一个实施方案中,所述第一反向重复序列包含功能性失活的RABS,所述第二反向重复序列包含功能性失活的RABS,并且所述第一反向重复序列的ITR封闭碱基对和所述第二反向重复序列的ITR封闭碱基对之间的DNA序列包含功能性失活的RABS。据考虑1、2或更多个RABS或者全部RABS可以是功能性失活的。
如第3、5.3.1、5.5和6节所述,本文所提供的DNA分子可以不包括的这些DNA序列元件或特性可以是末端解析位点(“TRS”)。TRS是指通过RAP(用于病毒核酸分子复制)所识别的DNA分子的反向重复序列中的核苷酸序列,并且是通过RAP蛋白的核酸内切酶活性链-特异性切割的位点。TRS也是RAP和核苷酸序列之间的特异性相互作用位点。可以通过分子生物学领域中已知并使用的DNA切口测定确定通过RAP蛋白的核酸内切酶活性特异性切割的保守位点的核苷酸序列,所述测定例如凝胶电泳、荧光团-基体外切口测定、放射性体外切口测定,如Xu P等人,2019.Antimicrob Agents Chemother 63:e01879-18;US20190203229A中进一步描述的;以上两篇参考文献均以其全部内容作为参考并入本文。在一些实施方案中,TRS可以是通过Rep蛋白(用于病毒核酸分子复制)所识别的DNA分子的反向重复序列中的核苷酸序列,并且是通过Rep蛋白的核酸内切酶活性的链特异性切口的位点。TRS还可以是通过Rep蛋白的核酸内切酶活性的特异性切割位点。在一个实施方案中,TRS可以是通过NS1蛋白(用于病毒核酸分子ns1)所识别的DNA分子的反向重复序列中的核苷酸序列,并且是通过NS1蛋白的核酸内切酶活性的链特异性切口的位点。在另一个实施方案中,TRS还可以包括NS1蛋白和核苷酸序列之间的特异性相互作用的位点。TRS可以是5个核苷酸至300个核苷酸的序列。在包括本5.3.4节在内的本文所提供的方法的一些实施方案中,TRS可以是具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少55、至少60、至少65、至少70、至少75、至少80、至少85、至少90、至少95、至少100、至少105、至少110、至少115、至少120、至少125、至少130、至少135、至少140、至少145、至少150、至少155、至少160、至少165、至少170、至少175、至少180、至少185、至少190、至少195、至少200、至少205、至少210、至少215、至少220、至少225、至少230、至少235、至少240、至少245、至少250、至少255、至少260、至少265、至少270、至少275、至少280、至少285、至少290、至少295、至少300、至少305、至少310、至少315、至少320、至少325、至少330、至少335、至少340、至少345、至少350、至少355、至少360、至少365、至少370、至少375、至少380、至少385、至少390、至少395或至少400个核苷酸的序列。在一些其它实施方案中,TRS可以是具有约5、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95、约100、约105、约110、约115、约120、约125、约130、约135、约140、约145、约150、约155、约160、约165、约170、约175、约180、约185、约190、约195、约200、约205、约210、约215、约220、约225、约230、约235、约240、约245、约250、约255、约260、约265、约270、约275、约280、约285、约290、约295、约300、约305、约310、约315、约320、约325、约330、约335、约340、约345、约350、约355、约360、约365、约370、约375、约380、约385、约390、约395或约400个核苷酸的序列。在一些其它实施方案中,本段所描述的TRS的任何实施方案可以与包括第3、5.2、5.3、5.4和6节在内的本文所提供的任何方法或DNA分子组合。
作为另外一种选择,本文所提供的DNA分子,包括第3、5.2、5.3、5.4和6节中的DNA分子,可以通过使存在于具有突变、插入和/或缺失(包括部分缺失或截短)的DNA分子中的TRS序列功能性失活而缺少功能性TRS,从而TRS不可再用作RAP(即Rep和NS1)的识别和/或结合位点。照此,在包括第3、5.2、5.3、5.4和6节在内的本文所提供的DNA分子的一些实施方案中,所述DNA分子包含功能性失活的TRS。可以通过测量和比较RAP(即Rep和NS1)与包含位于RAP和包含野生型(wt)TRS序列(例如,相同DNA分子,但是具有wt TRS序列)的参考分子之间的功能性失活的TRS的DNA分子之间的结合来评价这种功能性失活。可以通过分子生物学领域中已知并使用的任何结合测量确定这种结合,例如,染色质免疫沉淀(ChIP)测定、DNA电泳迁移率变动分析(EMSA)、DNA下拉测定(Pull-down assay)或微板捕获和检测测定,如Matthew J.Guille&G.Geoff Kneale,Molecular Biotechnology 8:35–52(1997);BipashaDey等人,Mol Cell Biochem.2012年6月;365(1-2):279-99中进一步描述的,以上两篇参考文献均以其全部内容作为参考并入本文。在一个实施方案中,与RAP(即Rep和NS1)和参考DNA分子(例如,相同DNA分子,但是具有wt TRS序列)中的野生型TRS之间的结合相比较,RAP(即Rep和NS1)与DNA分子中功能性失活的TRS之间的结合为至多0.001%、至多0.01%、至多0.1%、至多1%、至多1.5%、至多2%、至多2.5%、至多3%、至多3.5、至多4%、至多4.5%、至多5%、至多5.5%、至多6%、至多6.5%、至多7%、至多7.5%、至多8%、至多8.5%、至多9%、至多9.5%或至多10%。在另一个实施方案中,与RAP(即Rep和NS1)和参考DNA分子(例如,相同DNA分子,但是具有wt TRS序列)中的野生型TRS之间的结合相比较,RAP(即Rep和NS1)与DNA分子中功能性失活的TRS之间的结合为约0.001%、约0.01%、约0.1%、约1%、约1.5%、约2%、约2.5%、约3%、约3.5、约4%、约4.5%、约5%、约5.5%、约6%、约6.5%、约7%、约7.5%、约8%、约8.5%、约9%、约9.5%或约10%。在另一个实施方案中,与RAP(即Rep和NS1)和参考DNA分子(例如,相同DNA分子,但是具有wt TRS序列)中的野生型TRS之间的结合相比较,RAP(即Rep和NS1)与DNA分子中功能性失活的TRS之间的结合为0.001%、0.01%、0.1%、1%、1.5%、2%、2.5%、3%、3.5、4%、4.5%、5%、5.5%、6%、6.5%、7%、7.5%、8%、8.5%、9%、9.5%或10%。
在一个实施方案中,所述DNA分子包含通过突变失活的TRS。在一个实施方案中,DNA分子包含通过TRS中1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20、21、22、23、24、25、26、27、28、29、10、31、32、33、34、35、36、37、38、39或者40个核苷酸的突变失活的TRS。在另一个实施方案中,所述DNA分子包含通过TRS中1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、10%、31%、32%、33%、34%、35%、36%、37%、38%、39%或者40%的核苷酸的突变失活的TRS。在其它实施方案中,DNA分子包含通过TRS中1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20、21、22、23、24、25、26、27、28、29、10、31、32、33、34、35、36、37、38、39或者40个核苷酸的缺失失活的TRS。在另一个实施方案中,所述DNA分子包含通过TRS中1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、10%、31%、32%、33%、34%、35%、36%、37%、38%、39%或者40%的核苷酸的缺失失活的TRS。在一些实施方案中,前句中的缺失是内部缺失、来自5'末端的缺失或者来自3'末端的缺失。在一些实施方案中,本段的缺失可以是内部缺失、来自5'末端的缺失和/或来自3'末端的缺失的任意组合。在某些实施方案中,所述DNA分子包含通过整个TRS序列的缺失失活的TRS。在一些其它实施方案中,所述DNA分子包含通过TRS序列的部分缺失失活的TRS。
类似地,本文所提供的DNA分子的任何特定区域(包括5.3和5.4节)或者本文所提供的方法中所使用的DNA分子的任何特定区域(包括5.2节)可以包括或不包括DNA序列元件或特性。在一个实施方案中,DNA分子缺少TRS。在另一个实施方案中,所述第一反向重复序列缺少TRS。在另一个实施方案中,所述第二反向重复序列缺少TRS。在其它实施方案中,所述第一反向重复序列缺少TRS并且所述第二反向重复序列缺少TRS。
作为另外一种选择,来自本文所提供的DNA分子的任何特定区域(包括5.3和5.4节)或者本文所提供的方法中所使用的DNA分子的任何特定区域(包括5.2节)的TRS序列元件或特性可以是功能性失活的。在一个实施方案中,所述DNA分子包含功能性失活的TRS。在另一个实施方案中,所述第一反向重复序列包含功能性失活的TRS。在另一个实施方案中,所述第二反向重复序列包含功能性失活的TRS。在其它实施方案中,所述第一反向重复序列包含功能性失活的TRS并且所述第二反向重复序列包含功能性失活的TRS。
在一些具体的实施方案中,本文所提供的DNA分子中不包括的或者功能性失活的RABS可以是下表中所列的RABS序列中任一个,或者任意数目的任意组合,或者全部。
表18:示例性RAP
图3以及相应SEQ ID NO:3、4、5、8、9和10中举例说明了缺少RBS序列的DNA分子的末端重复的其它非限制性实例。在一些具体的实施方案中,本文所提供的DNA分子中不包括的或者功能性失活的RABS可以是下表中所列的RABS序列中任一个,或者任意数目的任意组合,或者全部。
在一个具体的实施方案中,所述DNA分子缺少前段表格中所述的RAP的任一个,或者任意数目的任意组合,或者全部的编码序列。在另一个具体的实施方案中,所述DNA分子包含编码前段表格中所述的RAP的任一个,或者任意数目的任意组合,或者全部的功能性失活的序列。在另一个具体的实施方案中,所述DNA分子包含编码前段表格中所述的RAP的任一个,或者任意数目的任意组合,或者全部的功能性失活的序列。
在另一个具体的实施方案中,所述DNA分子包含前段表格中所述的RAP的任一个,或者任意数目的任意组合,或者全部的功能性失活的识别序列。在一个具体实施方案中,具有发夹结构的反向重复序列之一或两者缺少RAPS识别序列:GGCCACTCCCGAAGAGCGCGCTCGCTATCTCACTGAGGCCGGGCGACCAAAGGT CGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGATAGCGAGCGCGCTCT TCGGGAGTGGCC(SEQ ID NO:333)
实施例10中举例说明了可以包括在缺少至少一个或任一个RBS序列的DNA分子中的具有发夹结构的反向重复序列的其它非穷举的实例。
在其它具体的实施方案中,本文所提供的DNA分子中不包括的或者功能性失活的TRS可以是下表中所列的TRS序列中任一个,或者任意数目的任意组合,或者全部。
表19:示例性RAP
RAP(病毒) | 相应TRS序列 |
Rep(AAV2、AAV3、AAV4) | AGTTGG |
Rep(AAV1、AAV6) | AGTTGC |
Rep(AAV5) | AGTGTGGC |
NS1(B19) | GACACC |
NS1(HBOV) | CTATATCT |
NS1(MVM) | CTWW/TCA(W=A/T) |
由于本文所提供的方法不需要病毒复制步骤并且本文所提供的DNA分子不需要在病毒生命周期中产生或复制,因此本发明公开提供并且阅读本发明公开文本的人将理解本文所提供的DNA分子可以缺少多种DNA序列或特性,包括本节(5.3.4节)中提供的那些序列或特性。如本5.3.4节所提供的缺少RABS和/或TRS的DNA分子和包含功能性失活的RABS和/或功能性失活TRS的DNA分子至少提供了一个主要优势,即当与包括这些RABS和/或TRS序列的DNA分子相比较时,一旦施用于患者,所述DNA分子将不具有或具有显著较低的动员或复制风险。动员风险是指复制缺陷型DNA分子在已施用所述DNA分子的宿主中恢复病毒颗粒复制或生产的风险。这种动员风险可以由通过已感染已施用所述DNA分子的相同宿主的病毒所表达的病毒蛋白质(例如,Rep蛋白、NS1蛋白或者病毒衣壳蛋白)的存在产生。动员风险为复制缺陷型病毒基因组作为基因疗法载体的使用造成了显著的安全性问题,如(例如)Liujiang Song,Hum Gene Ther,2020年10月;31(19-20):1054-1067中所述(该文献以其全部内容作为参考并入本文)。这些缺少RABS和/或TRS的DNA分子将不具有起始复制的病毒RAP的结合位点,即使在相同宿主中存在提供RAP的其它辅助病毒。不受理论束缚,据信复制起始的存在可能需要辅助因子,其通过辅助病毒(称为“辅助病毒”)对宿主的共感染提供,所述辅助病毒可以包括来自疱疹病毒家族、腺病毒和乳头瘤病毒的病毒。
因此,在包括本5.3.4节在内的本文所提供的DNA分子的一些实施方案中,当与具有RABS和/或具有TRS的DNA分子相比时,无RABS和/或无TRS的DNA分子在向受试者或患者施用后具有较低的动员风险。在包括本5.3.4节在内的本文所提供的DNA分子的某些实施方案中,当与具有RABS和/或具有TRS的DNA分子相比时,包含功能性失活的RABS和/或功能性失活的TRS的DNA分子在向受试者或患者施用后具有较低的动员风险。可以将这种动员风险的降低确定为(Pm-Po)/Pm,其中Pm是当RAP存在时(例如,由于包含RAP的任何病毒的感染或者RAP在相同宿主中的工程化表达),从具有RABS的对照DNA分子产生的病毒颗粒的数目;Po是在用于对照DNA分子的相同宿主中的相当条件下,从如本文所提供的缺少RABS或包含功能性失活的RABS的DNA分子产生的病毒颗粒的数目。作为另外一种选择,可以将这种动员风险的降低确定为(Pm-Po)/Pm,其中Pm是当RAP存在时(例如,由于包含RAP的任何病毒的感染或者RAP在相同宿主中的工程化表达),从具有TRS的对照DNA分子产生的病毒颗粒的数目;Po是在用于对照DNA分子的相同宿主中的相当条件下,从如本文所提供的缺少TRS或包含功能性失活的TRS的DNA分子产生的病毒颗粒的数目。另外,可以将这种动员风险的降低确定为(Pm-Po)/Pm,其中Pm是当RAP存在时(例如,由于包含Rep蛋白或NS1蛋白的任何病毒的感染或者Rep蛋白或NS1蛋白在相同宿主中的工程化表达),从具有RABS且具有TRS的对照DNA分子产生的病毒颗粒的数目;Po是在用于对照DNA分子的相同宿主中的相当条件下,从如本文所提供的(i)缺少RABS或包含功能性失活的RABS,和(ii)缺少TRS或包含功能性失活的TRS的DNA分子产生的病毒颗粒的数目。如Liujiang Song,Hum Gene Ther,2020年10月;31(19-20):1054-1067(以其全部内容作为参考并入本文)所述,用于确定可以产生的颗粒数目的宿主可以是细胞、动物(例如,小鼠、仓鼠、大鼠、狗、兔、豚鼠和其它适合的哺乳动物)或者人。本发明公开文本还提供并且阅读本发明公开文本的本领域的常规技术人员将理解分别如本段所述的Pm和Po还可以用于确定动员的绝对或相对水平。简要而言,在该测定中,通过包含DNA分子的病毒颗粒感染,将DNA分子转染到宿主细胞(例如,HEK293细胞)中或者转导到宿主细胞中。还用Rep蛋白、NS1蛋白转染或者用表达Rep蛋白或NS1蛋白的另一种病毒(例如,野生型病毒)共转染宿主细胞。然后,培养宿主细胞以生产和释放病毒颗粒。然后,通过在培养48至72小时(例如,65小时)后收集宿主细胞和培养基两者收获病毒颗粒。可以通过在核酸酶(Benzonase)处理以消除非衣壳化DNA后的探针-基定量PCR(qPCR)分析来确定病毒颗粒的滴度(Pm和Po的代表),如Song等人,Cytotherapy 2013;15:986–998所述,以上文献以其全部内容作为参考并入。这种测定的示例性实施见Liujiang Song,Hum Gene Ther,2020年10月;31(19-20):1054-1067,该文献以其全部内容作为参考并入本文。
基于动员风险和动员风险水平的降低的确定,在包括本5.3.4节在内的本文所提供的DNA分子的一些实施方案中,当施用于宿主时,所述DNA分子的动员风险比具有RABS和/或具有TRS的对照DNA分子小100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、44%、43%、42%、41%、40%、39%、38%、37%、36%、35%、34%、33%、32%、31%、30%、29%、28%、27%、26%、25%、24%、23%、22%、21%或20%。在某些实施方案中,当施用于宿主时,所述DNA分子的动员风险比具有RABS和/或具有TRS的对照DNA分子小至少99%、至少98%、至少97%、至少96%、至少95%、至少94%、至少93%、至少92%、至少91%、至少90%、至少89%、至少88%、至少87%、至少86%、至少85%、至少84%、至少83%、至少82%、至少81%、至少80%、至少79%、至少78%、至少77%、至少76%、至少75%、至少74%、至少73%、至少72%、至少71%、至少70%、至少69%、至少68%、至少67%、至少66%、至少65%、至少64%、至少63%、至少62%、至少61%、至少60%、至少59%、至少58%、至少57%、至少56%、至少55%、至少54%、至少53%、至少52%、至少51%、至少50%、至少49%、至少48%、至少47%、至少46%、至少45%、至少44%、至少43%、至少42%、至少41%、至少40%、至少39%、至少38%、至少37%、至少36%、至少35%、至少34%、至少33%、至少32%、至少31%、至少30%、至少29%、至少28%、至少27%、至少26%、至少25%、至少24%、至少23%、至少22%、至少21%或至少20。在其它实施方案中,当施用于宿主时,所述DNA分子的动员风险比具有RABS和/或具有TRS的对照DNA分子小约100%、约99%、约98%、约97%、约96%、约95%、约94%、约93%、约92%、约91%、约90%、约89%、约88%、约87%、约86%、约85%、约84%、约83%、约82%、约81%、约80%、约79%、约78%、约77%、约76%、约75%、约74%、约73%、约72%、约71%、约70%、约69%、约68%、约67%、约66%、约65%、约64%、约63%、约62%、约61%、约60%、约59%、约58%、约57%、约56%、约55%、约54%、约53%、约52%、约51%、约50%、约49%、约48%、约47%、约46%、约45%、约44%、约43%、约42%、约41%、约40%、约39%、约38%、约37%、约36%、约35%、约34%、约33%、约32%、约31%、约30%、约29%、约28%、约27%、约26%、约25%、约24%、约23%、约22%、约21%或约20%。
作为另外一种选择,在一个实施方案中,包括本5.3.4节在内的本文所提供的DNA分子导致产生无可检测的动员(例如,基于本5.3.4节中提供的Po测量)。在另一个实施方案中,包括本5.3.4节在内的本文所提供的DNA分子导致产生了不大于由参考DNA分子(例如,相同DNA分子,但是具有野生型RABS和/或具有野生型TRS序列)所产生的动员的0.0001%、不大于0.001%、不大于0.01%、不大于0.1%、不大于1%、不大于1.5%、不大于2%、不大于2.5%、不大于3%、不大于3.5、不大于4%、不大于4.5%、不大于5%、不大于5.5%、不大于6%、不大于6.5%、不大于7%、不大于7.5%、不大于8%、不大于8.5%、不大于9%、不大于9.5%或不大于10%的动员。在其它实施方案中,包括本5.3.4节在内的本文所提供的DNA分子导致产生了由参考DNA分子(例如,相同DNA分子,但是具有野生型RABS和/或具有野生型TRS序列)所产生的动员的约0.0001%、约0.001%、约0.01%、约0.1%、约1%、约1.5%、约2%、约2.5%、约3%、约3.5、约4%、约4.5%、约5%、约5.5%、约6%、约6.5%、约7%、约7.5%、约8%、约8.5%、约9%、约9.5%或约10%的动员。在另一个实施方案中,包括本5.3.4节在内的本文所提供的DNA分子导致产生了由参考DNA分子(例如,相同DNA分子,但是具有野生型RABS和/或具有野生型TRS序列)所产生的动员的0.0001%、0.001%、0.01%、0.1%、1%、1.5%、2%、2.5%、3%、3.5、4%、4.5%、5%、5.5%、6%、6.5%、7%、7.5%、8%、8.5%、9%、9.5%或10%的动员。可以通过使用如前段(包括前两段)中进一步描述的所确定的Pm和Po确定这种动员百分比。
在某些实施方案中,本文(例如,如本5.3.4节)所提供的DNA分子包含具有功能性失活的RABS和/或功能性失活的TRS的ITR。在某些实施方案中,本文所提供的DNA分子包含缺少RABS和/或TRS的ITR。在某些实施方案中,当与包含功能性RABS和/或功能性TRS的DNA分子相比较时,在向受试者或患者施用后,本文所提供的DNA分子具有较低的动员风险。具有功能性失活的RABS和/或功能性失活的TRS的ITR可互换地被称为“病毒复制缺陷型反向重复序列”或者“病毒复制缺陷型反向末端重复序列”。
在某些实施方案中,本文所提供的方法不需要任何RABS。在某些实施方案中,本文所提供的DNA分子不需要在病毒生命周期中产生和/或复制。本领域技术人员将理解本文所提供的DNA分子可以缺少惯例上与RABS和/或病毒生产或复制有关的其它特性,包括(例如)本5.3.4节中所讨论的那些序列或特性。在某些实施方案中,本文(例如,如5.3.4节)所提供的缺少RBS的DNA分子和/或包含功能性失活的RBS的DNA分子至少提供一种其它优势,即当与具有野生型病毒ITR序列的DNA分子相比较时,一旦处于宿主细胞中,DNA分子的末端重复序列可以不具有或具有降低的内源启动子和/或转录活性(例如,P5 AAV启动子,其与RBS共有同源序列)。转录活性或内源启动子活性是指具有发夹结构末端的DNA分子促进从折叠的发夹悬突序列起始的转基因表达的能力(例如,当这些序列含有一个或多个转录起始位点(TSS)时)。这种转录活性可以由通过已感染已施用所述DNA分子的相同宿主的病毒所表达的病毒蛋白质(例如,Rep蛋白或NS1蛋白)的存在产生或者由宿主细胞中表达的内源转录因子的结合产生。TSS和启动子序列或其片段(例如,P5启动子)的存在可以使治疗应用中的预期转基因表达混乱,或者影响与启动子选择无关的转基因表达盒,其中非常期望通过适当控制元件(例如,组织特异性启动子)对(例如,组织特异性)转基因表达进行密切控制。在一些实施方案中,可以通过缺少位于ORF上游的顺式-调控元件(例如,如5.3.3节所述的启动子)(例如,通过使如5.3.3所述的表达盒的启动子序列缺失或失活)的本文所提供的发夹末端DNA分子,测量这些序列促进宿主细胞中的转基因表达的能力(例如,通过检测报告基因表达、mRNA转录本的qPCR、免疫印迹等)确定从发夹末端DNA分子的折叠的发夹悬突DNA序列产生的转录活性和/或内源启动子活性的存在或水平(称为“ITR转录活性”)。
在其它实施方案中,可以通过测量包含含有组织特异性顺式-调控元件(例如,如5.3.3节所述的组织特异性启动子)的表达盒的发夹末端DNA分子促进不来源于所述组织的宿主细胞中的转基因表达(例如,通过检测报告基因表达、mRNA转录本的qPCR、免疫印迹等)的残余能力来确定ITR转录活性。
基于ITR转录活性和ITR转录活性水平的降低的确定,在包括本5.3.4节在内的本文所提供的DNA分子的一些实施方案中,当施用于宿主时,所述DNA分子的ITR转录活性比具有野生型病毒ITR和/或RABS的对照DNA分子小100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、44%、43%、42%、41%、40%、39%、38%、37%、36%、35%、34%、33%、32%、31%、30%、29%、28%、27%、26%、25%、24%、23%、22%、21%,或20%。在某些实施方案中,当施用于宿主时,所述DNA分子的ITR转录活性比具有RABS和/或具有野生型病毒ITR的对照DNA分子小至少99%、至少98%、至少97%、至少96%、至少95%、至少94%、至少93%、至少92%、至少91%、至少90%、至少89%、至少88%、至少87%、至少86%、至少85%、至少84%、至少83%、至少82%、至少81%、至少80%、至少79%、至少78%、至少77%、至少76%、至少75%、至少74%、至少73%、至少72%、至少71%、至少70%、至少69%、至少68%、至少67%、至少66%、至少65%、至少64%、至少63%、至少62%、至少61%、至少60%、至少59%、至少58%、至少57%、至少56%、至少55%、至少54%、至少53%、至少52%、至少51%、至少50%、至少49%、至少48%、至少47%、至少46%、至少45%、至少44%、至少43%、至少42%、至少41%、至少40%、至少39%、至少38%、至少37%、至少36%、至少35%、至少34%、至少33%、至少32%、至少31%、至少30%、至少29%、至少28%、至少27%、至少26%、至少25%、至少24%、至少23%、至少22%、至少21%或至少20。在其它实施方案中,当施用于宿主时,所述DNA分子的ITR转录活性比具有RABS和/或具有野生型病毒ITR的对照DNA分子小约100%、约99%、约98%、约97%、约96%、约95%、约94%、约93%、约92%、约91%、约90%、约89%、约88%、约87%、约86%、约85%、约84%、约83%、约82%、约81%、约80%、约79%、约78%、约77%、约76%、约75%、约74%、约73%、约72%、约71%、约70%、约69%、约68%、约67%、约66%、约65%、约64%、约63%、约62%、约61%、约60%、约59%、约58%、约57%、约56%、约55%、约54%、约53%、约52%、约51%、约50%、约49%、约48%、约47%、约46%、约45%、约44%、约43%、约42%、约41%、约40%、约39%、约38%、约37%、约36%、约35%、约34%、约33%、约32%、约31%、约30%、约29%、约28%、约27%、约26%、约25%、约24%、约23%、约22%、约21%或约20%。
在某些实施方案中,包括本5.3.4节在内的本文所提供的DNA分子导致产生无可检测的ITR转录活性(例如,基于本5.3.4节中的转基因表达方法的测量)。在另一个实施方案中,包括本5.3.4节在内的本文所提供的DNA分子导致产生了不大于由参考DNA分子(例如,相同DNA分子,但是具有野生型RABS和/或具有野生型ITR序列)所产生的ITR转录活性的0.0001%、不大于0.001%、不大于0.01%、不大于0.1%、不大于1%、不大于1.5%、不大于2%、不大于2.5%、不大于3%、不大于3.5、不大于4%、不大于4.5%、不大于5%、不大于5.5%、不大于6%、不大于6.5%、不大于7%、不大于7.5%、不大于8%、不大于8.5%、不大于9%、不大于9.5%或不大于10%的ITR转录活性。在其它实施方案中,包括本5.3.4节在内的本文所提供的DNA分子导致产生了由参考DNA分子(例如,相同DNA分子,但是具有野生型RABS和/或具有野生型ITR序列)所产生的ITR转录活性的约0.0001%、约0.001%、约0.01%、约0.1%、约1%、约1.5%、约2%、约2.5%、约3%、约3.5、约4%、约4.5%、约5%、约5.5%、约6%、约6.5%、约7%、约7.5%、约8%、约8.5%、约9%、约9.5%或约10%的ITR转录活性。在另一个实施方案中,包括本5.3.4节在内的本文所提供的DNA分子导致产生了由参考DNA分子(例如,相同DNA分子,但是具有野生型RABS和/或具有野生型ITR序列)所产生的ITR转录活性的0.0001%、0.001%、0.01%、0.1%、1%、1.5%、2%、2.5%、3%、3.5、4%、4.5%、5%、5.5%、6%、6.5%、7%、7.5%、8%、8.5%、9%、9.5%或10%的ITR转录活性。可以通过使用如前段(包括前两段)中进一步描述的所确定的转基因表达确定这种ITR转录活性百分比。
如根据本5.3.4节中的描述可知,本文所提供的DNA分子中不包括的DNA序列或特性可以以任何方式与本文(包括第3、5.2和6节)所提供的任何方法、本文(包括第3、5.3和6节)所提供的任何DNA分子和本文(包括第3、5.4和6节)所提供的任何具有发夹结构末端的DNA分子组合,并且有助于如本文(包括第3、5.5和6节)所提供的DNA分子的功能性质。
5.3.5载体,如质粒
本发明公开提供所述DNA分子可以具有多种形式。在一个实施方案中,为本文的方法和组合物所提供的DNA分子是载体。载体是可以复制和/或在宿主细胞中表达的核酸分子。本文提供了本领域技术人员已知的任何载体。在一些实施方案中,载体可以是质粒、病毒载体、粘粒和人工染色体(例如,细菌人工染色体或酵母人工染色体)。在一个具体实施方案中,载体是质粒。如根据描述可知,当DNA分子处于载体(包括质粒)形式时,所述载体将包含本文对于DNA分子所描述的全部特性,包括第3节和本节(5.3节)所述的那些特性。
在一些实施方案中,本节(5.3.5节)中提供的载体可以用于生产第3和5.4节中提供的DNA分子,例如,通过实施5.2节中提供的方法步骤。照此,本节(5.3.5节)中提供的载体(1)包含第3和5.4节中提供的DNA分子的特性,包括可以形成如5.3.1和5.4节所述的发夹结构的IR或ITR,如5.3.3所述的表达盒,和如5.3.2、5.2.4和5.3.6节所述的切口核酸内切酶或者限制性内切酶的限制性位点,和/或(2)缺少如5.3.4节所述的RABS和/或TRS序列。因此,本发明公开提供本节(5.3.5节)中提供的载体可以(1)包含可以形成如5.3.1和5.4节所述的发夹结构的IR或ITR,如5.3.3所述的表达盒,如5.3.2、5.2.4和5.3.6节所述的切口核酸内切酶或者限制性内切酶的限制性位点和本节(5.3.5节)中提供的载体的其它特性的实施方案的任意组合,和/或(2)缺少如5.3.4节所述的RABS和/或TRS序列。在一些实施方案中,可以使用已知技术构建载体,从而在转录方向作为可操作性连接的组分提供至少下列:(1)5'ITR序列;(2)包含顺式-调控元件,例如,启动子、诱导型启动子、调控开关、增强子等的表达盒;和(3)3'IR序列。在一些实施方案中,表达盒侧接ITR,其包含用于引入外源序列的克隆位点。
具体地,在一个实施方案中,所述DNA分子是质粒。质粒是广泛已知的并且在本领域中用作复制或表达质粒中的DNA分子的载体。质粒通常是指能够在适合的宿主细胞中自主复制的双链和/或环状DNA分子。在某些实施方案中,可以通过限制性内切酶消化使为5.2节中所述的方法所提供的质粒线性化和/或以线性形式存在。为本文所描述的方法和组合物所提供的质粒包括用于熟知宿主细胞(包括原核和真核宿主细胞两者)的可商购的质粒,如得自多种厂家和/或见于Molecular Cloning:A Laboratory Manual,第4版,by MichaelGreen and Joseph Sambrook,ISBN 978-1-936113-42-2(2012)的质粒,该文献以其全部内容作为参考并入本文。在某些实施方案中,质粒还包含多克隆位点。在一些实施方案中,质粒还包含选择标志物,其(例如)可以是抗生素抗性基因。在一些实施方案中,质粒还包含复制起点(ORI)。ORI是在此起始复制的序列,其使得质粒能够在宿主细胞内增殖。在某些实施方案中,为本文所描述的方法和组合物所提供的ORI可以是细菌复制起点。在某些实施方案中,为本文所描述的方法和组合物所提供的ORI可以是真核复制起点。在某些实施方案中,为本文所描述的方法和组合物所提供的ORI可以是病毒复制起点。在一些具体的实施方案中,所述ORI可以是pBR322、F1、ColE1、pMB1、pUC、pSC101、R6K、15A、EBV ORI或SV40 ORI。
本节(5.3.5节)中所描述的质粒还可以包含其它特性。在一些实施方案中,所述质粒还包含位于所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的限制性内切酶位点(例如,如5.2.4和5.3.2节所述的限制性内切酶位点),其中所述限制性内切酶位点在所述第一反向重复序列、第二反向重复序列和所述第一和第二反向重复序列之间的区域中的任一个中不存在。在某些实施方案中,在本段中所描述的限制性位点用限制性内切酶切割导致产生了在有利于所述第一和/或第二反向重复序列退火的条件下(例如,如5.2.5节所述的条件)在可检测的水平上不退火的单链悬突。在一些其它实施方案中,所述质粒还包含编码识别并切割本段所述的限制性位点的限制性内切酶的开放阅读框。在某些实施方案中,限制性内切酶位点和相应限制性内切酶可以是5.2.4和5.3.2节中所描述的限制性内切酶位点及其相应限制性内切酶中的任一种。在其它实施方案中,本段所述的限制性内切酶的表达受启动子控制。在一些实施方案中,本段中所描述的启动子可以是以上5.3.3节中所描述的任何启动子。在其它实施方案中,所述启动子是诱导型启动子。在某些实施方案中,所述诱导型启动子是化学诱导型启动子。在其它实施方案中,所述诱导型启动子是选自下列的任一种:四环素开启(Tet-On)启动子、负诱导型pLac启动子、alcA、amyB、bli-3、bphA、catR、cbhl、cre1、exylA、gas、glaA、gla1、mir1、niiA、qa-2、Smxyl、tcu-1、thiA、vvd、xyl1、xyl1、xylP、xyn1和ZeaR,如Janina Kluge等人,Applied Microbiologyand Biotechnology 102:6357–6372(2018)中所述,该文献以其全部内容作为参考并入本文。
类似地,在某些实施方案中,所述质粒还可以包含位于所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的切口核酸内切酶的第五和第六限制性位点(例如,如5.2.4和5.3.2节所述的切口核酸内切酶的限制性位点),其中所述切口核酸内切酶的第五和第六限制性位点是:a.)位于相对链;和b.)在所述双链DNA分子中产生断裂,从而所述断裂的单链悬突在有利于所述第一和/或第二反向重复序列退火的条件(例如,如5.2.5节所述的条件)下在可检测的水平上分子间或内分子不退火。如根据5.2.4节的描述可知,与切口核酸内切酶培育将导致产生对应于切口核酸内切酶的第五限制性位点的第五切口和对应于切口核酸内切酶的第六限制性位点的第六切口。本发明公开提供第五和第六切口可以在它们之间具有多种相对位置。在一个实施方案中,所述第五和第六切口相隔1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,由于第五和第六切口之间的ssDNA悬突在有利于所述第一和/或第二反向重复序列退火的条件下在可检测水平上分子间或分子内不退火,因此由第五和第六切口所产生的ssDNA悬突具有低于5.2.3和5.3.2节所述的ssDNA悬突的解链温度。在某些实施方案中,由第五和第六切口所产生的ssDNA悬突比5.2.3和5.3.2节中所描述的ssDNA悬突短。在其它实施方案中,由第五和第六切口所产生的ssDNA悬突的G-C含量百分比低于5.2.3和5.3.2节中所描述的ssDNA悬突。在一些具体的实施方案中,由第五和第六切口所产生的ssDNA悬突为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸长。在其它具体的实施方案中,由第五和第六切口所产生的ssDNA悬突比5.2.3和5.3.2节中所描述的ssDNA悬突短至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少55、至少60、至少65、至少70、至少75、至少80、至少85、至少90、至少95、至少100、至少105、至少110、至少115、至少120、至少125、至少130、至少135、至少140、至少145、至少150、至少155、至少160、至少165、至少170、至少175或至少180个核苷酸。在一些具体的实施方案中,由第五和第六切口所产生的ssDNA悬突比5.2.3和5.3.2节中所描述的ssDNA悬突短约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95、约100、约105、约110、约115、约120、约125、约130、约135、约140、约145、约150、约155、约160、约165、约170、约175或约180个核苷酸。
在某些实施方案中,所述质粒还可以包含位于所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的7、8、9、10、11、12、13、14、15、16、17、18、19或更多个切口核酸内切酶的限制性位点(例如,如5.2.4和5.3.2节所述切口核酸内切酶的限制性位点),其中所述切口核酸内切酶的其它限制性位点可以a.)位于相对链;和b.)在所述双链DNA分子中产生断裂,从而所述断裂的单链悬突在有利于所述第一和/或第二反向重复序列退火的条件(例如,如5.2.5节所述的条件)下在可检测的水平上分子间或内分子不退火。在某些实施方案中,所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的切口可以在它们之间具有多种相对位置。在一个实施方案中,所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的切口相隔1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,由于所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的切口之间的ssDNA悬突在有利于所述第一和/或第二反向重复序列退火的条件下在可检测水平上分子间或分子内不退火,因此由所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的切口所产生的ssDNA悬突具有低于5.2.3和5.3.2节所述的ssDNA悬突的解链温度。在某些实施方案中,由所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的切口所产生的ssDNA悬突比5.2.3和5.3.2节中所描述的ssDNA悬突短。在其它实施方案中,由所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的切口所产生的ssDNA悬突的G-C含量百分比低于5.2.3和5.3.2节中所描述的ssDNA悬突。在一些具体的实施方案中,由所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的切口所产生的ssDNA悬突为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸长。
如以上5.2.4和5.3.2节所述,在多个实施方案中,切口核酸内切酶的第一、第二、第三和第四限制性位点可以是相同或不同的切口核酸内切酶的靶标序列。类似的,在某些实施方案中,切口核酸内切酶的第五和第六限制性位点可以是相同或不同的切口核酸内切酶的靶标序列。在一些实施方案中,为如第3和5.2.4节以及本5.3节所述的DNA分子提供的切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点可以均为相同切口核酸内切酶的靶标序列。作为另外一种选择,在其它实施方案中,切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点是两种不同切口核酸内切酶的靶标序列,包括布置两种不同切口核酸内切酶靶标序列的6个位点的所有可能组合(例如,第一切口核酸内切酶的第一限制性位点和第二切口核酸内切酶的其它位点、第一切口核酸内切酶的第一和第二限制性位点和第二切口核酸内切酶的其它位点等)。另外,在某些实施方案中,切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点是3种不同切口核酸内切酶的靶标序列,包括布置3种不同切口核酸内切酶靶标序列的6个位点的所有可能组合。此外,在一些实施方案中,切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点是4种不同切口核酸内切酶的靶标序列,包括布置4种不同切口核酸内切酶靶标序列的6个位点的所有可能组合。另外,在一些实施方案中,切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点是5种不同切口核酸内切酶的靶标序列,包括布置5种不同切口核酸内切酶靶标序列的6个位点的所有可能组合。此外,在一些实施方案中,切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点是6种不同的切口核酸内切酶的靶标序列。
在一些实施方案中,前段所述的切口核酸内切酶位点中的一个或多个是内源切口核酸内切酶的靶标序列。在一些具体的实施方案中,所述质粒还包含编码识别本节(5.3.5节),包括前段中所描述的切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点的一个或多个的切口核酸内切酶的ORF。在一个具体实施方案中,所述质粒还包含编码识别本节(5.3.5节),包括前段中所描述的切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点的两个或更多个的2个切口核酸内切酶的2个ORF。在另一个具体的实施方案中,所述质粒还包含编码识别本节(5.3.5节),包括前段中所描述的切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点的三个或更多个的3个切口核酸内切酶的3个ORF。在另一个具体实施方案中,所述质粒还包含编码识别本节(5.3.5节),包括前段中所描述的切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点的四个或更多个的4个切口核酸内切酶的4个ORF。在另一个具体实施方案中,所述质粒还包含编码识别本节(5.3.5节),包括前段中所描述的切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点的四个或更多个的4个切口核酸内切酶的4个ORF。在其它具体实施方案中,所述质粒还包含编码识别本节(5.5.5节),包括前段中所描述的切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点的五个或更多个的5个切口核酸内切酶的5个ORF。在一个具体实施方案中,所述质粒还包含编码分别识别本节(5.3.5节),包括前段中所描述的切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点的6个切口核酸内切酶的6个ORF。在某些实施方案中,本段中所描述的一个或多个切口核酸内切酶的表达受启动子控制。在一些实施方案中,本段中所描述的一个或多个切口核酸内切酶的表达受启动子控制。在一些实施方案中,本段中所描述的一个或多个切口核酸内切酶的表达受诱导型启动子控制。在一些具体的实施方案中,所述诱导型启动子可以是以上本节(5.3.5节)中所描述的任何诱导型启动子。
在一些实施方案中,识别切口核酸内切酶的第一、第二、第三和/或第四限制性位点的切口核酸内切酶可以是第3、5.2.4和5.3.2节中所描述的任一种。在某些具体的实施方案中,识别切口核酸内切酶的第一、第二、第三和/或第四限制性位点的切口核酸内切酶为Nt.BsmAI;Nt.BtsCI;N.ALwl;N.BstNBI;N.BspD6I;Nb.Mva1269I;Nb.BsrDI;Nt.BtsI;Nt.BsaI;Nt.Bpu10I;Nt.BsmBI;Nb.BbvCI;Nt.BbvCI;或Nt.BspQI。在一些实施方案中,识别切口核酸内切酶的第五和第六限制性位点的切口核酸内切酶可以是第3、5.2.4和5.3.2节中所描述的任一种。在某些具体的实施方案中,识别切口核酸内切酶的第五和第六限制性位点的切口核酸内切酶为:Nt.BsmAI;Nt.BtsCI;N.ALwl;N.BstNBI;N.BspD6I;Nb.Mva1269I;Nb.BsrDI;Nt.BtsI;Nt.BsaI;Nt.Bpu10I;Nt.BsmBI;Nb.BbvCI;Nt.BbvCI;或Nt.BspQI。
另外,在一些实施方案中,本节(5.3.5节)中提供的质粒可以包含用于在细菌培养物中生产质粒中使用的可选择或选择标志物。在一个实施方案中,选择标志物可以插入3'ITR序列的下游(例如,3')。在另一个实施方案中,选择标志物可以插入5'IR序列的上游(例如,5')。本节(5.3.5节)中提供的质粒还可以包含位于用于生产稳定表达细胞系的IR之间的可选择或选择标志物。在一个实施方案中,选择标志物可以插入3'ITR序列的上游(例如,5')。在另一个实施方案中,选择标志物可以插入5'ITR序列的下游(例如,3')。合适的选择标志物的实施方案包括赋予抗药性的那些实施方案。在某些实施方案中,选择标志物可以是稻瘟散-S-抗性基因、卡那霉素、遗传霉素等。在具体的实施方案中,药物选择标志物为氯霉素(choramphenicol)-抗性基因。在一些实施方案中,所述质粒还可以包含编码选择标志物的ORF。在某些实施方案中,所述选择标志物是抗生素抗性基因。在一些具体的实施方案中,选择标志物是提供抗选择试剂抗性的一种标志物,所述选择试剂选自下列:卡那霉素、大观霉素、链霉素、氨苄西林、羧苄西林、博来霉素、红霉素、多粘菌素b、四环素、氯霉素、杀稻瘟素、g418/遗传霉素、潮霉素B、嘌罗霉素和zeocin。
在其它实施方案中,本节(5.3.5节)的质粒可以包含5.3和5.3.1节标题之间的段落中所描述的DNA分子的一个或多个拷贝。在一个具体实施方案中,本节(5.3.5节)的质粒可以包含5.3和5.3.1节标题之间的段落中所描述的DNA分子的一个拷贝。在另一个具体的实施方案中,本节(5.3.5节)的质粒可以包含5.3和5.3.1节标题之间的段落中所描述的DNA分子的2个拷贝。在另一个具体实施方案中,本节(5.3.5节)的质粒可以包含5.3和5.3.1节标题之间的段落中所描述的DNA分子的1、2、3、4、5、6、7、8、9或10个拷贝。
在一些实施方案中,用于本文所提供的方法和组合物的DNA分子(例如,如第3节和本节(5.3节)所提供的)可以是线性、非环形DNA分子。
在一些实施方案中,用于本文所提供的方法和组合物的载体以多种排列与组合包含本节(5.3.5节)中描述的任何一个或多个特性。在某些实施方案中,用于本文所提供的方法和组合物的质粒包含本节(5.3.5节)中所描述的任何一种或多种特性。在某些实施方案中,用于本文所提供的方法和组合物的质粒以多种排列与组合包含本节(5.3.5节)中所描述的任何一种或多种特性。
对本节(5.3.5节)中对于切口核酸内切酶和/或切口核酸内切酶的限制性位点所述的多种实施方案另外提供了被可编程切口酶替换的切口核酸内切酶和被可编程切口酶的靶标位点替换的限制性位点。已在5.2.4节中提供了本段和本节(5.3.3节)中的可编程切口酶和它们的靶标位点。
5.3.6对切口核酸内切酶具有小于4个限制性位点的DNA分子和对可编程切口酶具有小于4个靶标位点的DNA分子
在一个其它方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第一限制性位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第二限制性位点和限制性内切酶的第二限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突;其中限制性内切酶的第一限制性位点比切口核酸内切酶的第一限制性位点距表达盒更远,并且限制性内切酶的第二限制性位点比切口核酸内切酶的第二限制性位点距表达盒更远。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第一限制性位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第二限制性位点和限制性内切酶的第二限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突;其中限制性内切酶的第一限制性位点比切口核酸内切酶的第一限制性位点距表达盒更远,并且限制性内切酶的第二限制性位点比切口核酸内切酶的第二限制性位点距表达盒更远。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第一限制性位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第二限制性位点和限制性内切酶的第二限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突;其中限制性内切酶的第一限制性位点比切口核酸内切酶的第一限制性位点距表达盒更远,并且限制性内切酶的第二限制性位点比切口核酸内切酶的第二限制性位点距表达盒更远。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第一限制性位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第二限制性位点和限制性内切酶的第二限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突;其中限制性内切酶的第一限制性位点比切口核酸内切酶的第一限制性位点距表达盒更远,并且限制性内切酶的第二限制性位点比切口核酸内切酶的第二限制性位点距表达盒更远。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。
另外,在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第三限制性位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突;其中限制性内切酶的第一限制性位点比切口核酸内切酶的第三限制性位点距表达盒更远。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第三限制性位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突;其中限制性内切酶的第一限制性位点比切口核酸内切酶的第三限制性位点距表达盒更远。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第三限制性位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突;其中限制性内切酶的第一限制性位点比切口核酸内切酶的第三限制性位点距表达盒更远。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中将切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则所述切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第三限制性位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突;其中限制性内切酶的第一限制性位点比切口核酸内切酶的第三限制性位点距表达盒更远。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。
另外,在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第一限制性位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第二和第三限制性位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则所述切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突;其中限制性内切酶的第一限制性位点比切口核酸内切酶的第一限制性位点距表达盒更远。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第一限制性位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第二和第三限制性位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则所述切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突;其中限制性内切酶的第一限制性位点比切口核酸内切酶的第一限制性位点距表达盒更远。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第一限制性位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第二和第三限制性位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则所述切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突;其中限制性内切酶的第一限制性位点比切口核酸内切酶的第一限制性位点距表达盒更远。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第一限制性位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则切口和限制性内切酶切割导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中切口核酸内切酶的第二和第三限制性位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则所述切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突;其中限制性内切酶的第一限制性位点比切口核酸内切酶的第一限制性位点距表达盒更远。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。
在一个其它方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第一靶标位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第二靶标位点和限制性内切酶的第二限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突;其中限制性内切酶的第一限制性位点比可编程切口酶的向导核酸的第一靶标位点距表达盒更远,并且限制性内切酶的第二限制性位点比可编程切口酶的向导核酸的第二靶标位点距表达盒更远。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第一靶标位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第二靶标位点和限制性内切酶的第二限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突;其中限制性内切酶的第一限制性位点比可编程切口酶的向导核酸的第一靶标位点距表达盒更远,并且限制性内切酶的第二限制性位点比可编程切口酶的向导核酸的第二靶标位点距表达盒更远。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第一靶标位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第二靶标位点和限制性内切酶的第二限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突;其中限制性内切酶的第一限制性位点比可编程切口酶的向导核酸的第一靶标位点距表达盒更远,并且限制性内切酶的第二限制性位点比可编程切口酶的向导核酸的第二靶标位点距表达盒更远。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第一靶标位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第二靶标位点和限制性内切酶的第二限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突;其中限制性内切酶的第一限制性位点比可编程切口酶的向导核酸的第一靶标位点距表达盒更远,并且限制性内切酶的第二限制性位点比可编程切口酶的向导核酸的第二靶标位点距表达盒更远。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。
另外,在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第一和第二靶标位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶的切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第三靶标位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突;其中限制性内切酶的第一限制性位点比可编程切口酶的向导核酸的第三靶标位点距表达盒更远。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第一和第二靶标位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶的切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第三靶标位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突;其中限制性内切酶的第一限制性位点比可编程切口酶的向导核酸的第三靶标位点距表达盒更远。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第一和第二靶标位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶的切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第三靶标位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突;其中限制性内切酶的第一限制性位点比可编程切口酶的向导核酸的第三靶标位点距表达盒更远。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第一和第二靶标位点布置在邻近所述第一反向重复序列的相对链上,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节中所述),则通过可编程切口酶的切口导致产生包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第三靶标位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第二反向重复序列,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突;其中限制性内切酶的第一限制性位点比可编程切口酶的向导核酸的第三靶标位点距表达盒更远。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。
另外,在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第一靶标位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第二和第三靶标位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶的切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突;其中限制性内切酶的第一限制性位点比可编程切口酶的向导核酸的第一靶标位点距表达盒更远。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第一靶标位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第二和第三靶标位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶的切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突;其中限制性内切酶的第一限制性位点比可编程切口酶的向导核酸的第一靶标位点距表达盒更远。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第一靶标位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链5'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第二和第三靶标位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶的切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链5'悬突;其中限制性内切酶的第一限制性位点比可编程切口酶的向导核酸的第一靶标位点距表达盒更远。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列。在某些实施方案中,所述底部链5'悬突包含所述第二反向重复序列。在某些实施方案中,所述顶部链5'悬突包含所述第一反向重复序列并且所述底部链5'悬突包含所述第二反向重复序列。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:i)第一反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第一靶标位点和限制性内切酶的第一限制性位点布置在相反末端并且邻近所述第一反向重复序列,从而一旦所述第一反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶和限制性内切酶切割的切口导致产生了包含所述第一反向重复序列或其片段(例如,所述第一反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的底部链3'悬突;ii)表达盒(例如,如5.3.3节所述);和iii)第二反向重复序列(例如,如5.3.1节所述),其中可编程切口酶的向导核酸的第二和第三靶标位点布置在邻近所述第二反向重复序列的相对链上,从而一旦所述第二反向重复序列的顶部链与底部链分离(例如,如5.2.3、5.2.4和5.3.2节所述),则通过可编程切口酶的切口导致产生了包含所述第二反向重复序列或其片段(例如,所述第二反向重复序列的至少50%、60%、70%、75%、80%、85%、90%、95%或99%)的顶部链3'悬突;其中限制性内切酶的第一限制性位点比可编程切口酶的向导核酸的第一靶标位点距表达盒更远。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列。在某些实施方案中,所述顶部链3'悬突包含所述第二反向重复序列。在某些实施方案中,所述底部链3'悬突包含所述第一反向重复序列并且所述顶部链3'悬突包含所述第二反向重复序列。
本节(5.3.6节)中提供的DNA分子包含如本节(5.3.6节)所述的多种特性或者具有多种实施方案,在以下多个小节中进一步描述了所述特性和实施方案:在5.3.1节中描述了反向重复序列,包括第一反向重复序列和/或第二反向重复序列的实施方案,在5.3.2节中描述了限制性内切酶、切口核酸内切酶和它们各自的限制性位点的实施方案,在5.2.4节中描述了可编程切口酶和它们的靶标位点的实施方案,在5.3.3节中描述了表达盒的实施方案并且在5.3.5节中描述了质粒和载体的实施方案。照此,本发明公开提供了包含本文所描述的DNA分子的多种实施方案和所述DNA分子的特性的实施方案的任何排列与组合的DNA分子。
本节(5.3.6节)中对于切口核酸内切酶所描述的多种实施方案与可编程切口酶是可互换的,并且切口核酸内切酶的限制性位点与可编程切口酶的靶标位点是可互换的。照此,在本节(5.3.6节)中,本文提供了通过用可编程切口酶替换切口核酸内切酶的一个或多个元件和/或用可编程切口酶的靶标位点替换切口核酸内切酶的限制性位点的一个或多个元件所产生的任意组合的其它实施方案。已在5.2.4节中提供了本段和本节(5.3.3节)中的可编程切口酶和它们的靶标位点。
5.3.7分离的DNA分子
本文所提供的方法和DNA分子的优势之一在于在所述方法中产生的和本文所提供的分离的DNA分子的纯度,因为本文所提供的DNA分子耐受核酸外切酶或其它DNA消化酶,并因此,如5.2.6节所述,可以用这种核酸外切酶或DNA消化酶处理以除去对这种处理方法敏感的DNA污染物。如5.3节标题和5.3.1节标题之间段落所述,第3、5.2、5.3、5.4和6节中包括的本文所提供的DNA分子可以是多种纯度的分离的DNA分子。此外,本发明公开提供并且本领域的常规技术人员将理解第3、5.2、5.3、5.4和6节中包括的本文所提供的DNA分子可以不含某些一般DNA污染物、不含某些特定DNA污染物或同时不含某些一般DNA污染物和某些特定DNA污染物两者。
因此,在一个实施方案中,分离的DNA分子不含DNA分子片段。在另一个实施方案中,所述分离的DNA分子不含非所述DNA分子片段的核酸污染物。在其它实施方案中,所述分离的DNA分子不含杆状病毒DNA。在一个实施方案,分离的DNA分子不含DNA分子片段并且不含非DNA分子片段的核酸污染物。在另一个实施方案中,分离的DNA分子不含DNA分子片段并且不含杆状病毒DNA。在其它实施方案中,分离的DNA分子不含杆状病毒DNA并且不含非DNA分子片段的核酸污染物。在另一个实施方案中,分离的DNA分子不含DNA分子片段,不含杆状病毒DNA并且不含非DNA分子片段的核酸污染物。
具体地,在一个实施方案中,DNA分子片段不大于1%、不大于2%、不大于3%、不大于4%、不大于5%、不大于6%、不大于7%、不大于8%、不大于9%、不大于10%、不大于11%、不大于12%、不大于13%、不大于14%、不大于15%、不大于16%、不大于17%、不大于18%、不大于19%、不大于20%、不大于21%、不大于22%、不大于23%、不大于24%、不大于25%、不大于26%、不大于27%、不大于28%、不大于29%、不大于30%、不大于31%、不大于32%、不大于33%、不大于34%、不大于35%、不大于36%、不大于37%、不大于38%、不大于39%、不大于40%、不大于41%、不大于42%、不大于43%、不大于44%、不大于45%、不大于46%、不大于47%、不大于48%、不大于49%或不大于50%的分离的DNA分子。在另一个实施方案中,DNA分子片段小于1%、小于2%、小于3%、小于4%、小于5%、小于6%、小于7%、小于8%、小于9%、小于10%、小于11%、小于12%、小于13%、小于14%、小于15%、小于16%、小于17%、小于18%、小于19%、小于20%、小于21%、小于22%、小于23%、小于24%、小于25%、小于26%、小于27%、小于28%、小于29%、小于30%、小于31%、小于32%、小于33%、小于34%、小于35%、小于36%、小于37%、小于38%、小于39%、小于40%、小于41%、小于42%、小于43%、小于44%、小于45%、小于46%、小于47%、小于48%、小于49%或小于50%的分离的DNA分子。在另一个实施方案中,DNA分子片段为约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%、约20%、约21%、约22%、约23%、约24%、约25%、约26%、约27%、约28%、约29%、约30%、约31%、约32%、约33%、约34%、约35%、约36%、约37%、约38%、约39%、约40%、约41%、约42%、约43%、约44%、约45%、约46%、约47%、约48%、约49%或约50%的分离的DNA分子。
另外,在一个实施方案中,非DNA分子片段的核酸污染物不大于1%、不大于2%、不大于3%、不大于4%、不大于5%、不大于6%、不大于7%、不大于8%、不大于9%、不大于10%、不大于11%、不大于12%、不大于13%、不大于14%、不大于15%、不大于16%、不大于17%、不大于18%、不大于19%、不大于20%、不大于21%、不大于22%、不大于23%、不大于24%、不大于25%、不大于26%、不大于27%、不大于28%、不大于29%、不大于30%、不大于31%、不大于32%、不大于33%、不大于34%、不大于35%、不大于36%、不大于37%、不大于38%、不大于39%、不大于40%、不大于41%、不大于42%、不大于43%、不大于44%、不大于45%、不大于46%、不大于47%、不大于48%、不大于49%或不大于50%的分离的DNA分子。在另一个实施方案中,非DNA分子片段的核酸污染物小于1%、小于2%、小于3%、小于4%、小于5%、小于6%、小于7%、小于8%、小于9%、小于10%、小于11%、小于12%、小于13%、小于14%、小于15%、小于16%、小于17%、小于18%、小于19%、小于20%、小于21%、小于22%、小于23%、小于24%、小于25%、小于26%、小于27%、小于28%、小于29%、小于30%、小于31%、小于32%、小于33%、小于34%、小于35%、小于36%、小于37%、小于38%、小于39%、小于40%、小于41%、小于42%、小于43%、小于44%、小于45%、小于46%、小于47%、小于48%、小于49%或小于50%的分离的DNA分子。在另一个实施方案中,非DNA分子片段的核酸污染物为约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%、约20%、约21%、约22%、约23%、约24%、约25%、约26%、约27%、约28%、约29%、约30%、约31%、约32%、约33%、约34%、约35%、约36%、约37%、约38%、约39%、约40%、约41%、约42%、约43%、约44%、约45%、约46%、约47%、约48%、约49%或约50%的分离的DNA分子。
另外,在一个实施方案中,杆状病毒DNA不大于1%、不大于2%、不大于3%、不大于4%、不大于5%、不大于6%、不大于7%、不大于8%、不大于9%、不大于10%、不大于11%、不大于12%、不大于13%、不大于14%、不大于15%、不大于16%、不大于17%、不大于18%、不大于19%、不大于20%、不大于21%、不大于22%、不大于23%、不大于24%、不大于25%、不大于26%、不大于27%、不大于28%、不大于29%、不大于30%、不大于31%、不大于32%、不大于33%、不大于34%、不大于35%、不大于36%、不大于37%、不大于38%、不大于39%、不大于40%、不大于41%、不大于42%、不大于43%、不大于44%、不大于45%、不大于46%、不大于47%、不大于48%、不大于49%或不大于50%的分离的DNA分子。在另一个实施方案中,杆状病毒DNA小于1%、小于2%、小于3%、小于4%、小于5%、小于6%、小于7%、小于8%、小于9%、小于10%、小于11%、小于12%、小于13%、小于14%、小于15%、小于16%、小于17%、小于18%、小于19%、小于20%、小于21%、小于22%、小于23%、小于24%、小于25%、小于26%、小于27%、小于28%、小于29%、小于30%、小于31%、小于32%、小于33%、小于34%、小于35%、小于36%、小于37%、小于38%、小于39%、小于40%、小于41%、小于42%、小于43%、小于44%、小于45%、小于46%、小于47%、小于48%、小于49%或小于50%的分离的DNA分子。在另一个实施方案中,杆状病毒DNA为约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%、约20%、约21%、约22%、约23%、约24%、约25%、约26%、约27%、约28%、约29%、约30%、约31%、约32%、约33%、约34%、约35%、约36%、约37%、约38%、约39%、约40%、约41%、约42%、约43%、约44%、约45%、约46%、约47%、约48%、约49%或约50%的分离的DNA分子。
如本5.3.7节前段所述,相对于具体污染物具有多种纯度的本文所提供的分离的DNA分子的多种实施方案(例如,DNA分子片段、非DNA分子片段的核酸污染物和/或杆状病毒DNA)不互相排斥并因此可以通过选择和组合本5.3.7节前段列表中所提供的任何实施方案以不同组合合并。此外,可以通过选择和组合其中所述列表中所提供的任何适合的实施方案,将本5.3.7节中提供的分离的DNA分子和5.3节标题和5.3.1节标题之间段落中所述的DNA分子以不同组合合并。
5.3.8在病毒颗粒中包装的DNA分子
可以在病毒颗粒中包装本文所提供的DNA分子,包括在第3、5.2、5.3、5.4和6节中所述的DNA分子。可以通过将DNA分子转染到适合的宿主细胞(例如,HEK 293)并用病毒包装所需的其它分子(例如,病毒衣壳(Cap)蛋白)共转染宿主细胞来包装这种病毒颗粒,如Grieger JC,等人,Nat Protoc 2006;1:1412–1428;和Liujiang Song,Hum Gene Ther,2020年10月;31(19-20):1054-1067所述,两篇参考文献均以其全部内容作为参考并入本文。本文所提供的方法和DNA分子的优势之一在于本文所提供的DNA分子的纯度,当在病毒颗粒中生产和包装时,因为如5.3.7节中提供的具有多种纯度的分离的DNA分子可以转染到宿主细胞和/或在病毒颗粒中包装,借此提供了在包装病毒颗粒中具有多种纯度的DNA分子。因此,本发明公开提供并且本领域的常规技术人员将理解当在病毒颗粒中包装这些DNA分子时,第3、5.2、5.3、5.4和6节中包括的本文所提供的DNA分子可以不含某些一般DNA污染物、不含某些特定DNA污染物或同时不含某些一般DNA污染物和某些特定DNA污染物两者。
因此,在一个实施方案中,在病毒颗粒中包装的DNA分子不含DNA分子片段。在另一个实施方案中,在病毒颗粒中包装的DNA分子不含非所述DNA分子片段的核酸污染物。在其它实施方案中,在病毒颗粒中包装的DNA分子不含杆状病毒DNA。在一个实施方案中,在病毒颗粒中包装的DNA分子不含DNA分子片段并且不含非DNA分子片段的核酸污染物。在另一个实施方案中,在病毒颗粒中包装的DNA分子不含DNA分子片段并且不含杆状病毒DNA。在其它实施方案中,在病毒颗粒中包装的DNA分子不含杆状病毒DNA且不含非所述DNA分子的片段的核酸污染物。在另一个实施方案中,在病毒颗粒中包装的DNA分子不含DNA分子片段,不含杆状病毒DNA并且不含非DNA分子片段的核酸污染物。
具体地,在一个实施方案中,DNA分子片段不大于病毒颗粒中包装的DNA分子的1%、不大于2%、不大于3%、不大于4%、不大于5%、不大于6%、不大于7%、不大于8%、不大于9%、不大于10%、不大于11%、不大于12%、不大于13%、不大于14%、不大于15%、不大于16%、不大于17%、不大于18%、不大于19%、不大于20%、不大于21%、不大于22%、不大于23%、不大于24%、不大于25%、不大于26%、不大于27%、不大于28%、不大于29%、不大于30%、不大于31%、不大于32%、不大于33%、不大于34%、不大于35%、不大于36%、不大于37%、不大于38%、不大于39%、不大于40%、不大于41%、不大于42%、不大于43%、不大于44%、不大于45%、不大于46%、不大于47%、不大于48%、不大于49%或不大于50%。在另一个实施方案中,DNA分子片段小于病毒颗粒中包装的DNA分子的1%、小于2%、小于3%、小于4%、小于5%、小于6%、小于7%、小于8%、小于9%、小于10%、小于11%、小于12%、小于13%、小于14%、小于15%、小于16%、小于17%、小于18%、小于19%、小于20%、小于21%、小于22%、小于23%、小于24%、小于25%、小于26%、小于27%、小于28%、小于29%、小于30%、小于31%、小于32%、小于33%、小于34%、小于35%、小于36%、小于37%、小于38%、小于39%、小于40%、小于41%、小于42%、小于43%、小于44%、小于45%、小于46%、小于47%、小于48%、小于49%或小于50%。在另一个实施方案中,DNA分子片段为病毒颗粒中包装的DNA分子的约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%、约20%、约21%、约22%、约23%、约24%、约25%、约26%、约27%、约28%、约29%、约30%、约31%、约32%、约33%、约34%、约35%、约36%、约37%、约38%、约39%、约40%、约41%、约42%、约43%、约44%、约45%、约46%、约47%、约48%、约49%或约50%。
另外,在一个实施方案中,非DNA分子片段的核酸污染物不大于病毒颗粒中包装的DNA分子的1%、不大于2%、不大于3%、不大于4%、不大于5%、不大于6%、不大于7%、不大于8%、不大于9%、不大于10%、不大于11%、不大于12%、不大于13%、不大于14%、不大于15%、不大于16%、不大于17%、不大于18%、不大于19%、不大于20%、不大于21%、不大于22%、不大于23%、不大于24%、不大于25%、不大于26%、不大于27%、不大于28%、不大于29%、不大于30%、不大于31%、不大于32%、不大于33%、不大于34%、不大于35%、不大于36%、不大于37%、不大于38%、不大于39%、不大于40%、不大于41%、不大于42%、不大于43%、不大于44%、不大于45%、不大于46%、不大于47%、不大于48%、不大于49%或不大于50%。在另一个实施方案中,非DNA分子片段的核酸污染物小于病毒颗粒中包装的DNA分子的1%、小于2%、小于3%、小于4%、小于5%、小于6%、小于7%、小于8%、小于9%、小于10%、小于11%、小于12%、小于13%、小于14%、小于15%、小于16%、小于17%、小于18%、小于19%、小于20%、小于21%、小于22%、小于23%、小于24%、小于25%、小于26%、小于27%、小于28%、小于29%、小于30%、小于31%、小于32%、小于33%、小于34%、小于35%、小于36%、小于37%、小于38%、小于39%、小于40%、小于41%、小于42%、小于43%、小于44%、小于45%、小于46%、小于47%、小于48%、小于49%或小于50%。在另一个实施方案中,非DNA分子片段的核酸污染物为病毒颗粒中包装的DNA分子的约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%、约20%、约21%、约22%、约23%、约24%、约25%、约26%、约27%、约28%、约29%、约30%、约31%、约32%、约33%、约34%、约35%、约36%、约37%、约38%、约39%、约40%、约41%、约42%、约43%、约44%、约45%、约46%、约47%、约48%、约49%或约50%。
另外,在一个实施方案中,杆状病毒DNA不大于病毒颗粒中包装的DNA分子的1%、不大于2%、不大于3%、不大于4%、不大于5%、不大于6%、不大于7%、不大于8%、不大于9%、不大于10%、不大于11%、不大于12%、不大于13%、不大于14%、不大于15%、不大于16%、不大于17%、不大于18%、不大于19%、不大于20%、不大于21%、不大于22%、不大于23%、不大于24%、不大于25%、不大于26%、不大于27%、不大于28%、不大于29%、不大于30%、不大于31%、不大于32%、不大于33%、不大于34%、不大于35%、不大于36%、不大于37%、不大于38%、不大于39%、不大于40%、不大于41%、不大于42%、不大于43%、不大于44%、不大于45%、不大于46%、不大于47%、不大于48%、不大于49%或不大于50%。在另一个实施方案中,杆状病毒DNA小于病毒颗粒中包装的DNA分子的1%、小于2%、小于3%、小于4%、小于5%、小于6%、小于7%、小于8%、小于9%、小于10%、小于11%、小于12%、小于13%、小于14%、小于15%、小于16%、小于17%、小于18%、小于19%、小于20%、小于21%、小于22%、小于23%、小于24%、小于25%、小于26%、小于27%、小于28%、小于29%、小于30%、小于31%、小于32%、小于33%、小于34%、小于35%、小于36%、小于37%、小于38%、小于39%、小于40%、小于41%、小于42%、小于43%、小于44%、小于45%、小于46%、小于47%、小于48%、小于49%或小于50%。在另一个实施方案中,杆状病毒DNA为病毒颗粒中包装的DNA分子的约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%、约20%、约21%、约22%、约23%、约24%、约25%、约26%、约27%、约28%、约29%、约30%、约31%、约32%、约33%、约34%、约35%、约36%、约37%、约38%、约39%、约40%、约41%、约42%、约43%、约44%、约45%、约46%、约47%、约48%、约49%或约50%。
本发明公开提供可以通过本领域已知并实践的多种方法检测并确定本5.3.8节所述的多种污染物,例如,通过下一代测序(NGS)或者通过PCR。
如本5.3.8节前段所述,相对于具体污染物具有多种纯度的本文所提供的在病毒颗粒中包装的DNA分子的多种实施方案(例如,DNA分子片段、非DNA分子片段的核酸污染物和/或杆状病毒DNA)不互相排斥并因此可以通过选择和组合本5.3.8节前段列表中所提供的任何实施方案以不同组合合并。此外,可以通过选择和组合其中所述列表中所提供的任何适合的实施方案,将本5.3.8节中提供的在病毒颗粒中包装的DNA分子和5.3节标题和5.3.1节标题之间段落中所述的DNA分子以不同组合合并。
5.4具有发夹结构末端的DNA分子
本发明公开提供可以通过对5.3节中提供的DNA分子实施5.2节(包括5.2.3、5.2.4和5.2.5节)中所描述的方法步骤产生本节(5.4节)所述的具有发夹结构末端的DNA分子。照此,本节(5.4节)所述的具有发夹结构末端的DNA分子可以(1)包含第3和5.3节中提供的DNA分子的多种特性,包括可以形成如5.3.1节和本节(5.4节)所述的发夹的IR或ITR,如5.3.1节和本节(5.4节)所述的IR或ITR的特异性序列、来源和性质,如5.3.3所述的表达盒,如5.3.2、5.2.4和5.3.6节所述的切口核酸内切酶或限制性内切酶的限制性位点,和如5.2.4节所述的可编程切口酶的靶标位点,和/或(2)缺少如5.3.4节所述的RABS和/或TRS序列。因此,本发明公开提供本节(5.4节)所述的具有发夹结构末端的DNA分子可以(1)包含可以形成如5.3.1节和本节(5.4节)所述的发夹的IR或ITR、如5.3.3所述的表达盒、如5.3.2、5.2.4和5.3.6节所述的切口核酸内切酶或限制性内切酶的限制性位点、如5.2.4节所述的可编程切口酶的靶标位点和本节(5.4节)中提供的载体的其它特性的实施方案的任意组合,和/或(2)缺少如5.3.4节所述的RABS和/或TRS序列。
如根据描述可知,例如,一旦实施第3、5.2.3、5.2.4和5.2.5节中所描述的方法步骤,可以从以上第3和5.3.1节所提供的ITR或IR形成本节(5.4节)中提供的具有发夹结构末端的DNA分子中的ITR或具有发夹的ITR。因此,在一些实施方案中,本节(5.4节)中提供的具有发夹结构末端的DNA分子中的2个ITR或2个具有发夹的ITR可以以任意组合包含第3和5.3.1节中提供的IR或ITR的任何实施方案和本节(5.4节)中提供的其它实施方案。
在一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:a.)第一发夹反向重复序列(例如,如5.3.1节和本节(5.4节)所述);b.)所述底部链的切口(例如,如5.2.4和5.3.2节以及本节(5.4节)所述);c.)表达盒(例如,如5.3.3节和本节(5.4节)所述);d.)所述底部链的切口(例如,如5.2.4和5.3.2节以及本节(5.4节)所述);和e.)第二发夹反向重复序列(例如,如5.3.1节和本节(5.4节)所述)。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:a.)第一发夹反向重复序列(例如,如5.3.1节和本节(5.4节)所述);b.)所述顶部链的切口(例如,如5.2.4和5.3.2节以及本节(5.4节)所述);c.)表达盒(例如,如5.3.3节和本节(5.4节)所述);d.)所述顶部链的切口(例如,如5.2.4和5.3.2节以及本节(5.4节)所述);和e.)第二发夹反向重复序列(例如,如5.3.1节和本节(5.4节)所述)。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:a.)第一发夹反向重复序列(例如,如5.3.1节和本节(5.4节)所述);b.)所述底部链的切口(例如,如5.2.4和5.3.2节以及本节(5.4节)所述);c.)表达盒(例如,如5.3.3节和本节(5.4节)所述);d.)所述顶部链的切口(例如,如5.2.4和5.3.2节以及本节(5.4节)所述);和e.)第二发夹反向重复序列(例如,如5.3.1节和本节(5.4节)所述)。
在另一个方面,本文提供了双链DNA分子,其在顶部链的5'至3'方向上包含:a.)第一发夹反向重复序列(例如,如5.3.1节和本节(5.4节)所述);b.)所述顶部链的切口(例如,如5.2.4和5.3.2节以及本节(5.4节)所述);c.)表达盒(例如,如5.3.3节和本节(5.4节)所述);d.)所述底部链的切口(例如,如5.2.4和5.3.2节以及本节(5.4节)所述);和e.)第二发夹反向重复序列(例如,如5.3.1节和本节(5.4节)所述)。
基于包括碱基对堆叠、茎、发夹、凸起、内环和多分支环的构象(例如,结构域)形成二级结构。就结构域而不是特异性核苷酸序列而言,IR的结构域-水平描述代表了链和所形成的复合物。在序列水平,为每个结构域分配特定核苷酸序列或基序,并且通过沃森-克里克碱基配对确定其互补序列。这覆盖了任何互补核苷酸对,包括G-T摆动碱基对之间结合的整个范围。整套结合(例如,碱基对)和未结合结构域形成了单分子复合物并且显示出多种二级结构。在一些实施方案中,发夹可以具有碱基-配对的茎和未配对碱基的小环。在某些实施方案中,多核苷酸序列中交织的非回文多核苷酸部分的存在可以导致产生被称为凸起的未配对核苷酸。凸起可以具有一个或多个核苷酸并且基于它们的位置以不同类型分类:在顶部链中(凸起),在两条链中(内环)或者在接合点处。这些碱基对的系列构成了DNA二级结构,其以其立体结构存在。
就结构域而非特异性核苷酸序列而言,本文还提供了对文中DNA分子的结构域-水平的描述以表示多条链和它们的复合物。在一些实施方案中,相互作用的单链DNA链的结构域(例如,序列基序)可以在单链水平显示出可以与其它DNA链相互作用的特定二级结构,并且在一些情况下,当第一链结合至第二链上的互补结构域以形成双螺旋时,采取杂交结构。可以将产生新复合物或二级结构变化的不同DNA链的相互作用视为“反应”。在序列水平,其它单分子和双分子反应也可能发生。较差的序列设计可以导致产生防碍包含本文所提供的一个或多个DNA分子的系统的预期反应的序列-水平结构或相互作用(例如,在表达盒中互补的多个结构域)。可以通过设计避免不希望发生的相互作用,从而导致形成可靠且可预测的二级结构。
本发明公开提供导致产生DNA二级结构的潜在作用力受构成热力学定律基础的疏水相互作用的控制,并且整体构象可以受物理化学条件影响。决定平衡状态的因素的示例性列表包括溶剂类型、化学试剂拥挤(chemical agents crowding)、盐浓度、pH和温度。尽管来源于实验文献的自由能变化参数和热函变化参数使得能够预测构象稳定性,但是如统计力学中常见的,从IR序列形成的发夹的整体立体结构对应于分子构象整体,而不仅对应于一个构象。随物理或化学条件(例如,盐、pH或温度)变化的主要构象转变是重排列的。
“茎结构域”或者“茎”是指将形成沃森-克里克碱基对的悬突链的自互补核苷酸序列。所述茎主要包含在DNA对的2个反向平行延伸之间形成的沃森-克里克碱基对并且可以是右手螺旋。在一个实施方案中,茎包含处于回文序列的自互补DNA序列延伸。
“主要茎结构域”或“主要茎”是指DNA分子距表达盒最近的ITR或者非ITR序列的自互补或反向互补核苷酸序列的一部分。在一个实施方案中,主要茎结构域是形成本文所提供的DNA分子末端的回文序列的自互补延伸,并且共价连接至侧接ITR的非ITR序列。主要茎涵盖了IR序列的起始以及末端两者。在某些实施方案中,主要茎的长度范围在1至100或更多个bp。主要茎区的长度对变性/复性动力学有影响。在一些具体的实施方案中,主要茎区具有至少约4至25个核苷酸以确保热稳定性。在其它具体的实施方案中,主要茎区具有约4至25个核苷酸以确保热稳定性。另一方面,反向重复序列结构域可以具有足以在生理条件下维持大致立体结构的任何长度。
“环”或“环结构域”是指不是转折点并且不在茎中的IR或ITR中的未配对核苷酸区。在一些实施方案中,环结构域存在于IR结构的顶点。环结构域可以起到其中DNA链的局部方向性逆转以提供起始茎的2个反向平行链的区域的作用。由于位阻排斥,在某些实施方案中,环包含最少2个核苷酸以在DNA发夹中转弯。在其它实施方案中,环包含4个核苷酸或更多个核苷酸。在其它实施方案中,环包含至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29或至少30个核苷酸。在一些其它实施方案中,环包含约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29或约30个核苷酸。所述环在茎的自互补序列之后,并且用于将其它核苷酸连接至茎结构域。在一些实施方案中,环包含不与环序列中的其它核苷酸或者ITR的其它元件形成邻接双螺旋结构的寡核苷酸序列(例如,环保持柔性、单链形式)。在一个实施方案中,不与环序列中其它核苷酸形成双螺旋的环序列是一系列相同碱基(例如,AAAAAAAA、CCCCCCCC、GGGGGGG或TTTTTTTT)。在一个实施方案中,环含有2至30个核苷酸。在其它实施方案中,环结构域含有2至15个核苷酸。在其它实施方案中,环包含核苷酸混合物。
如本文所使用的,术语“发夹”是指由IR或ITR序列形成的任何DNA结构以及整体DNA结构,包括二级或三级结构。如本文所使用的,“具有发夹结构的”DNA分子是指其中在所述DNA分子中形成的一个或多个发夹结构的DNA分子。在一个实施方案中,发夹包含互补的茎和环。处于其最简单的形式的发夹由互补的茎和环组成。涵盖茎和环的结构被称为“茎-环”、“茎环”或“SL”。在另一个实施方案中,发夹由互补的茎和环组成。“分支发夹结构”是指具有形成分支结构的多个茎环的发夹亚型(例如,如图1所示)。形成发夹结构之后的IR或ITR可以被称为具有发夹结构的ITR或IR。“具有发夹结构末端的”DNA分子是指其中在所述DNA分子的一端形成发夹结构或者在所述DNA分子的两端中的每一端形成发夹结构的DNA分子。
“转折点”或“顶点”是指在ITR空间末端未配对的核苷酸区域。转折点起到其中DNA链的全局方向性逆转以提供起始茎的2个反向平行链的区域的作用。转折点还标记IR或ITR序列在此逆转或反向互补的点。
在一些实施方案中,在主要茎结构域之后的ITR的一部分可以编码核苷酸序列,其与常规双链DNA相反,当折叠到自身上时,可以形成非沃森-克里克-基结构元件,包括摆动和错配,和结构缺陷或不完全,如凸起和内环(参见,例如图1)。“凸起”在一条链上含有一个或多个未配对的核苷酸,尽管“内环”在顶部链和底部链两者上含有一个或多个未配对的核苷酸。对称内环往往使螺旋的扭曲小于凸起和不对称内环,其可以使螺旋扭结或弯曲。在一些实施方案中,茎中未配对的核苷酸可以以不同的结构相互作用接合,如非典型氢键作用和堆叠,其适合于其它热力学稳定性和功能性多样性。不受理论束缚,据认为IR茎和环的结构多样性导致了复杂的二级结构和功能性多样性。
在一些实施方案中,具有发夹结构末端的DNA分子的发夹包含主要茎。在一个实施方案中,具有发夹结构末端的DNA分子的发夹包含1、2、3、4、5、6、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个茎。在另一个实施方案中,具有发夹结构末端的DNA分子的发夹包含1、2、3、4、5、6、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个环。在另一个实施方案中,具有发夹结构末端的DNA分子的发夹包含1、2、3、4、5、6、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个内环。在其它实施方案中,具有发夹结构末端的DNA分子的发夹包含1、2、3、4、5、6、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个凸起。在一个实施方案中,具有发夹结构末端的DNA分子的发夹包含1、2、3、4、5、6、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个分支发夹。在另一个实施方案中,具有发夹结构末端的DNA分子的发夹包含1、2、3、4、5、6、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个顶点。在其它实施方案中,具有发夹结构末端的DNA分子的发夹以任意组合包含多个茎、分支发夹、环、凸起、顶点和/或内环。
在一些实施方案中,本文所提供的DNA分子中的发夹结构是由对称悬突形成的。为了获得对称悬突,5'茎区中的修饰将在所述茎区的相应位置需要同源3'修饰,从而修饰的5'位置可以与修饰的3'位置形成碱基对。可以如本发明公开所述,结合提交时的现有技术水平,实施形成对称悬突的这种修饰。例如,通过在位置23插入A产生切口核酸内切酶的BstNBI限制性位点,将需要相对于wt AAV2 ITR(例如,SEQ ID NO:162)在位置105插入T。
在一些实施方案中,来自具有发夹结构的ITR对的5'和3'端具有发夹结构的ITR可以具有不同的反向互补核苷酸序列以具有切口核酸内切酶的反向平行限制性位点(例如,5'ITR,从而切口导致产生底部链5'悬突,和3'ITR,从而切口导致产生底部链3'悬突),但是仍具有相同三维空间组织,从而两个ITR具有导致产生相同整体3D形状的突变。
在一些实施方案中,本文所使用的具有发夹结构的ITR可以在选自下列的区域中的任何一个或多个中包含至少1、2、3、4、5、6、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸的修饰(例如,缺失、替换或添加):主要茎结构域、茎、分支发夹、环、凸起或内环。在一个具体实施方案中,右侧具有发夹结构的ITR中的核苷酸可以从A替换为G、C或T或者缺失或者添加一个或多个核苷酸;左侧具有发夹结构的ITR中的核苷酸可以从T改变为G、C或A或者缺失或者添加一个或多个核苷酸。
在一些实施方案中,本文所使用的具有发夹结构的ITR可以在选自下列的区域中的任何一个或多个中包含至少1、2、3、4、5、6、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸的修饰(例如,缺失、替换或添加):主要茎结构域、茎、分支发夹、环、凸起或内环,以替换或排除CpG基序的存在,借此:(i)与病毒野生型ITR相比,降低或消除这些修饰的具有发夹结构的ITR对toll样受体家族(TLR)(例如,TLR9)的结合,和/或(ii)通过除去转录活性的CpG岛降低或减少ITR转录活性。通常将转录活性的CpG岛定义为C+G比大于50%且观察比预期的CpG二核苷酸在60%或以上的序列,如Gardiner-Garden M,FrommerM.CpG Islands in vertebrate genomes.J Mol Biol 1987;196:261–282中所述。在一个具体实施方案中,右侧具有发夹结构的ITR中的核苷酸可以从G或C替换为A或T或者缺失或者在C和G或G和C之间添加一个或多个核苷酸;左侧具有发夹结构的ITR中的核苷酸可以从C或G改变为T或A或者缺失或者在C和G或G和C之间添加一个或多个核苷酸。在一个具体实施方案中,具有发夹结构的ITR包含排除CpG的以下序列:TTGGTCACTCCCTCTCTGTACACTCACTCACTCACTGATCCCTGGATACCAAAGGT ATCCAGACACCCAGTCTTTGACTGGGTGGGATCAGTGAGTGAGTGAGTGTACAGA GAGGGAGTGACCAA(SEQ ID NO 336):
在一些实施方案中,本文所提供的DNA分子的具有发夹结构的ITR可以包含主要茎,其中从每个主要茎结构域除去1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或更多个互补碱基对,从而主要茎结构域较短并且具有较低的折叠自由能。简要地,在这些实施方案中,如果在主要茎结构域的一部分中除去碱基,则还除去了主要茎结构域中的互补碱基对,借此缩短了整体主要茎结构域。
在一些实施方案中,本文所提供的DNA分子的具有发夹结构的ITR可以包含主要茎,其中从每个主要茎结构域引入1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或更多个互补碱基对,从而主要茎结构域较长并且具有较高的折叠自由能。简要地,在这些实施方案中,如果在主要茎结构域的一部分中引入碱基,则还引入了主要茎结构域中的互补碱基对,借此延长了整体主要茎结构域。
在一些实施方案中,本文所提供的DNA分子的具有发夹结构的ITR可以包含主要茎,其中将来自每个主要茎结构域的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或更多个互补碱基对从A或T替换为G或C,从而主要茎结构域是更富含G/C的并且具有较高的折叠自由能。简要地,在这些实施方案中,如果在主要茎结构域的一部分中替换碱基(例如,T替换为G),则还替换了主要茎结构域中的互补碱基对(例如,A替换为C),借此提高了整体主要茎结构域的G/C含量。
在其它实施方案中,本文所提供的DNA分子的具有发夹结构的ITR可以包含主要茎,其中来自每个主要茎结构域的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或更多个互补碱基对从G或C替换为A或T,或者缺失或者在C和G或者G和C之间添加一个或多个核苷酸,从而主要茎结构域含有较少或不含CpG基序并且具有低于病毒ITR的TLR9结合倾向和/或与参考DNA(例如,相同DNA分子,但是具有未修饰的包含CpG基序的主要茎序列)相比较少的转录活性CpG岛。
在另一个实施方案中,本文所提供的DNA分子的具有发夹结构的ITR可以包含主要茎,其中将来自每个主要茎结构域的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或更多个互补碱基对从G或C替换为A或T,从而RAP(例如,Rep)不可再有效结合至主要茎结构域。
在另一个实施方案中,本文所提供的DNA分子的具有发夹结构的ITR可以包含主要茎,其中来自每个主要茎结构域的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或更多个互补碱基对从A或T替换为G或C,从而主要茎结构域更富含G/C并且具有更高的折叠自由能,从而RAP(例如,Rep或NS1)不可再有效结合至主要茎结构域。
在一些实施方案中,本文所提供的DNA分子中的具有发夹结构的ITR序列可以相对于全长WT病毒ITR序列具有1至40个核苷酸缺失,同时完整的wt ITR序列仍存在于载体中。例如,在对称ITR,如AAV2 ITR中,如果切口核酸内切酶的限制性位点分别距顶点远离25个碱基,则在悬突的切口核酸内切酶的限制性位点之后的部分不需要wt IR序列,因为它将在如5.2.3至5.2.4节所述的与切口核酸内切酶(或者切口核酸内切酶和限制性内切酶)培育和变性之后从所述DNA分子移除。在某些实施方案中,本文所提供的DNA分子中的具有发夹结构的ITR序列可以相对于全长WT病毒ITR序列具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸缺失,同时完整的wt ITR序列仍存在于载体中。
在一些实施方案中,基于存在于ITR茎区的分离的核苷酸序列的预测解链温度选择切口核酸内切酶的限制性位点。在一些实施方案中,预测的解链温度在40-95℃之间。切口核酸内切酶的限制性位点的其它实施方案以及解链温度中的影响因素的实施方案如以上5.2.3、5.2.4、5.2.5和5.3.2节中所述。
在一个实施方案中,还通过缺失、插入和/或取代进一步修饰涵盖本文所提供的DNA分子中具有发夹结构的ITR的茎区的核苷酸序列的长度和GC含量,从而当温度保持在约4℃时,形成发夹结构。例如,与病毒ITR的野生型序列相比,可以修饰结构元件的核苷酸序列。在一个实施方案中,设计茎的长度和GC含量,从而当将温度维持在比总ITR的解链温度低约10℃或以上时,形成发夹结构。可以通过改变GC含量、切口核酸内切酶的限制性位点之间的距离和最接近主要茎的接合点(例如,图1中编号4),或者序列错配或环来设计发夹结构的解链温度,从而解链温度足够高以允许具有发夹结构的ITR在50℃以上仍处于折叠以确保储存稳定性。茎的真实最适长度可以随ITR序列和ITR的微结构域(如分支、环和臂)而改变,其可以根据本发明公开结合现有技术确定。
在一些实施方案中,具有发夹结构的ITR的茎区编码II类切口核酸内切酶的限制性位点(例如,5'的NNNN下游)。在一些实施方案中,茎区不含II类切口核酸内切酶的限制性位点。
在一些实施方案中,具有发夹结构的ITR的茎区编码I类切口核酸内切酶的限制性位点。在一些实施方案中,具有发夹结构的ITR的茎区编码III、IV或V类切口核酸内切酶的限制性位点。图4显示了发夹的主要茎中的核酸内切酶的限制性位点的多种示例性布置。
在一些实施方案中,具有发夹结构末端的DNA分子中的表达盒可以是5.3.3节中所描述的表达盒的任何实施方案。在某些实施方案中,具有发夹结构末端的DNA分子中的ITR可以是5.3.1节中所描述的IR或ITR的任何实施方案。在其它实施方案中,ITR、表达盒和切口核酸内切酶或限制性内切酶的限制性位点中的布置可以是如5.2.3、5.2.4、5.2.5、5.3.1、5.3.2、5.3.3和5.3.6节所述的任何布置。
在一些实施方案中,具有发夹结构末端的DNA包含共价连接至3'ITR以及5'ITR的顶部链并且一旦ITR折叠,则底部链在底部链的任一端侧接2个切口(第一和第二切口),从而表达盒位于所述第一切口和第二切口之间,其中由于顶部链5'ITR发夹,在底部链的3'端和顶部链的并置的5'端之间形成第一切口,并且由于顶部链3'ITR发夹,在底部链的5'端和顶部链的并置的3'端之间形成第二切口。
在一些实施方案中,具有发夹结构末端的DNA包含共价连接至3'ITR以及5'ITR的底部链并且一旦ITR折叠,则顶部链在顶部链的任一端侧接2个切口(第一和第二切口),从而表达盒位于所述第一切口和第二切口之间,其中由于底部链3'ITR发夹,在顶部链的5'端和底部链的并置的3'端之间形成第一切口,并且由于底部链3'ITR发夹,在顶部链的3'端和底部链的并置的5'端之间形成第二切口。
在一些实施方案中,具有发夹结构末端的DNA包含共价连接至5'ITR的顶部链和共价连接至5'ITR的底部链,从而当ITR折叠时,由于顶部链5'ITR发夹,在底部链的3'端和顶部链并置的5'端之间邻近于底部链形成第一切口,并且由于底部链5'ITR发夹,在顶部链的3'端和底部链并置的5'端之间邻近于顶部链形成第二切口,其中所述表达盒侧接所述第一和第二切口。
在一些实施方案中,具有发夹结构末端的DNA包含共价连接至3'ITR的顶部链和共价连接至3'ITR的底部链,从而当ITR折叠时,由于底部链3'ITR发夹,在顶部链的5'端和底部链并置的3'端之间邻近于顶部链形成第一切口,并且由于顶部链3'ITR发夹,在底部链的5'端和顶部链并置的3'端之间邻近于底部链形成第二切口,其中所述表达盒侧接所述第一和第二切口。
在一些实施方案中,可以将如本节(5.4节)和之前4段所述的包含2个切口的具有发夹结构末端的DNA连接以通过在所述2个侧接切口的核苷酸之间形成共价键来修复切口。在一些实施方案中,可以将本节(5.45.4节)和之前4段中所述的2个切口之一连接并修复,从而当变性时,所述DNA分子成为线性单链DNA分子。在一些实施方案中,可以将本节(5.4节)和之前4段中所述的2个切口连接并修复,从而当变性时,所述DNA分子成为环状单链DNA分子。
在一些实施方案中,具有发夹结构末端的DNA分子中2个侧接的ITR对包含相同的DNA序列。在一些实施方案中,具有发夹结构末端的DNA分子中2个侧接的ITR对包含不同的DNA序列。在一些实施方案中,与相同的具有发夹结构末端的DNA分子中的其它ITR相比,通过缺失、插入和/或替换,修饰具有发夹结构末端的DNA分子中的ITR之一。在另一个实施方案中,例如,通过缺失、插入和/或替换,修饰所述具有发夹结构末端的DNA分子中的第一ITR和第二ITR两者。在另一个实施方案中,在具有发夹结构末端的DNA分子中第一ITR和第二ITR包含不同的DNA序列并且两者均被修饰。在其它实施方案中,在具有发夹结构末端的DNA分子中第一ITR和第二ITR包含不同的DNA序列并且两者均被修饰,其中2个ITR的修饰是不同的。在其它实施方案中,在具有发夹结构末端的DNA分子中第一ITR和第二ITR包含不同的DNA序列并且两者均被修饰,其中2个ITR的修饰是相同的。在一个实施方案中,在具有发夹结构末端的DNA分子中第一ITR和第二ITR包含相同的DNA序列并且两者均被修饰,其中2个ITR的修饰是相同的。在一个实施方案中,在具有发夹结构末端的DNA分子中第一ITR和第二ITR包含相同的DNA序列并且两者均被修饰,其中2个ITR的修饰是相同的。在一个实施方案中,在具有发夹结构末端的DNA中第一ITR和第二ITR均为修饰的ITR,并且所述2个修饰的ITR不相同。在一些实施方案中,具有发夹结构末端的DNA分子包含2个不对称的ITR,其中所述不对称性可以是因为不在其它ITR中反映的一个ITR的任何变化所造成的。在某些实施方案中,具有发夹结构末端的DNA分子包含2个不对称的ITR,其中所述ITR以任何方式相对于彼此不同。在某些实施方案中,本段所提供的修饰,包括缺失、插入和/或替换可以是以上本节(5.4节)中所述的任何这些修饰。
在一个方面,本文所提供的具有发夹结构末端的DNA分子在5'至3'方向上包含:第一IR、感兴趣的核苷酸序列和第二IR。在一个实施方案中,感兴趣的核苷酸序列包含如本文,例如,5.3.3节所描述的表达盒。在某些实施方案中,本文,包括在第3节和本节(5.4节)中所提供的具有发夹结构末端的DNA分子包含表达盒,其中所述表达盒可以是第3和5.3.3节中所描述的任何实施方案。
具有发夹结构末端的DNA分子可以包含dsDNA和ssDNA的组合。在一些实施方案中,本节(5.4节)中提供的具有发夹结构末端的DNA分子的某些部分是dsDNA。在一些实施方案中,本节(5.4节)中提供的具有发夹结构末端的DNA分子的dsDNA部分包含表达盒、ITR的茎区或两者。在一些实施方案中,本节(5.4节)中提供的具有发夹结构末端的DNA分子的某些部分是ssDNA。在其它实施方案中,本节(5.4节)中提供的具有发夹结构末端的DNA分子的dsDNA部分。在一个实施方案中,本节(5.4节)中提供的具有发夹结构末端的DNA分子的dsDNA部分占所述具有发夹结构末端的DNA分子的90%以上。在另一个实施方案中,本节(5.4节)中提供的具有发夹结构末端的DNA分子的dsDNA部分占所述具有发夹结构末端的DNA分子的至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%。在另一个实施方案中,本节(5.4节)中提供的具有发夹结构末端的DNA分子的dsDNA部分占所述具有发夹结构末端的DNA分子的约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%。
在一些实施方案中,可以将本文所提供的具有发夹结构末端的DNA分子有效靶向或输送至细胞核。在一个实施方案中,可以通过在ITR所形成的适体和核蛋白之间的结合将本文所提供的具有发夹结构末端的DNA分子有效靶向或输送至细胞核。在另一个实施方案中,可以将本文所提供的具有发夹结构末端的DNA分子有效靶向或输送至细胞核,从而核中的具有发夹结构末端的DNA分子的丰度比细胞质中的高10%、20%、30%、40%、50%、60%、70%、80%、90%或者100%。在另一个实施方案中,可以将本文所提供的具有发夹结构末端的DNA分子有效靶向或输送至细胞核,从而核中的具有发夹结构末端的DNA分子的丰度比细胞质中的高1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30倍。
在本文,包括本节(5.4节)所提供的具有发夹结构末端的DNA分子的多个实施方案中,所述具有发夹结构末端的DNA分子缺少RABS和/或TRS序列,如5.3.4节所述。在本文,包括本节(5.4节)所提供的具有发夹结构末端的DNA分子的其它实施方案中,所述具有发夹结构末端的DNA分子缺少如5.3.4节所述的DNA序列、元件或特性的任一种或任意组合。
在一些其它实施方案中,在本文,包括本节(5.4节)所提供的具有发夹结构末端的DNA分子的实施方案中,所述具有发夹结构末端的DNA分子可以是相对于如5.3.7节所述的纯度处于任何实施方案的分离的具有发夹结构末端的DNA分子。
5.5具有发夹结构末端的DNA分子的功能性
在一些实施方案中,ITR促进细胞核中核酸分子的长期存活。在一些实施方案中,ITR促进细胞核中核酸分子的永久存活(例如,细胞的整个生命周期)。在一些实施方案中,ITR促进细胞核中核酸分子的稳定性。在一些实施方案中,ITR抑制或防止细胞核中核酸分子的降解。
在一些实施方案中,当ITR采取其折叠状态时,它耐受核酸外切酶消化(例如,核酸外切酶V),例如,在37℃耐受超过一小时。在一个实施方案中,具有发夹结构末端的DNA分子耐受核酸外切酶消化(例如,通过核酸外切酶V的消化)。在另一个实施方案中,具有发夹结构末端的DNA分子耐受核酸外切酶消化(例如,通过核酸外切酶V的消化)至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10个或更多个小时。在另一个实施方案中,具有发夹结构末端的DNA分子耐受核酸外切酶消化(例如,通过核酸外切酶V的消化)约1、约2、约3、约4、约5、约6、约7、约8、约9或约10小时。
如本发明人意外发现和本文所提供的,可以无需RAP产生具有类似于病毒ITR的ITR的双螺旋线性DNA载体,并因此对于基因组复制不依赖于RABS或TRS序列。因此,可以任选地在本文所公开的核苷酸序列中编码RABS和TRS,但是它们不是必需的,并且为ITR设计提供了灵活性。在一个实施方案中,本文所提供的DNA分子包含不包含RABS的ITR。在另一个实施方案中,本文所提供的DNA分子包含不包含TRS的ITR。在另一个实施方案中,本文所提供的DNA分子包含不包含RABS或TRS中任一种的ITR。在其它实施方案中,本文所提供的DNA分子包含不包含RABS、TRS或RABS和TRS两者的ITR。
在一些实施方案中,本文所提供的具有发夹结构末端的DNA分子在宿主细胞中稳定。在一些实施方案中,本文所提供的具有发夹结构末端的DNA分子在宿主细胞中对于长期培养稳定。
在某些实施方案中,可以将本文所提供的具有发夹结构末端的DNA分子有效递送至宿主细胞。
本文所提供的DNA分子不仅对于它们对以上所描述的核酸外切酶消化的耐受性,而且对于它们的结构具有优良的稳定性。在一个实施方案中,所述DNA分子的结构在室温下储存后保持相同1天、2天、3天、4天、5天、6天、7天、2周、3周、4周、5周、6周、7周、8周、3个月、4个月、5个月、6个月、7个月、8个月、9个月、10个月、11个月或12个月。在另一个实施方案中,所述DNA分子的整体结构在室温下储存后保持相同1天、2天、3天、4天、5天、6天、7天、2周、3周、4周、5周、6周、7周、8周、3个月、4个月、5个月、6个月、7个月、8个月、9个月、10个月、11个月或12个月。在一些实施方案中,在2、3、4、5、10或20次变性/复性(例如,如5.2.3节所述的变性和如5.2.5节所述的重退火)循环后,本文所提供的DNA分子的结构是相同的。可以通过在最小能量处或附近的结构整体来描述DNA结构。在某些实施方案中,在2、3、4、5、10或20次变性/复性循环后,整体DNA结构是相同的。在一个实施方案中,在2、3、4、5、10或20次变性/复性循环后,从本文所提供的ITR或IR所形成的折叠发夹结构是相同的。在另一个实施方案中,在2、3、4、5、10或20次变性/复性循环后,折叠发夹的整体结构是相同的。
5.6包含具有发夹结构末端的DNA分子的递送媒介物
在一些实施方案中,可以经由如USPN 10,561,610所述的杂交体递送本文所提供的具有发夹结构末端的DNA分子,其以其全部内容作为参考并入本文。在其它实施方案中,可以经由杂交体递送本文所提供的DNA分子。
在某些实施方案中,可以经由脂质颗粒,包括脂质纳米颗粒递送本文所提供的DNA分子。在其它实施方案中,可以经由脂质纳米颗粒递送本文所提供的具有发夹结构末端的DNA分子。在一些实施方案中,所述脂质纳米颗粒包含任何一种或多种脂质,其选自可电离脂质、非阳离子脂质(例如,磷脂)、甾醇类(例如,胆固醇)和PEG化的脂质。在一个实施方案中,脂质颗粒包含任何一种或多种脂质,其选自可电离脂质、非阳离子脂质(例如,磷脂)、甾醇类(例如,胆固醇)和PEG化的脂质,其中对于可电离脂质,脂质的摩尔比在20至70摩尔百分比或者40至60摩尔百分比的范围内,非阳离子脂质的摩尔百分比在0至30或者0至15的范围内,甾醇类的摩尔百分比在20至70或者30至50的范围内并且PEG化的脂质的摩尔百分比在1至6或2至5的范围内。在另一个实施方案中,脂质颗粒包含任何一种或多种脂质,其选自可电离脂质、非阳离子脂质(例如,磷脂)、甾醇类(例如,胆固醇)和PEG化的脂质,其中对于可电离脂质,脂质的摩尔比在40至60摩尔百分比的范围内,非阳离子脂质的摩尔百分比在0至15的范围内,甾醇类的摩尔百分比在30至50的范围内并且PEG化的脂质的摩尔百分比在2至5的范围内。在另一个实施方案中,脂质颗粒包含任何一种或多种脂质,其选自可电离脂质、非阳离子脂质(例如,磷脂)、甾醇类(例如,胆固醇)和PEG化的脂质,其中对于可电离脂质,脂质的摩尔比在20至70摩尔百分比的范围内,非阳离子脂质的摩尔百分比在0至30的范围内,甾醇类的摩尔百分比在20至70的范围内并且PEG化的脂质的摩尔百分比在1至6的范围内。
本发明公开提供可电离脂质可以用于在低pH下缩合核酸货物,并且驱使膜结合和融合性。这些可电离脂质可以用作用于组合物的递送媒介物和用于本文所提供的DNA分子的方法的一部分。在一些实施方案中,可电离脂质是包含至少一个带正电荷的或者在酸性条件,例如在pH 6.5或以下质子化的氨基的脂质。在一些实施方案中,可电离脂质具有至少一个可质子化或可去质子化的基团,从而所述脂质在生理学pH(例如,pH 7.4)或低于生理学pH时带正电荷,并且在第二pH,例如,在或高于生理学pH时为中性。本领域的技术人员将理解与pH有关的质子的添加或去除是平衡过程,并且提及带电或中性脂表示主要物质的性质,并且不需要所有脂质以带电或中性形式存在。一般地,可电离脂质具有在约4至约7的范围内的可质子化基团的pKa。
其它示例性可电离脂质描述于PCT专利公开W02015/095340、WO2015/199952、W02018/011633、WO2017/049245、WO2015/061467、WO2012/040184、WO2012/000104、WO2015/074085、W02016/081029、WO2017/004143、WO2017/075531、WO2017/117528、WO2011/022460、WO2013/148541、WO2013/116126、WO2011/153120、WO2012/044638、WO2012/054365、WO2011/090965、W02013/016058、W02012/162210、W02008/042973、WO2010/129709、W02010/144740、WO2012/099755、WO2013/049328、WO2013/086322、WO2013/086373、WO2011/071860、W02009/132131、W02010/048536、W02010/088537、WO2010/054401、W02010/054406、W02010/054405、WO2010/054384、W02012/016184、W02009/086558、W02010/042877、WO2011/000106、WO2011/000107、W02005/120152、WO2011/141705、WO2013/126803、W02006/007712、WO2011/038160、WO2005/121348、WO2011/066651、W02009/127060、WO2011/141704、W02006/069782、WO2012/031043、WO2013/006825、WO2013/033563、W02013/089151、WO2017/099823、WO2015/095346和WO2013/086354,以上专利均以其全部内容作为参考并入本文。
在一些具体的实施方案中,所述可电离脂质为MC3(6Z,9Z,28Z,3lZ)-三十七烷-6,9,28,31-四烯-19-基-4-(二甲基氨基)丁酸酯(DLin-MC3-DMA或者MC3)。
在一些具体的实施方案中,所述可电离脂质为MC3(6Z,9Z,28Z,3lZ)-三十七烷-6,9,28,31-四烯-19-基-4-(二甲基氨基)丁酸酯(DLin-MC3-DMA或者MC3)。
在一些具体的实施方案中,所述可电离脂质为(((4-羟丁基)氮烷二基)双(己烷-6,1-二基)双(2-己基癸酸酯)。
在一些具体的实施方案中,所述可电离脂质为9-十七基8-{(2-羟乙基)[6-氧-6-(十一基氧)己基]氨基}辛酸酯。
在一些实施方案中,本文所提供的DNA分子的脂质纳米颗粒封装包括一种或多种脂质,其选自二硬脂酰-磷脂酰胆碱(DSPC)、二油酰基-磷脂酰胆碱(DOPC)、二棕榈酰基-磷脂酰胆碱(DPPC)、二油酰基-磷脂酰甘油(DOPG)、二棕榈酰基-磷脂酰甘油(DPPG)、二油酰基-磷脂酰乙醇胺(DOPE)、棕榈酰油酰-磷脂酰胆碱(POPC)、棕榈酰油酰-磷脂酰乙醇胺(POPE)和二油酰基-磷脂酰-乙醇胺、二棕榈酰基-磷脂酰基-乙醇胺(DPPE)、肉豆蔻基磷-乙醇胺(DMPE)、二硬脂酰-磷脂酰基-乙醇胺(DSPE)、16-O-一甲基PE、16-O-二甲基PE、18-1-反式PE、1-硬脂酰-2-油酰基-磷脂酰乙醇胺(SOPE)和1,2-二反油酸氧基-sn-甘油基-3-磷酸乙醇胺(反式DOPE)。
本文所提供的递送媒介物包括用于将本文所提供的DNA分子递送至细胞的递送媒介物,其有时被称为转染。其它有用的转染方法包括(但不限于)脂质-介导的转染、阳离子聚合物-介导的转染或者磷酸钙沉淀。本文提供了在本领域中熟知的转染试剂并且其包括(但不限于)TurboFect转染试剂(Thermo Fisher Scientific)、Pro-Ject试剂(ThermoFisher Scientific)、TRANSPASSTMP蛋白转染试剂(New England Biolabs)、CHARIOTTM蛋白递送试剂(Active Motif)、PROTEOJUICETM蛋白转染试剂(EMD Millipore)、293fectin、LIPOFECT AMINETM2000、LIPOFECT AMINETM3000(Thermo Fisher Scientific)、LIPOFECTAMINETM(Thermo Fisher Scientific)、LIPOFECTINTM(Thermo Fisher Scientific)、DMRIE-C、CELLFECTINTM(Thermo Fisher Scientific)、OLIGOFECT AMINETM(Thermo FisherScientific)、LIPOFECT ACETM、FUGENETM(Roche,Basel,Switzerland)、FUGENETMHD(Roche)、TRANSFECT AMTM(Transfectam,Promega,Madison,Wis.)、TFX-10TM(Promega)、TFX-20TM(Promega)、TFX-50TM(Promega)、TRANSFECTINTM(BioRad,Hercules,Calif.)、SILENTFECTTM(Bio-Rad)、EffecteneTM(Qiagen,Valencia,Calif.)、DC-chol(Avanti Polar Lipids)、GENEPORTERTM(Gene Therapy Systems,San Diego,Calif.)、DHARMAFECT 1TM(Dharmacon,Lafayette,Colo.)、DHARMAFECT 2TM(Dharmacon)、DHARMAFECT 3TM(Dharmacon)、DHARMAFECT 4TM(Dharmacon)、ESCORTTMIII(Sigma,St.Louis,Mo.)和ESCORTTMIV(SigmaChemical Co.)。
在一些情况下,化学递送系统可以用于递送本文所提供的DNA分子,例如,通过使用阳离子转染试剂,其包括通过多聚阳离子化学品对带负电荷的核酸的压紧以形成阳离子脂质体/胶束或者阳离子聚合物。用于递送方法的阳离子脂质包括(但不限于)一价阳离子脂质、多价阳离子脂质、含胍化合物、胆固醇衍生物化合物、阳离子聚合物(例如,聚(氮丙啶)、聚L-赖氨酸、鱼精蛋白、其它阳离子聚合物)和脂质-聚合物复合物。
在一些实施方案中,通过施加机械、电学、超声波、流体动力学或者激光器-基能量,从而辅助DNA向靶细胞的进入,通过在细胞膜中瞬时渗透,递送本文所提供的DNA分子。例如,可以通过挤压细胞通过具有尺寸限制的通道或者通过本领域中已知的其它方式,瞬时破坏细胞膜来递送本文所提供的DNA分子。
本发明公开提供可以作为药物组合物制备本文所提供的DNA分子。将理解这些组合物必需包含一种或多种活性成分,并且最通常地包含药学上可接受的赋形剂。
基于要治疗的受试者的身份、体型和/或状况并且还基于将要施用的组合物的途径,在根据本发明的药物组合物中活性成分(例如,用于向受试者输送或移植的本文所提供的DNA分子或者包含本文所提供的DNA分子的细胞)、药学上可接受的赋形剂和/或任何其它成分的相对量可以改变。例如,所述组合物可以包括0.1%至99%(w/w)之间的活性成分。举例来说,所述组合物可以包含0.1%至100%,例如,0.5至50%之间、1-30%之间、5-80%之间、至少80%(w/w)的活性成分。
本发明公开的制剂可以无限制地包括盐水、脂质体、脂质纳米颗粒、聚合物、肽、蛋白、包含本文所提供的DNA分子的细胞(例如,用于向受试者输送或移植)及其组合。在一些实施方案中,制剂可以包括外来体,胞外囊泡、杂交体和融合体。
就可以含有内源核酸的病毒颗粒、外来体或杂交体来说,DNA分子的定量可以用作包含在制剂中的剂量的量度。本领域中已知的任何方法可以用于确定本文提供的组合物的DNA分子数目。用于实施DNA分子数滴定的一种方法如下所示:首先用DNA酶处理包含具有发夹结构末端的DNA的病毒颗粒、外来体或杂交体组合物样品以从生产过程中消除污染宿主DNA。然后,对耐受DNA酶的颗粒进行热处理以从衣壳释放基因组。然后,使用靶向病毒基因组特定区域(例如多聚A信号)的引物/探针组通过实时PCR定量释放的基因组。另一种适合于确定基因组拷贝的方法是定量-PCR(qPCR),特别是优化的qPCR或数字微滴式PCR。
可以通过任何药学领域中已知的或此后发展的方法制备本文所述的药物组合物的制剂。如本文所使用的术语“药物组合物”是指包含至少一种活性成分和任选地一种或多种药物可用的赋形剂的组合物。
通常,这些制备方法包括将活性成分与赋形剂和/或一种或多种其它辅助成分结合的步骤。如本文所使用的,短语“活性成分”一般表示本文所提供的DNA分子或者包含本文所提供的DNA分子的细胞或物质中的任一种。
可以通过任何药学领域中已知的或此后发展的方法制备本文所述的DNA分子和药物组合物的制剂。一般地,这些制备方法包括使活性成分与赋形剂和/或一种或多种其它辅助成分结合,然后,如有必要和/或如果希望,将所述产物划分、成形和/或包装成所期望的单剂量或多剂量单元的步骤。
在一些实施方案中,本文所描述的制剂可以含有对于用于疾病治疗的在表达盒中的ORF的表达足够的DNA分子或活性成分。
在一些实施方案中,本发明公开的DNA分子基本不含任何病毒蛋白质,如AAVRep78。在一些实施方案中,本发明公开的分离的DNA分子100%不含、99%不含、98%不含、97%不含、96%不含、95%不含、94%不含、93%不含、92%不含、91%不含或者90%不含病毒蛋白质。
可以使用一种或多种赋形剂或稀释剂配制本发明公开所述的DNA分子以(1)提高稳定性;(2)提高细胞转染或转导;(3)允许活性成分持续或延迟释放;(4)改变生物分布(例如,将所述DNA分子或者包含所述DNA分子的活性成分靶向特定组织或细胞类型);(5)提高表达盒中ORF的翻译;(6)改变通过表达盒ORF编码的蛋白的释放谱和/或(7)使得表达盒的ORF可调控的表达。
在一些实施方案中,药学上可接受的赋形剂可以是至少95%、至少96%、至少97%、至少98%、至少99%或者100%纯的。在一些实施方案中,允许赋形剂用于人和用于兽医用途。在一些实施方案中,可以通过美国食品药物管理局批准赋形剂。在一些实施方案中,赋形剂可以是药物级的。在一些实施方案中,赋形剂可以达到美国药典(USP)、欧洲药典(EP)、英国药典和/或国际药典的标准。
如本文所使用的,赋形剂包括(但不限于)适合于所期望的特定剂量形式的任何和所有溶剂、分散媒介、稀释剂或其它液体媒介物,分散或混悬助剂、表面活性剂、等张剂、增稠或乳化剂、防腐剂等。对于制备组合物,用于配制药物组合物的多种赋形剂和技术在本领域中是已知的(参见Remington:The Science and Practice of Pharmacy,第21版,A.R.Gennaro,Lippincott,Williams&Wilkins,Baltimore,MD,2006;以其全部内容作为参考并入本文)。在本发明公开的范围内可以考虑常规赋形剂媒介物的使用,除了如通过产生任何不希望的生物作用或另外以有害方式与所述药物组合物的任何其它组分相互作用,可能与物质或其衍生物不相容的任何常规赋形剂媒介物外。
示例性的稀释剂包括本领域中已知和使用的那些(参见Remington:The Scienceand Practice of Pharmacy,第21版,A.R.Gennaro,Lippincott,Williams&Wilkins,Baltimore,MD,2006)。
在一些实施方案中,用于本文所提供的DNA分子的药物组合物可以包含至少一种非活性成分。如本文所使用的,术语“非活性成分”是指对包括在制剂中的药物组合物的活性成分的活性没有促进作用的一种或多种试剂。在一些实施方案中,在本发明公开的制剂中使用的所有、无或一些非活性成分可以是美国食品和药物管理局(FDA)批准的并且在本领域中使用的任一种。
5.7使用方法
本发明公开提供本文所提供的DNA分子可以用于将表达盒中的ORF或转基因递送至细胞用于表达。可以有效递送5.3.3节中所述的ORF或转基因。本发明公开提供本文所提供的DNA分子可以用于将表达盒中的ORF或转基因递送至人受试者。可以有效递送5.3.3节中所述的任何ORF或转基因。
在一个具体实施方案中,将感兴趣的基因递送至用于表达的细胞的方法包括:将本文所提供的DNA分子转染至细胞。在某些实施方案中,所述细胞是人细胞。在另一个实施方案中,所述细胞是人原代细胞。在另一个实施方案中,所述细胞是原代人血细胞。在一个实施方案中,可以经由5.6节中所述的任何递送媒介物将DNA分子转染至细胞。
在另一个具体的实施方案中,将感兴趣的基因递送至用于表达的人受试者的方法包括:将本文所提供的DNA分子转染至细胞并将所述细胞施用于人受试者。在某些实施方案中,所述细胞是人细胞。在另一个实施方式中,所述细胞是人原代细胞。在另一个实施方案中,所述细胞是原代人血细胞。在一个实施方案中,可以经由5.6节中所述的任何递送媒介物将DNA分子转染至细胞。
在一些实施方案中,本文所提供的DNA分子可以通过如前3段所述将表达盒中的疾病修正基因递送至细胞或人受试者用于基因疗法。
在某些实施方案中,如本领域中已知的,本文所提供的DNA分子可以用于转染难以转染的细胞。已知难以转染的这些细胞包括不主动分裂的细胞。在一些实施方案中,这些细胞可以是人原代细胞,包括(例如)人原代血细胞、人原代肝细胞、人原代神经元、人原代肌细胞、人原代心肌细胞。
5.7.1宿主细胞
如本文所使用的,术语“宿主细胞”包括对用本发明公开所述的核酸构建体或具有发夹结构末端的表达载体的转化、转染、转导等敏感的任何细胞类型。
在一些实施方案中,如本文所公开的具有发夹结构末端的载体将表达盒递送至受试者宿主细胞。在一些实施方案中,受试者宿主细胞是人宿主细胞,包括(例如)血细胞、干细胞、造血细胞、CD34+细胞、肝细胞、癌细胞、血管细胞、肌细胞、胰腺细胞、神经细胞、眼或视网膜细胞、上皮细胞或内皮细胞、树突状细胞、成纤维细胞或者哺乳动物来源的任何其它细胞,其无限制地包括肝脏(即肝)细胞、肺细胞、心肌细胞、胰腺细胞、肠细胞、隔膜细胞、肾脏(即肾)细胞、神经细胞、血细胞、骨髓细胞或者对其考虑基因疗法的受试者的任何一种或多种所选的组织。在一个方面,受试者宿主细胞是人宿主细胞。
本发明公开还涉及如以上所提及的宿主细胞,包括如本文所公开的具有发夹结构末端的载体。因此,基于对技术人员而言显而易见的目的,可以使用多种宿主细胞。可以将如本文所公开的包含表达盒的用于表达的具有发夹结构末端的载体引入宿主细胞,从而作为染色体整合体维持供体序列。术语宿主细胞涵盖了由于复制期间发生的突变而不同于亲代细胞的亲代细胞的任何子代。宿主细胞的选择在很大程度上可以取决于供体序列及其来源。
宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。在一个实施方案中,宿主细胞是人细胞(例如,原代细胞、干细胞或者无限增殖化细胞系)。在一些实施方案中,可以向宿主细胞施用具有发夹结构末端的载体用于如本文所公开的表达盒的离体表达,然后在基因疗法事件之后将所述宿主细胞递送至受试者。宿主细胞可以是任何细胞类型,例如,体细胞或干细胞、诱导的多潜能干细胞或者血细胞,例如,T细胞或B细胞或者骨髓细胞。在某些实施方案中,所述宿主细胞是同种异体细胞。在一些实施方案中,可以将基因修饰的宿主细胞,例如,骨髓干细胞,例如,CD34+细胞,或者诱导的多潜能干细胞移植回患者用于治疗性蛋白的表达。
5.7.2使用具有发夹结构末端的DNA分子对成功基因表达的测试
在本领域中熟知的测定可以在体外和体内模型两者中通过具有发夹结构末端的DNA分子用于测试表达盒的基因递送效率。在一些实施方案中,本领域技术人员可以通过测量蛋白的mRNA和蛋白水平(例如,反转录PCR、免疫印迹分析和酶联免疫吸附测定(ELISA))评价具有发夹结构末端的DNA所编码的蛋白的表达水平。在一个实施方案中,所述DNA包含可以用于评价表达盒表达的报告蛋白,例如,通过使用荧光显微术或发光酶标仪检验报告蛋白表达。对于体内应用,蛋白功能测定可以用于测试给定转录本的功能性以确定基因表达是否成功发生。本领域技术人员将能够通过具有发夹结构末端的DNA分子体外或体内确定用于测量转录本功能性的最佳测试。
本文中考虑来自细胞或受试者中具有发夹结构末端的DNA的基因表达的影响可以持续至少0.5个月、至少1个月、至少2个月、至少3个月、至少4个月、至少5个月、至少6个月、至少10个月、至少12个月、至少18个月、至少2年、至少5年、至少10年、至少20年,或者可以是永久的。
在一些实施方案中,本文所描述的具有发夹结构末端的DNA分子可以对宿主细胞密码子优化。如本文所使用的,术语“密码子优化的”或“密码子优化”表示通过用脊椎动物基因中更频繁或更频繁使用的密码子替换至少一个、不止一个或者很多个天然序列(例如,原核序列)的密码子修饰核酸序列用于增强感兴趣的脊椎动物,例如,小鼠或人(例如,人源化)的细胞中的表达的方法。多种物种显示出对特定氨基酸的特定密码子的特定偏向。通常,密码子优化不改变原始翻译蛋白的氨基酸序列。可以使用(例如)Aptagen's Gene密码子优化和常规基因合成平台(Aptagen,Inc.)或者其它公开可获得的数据库确定优化的密码子。
所有专利申请、出版物(专利和专利申请、科学文献或任何其它出版物)、专利、GenBank引用及其它数据库引用、网页公开内容、商品化产品目录和本文引用的其它参考文献以其全部内容作为参考并入本文。
6.实施例
本文已描述了一些实施方案。尽管如此,将理解本节(即第6节)中的多种实施例仅出于说明的目的在本文中描述了具体实施方案而不限制如权利要求或本发明公开所述的范围。可以在不背离本文所提供的精神和范围的情况下做出多种改变。
6.1实施例1—编码载体的质粒的生产
计算机设计编码载体的核酸序列。构建体1编码左侧反向重复序列、微型人PGK启动子、turboluc ORF、SV40聚(a)和右侧反向重复序列(TGCGCGACTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCC GGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGTCGCGCAGAGAGGTTAAAACCAACTAGACAACTTTGTATATCTAGAGTTGGGGTTGCGCCTTTTCCAAGGCAGCCCTGGGTTTGCGCAGGGACGCGGCTGCTCTGGGCGTGGTTCCGGGAAACGCAGCGGCGCCGACCCTGGGTCTCGCACATTCTTCACGTCCGTTCGCAGCGTCACCCGGATCTTCGCCGCTACCCTTGTGGGCCCCCCGGCGACGCTTCCTGCTCCGCCCCTAAGTCGGGAAGGTTCCTTGCGGTTCGCGGCGTGCCGGACGTGACAAACGGAAGCCGCACGTCTCACTAGTACCCTCGCAGACGGACAGCGCCAGGGAGCAATGGCAGCGCGCCGACCGCGATGGGCTGTGGCCAATAGCGGCTGCTCAGCAGGGCGCGCCGAGAGCAGCGGCCGGGAAGGGGCGGTGCGGGAGGCGGGGTGTGGGGCGGTAGTGTGGGCCCTGTTCCTGCCCGCGCGGTGTTCCGCATTCTGCAAGCCTCCGGAGCGCACGTCGGCAGTCGGCTCCCTCGTTGACCGAATCACCGACCTCTCTCCCCAGGCAAGTTTGTACAAAAAAGCGCGGCCGCGGCAGGCTGCCACCATGGAAACCGATACACTGCTGCTTTGGGTACTTTTGCTGTGGGTGCCCGGCAGTACGGGCGACGCCGCACAACCAGCTAGGAGAGCAGTCCGGAGCCTGGTCCCCTCTTCCgAGGCCGAGGCTGAACGGGGAAAGCTGCCAGGCAAGAAACTCCCCTTAGAGGTTCTCATCGAGCTGGAAGCAAACGCACGCAAGGCCGGTTGCACTAGGGGCTGCCTCATCTGCCTCAGCAAGATCAAATGTACAGCAAAGATGAAGAAGTATATTCCTGGCCGCTGTGCAGACTACGGAGGCGACAAAAAAACAGGACAAGCTGGTATAGTTGGCGCCATCGTAGATATCCCCGAGATTAGTGGGTTCAAGGAAATGGAGCCAATGGAGCAATTCATTGCACAGGTTGATAGATGTGCGGATTGCACTACTGGTTGCCTTAAGGGCTTGGCGAATGTCAAGTGTAGTGATCTTCTGAAAAAGTGGCTACCCGGCCGGTGTGCCACCTTCGCTGACAAAATACAGAGCGAAGTCGACAATATTAAAGGACTTGCCGGGGACTAATGATAGTGACACAAAGTGACGCGTCCTAGAGCTCGCACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGAGAATAGCAGGCATGCTGGGGAGGGCGCTAGCGCAGGAACCCCTTTTAATGGAGTTGGCGAGTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGATCGACTCSEQ ID NO:174)其中布置切口核酸内切酶的4个限制性位点以在5'顶部链和3'底部链上造成ITR悬突。构建体2编码修饰的左侧ITR、人PGK启动子、分泌的turbolucORF、SV40聚(a)、右侧ITR和右侧ITR下游115个碱基对处的切口核酸内切酶的双限制性位点(TGCGCGACTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCC GGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGTCGCGCAGAGAGGTTAAAACCAACTAGACAACTTTGTATATCTAGAGTTGGGGTTGCGCCTTTTCCAAGGCAGCCCTGGGTTTGCGCAGGGACGCGGCTGCTCTGGGCGTGGTTCCGGGAAACGCAGCGGCGCCGACCCTGGGTCTCGCACATTCTTCACGTCCGTTCGCAGCGTCACCCGGATCTTCGCCGCTACCCTTGTGGGCCCCCCGGCGACGCTTCCTGCTCCGCCCCTAAGTCGGGAAGGTTCCTTGCGGTTCGCGGCGTGCCGGACGTGACAAACGGAAGCCGCACGTCTCACTAGTACCCTCGCAGACGGACAGCGCCAGGGAGCAATGGCAGCGCGCCGACCGCGATGGGCTGTGGCCAATAGCGGCTGCTCAGCAGGGCGCGCCGAGAGCAGCGGCCGGGAAGGGGCGGTGCGGGAGGCGGGGTGTGGGGCGGTAGTGTGGGCCCTGTTCCTGCCCGCGCGGTGTTCCGCATTCTGCAAGCCTCCGGAGCGCACGTCGGCAGTCGGCTCCCTCGTTGACCGAATCACCGACCTCTCTCCCCAGGCAAGTTTGTACAAAAAAGCGCGGCCGCGGCAGGCTGCCACCATGGAAACCGATACACTGCTGCTTTGGGTACTTTTGCTGTGGGTGCCCGGCAGTACGGGCGACGCCGCACAACCAGCTAGGAGAGCAGTCCGGAGCCTGGTCCCCTCTTCCgAGGCCGAGGCTGAACGGGGAAAGCTGCCAGGCAAGAAACTCCCCTTAGAGGTTCTCATCGAGCTGGAAGCAAACGCACGCAAGGCCGGTTGCACTAGGGGCTGCCTCATCTGCCTCAGCAAGATCAAATGTACAGCAAAGATGAAGAAGTATATTCCTGGCCGCTGTGCAGACTACGGAGGCGACAAAAAAACAGGACAAGCTGGTATAGTTGGCGCCATCGTAGATATCCCCGAGATTAGTGGGTTCAAGGAAATGGAGCCAATGGAGCAATTCATTGCACAGGTTGATAGATGTGCGGATTGCACTACTGGTTGCCTTAAGGGCTTGGCGAATGTCAAGTGTAGTGATCTTCTGAAAAAGTGGCTACCCGGCCGGTGTGCCACCTTCGCTGACAAAATACAGAGCGAAGTCGACAATATTAAAGGACTTGCCGGGGACTAATGATAGTGACACAAAGTGACGCGTCCTAGAGCTCGCACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGAGAATAGCAGGCATGCTGGGGAGGGCGCTAGCGCAGGAACCCCTTTTAATGGAGTTGGCGAGTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGATCGACTCCTCGGCCACTTGGAGGGGCCGGGGGGACGACGCAATCTGGAGTGGAAAGAACCCCCGTCTATGCGGCTTAAAGCACGGCCAGGGAATAGTGGATCAAGTGTACTGACATGTGCCGGAGTCCCTCCATGCCCAGATCGACTCCCTCGAGATATATGGATCC SEQ ID NO:175)。通过商品化DNA合成厂商合成并将构建体1和2克隆至pUC57主链(分别为质粒1和质粒2)。
转化质粒1&2,然后在NEBstable或MDS-42株中扩增过夜,然后使用商品化质粒分离试剂盒(Nucleobond Xtra Maxi Plus EF(Macherey Nagel))质粒分离,并溶于无核酸酶的水中。
对于构建体1:为了在构建体1上引起切口,将切口核酸内切酶Nt.BstNBI(6.2U/μgDNA)加入至1×Neb3.1缓冲液中的分离的构建体1并在55℃培育1小时。然后,将含有切口的质粒的反应混合物在热振荡器上加热至90℃,10min,以使ITR侧接的转基因从质粒主链解离,然后使混合物冷却至室温30min,以使得在单链悬突末端ITR折叠。然后,向反应混合物补充限制性内切酶PvuII和RecBCD核酸外切酶V两者(分别为0.157U和0.625U每μg切口的质粒)以及三磷腺苷(最终浓度1mM)。然后,将反应混合物在37℃置于振荡器上120min,以使得所述限制性内切酶切割主链片段并且使核酸外切酶消化主链片段。核酸外切酶通常不消化受发夹结构末端保护的线性片段。最终,根据生产商的说明,使用Takara NucleoSpin凝胶和PCR纯化试剂盒纯化反应混合物,并且洗脱剩余的ITR侧接的载体。
对于构建体2:为了引起切口并使构建体2线性化,将切口核酸内切酶Nt.BstNBI(0.62U/μg DNA)加入至1×Neb3.1缓冲液中的分离的构建体2并在55℃培育120min。然后,将含有切口构建体2的反应混合物在热循环仪上加热至95℃,3min以使ITR侧接的转基因从质粒主链解离,并随后在热循环仪中以0.05℃/s的斜率冷却到40℃。然后,向反应混合物补充核酸外切酶V(2.5U/μg的DNA)以及三磷腺苷(最终浓度1mM)。然后,将反应混合物在37℃置于振荡器上120min,以使得所述限制性内切酶切割主链片段并且使核酸外切酶消化主链片段。核酸外切酶通常不消化受发夹结构末端保护的线性片段。最终,根据生产商的说明,使用Takara NucleoSpin凝胶和PCR纯化试剂盒纯化反应混合物,并且洗脱剩余的ITR侧接的载体。
通过天然琼脂糖凝胶电泳使切口、变性/复性和消化耐受的DNA产物显象。
对于构建体1,琼脂糖凝胶(图6)在泳道3中显示了切口质粒,在泳道4中显示了变性/复性的DNA产物并且在泳道8显示了消化耐受的载体的单一条带。为了进一步证实折叠ITR的形成,用限制性内切酶SpeI消化质粒以及变性/复性的DNA产物,其在载体的微型PGK启动子区中具有单一切割位点。如图6所示,SpeI消化切割载体,从而导致泳道5中较小条带的迁移,并且一旦用核酸外切酶V处理,则消化载体片段,同时通过折叠的反义ITR保护不被消化的主链仍保留。当用限制性内切酶PvuII消化变性/复性的DNA时相反情况是正确的,其在主链具有2个切割位点,并且在核酸外切酶V处理后,仅保留所期望的产物(泳道8)。另外,用SpeI或PvuII使构建体1起始材料线性化,从而就SpeI来说释放线性DNA链,并且通过PvuII释放2个片段。整体上,这证实通过切口以及随后的DNA的变性/复性,形成了包含侧接2个反向重复序列(其进一步分别包含布置在相对链上的切口核酸内切酶的第一和第二限制性位点)的表达盒的双链DNA分子。这种发夹结构末端DNA分子的形成进一步表明对核酸外切酶V消化的耐受。
对于构建体2,其含有位于3'ITR下游的切口核酸内切酶的紧邻的双限制性位点,用切口核酸内切酶BstNBI处理导致环形质粒的线性化。如图7所示,琼脂糖凝胶在泳道2中显示了线性化DNA。在变性/复性后,DNA产物在泳道3可见,并且在用RecBCD核酸外切酶V消化后,消化耐受的载体的单一条带在泳道5可见。为了进一步证实折叠ITR的形成和质粒的线性化,用在主链具有2个切割位点的PvuII消化复性/变性的DNA产物。在核酸外切酶V消化后,未检测到其它条带。这表明通过在5'ITR的上游或者3'ITR的下游掺入切口核酸内切酶的紧邻的双限制性位点,可以通过使主链同时碎片化,同时对反向重复序列部分切口,从而使得通过限制性位点的主链的进一步消化被废弃。
6.2实施例2DNA构建体的反复变性/复性
为了评价DNA构建体折叠的稳定性,使切口的构建体1和相应具有发夹结构的载体经受多个变性和退火循环。在第一步,将100ng总DNA在NEB缓冲液3.1中与1μM Sybr GreenI染料培育并转移至384孔PCR板。密封板并在Quantstudio 5实时PCR仪上实施的一些70-98℃加热循环内连续监测Sybr Green荧光。在对载体进行3个加热循环(除生产期间的加热循环外)并对切口构建体进行4个循环后,通过天然琼脂糖凝胶电泳对样品显象。如图8A所示,在泳道2对载体存在一个条带,并且对应于载体和主链的条带在泳道3可见。另外,图8B和图8C中的解链曲线显示出不同的解链指纹,其在每个循环中仍非常相似。
6.3实施例3载体的等温形成
除了通过热能使载体从切口质粒解离外,测试了使用化学变性剂的等温变性的可能性。具体地,测试了NaOH起到变性剂以解离实施例1的切口构建体的能力。首先,将切口构建体(100ng总DNA)与0.2μM SYBR green I染料在先前用1M NaOH对相应pH值调整的NEB缓冲液3.1中混合。使用酶标仪,在相应pH值检测荧光信号。如图9B所示,随着pH提高,背景调整的荧光降低,表明变性DNA部分增加。然后,用HCl将变性DNA的pH恢复至pH 7.9,并将样品加载至琼脂糖电泳凝胶。如图9A所示,在大于10.3的pH值下,DNA构建体解离并形成包括相应载体的条带的预期条带。在使用热能复性/变性之后,相同条带可见。
6.4实施例4LNP和杂交体的转染
根据生产商的说明书,在NanoassemblrTM微流体系统(Precision NanoSystems)上制备脂质纳米颗粒。基于所期望的制剂,以10mM总脂质浓度制备类似于预制囊泡方法的乙醇溶液,其以适当摩尔比(例如,40:40:18:2)由可电离脂质(例如,MC3)、两性离子脂质(例如,二硬脂酰磷脂酰胆喊(DSPC)、二油酰基甘油磷酸胆碱(DOPC),提供膜完整性的组分(如甾醇,例如,胆固醇)和缀合的脂质分子(如PEG-脂质,例如,1-(单甲氧基-聚乙二醇)-2,3-二肉豆蔻酰甘油,其平均值PEG分子量为2000(“PEG-DMG”))组成。此外,在25mM乙酸盐缓冲液(pH 4.0)中制备了DNA与脂质之比(wt/wt)为约14的DNA水溶液。基于生产总体积,使用1和3ml注射器产生了总流速为12ml/min的入口流。对于每种制剂,在室温下,以3:1的流速比(Aq:Et)将DNA水溶液与乙醇-脂质溶液混合。然后,将产物对PBS透析以除去残余乙醇并将pH升高至7.4。
对于外来体生产,将细胞在搅拌生物反应器中以灌注模式生长,并且通过切向流过滤,然后通过Captocore 700液相色谱进行外来体分离,如Nordin等人,Methods inMolecular Biology,1953卷.Humana Press,New York,NY(2019)中所述,该文献以其全部内容作为参考并入本文。
将人胚肾细胞(HEK-293T)在补充有10% FCS的DMEM中培养。使细胞在37℃,5%CO2-润湿的培育箱中生长。为了测试荧光素酶表达,将细胞(2×104个/孔)接种至96-孔板并用100ng、10ng和1ng(0.37pmol、0.031pmol、0.001pmol和0.001pmol)编码Turboluc的DNA载体转染48h。如US15/112,180所列,使用通过将外来体与脂质纳米颗粒融合产生的杂交体介导转染。作为比较,用脂质纳米颗粒另外转染细胞。
在使用来自NanoLight Technology的Gluc Glow测定试剂盒转染后48h确定荧光素酶表达水平。除去含有转染细胞的孔中的150μl培养基(孔中保留50μl培养基)并以50μM腔肠素(Coelenterazine)的最终浓度添加50μl在细胞胞溶缓冲液(NanoLightTechnology)中的腔肠素(Coelenterazine)。然后,将细胞在室温下培育5min,同时避光振荡。将含有荧光素酶底物的细胞胞溶液转移至白色96-孔板(BRAND)。使用SynergyMX酶标仪(BioTek)通过测量发光确定荧光素酶活性,并且荧光素酶活性如图10所示。
6.5实施例5分裂和未分裂细胞中的表达
产生构建体以包括将Turboluc报告基因编码至侧接2个ITR的表达盒中的开放阅读框。基于每个细胞培养物中的荧光素酶活性确定Turboluc随时间从载体的表达,从而确认从来自载体的基因表达所产生的荧光素酶活性。
详细地,将人胚肾细胞(HEK-293T)在DMEM(10% FCS、1%pen/strep)和2mM稳定的谷氨酰胺中培养。将辐照的小鼠胚胎成纤维细胞(C57BL/6,Thermo Fisher)在DMEM(10%FCS,1%pen/strep)、2mM稳定谷氨酰胺和1mM丙酮酸钠中培养。使细胞在37℃、5% CO2-润湿的培育箱中生长。将细胞(6×104个/孔)接种到涂覆有0.1%明胶溶液的96-孔板中并用100ng(0.13pmol)实施例1所述的折叠的ITR DNA载体1转染。根据生产商的说明书,使用JetPrime(PolyPlus)转染试剂进行转染。转染后3天更换培养基。从转染后第1天开始,在转染后不同天数,使用Gluc Glow测定试剂盒(NanoLight Technology)确定荧光素酶表达水平。用磷酸盐缓冲盐水(50μl)替换含有转染细胞的孔中的培养基并以50μM腔肠素(Coelenterazine)的最终浓度添加50μl在细胞胞溶缓冲液(NanoLight Technology)中的腔肠素(Coelenterazine)。然后,将细胞在室温下培育5分钟,同时避光振荡。将含有荧光素酶底物的细胞胞溶液转移至白色96-孔板。对于构建体2,其编码分泌的Turboluc,在不同天数除去50ul样品上清液并更换为完全培养基。将上清液样品与最终浓度50μM的腔肠素(Coelenterazine)培育2分钟。使用SynergyMX酶标仪(BioTek)通过测量发光确定荧光素酶活性。对于背景分析,按照上述规程测量未处理细胞的生物发光。如图11A和图11B所示,对于表达非分泌的Turboluc的构建体1,荧光素酶活性在分裂细胞中在第2天达到峰值,而在未分裂细胞中表达继续升高。如图11C和图11D所示,对于表达分泌的Turboluc的构建体2,荧光素酶活性在分裂细胞中在第2天达到峰值,而在未分裂细胞中表达升高,然后保持稳定9天。作为直接比较,还转染了等摩尔量的编码构建体2的完整环形质粒,并且如图11C和图11D所示,通常记录了较低的荧光素酶活性,从而表明了具有折叠的ITR的纯化的构建体2的改善的核递送。
6.6实施例6含有ITR的DNA质粒的构建
如通常通过商品化DNA合成厂家所提供的寡核苷酸的从头无细胞合成使得能够快速且经济地生产定制载体和载体文库,然而含有长反向重复序列的序列的从头合成有一定难度,特别是如果存在类似的反向重复序列的多个部分(如在侧接表达盒的左侧ITR和右侧ITR中)。因此,设计了允许组装含ITR质粒的策略。多种病毒ITR含有大致处于它们各自ITR中间的限制性内切酶位点(即B19V ITR中的BssHII或AAV2ITR中的BsaHI)并且可以设计人工ITR以导致中央限制性位点。为了提高构建体的可生产性,将ITR序列在接近于ITR特异性限制性内切酶位点处分开(即左侧ITR为分开1和分开2,并且将右侧ITR分成R1和R2)并单独生产。如图12所示,通过产生2个第一基因片段,一个编码分开ITR R2并且另一个编码分开ITR L2,同时具有多克隆位点和抗生素抗性盒或者复制起点中的任一个,组装并连接从头基因片段以制备转化用于扩增的环形质粒。合成含有分开ITR的剩余一半(分别为R1和L1)以及抗生素抗性盒和复制起点的第三基因片段。由步骤1所产生的两种质粒编码分开ITRR2和L2以及连接的多克隆位点和第三片段,其然后可以被ITR特异性限制性内切酶(即HBoVITR中的BssHII或者AAV2 ITR中的BsaHI)消化,然后无疤环化以形成含有ITR以及多克隆位点两者的质粒。然后,可以将定制表达盒在多克隆位点克隆至载体。
6.7实施例7连接和未连接的构建体的长期表达
构建体3是具有其布置导致在5'顶部链和3'底部链上产生ITR悬突的切口核酸内切酶的4个限制性位点的构建体。构建体3编码修饰的左侧ITR、截短的SFFV启动子、小鼠κIgG前导序列、turboluc ORF、bGH聚(a)信号(a)、右侧ITR和右侧ITR下游115个碱基对处的切口核酸内切酶的双限制性位点(TGCGCGACTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCC GGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGTCGCGCAGAGAGGTTAAAACCAACTAGACAACTTTGTATATCTAGAGTAACGCCATTTTGCAAGGCATGGAAAAATACCAAACCAAGAATAGAGAAGTTCAGATCAAGGGCGGGTACATGAAAATAGCTAACGTTGGGCCAAACAGGATATCTGCGGTGAGCAGTTTCGGCCCCGGCCCGGGGCCAAGAACAGATGGTCACCGCAGTTTCGGCCCCGGCCCGAGGCCAAGAACAGATGGTCCCCAGATATGGCCCAACCCTCAGCAGTTTCTTAAGACCCATCAGATGTTTCCAGGCTCCCCCAAGGACCTGAAATGACCCTGCGCCTTATTTGAATTAACCAATCAGCCTGCTTCTCGCTTCTGTTCGCGCGCTTCTGCTTCCCGAGCTCTATAAAAGAGCTCACAACCCCTCACTCGGCGCGCCAGTCCTCCGATTGACTGAGTGCGGCCGCGGCAGGCTGCCACCATGGAAACCGATACACTGCTGCTTTGGGTACTTTTGCTGTGGGTGCCCGGCAGTACGGGCGACGCCGCACAACCAGCTAGGAGAGCAGTCCGGAGCCTGGTCCCCTCTTCCGAGGCCGAGGCTGAACGGGGAAAGCTGCCAGGCAAGAAACTCCCCTTAGAGGTTCTCATCGAGCTGGAAGCAAACGCACGCAAGGCCGGTTGCACTAGGGGCTGCCTCATCTGCCTCAGCAAGATCAAATGTACAGCAAAGATGAAGAAGTATATTCCTGGCCGCTGTGCAGACTACGGAGGCGACAAAAAAACAGGACAAGCTGGTATAGTTGGCGCCATCGTAGATATCCCCGAGATTAGTGGGTTCAAGGAAATGGAGCCAATGGAGCAATTCATTGCACAGGTTGATAGATGTGCGGATTGCACTACTGGTTGCCTTAAGGGCTTGGCGAATGTCAAGTGTAGTGATCTTCTGAAAAAGTGGCTACCCGGCCGGTGTGCCACCTTCGCTGACAAAATACAGAGCGAAGTCGACAATATTAAAGGACTTGCCGGGGACTAATGATAGTGACACAAAGTGACGCGTCCTAGAGCTCGCACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGAGAATAGCAGGCATGCTGGGGAGGGCGCTAGCGCAGGAACCCCTTTTAATGGAGTTGGCGAGTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGATCGACTCCTCGGCCACTTGGAGGGGCCGGGGGGACGACGCAATCTGGAGTGGAAAGAACCCCCGTCTATGCGGCTTAAAGCACGGCCAGGGAATAGTGGATCAAGTGTACTGACATGTGCCGGAGTCCCTCCATGCCCAGATCGACTCCCTCGAG SEQ ID NO:334)。通过与实施例1中用于构建体2的相同方法产生构建体3。在通过凝胶和PCR纯化试剂盒纯化后,根据生产商的说明将纯化载体与T4连接酶和T4连接缓冲液混合,并在25℃培育2h。为了确认完全连接,用100mM Tris-HCl(pH 8.8)调整连接的构建体的样品的pH,将T5核酸外切酶加入至混合物,然后在37℃培育1h。还通过连接的构建体样品在水中的稀释,以及随后甲酰胺和加载染料的添加进一步确认了连接。将该混合物在65℃培育5min,然后保持在冰上直至加载至琼脂糖凝胶。在连接步骤后,使用凝胶和PCR纯化试剂盒再次纯化连接的构建体。
为了确认连接,使用琼脂糖凝胶分析结果。琼脂糖凝胶(图20A)在泳道2显示了纯化的构建体,在泳道3显示了连接后的连接酶&构建体混合物,在泳道4显示了T5核酸外切酶处理的,先前连接的构建体,在泳道5显示了甲酰胺变性的,先前连接的构建体并且在泳道6显示了所产生的再次纯化的连接的构建体。琼脂糖凝胶的另一半显示了在连接缓冲液中未连接的构建体(泳道7)、T5核酸外切酶处理(泳道8)、甲酰胺变性(泳道9)和再次纯化(泳道10)。
随后,将纯化的连接的构建体、未连接的构建体和环形亲代质粒加载至LNP,以及如实施例4所列的杂交体。在用包封连接的构建体、未连接的构建体或亲代环形质粒的杂交体转染未分裂的HepRG细胞后,随时间监测分泌的turboluc的表达(图20B)。尽管来自环形质粒转染的表达快速减少,但是连接的构建体和未连接的构建体随时间保持稳定。意外地,观察到来自未连接的构建体的表达水平高于在连接构建体转染中所观察到的水平。
6.8实施例8用LNP和杂交体转染后的长期表达
产生构建体以包括将Turboluc报告基因编码至侧接2个ITR的表达盒中的开放阅读框。基于荧光素酶活性确定来自载体的随时间的分泌的Turboluc的表达。
详细地,将分化的未分裂HepRG细胞维持在HepaRGTM维持/代谢培养基中并用先前如实施例7所列制备的LNP和杂交体转染。为了分析表达持续时间,如实施例7所述,在不同时间点确定未分裂细胞的荧光素酶表达水平(图21A)。使用SynergyMX酶标仪(BioTek),通过测量发光确定荧光素酶活性。对于背景分析,按照以上实施例1中所描述的规程测量未处理细胞的生物发光。如图21A所示,对于用编码分泌的Turboluc的构建体转染的未分裂细胞,荧光素酶活性保持稳定超过2个月。
6.9实施例9用编码Cre的具有发夹末端的DNA转染
计算机设计构建体,其编码左侧ITR、修饰以除去切口位点的EF1a启动子、Cre-重组酶ORF、bGH聚(a)信号(a)、右侧ITR和右侧ITR下游115个碱基对处的切口核酸内切酶的双限制性位点。订购合成并克隆至pUC微主链中的构建体。如实施例1,从环形质粒产生具有发夹结构末端的DNA,并随后将纯化的DNA分子加载至LNP,以及如实施例4所列的杂交体。使用单克隆扩增的HEK293-loxP-GFP-RFP(GenTarget)稳定细胞系监测转染细胞百分比。一旦成功转染,在细胞中表达Cre重组酶蛋白,其进入核酸酶并切除floxed GFP-stop,从而将细胞从GFP阳性切换至RFP阳性。用起到阳性对照作用的JetPrime转染载体。将HEK293-loxP-GFP-RFP细胞在96孔板中铺板并用4种不同剂量的DNA转染。72h后,将细胞用胰蛋白酶解并通过流式细胞术分析RFP表达。如图22所示,在最高剂量,杂交体成功转染>85%的细胞,而LNP和阳性对照JetPrime显示有限的细胞群体转染效率。
6.10实施例10RABS替换
为了研究AAV RBE对所述方法和转染效率的影响,设计了编码右侧ITR、pUC ori、Ampicilin抗性和左侧ITR的从头DNA主链,并通过商品化厂家将其合成并克隆至卡那霉素抗性载体。消化载体,并从卡那霉素主链切下合成片段并通过凝胶提取分离。然后,纯化合成主链片段,并将编码分泌的turboluc的实施例7的表达盒与合成主链连接以环化质粒。在Stabl3细菌中产生并扩增了在表达盒之间编码如下所示的左ITR和右ITR的5条主链。然后,用Nt.BstNBI对质粒切口,并如实施例1所述产生具有发夹结构末端的DNA。通过运行如图23所示的琼脂糖凝胶确认具有发夹结构末端的DNA的产生。所述凝胶显示产物和得率均无显著差异。然后,根据生产商的说明,使用JetPrime用50ng纯化的具有发夹结构末端的DNA转染HepRG细胞,并如实施例7所述,在几天内持续监测分泌的turboluc的水平。
6.11实施例11具有双切口位点的具有发夹结构末端的DNA的产生
从头设计DNA片段以包含位于(i)右侧ITR和pUC ori之间、(ii)pUC ori和氨苄西林抗性之间以及(iii)氨苄西林抗性和左侧ITR之间的双切口位点,并通过商品化厂家将其合成并克隆至卡那霉素抗性载体。与实施例10类似,然后切下ITR和主链片段,并凝胶纯化以与荧火虫荧光素酶表达盒连接,如图24B所示(相应序列如下)。扩增质粒,用在切口缓冲液中的500ng/ul的Nt.BspQI酶NEB(40ul)对0.5mg质粒切口并在37℃培育1h。然后,通过添加33mM NaOH使切口质粒变性,随后用41.6mM Tris pH 7.2退火。然后,用核酸外切酶V消化退火的DNA片段。将每个步骤的样品加载至琼脂糖凝胶并如图25A所示,在切口后,将质粒分成3条预期片段(A、B和C),它们全部具有双链末端。通过变性和退火,A条带进一步断裂成稍低的A1条带以及标记为A2/A3的新的微弱条带。这对应于悬突从产物的释放,如图25A所示。消化后,仅A1条带耐受消化。然后,如实施例1所述纯化耐受消化的具有发夹结构末端的DNA,并根据生产商的说明使用JetPrime转染HEK293T细胞。48小时后,使用Steady-Glo发光测定在SynergyMX酶标仪(BioTek)上记录荧光素酶表达并且如图25B所示。
(GTTCGAGATCGCTCTTCAGAAGAGCGCGGAGTCACATTCGCGACTCGCAATGC ATTGCAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCCACAACACCGTGAAGCTGAAGGTGACCAAGGGCGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCCCAGTTCCAGTACGGCTCCAAGGTGTACGTGAAGCACCCCGCCGACATCCCAGCTCGGTAGCCACCTGACGTCGCTCTTCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGAAGAGCGGGAGTGAGTGGCCAAAAAGTACCCGGCCAGAAAGGAACCGTAAAACCAACTAGACAGCCGGTGACTTTGTTCCCCAGCTCGGTTCATTCTCAAGCCTCAGACAGGAGAACCGGGACTAGTATATGAGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACGCCCCTGGCTGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAAGTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCAAGATCGATCTGCACACTGGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCGGCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTGCCTGGCCTCGCGCCGCCGTGTATCGCCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCGGAAAGATGGCCGCTTCCCGGCCCTGCTGCAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGTGAGACACCCACACAAAGGAAAAGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACACCACGGAGTACCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGATCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGAATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTGTCGTGAGCGGCCGCGGCAGGCTGCCACCATGGAGGATGCCAAGAATATTAAGAAAGGCCCTGCCCCATTCTACCCTCTGGAAGATGGCACTGCTGGTGAGCAACTGCACAAGGCCATGAAGAGGTATGCCCTGGTCCCTGGCACAATTGCCTTCACTGATGCTCACATTGAGGTGGACATCACCTATGCTGAATACTTTGAGATGTCTGTGAGGCTGGCAGAAGCCATGAAAAGATATGGACTGAACACCAACCACAGGATTGTGGTGTGCTCTGAGAACTCTCTCCAGTTCTTCATGCCTGTGTTGGGAGCCCTGTTCATTGGAGTGGCTGTGGCCCCTGCCAATGACATCTACAATGAGAGAGAGCTCCTGAACAGCATGGGCATCAGCCAGCCAACTGTGGTCTTTGTGAGCAAGAAGGGCCTGCAAAAGATCCTGAATGTGCAGAAGAAGCTGCCCATCATCCAGAAGATCATCATCATGGACAGCAAGACTGACTACCAGGGCTTCCAGAGCATGTATACCTTTGTGACCAGCCACCTCCCCCCTGGCTTCAATGAGTATGACTTTGTGCCTGAGAGCTTTGACAGGGACAAGACAATTGCTCTGATTATGAACAGCTCTGGCTCCACTGGACTGCCCAAAGGTGTGGCTCTGCCCCACAGAACTGCTTGTGTGAGATTCAGCCATGCCAGAGACCCCATCTTTGGCAACCAGATCATCCCTGACACTGCCATCCTGTCTGTGGTTCCATTCCATCATGGCTTTGGCATGTTCACAACACTGGGGTACCTGATCTGTGGCTTCAGAGTGGTGCTGATGTATAGGTTTGAGGAGGAGCTGTTTCTGAGGAGCTTGCAAGACTACAAGATCCAGTCTGCCCTGCTGGTGCCCACTCTGTTCAGCTTCTTTGCCAAGAGCACCCTCATTGACAAGTATGACCTGAGCAACCTGCATGAGATTGCCTCTGGAGGAGCACCCCTGAGCAA
GGAGGTGGGTGAGGCTGTGGCAAAGAGGTTCCATCTCCCAGGAATCAGACAGGG
CTATGGCCTGACTGAGACCACCTCTGCCATCCTCATCACCCCTGAAGGAGATGAC
AAGCCTGGTGCTGTGGGCAAGGTGGTTCCCTTTTTTGAGGCCAAGGTGGTGGACC
TGGACACTGGCAAGACCCTGGGAGTGAACCAGAGGGGTGAGCTGTGTGTGAGGG
GTCCCATGATCATGTCTGGCTATGTGAACAACCCTGAGGCCACCAATGCCCTGAT
TGACAAGGATGGCTGGCTGCACTCTGGTGATATTGCCTACTGGGATGAGGATGAG
CACTTTTTCATTGTGGACAGGCTGAAGAGTCTCATCAAGTACAAAGGCTACCAAG
TGGCACCTGCTGAGCTTGAGAGCATCCTGCTCCAGCACCCCAACATCTTTGATGC
TGGTGTGGCTGGCCTGCCTGATGATGATGCTGGAGAGCTGCCTGCTGCTGTTGTG
GTTCTGGAGCATGGAAAGACCATGACTGAGAAGGAGATTGTGGACTATGTGGCC
AGTCAGGTGACCACTGCCAAGAAGCTGAGGGGAGGTGTGGTGTTTGTGGATGAG
GTGCCAAAGGGTCTGACTGGCAAGCTGGATGCCAGAAAGATCAGAGAGATCCTG
ATCAAGGCCAAGAAGGGAGGAAAGATTGCAGTTTAAGGATCCTGACACAAAGTG
ACGCGTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTA
ACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCAT
GCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTG
TCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTG
TGTTTGCTGACGCAACCCCCACTGGTTGGGGCTTTGCCACCACCTGTCAGCTCCTT
TCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTG
CCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTG
TTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGAT
TCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTC
CTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCT
CAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCACGCGTCCTAGAGCTCGC
ACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTG
ACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCAT
CGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAG
CAAGGGGGAGGATTGGGAAGAGAATAGCAGGCATGCTGGGGAGGGCGCTAGCG
CAGGGGGACCCCAAGTGACGATTGAACCCCGATTCAGGTACCCATTGGAAATTTT
AATGGAGTAACATAACTGCTGGAGTAGATGAAGAACCTCTTGGCCACTCCGCTCC
CGAAGAGCGCACTCGCTCGCTCGGTGGGGCCTGGCGACCAAAGGTCGCCAGACG
GACGTGCTTTGCACGTCCGGCCCCACCGAGCGAGCGAGTGCGCTCTTCGGGCCAC
TTGGAGGGGCCGGGGGGACGACGCAATCTGGAGTGGAAAGAACCCCCGTCTATG
CGGCTTAAAGCACGGCCAGGGAATAGTGGATCAAGTGTACTGACATGTGCCGGC
AATGCATTGCGTCCCGAGTCACATTCGCGACTCTCGACGCTCTTCAGAAGAGCAG
CTTAGCTTCAATAGCTCAATGATATCGGAAAGAACATGTGAGCAAAAGGCCAGC
AAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCG
CCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCC
GACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCT
CCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAG
CGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTC
GCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTT
ATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTG
GCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACA
GAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTA
TCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATC
CGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATT
ACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTG
ACGCTCAGTGGAACGAAAACTCACGTTAAGGGGCTCTTCAGAAGAGCGAGTCAC
ATTCGCGACTCTGCAATGCATTGCCATGAGATTATCAAAAAGGATCTTCACCTAG
ATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAA
CTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGT
CTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACG
GGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCA
CCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGA
AGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGC
TAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACA
GGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCA
ACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCC
TTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGT
TATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTG
TGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAG
TTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTA
AAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTAC
CGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGC
ATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCC
GCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTT
TTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTT
GAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTA)SEQ ID NO:335
6.12实施例12具有异型端粒HBOV来源的ITR的具有发夹结构的反向重复序列DNA
从头设计DNA片段以包含位于(i)右侧HBOV-来源的ITR和pUC ori之间、(ii)pUCori和氨苄西林抗性之间以及(iii)氨苄西林抗性和左侧HBOV-来源的ITR之间的双切口位点,并通过商品化厂家将其合成并克隆至卡那霉素抗性载体。与实施例10类似,然后切下ITR和主链片段,并凝胶纯化以与荧火虫荧光素酶表达盒片段连接并环化,如以上实施例所述。扩增质粒并用在切口缓冲液中的500ng/ul的Nt.BspQI酶NEB(40ul)对0.5mg质粒切口并在37℃培育1h。然后,通过添加33mM NaOH使切口质粒变性以释放悬突,随后用41.6mM TrispH 7.2使悬突退火。然后,用RecBDC消化退火的DNA片段。通过琼脂糖凝胶使每个步骤的样品显象以确认载体产生。
GTTCGAGATCGCTCTTCAGAAGAGCGCGGAGTCACATTCGCGACTCG CAATGCATTGCAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCCACAACACCGTGAAGCTGAAGGTGACCAAGGGCGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCCCAGTTCCAGTACGGCTCCAAGGTGTACGTGAAGCACCCCGCCGACATCCCAGCTCGGTAGCCACCTGACGTCGCTCTTCGGTGGTTGTACAGACGCCATCTTGGAATCCAATATGTCTGCCGGCTCAGTCATGCCTGCGCTGCGCGCAGCGCGCTGCGCGCGCGCATGATCTAATCGCCGGCAGACATATTGGATTCCAAGATGGCGTCTGTACAACCACCGAAGAGCGGAGTGGCCAAAAAGTACCCGGCCAGAAAGGAACCGTAAAACCAACTAGACAGCCGGTGACTTTGTTCCCCAGCTCGGTTCATTCTCAAGCCTCAGACAGGAGAACCGGGACTAGTATATGAGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACGCCCCTGGCTGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAAGTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCAAGATCGATCT
GCACACTGGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCC
CAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCGGCCACCGAGAATCGGA
CGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTGCCTGGCCTCGCGCCGCCGT
GTATCGCCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGC
GGAAAGATGGCCGCTTCCCGGCCCTGCTGCAGGGAGCTCAAAATGGAGGACGCG
GCGCTCGGGAGAGCGGGCGGGTGAGACACCCACACAAAGGAAAAGGGCCTTTCC
GTCCTCAGCCGTCGCTTCATGTGACACCACGGAGTACCGGGCGCCGTCCAGGCAC
CTCGATTAGTTCTCGATCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAG
GGGTTTTATGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGAAGTTAGGC
CAGCTTGGCACTTGATGTAATTCTCCTTGGAATTTGCCCTTTTTGAGTTTGGATCTT
GGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTG
TCGTGAGCGGCCGCGGCAGGCTGCCACCATGGAGGATGCCAAGAATATTAAGAA
AGGCCCTGCCCCATTCTACCCTCTGGAAGATGGCACTGCTGGTGAGCAACTGCAC
AAGGCCATGAAGAGGTATGCCCTGGTCCCTGGCACAATTGCCTTCACTGATGCTC
ACATTGAGGTGGACATCACCTATGCTGAATACTTTGAGATGTCTGTGAGGCTGGC
AGAAGCCATGAAAAGATATGGACTGAACACCAACCACAGGATTGTGGTGTGCTC
TGAGAACTCTCTCCAGTTCTTCATGCCTGTGTTGGGAGCCCTGTTCATTGGAGTGG
CTGTGGCCCCTGCCAATGACATCTACAATGAGAGAGAGCTCCTGAACAGCATGGG
CATCAGCCAGCCAACTGTGGTCTTTGTGAGCAAGAAGGGCCTGCAAAAGATCCTG
AATGTGCAGAAGAAGCTGCCCATCATCCAGAAGATCATCATCATGGACAGCAAG
ACTGACTACCAGGGCTTCCAGAGCATGTATACCTTTGTGACCAGCCACCTCCCCC
CTGGCTTCAATGAGTATGACTTTGTGCCTGAGAGCTTTGACAGGGACAAGACAAT
TGCTCTGATTATGAACAGCTCTGGCTCCACTGGACTGCCCAAAGGTGTGGCTCTG
CCCCACAGAACTGCTTGTGTGAGATTCAGCCATGCCAGAGACCCCATCTTTGGCA
ACCAGATCATCCCTGACACTGCCATCCTGTCTGTGGTTCCATTCCATCATGGCTTT
GGCATGTTCACAACACTGGGGTACCTGATCTGTGGCTTCAGAGTGGTGCTGATGT
ATAGGTTTGAGGAGGAGCTGTTTCTGAGGAGCTTGCAAGACTACAAGATCCAGTC
TGCCCTGCTGGTGCCCACTCTGTTCAGCTTCTTTGCCAAGAGCACCCTCATTGACA
AGTATGACCTGAGCAACCTGCATGAGATTGCCTCTGGAGGAGCACCCCTGAGCAA
GGAGGTGGGTGAGGCTGTGGCAAAGAGGTTCCATCTCCCAGGAATCAGACAGGG
CTATGGCCTGACTGAGACCACCTCTGCCATCCTCATCACCCCTGAAGGAGATGAC
AAGCCTGGTGCTGTGGGCAAGGTGGTTCCCTTTTTTGAGGCCAAGGTGGTGGACC
TGGACACTGGCAAGACCCTGGGAGTGAACCAGAGGGGTGAGCTGTGTGTGAGGG
GTCCCATGATCATGTCTGGCTATGTGAACAACCCTGAGGCCACCAATGCCCTGAT
TGACAAGGATGGCTGGCTGCACTCTGGTGATATTGCCTACTGGGATGAGGATGAG
CACTTTTTCATTGTGGACAGGCTGAAGAGTCTCATCAAGTACAAAGGCTACCAAG
TGGCACCTGCTGAGCTTGAGAGCATCCTGCTCCAGCACCCCAACATCTTTGATGC
TGGTGTGGCTGGCCTGCCTGATGATGATGCTGGAGAGCTGCCTGCTGCTGTTGTG
GTTCTGGAGCATGGAAAGACCATGACTGAGAAGGAGATTGTGGACTATGTGGCC
AGTCAGGTGACCACTGCCAAGAAGCTGAGGGGAGGTGTGGTGTTTGTGGATGAG
GTGCCAAAGGGTCTGACTGGCAAGCTGGATGCCAGAAAGATCAGAGAGATCCTG
ATCAAGGCCAAGAAGGGAGGAAAGATTGCAGTTTAAGGATCCTGACACAAAGTG
ACGCGTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTA
ACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCAT
GCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTG
TCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTG
TGTTTGCTGACGCAACCCCCACTGGTTGGGGCTTTGCCACCACCTGTCAGCTCCTT
TCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTG
CCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTG
TTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGAT
TCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTC
CTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCT
CAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCACGCGTCCTAGAGCTCGC
ACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTG
ACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCAT
CGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAG
CAAGGGGGAGGATTGGGAAGAGAATAGCAGGCATGCTGGGGAGGGCGCTAGCG
CAGGGGGACCCCAAGTGACGATTGAACCCCGATTCAGGTACCCATTGGAAATTTT
AATGGAGTAACATAACTGCTGGAGTAGATGAAGAACCTCTTGGCCACTCCGTTGC
TTATGCAATCGCGAAACTCTATATCTTGCTCTTCTTAATGTGTTGTTGTTGTACAT
GCGCCATCTTAGTTTTATATCAGCTGGCGCCTTAGTTATATAACATGCATGTTATA
TAACTAAGGCGCCAGCTGATATAAAACTAAGATGGCGCATGTACAACAACAACA
CATTAAGAAGAGCGCCGGGGGGACGACGCAATCTGGAGTGGAAAGAACCCCCGT
CTATGCGGCTTAAAGCACGGCCAGGGAATAGTGGATCAAGTGTACTGACATGTGC
CGGCAATGCATTGCGTCCCGAGTCACATTCGCGACTCTCGACGCTCTTCAGAAGA
GCAGCTTAGCTTCAATAGCTCAATGATATCGGAAAGAACATGTGAGCAAAAGGC
CAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGG
CTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGA
AACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGC
GCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCG
GGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGG
TCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTG
CGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCG
CCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGT
GCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTAT
TTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTC
TTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAG
CAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGG
GGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGGCTCTTCAGAAGAGCG
AGTCACATTCGCGACTCTGCAATGCATTGCCATGAGATTATCAAAAAGGATCTTC
ACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATG
AGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGC
GATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTA
CGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCC
ACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGA
GCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCC
GGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCAT
TGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCG
GTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGT
TAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCAC
TCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGC
TTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGC
GACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAG
AACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGG
ATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATC
TTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAA
AATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTC
TTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATA
CATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTA(SEQID NO 337)
6.13实施例13OriL-来源的ITR的产生和转染
设计了包含分别侧接Nt.BspQI切口位点的来源于人OriL序列的左侧和右侧反向重复序列的质粒(SEQ ID No 29和图4)。所述表达盒包含微型人PGK启动子、分泌的turboluc ORF、SV40聚(a)。转化质粒,然后在NEBstable株中扩增过夜,然后使用商品化质粒分离试剂盒(Nucleobond Xtra Maxi Plus EF(Macherey Nagel))质粒分离,并溶于无核酸酶的水中。
如实施例1所述,使用切口核酸内切酶Nt.BstNBI(6.2U/μg DNA)对质粒切口。然后,将含有切口的质粒的反应混合物在热振荡器上加热至92℃、3min,以使OriL-来源的ITR侧接的转基因从质粒主链解离,然后使混合物冷却至室温30min,以使得在单链悬突末端ITR折叠。然后,如实施例1所述,用限制性内切酶PvuII和RecBCD两者消化反应混合物。最终,根据生产商的说明书,使用Takara NucleoSpin凝胶和PCR纯化试剂盒纯化反应混合物,并且洗脱剩余的ITR侧接的载体。使来自不同生产步骤的样品在琼脂糖凝胶上显象(图26)。泳道5显示了耐受消化的载体的单一条带。泳道4中的第三条带表示通过热振荡器的不完全变性,从而在反应混合物中留下切口质粒。一旦添加PvuII和RecBCD,则成功消化掉切口的质粒,而具有发夹结构末端的DNA保留。根据生产商的规程,使用JetPrime用纯化的构建体转染HEK293细胞。在使用来自NanoLight Technology的Gluc Glow测定试剂盒转染后48h确定上清液中的荧光素酶表达水平。
根据上述内容将理解,尽管在本文中已出于说明的目的描述了具体实施方案,但是在不背离本文所提供的精神和范围的情况下可以做出多种改变。以上提及的所有参考文献以其全部内容作为参考并入本文。
SEQUENCE LISTING
<110> 安杰瑞姆生物科学公司
<120> DNA分子组合物及其制备方法和使用方法
<130> 14497-005-228
<150> 63/057,179
<151> 2020-07-27
<150> 63/139,486
<151> 2021-01-20
<160> 338
<170> PatentIn version 3.5
<210> 1
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nb.BbvCI; 格式:bl
<400> 1
ttgcccactc cccctcagcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgctg agggggagtg 120
ggcaa 125
<210> 2
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nb.BbvCI; 格式:tl
<400> 2
ttgcccactc ccgctgaggg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgccctc agcgggagtg 120
ggcaa 125
<210> 3
<211> 85
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ITR - ssDNA悬突
<400> 3
gctcgactcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 60
ggcggcctca gtgagcgagt cgagc 85
<210> 4
<211> 77
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ITR - ssDNA悬突
<400> 4
gctcgactca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg 60
gcctcagtga gtcgagc 77
<210> 5
<211> 69
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ITR - ssDNA悬突
<400> 5
cgctgactca ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 60
gagtcagcg 69
<210> 6
<211> 125
<212> DNA
<213> AAV 血清型 4 (AAV4)
<220>
<223> AAV4 右 wt
<400> 6
ttggccacat tagctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagggagtg 120
gccaa 125
<210> 7
<211> 89
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ITR - ssDNA悬突
<400> 7
cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc 60
cgggcggcct cagtgagcga gcgagcgcg 89
<210> 8
<211> 71
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ITR - ssDNA悬突
<400> 8
tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 60
tcagtgagcg a 71
<210> 9
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ITR - ssDNA悬突
<400> 9
actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc ggcctcagt 59
<210> 10
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ITR - ssDNA悬突
<400> 10
aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc t 51
<210> 11
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1 左 ITR
<400> 11
ttgcccactc cctctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcag agagggagtg 120
ggcaa 125
<210> 12
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1 右 ITR
<400> 12
ttgcccactc cctctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcag agagggagtg 120
ggcaa 125
<210> 13
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2 左 ITR
<400> 13
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaa 125
<210> 14
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2 右 ITR
<400> 14
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaa 125
<210> 15
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3 左 ITR
<400> 15
ttggccactc cctctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgcat agagggagtg 120
gccaa 125
<210> 16
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3 右 ITR
<400> 16
ttggccactc cctctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgcat agagggagtg 120
gccaa 125
<210> 17
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4 左 ITR
<400> 17
ttggccactc cctctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagggagtg 120
gccaa 125
<210> 18
<211> 112
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4 右 ITR
<400> 18
ctatgcgcgc tcgctcactc actcggccct ggagaccaaa ggtctccaga ctgccggcct 60
ctggccggca gggccgagtg agtgagcgag cgcgcataga gggagtggcc aa 112
<210> 19
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5 (登录号 NC_006152) 左 ITR
<400> 19
ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacaggg gggagag 137
<210> 20
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5 (登录号 NC_006152) 右 ITR
<400> 20
ctctcccccc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacaggg gggagag 137
<210> 21
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7 (登录号 NC_006260) 左 ITR
<400> 21
ttggccactc cctctatgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcat agagggagtg 120
gccaa 125
<210> 22
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7 (登录号 NC_006260) 右 ITR
<400> 22
ttggccactc cctctatgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcat agagggagtg 120
gccaa 125
<210> 23
<211> 140
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> HBOV (登录号 JQ923422) 左 ITR
<400> 23
gtggttgtac agacgccatc ttggaatcca atatgtctgc cggctcagtc atgcctgcgc 60
tgcgcgcagc gcgctgcgcg cgcgcatgat ctaatcgccg gcagacatat tggattccaa 120
gatggcgtct gtacaaccac 140
<210> 24
<211> 200
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> HBOV (登录号 JQ923422) 右 ITR
<400> 24
ttgcttatgc aatcgcgaaa ctctatatct tttaatgtgt tgttgttgta catgcgccat 60
cttagtttta tatcagctgg cgccttagtt atataacatg catgttatat aactaaggcg 120
ccagctgata taaaactaag atggcgcatg tacaacaaca acacattaaa agatatagag 180
tttcgcgatt gcataagcaa 200
<210> 25
<211> 89
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> hB19 (登录号 AY386330) 左 ITR
<400> 25
tgggccagct tgcttggggt tgccttgaca ctaagacaag cggcgcgccg cttgatctta 60
gtggcacgtc aaccccaagc gctggccca 89
<210> 26
<211> 89
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> hB19 (登录号 AY386330) 右 ITR
<400> 26
tgggccagcg cttggggttg acgtgccact aagatcaagc ggcgcgccgc ttgtcttagt 60
gtcaaggcaa ccccaagcaa gctggccca 89
<210> 27
<211> 70
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ITR - ssDNA悬突
<400> 27
ccatgcatcc ggctttaaac gggcaactgc gtctcattca cgttagagac tacaaccgtc 60
ggatgcatgg 70
<210> 28
<211> 102
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ITR - ssDNA悬突
<400> 28
ttcaaacctg ccgggggaga agcggcgttt tttcccggcc gccgcttctc ttcttctccc 60
gccgccggga aaaaaggcgg gagaagcccc ggcaggtttg aa 102
<210> 29
<211> 92
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ITR - ssDNA悬突
<400> 29
gtccgggcca tgcttcaaac ctgccggggc ttctcccgcc ttttttcccg gcggcgggag 60
aagtagattt ctcgtacctg catggcccgg ac 92
<210> 30
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2 右 ITR
<400> 30
cttctcccgc cgccgggaaa aaaggcggga gaagccccgg caggtttgaa 50
<210> 31
<211> 87
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ITR - ssDNA悬突
<400> 31
ccagcgcttg gggttgacgt gccactaaga tcaagcggcg cgcgcgcgcc gcttgtctta 60
gtgtcaaggc aaccccaagc aagctgg 87
<210> 32
<211> 113
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ITR - ssDNA悬突
<400> 32
ggttgactct gggccagctt gcttggggtt gccttgacac taagacaagc ggcgcgcgcg 60
cgccgcttga tcttagtggc acgtcaaccc caagcgctgg cccagagtca acc 113
<210> 33
<211> 83
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ITR - ssDNA悬突
<400> 33
cgcgctcgct cgctcactga ggccgggcca aaggcccgac gcccgggctt tgcccgggcg 60
gcctcagtga gcgagcgagc gcg 83
<210> 34
<211> 83
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ITR - ssDNA悬突
<400> 34
cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gtttcgggcg 60
gcctcagtga gcgagcgagc gcg 83
<210> 35
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ITR - ssDNA悬突
<400> 35
cgcgctcgct cgctcactga ggccgcccgg gctttgcccg ggcggcctca gtgagcgagc 60
gagcgcg 67
<210> 36
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nb.BbvCI; 格式:bl
<400> 36
ttggccactc cccctcagcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgctg agggggagtg 120
gccaa 125
<210> 37
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nb.BbvCI; 格式:tl
<400> 37
ttggccactc ccgctgaggg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgccctc agcgggagtg 120
gccaa 125
<210> 38
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nb.BbvCI; 格式:bl
<400> 38
ttggccactc cccctcagcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgctg agggggagtg 120
gccaa 125
<210> 39
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nb.BbvCI; 格式:tl
<400> 39
ttggccactc ccgctgaggg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgccctc agcgggagtg 120
gccaa 125
<210> 40
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nb.BbvCI; 格式:bl
<400> 40
ttggccactc cccctcagcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgctg agggggagtg 120
gccaa 125
<210> 41
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nb.BbvCI; 格式:tl
<400> 41
ttggccactc ccgctgaggg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgccctc agcgggagtg 120
gccaa 125
<210> 42
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nb.BbvCI; 格式:bl
<400> 42
ttggccacat tacctcagcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgctg agggggagtg 120
gccaa 125
<210> 43
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nb.BbvCI; 格式:tl
<400> 43
ttggccacat tagctgaggg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgccctc agcgggagtg 120
gccaa 125
<210> 44
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nb.BbvCI; 格式:bl
<400> 44
ctctcccctc agccgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcggctgag gggagag 137
<210> 45
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nb.BbvCI; 格式:tl
<400> 45
ctctccccgc tgaggcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcctcagcg gggagag 137
<210> 46
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nb.BbvCI; 格式:bl
<400> 46
ttggccactc cccctcagcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgctg agggggagtg 120
gccaa 125
<210> 47
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nb.BbvCI; 格式:tl
<400> 47
ttggccactc ccgctgaggg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgccctc agcgggagtg 120
gccaa 125
<210> 48
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nb.BsmI; 格式:bl
<400> 48
ttgcccactc cctgaatgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcat tcagggagtg 120
ggcaa 125
<210> 49
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nb.BsmI; 格式:tl
<400> 49
ttgcccactc cctctctgcg cattcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gaatgcgcag agagggagtg 120
ggcaa 125
<210> 50
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nb.BsmI; 格式:bl
<400> 50
ttggccactc cctgaatgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcat tcagggagtg 120
gccaa 125
<210> 51
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nb.BsmI; 格式:tl
<400> 51
ttggccactc cctctctgcg cattcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gaatgcgcag agagggagtg 120
gccaa 125
<210> 52
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nb.BsmI; 格式:bl
<400> 52
ttggccactc cctgaatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgcat tcagggagtg 120
gccaa 125
<210> 53
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nb.BsmI; 格式:tl
<400> 53
ttggccactc cctctatgcg cattcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gaatgcgcat agagggagtg 120
gccaa 125
<210> 54
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nb.BsmI; 格式:bl
<400> 54
ttggccactc cctgaatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat tcagggagtg 120
gccaa 125
<210> 55
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nb.BsmI; 格式:tl
<400> 55
ttggccactc cctctatgcg cattcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gaatgcgcat agagggagtg 120
gccaa 125
<210> 56
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nb.BsmI; 格式:bl
<400> 56
ttggccacat taggaatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat tcagggagtg 120
gccaa 125
<210> 57
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nb.BsmI; 格式:tl
<400> 57
ttggccacat tagctatgcg cattcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gaatgcgcat agagggagtg 120
gccaa 125
<210> 58
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nb.BsmI; 格式:bl
<400> 58
ctctccccga atgcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgcattcg gggagag 137
<210> 59
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nb.BsmI; 格式:tl
<400> 59
ctctcccccc tgtcgcattc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
tgcgacaggg gggagag 137
<210> 60
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nb.BsmI; 格式:bl
<400> 60
ttggccactc cctgaatgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcat tcagggagtg 120
gccaa 125
<210> 61
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nb.BsmI; 格式:tl
<400> 61
ttggccactc cctctatgcg cattcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gaatgcgcat agagggagtg 120
gccaa 125
<210> 62
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nb.BsrDI; 格式:bl
<400> 62
ttgcccactc ccgcaatgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcat tgcgggagtg 120
ggcaa 125
<210> 63
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nb.BsrDI; 格式:tl
<400> 63
ttgcccactc cctcattgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcaa tgagggagtg 120
ggcaa 125
<210> 64
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nb.BsrDI; 格式:bl
<400> 64
ttggccactc ccgcaatgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcat tgcgggagtg 120
gccaa 125
<210> 65
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nb.BsrDI; 格式:tl
<400> 65
ttggccactc cctcattgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcaa tgagggagtg 120
gccaa 125
<210> 66
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nb.BsrDI; 格式:bl
<400> 66
ttggccactc ccgcaatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgcat tgcgggagtg 120
gccaa 125
<210> 67
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nb.BsrDI; 格式:tl
<400> 67
ttggccactc cctcattgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgcaa tgagggagtg 120
gccaa 125
<210> 68
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nb.BsrDI; 格式:bl
<400> 68
ttggccactc ccgcaatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat tgcgggagtg 120
gccaa 125
<210> 69
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nb.BsrDI; 格式:tl
<400> 69
ttggccactc cctcattgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcaa tgagggagtg 120
gccaa 125
<210> 70
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nb.BsrDI; 格式:bl
<400> 70
ttggccacat tagcaatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat tgcgggagtg 120
gccaa 125
<210> 71
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nb.BsrDI; 格式:tl
<400> 71
ttggccacat tagcattgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcaa tgagggagtg 120
gccaa 125
<210> 72
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nb.BsrDI; 格式:bl
<400> 72
ctctccgcaa tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacattg cggagag 137
<210> 73
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nb.BsrDI; 格式:tl
<400> 73
ctctccccca ttgcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgcaatgg gggagag 137
<210> 74
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nb.BsrDI; 格式:bl
<400> 74
ttggccactc ccgcaatgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcat tgcgggagtg 120
gccaa 125
<210> 75
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nb.BsrDI; 格式:tl
<400> 75
ttggccactc cctcattgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcaa tgagggagtg 120
gccaa 125
<210> 76
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nb.BssSI; 格式:bl
<400> 76
ttgcccacga gctctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcag agagctcgtg 120
ggcaa 125
<210> 77
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nb.BssSI; 格式:tl
<400> 77
ttgcccactc cctcgtggcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcca cgagggagtg 120
ggcaa 125
<210> 78
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nb.BssSI; 格式:bl
<400> 78
ttggccacga gctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagctcgtg 120
gccaa 125
<210> 79
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nb.BssSI; 格式:tl
<400> 79
ttggccactc cctcgtggcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcca cgagggagtg 120
gccaa 125
<210> 80
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nb.BssSI; 格式:bl
<400> 80
ttggccacga gctctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgcat agagctcgtg 120
gccaa 125
<210> 81
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nb.BssSI; 格式:tl
<400> 81
ttggccactc cctcgtggcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgcca cgagggagtg 120
gccaa 125
<210> 82
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nb.BssSI; 格式:bl
<400> 82
ttggccacga gctctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagctcgtg 120
gccaa 125
<210> 83
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nb.BssSI; 格式:tl
<400> 83
ttggccactc cctcgtggcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcca cgagggagtg 120
gccaa 125
<210> 84
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nb.BssSI; 格式:bl
<400> 84
ttggccacga gagctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagctcgtg 120
gccaa 125
<210> 85
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nb.BssSI; 格式:tl
<400> 85
ttggccacat tctcgtggcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcca cgagggagtg 120
gccaa 125
<210> 86
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nb.BssSI; 格式:bl
<400> 86
ctcacgagcc tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacaggc tcgtgag 137
<210> 87
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nb.BssSI; 格式:tl
<400> 87
ctctccctcg tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacacga gggagag 137
<210> 88
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nb.BssSI; 格式:bl
<400> 88
ttggccacga gctctatgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcat agagctcgtg 120
gccaa 125
<210> 89
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nb.BssSI; 格式:tl
<400> 89
ttggccactc cctcgtggcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcca cgagggagtg 120
gccaa 125
<210> 90
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nb.BtsI; 格式:bl
<400> 90
ttgcccactc ccgcagtgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcac tgcgggagtg 120
ggcaa 125
<210> 91
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nb.BtsI; 格式:tl
<400> 91
ttgcccactc cctcactgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcag tgagggagtg 120
ggcaa 125
<210> 92
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nb.BtsI; 格式:bl
<400> 92
ttggccactc ccgcagtgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcac tgcgggagtg 120
gccaa 125
<210> 93
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nb.BtsI; 格式:tl
<400> 93
ttggccactc cctcactgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag tgagggagtg 120
gccaa 125
<210> 94
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nb.BtsI; 格式:bl
<400> 94
ttggccactc ccgcagtgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgcac tgcgggagtg 120
gccaa 125
<210> 95
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nb.BtsI; 格式:tl
<400> 95
ttggccactc cctcactgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgcag tgagggagtg 120
gccaa 125
<210> 96
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nb.BtsI; 格式:bl
<400> 96
ttggccactc ccgcagtgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcac tgcgggagtg 120
gccaa 125
<210> 97
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nb.BtsI; 格式:tl
<400> 97
ttggccactc cctcactgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcag tgagggagtg 120
gccaa 125
<210> 98
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nb.BtsI; 格式:bl
<400> 98
ttggccacat tagcagtgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcac tgcgggagtg 120
gccaa 125
<210> 99
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nb.BtsI; 格式:tl
<400> 99
ttggccacat tagcactgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcag tgagggagtg 120
gccaa 125
<210> 100
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nb.BtsI; 格式:bl
<400> 100
ctctccgcag tgtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgacactg cggagag 137
<210> 101
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nb.BtsI; 格式:tl
<400> 101
ctctccccac tgccgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcggcagtg gggagag 137
<210> 102
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nb.BtsI; 格式:bl
<400> 102
ttggccactc ccgcagtgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcac tgcgggagtg 120
gccaa 125
<210> 103
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nb.BtsI; 格式:tl
<400> 103
ttggccactc cctcactgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcag tgagggagtg 120
gccaa 125
<210> 104
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nt.AlwI; 格式:bl
<400> 104
ttgcccactc cctcgatccg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcggat cgagggagtg 120
ggcaa 125
<210> 105
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nt.AlwI; 格式:tl
<400> 105
ttgcccactg gatctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcag agatccagtg 120
ggcaa 125
<210> 106
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nt.AlwI; 格式:bl
<400> 106
ttggccactc cctcgatccg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcggat cgagggagtg 120
gccaa 125
<210> 107
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nt.AlwI; 格式:tl
<400> 107
ttggccactg gatctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agatccagtg 120
gccaa 125
<210> 108
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nt.AlwI; 格式:bl
<400> 108
ttggccactc cctcgatccg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcggat cgagggagtg 120
gccaa 125
<210> 109
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nt.AlwI; 格式:tl
<400> 109
ttggccactg gatctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgcat agatccagtg 120
gccaa 125
<210> 110
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nt.AlwI; 格式:bl
<400> 110
ttggccactc cctcgatccg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcggat cgagggagtg 120
gccaa 125
<210> 111
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nt.AlwI; 格式:tl
<400> 111
ttggccactg gatctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agatccagtg 120
gccaa 125
<210> 112
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nt.AlwI; 格式:bl
<400> 112
ttggccacat tagcgatccg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcggat cgagggagtg 120
gccaa 125
<210> 113
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nt.AlwI; 格式:tl
<400> 113
ttggccacag gatctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agatccagtg 120
gccaa 125
<210> 114
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nt.AlwI; 格式:bl
<400> 114
ctctcccccc tgtcgcgatc cctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagggat 120
cgcgacaggg gggagag 137
<210> 115
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nt.AlwI; 格式:tl
<400> 115
ctctcccccg gatcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgatccgg gggagag 137
<210> 116
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nt.AlwI; 格式:bl
<400> 116
ttggccactc cctcgatccg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcggat cgagggagtg 120
gccaa 125
<210> 117
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nt.AlwI; 格式:tl
<400> 117
ttggccactg gatctatgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcat agatccagtg 120
gccaa 125
<210> 118
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nt.BbvCI; 格式:bl
<400> 118
ttgcccactc ccgctgaggg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgccctc agcgggagtg 120
ggcaa 125
<210> 119
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nt.BbvCI; 格式:tl
<400> 119
ttgcccactc cccctcagcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgctg agggggagtg 120
ggcaa 125
<210> 120
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nt.BbvCI; 格式:bl
<400> 120
ttggccactc ccgctgaggg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgccctc agcgggagtg 120
gccaa 125
<210> 121
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nt.BbvCI; 格式:tl
<400> 121
ttggccactc cccctcagcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgctg agggggagtg 120
gccaa 125
<210> 122
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nt.BbvCI; 格式:bl
<400> 122
ttggccactc ccgctgaggg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgccctc agcgggagtg 120
gccaa 125
<210> 123
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nt.BbvCI; 格式:tl
<400> 123
ttggccactc cccctcagcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgctg agggggagtg 120
gccaa 125
<210> 124
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nt.BbvCI; 格式:bl
<400> 124
ttggccactc ccgctgaggg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgccctc agcgggagtg 120
gccaa 125
<210> 125
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nt.BbvCI; 格式:tl
<400> 125
ttggccactc cccctcagcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgctg agggggagtg 120
gccaa 125
<210> 126
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nt.BbvCI; 格式:bl
<400> 126
ttggccacat tagctgaggg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgccctc agcgggagtg 120
gccaa 125
<210> 127
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nt.BbvCI; 格式:tl
<400> 127
ttggccacat tacctcagcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgctg agggggagtg 120
gccaa 125
<210> 128
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nt.BbvCI; 格式:bl
<400> 128
ctctccccgc tgaggcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcctcagcg gggagag 137
<210> 129
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nt.BbvCI; 格式:tl
<400> 129
ctctcccctc agccgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcggctgag gggagag 137
<210> 130
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nt.BbvCI; 格式:bl
<400> 130
ttggccactc ccgctgaggg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgccctc agcgggagtg 120
gccaa 125
<210> 131
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nt.BbvCI; 格式:tl
<400> 131
ttggccactc cccctcagcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgctg agggggagtg 120
gccaa 125
<210> 132
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nt.BsmAI; 格式:bl
<400> 132
ttgcccactg agactctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcag agtctcagtg 120
ggcaa 125
<210> 133
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nt.BsmAI; 格式:tl
<400> 133
ttgcccactc cgtctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcag agacggagtg 120
ggcaa 125
<210> 134
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nt.BsmAI; 格式:bl
<400> 134
ttggccactg agactctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agtctcagtg 120
gccaa 125
<210> 135
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nt.BsmAI; 格式:tl
<400> 135
ttggccactc cgtctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agacggagtg 120
gccaa 125
<210> 136
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nt.BsmAI; 格式:bl
<400> 136
ttggccactg agactatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgcat agtctcagtg 120
gccaa 125
<210> 137
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nt.BsmAI; 格式:tl
<400> 137
ttggccactc cgtctctgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgcag agacggagtg 120
gccaa 125
<210> 138
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nt.BsmAI; 格式:bl
<400> 138
ttggccactg agactatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agtctcagtg 120
gccaa 125
<210> 139
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nt.BsmAI; 格式:tl
<400> 139
ttggccactc cgtctctgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcag agacggagtg 120
gccaa 125
<210> 140
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nt.BsmAI; 格式:bl
<400> 140
ttggccacag agactatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agtctcagtg 120
gccaa 125
<210> 141
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nt.BsmAI; 格式:tl
<400> 141
ttggccacat tgtctctgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcag agacggagtg 120
gccaa 125
<210> 142
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nt.BsmAI; 格式:bl
<400> 142
ctctcccccg agacgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgtctcgg gggagag 137
<210> 143
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nt.BsmAI; 格式:tl
<400> 143
ctctcccccg tctcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgagacgg gggagag 137
<210> 144
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nt.BsmAI; 格式:bl
<400> 144
ttggccactg agactatgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcat agtctcagtg 120
gccaa 125
<210> 145
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nt.BsmAI; 格式:tl
<400> 145
ttggccactc cgtctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcag agacggagtg 120
gccaa 125
<210> 146
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nt.BspQI; 格式:bl
<400> 146
ttgcccactc ccgaagagcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgctc ttcgggagtg 120
ggcaa 125
<210> 147
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nt.BspQI; 格式:tl
<400> 147
ttgcccactc ccgctcttcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgaag agcgggagtg 120
ggcaa 125
<210> 148
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nt.BspQI; 格式:bl
<400> 148
ttggccactc ccgaagagcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgctc ttcgggagtg 120
gccaa 125
<210> 149
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nt.BspQI; 格式:tl
<400> 149
ttggccactc ccgctcttcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgaag agcgggagtg 120
gccaa 125
<210> 150
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nt.BspQI; 格式:bl
<400> 150
ttggccactc ccgaagagcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgctc ttcgggagtg 120
gccaa 125
<210> 151
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nt.BspQI; 格式:tl
<400> 151
ttggccactc ccgctcttcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgaag agcgggagtg 120
gccaa 125
<210> 152
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nt.BspQI; 格式:bl
<400> 152
ttggccactc ccgaagagcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgctc ttcgggagtg 120
gccaa 125
<210> 153
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nt.BspQI; 格式:tl
<400> 153
ttggccactc ccgctcttcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgaag agcgggagtg 120
gccaa 125
<210> 154
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nt.BspQI; 格式:bl
<400> 154
ttggccacat tagaagagcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgctc ttcgggagtg 120
gccaa 125
<210> 155
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nt.BspQI; 格式:tl
<400> 155
ttggccacat tagctcttcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgaag agcgggagtg 120
gccaa 125
<210> 156
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nt.BspQI; 格式:bl
<400> 156
ctctcccgaa gagcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgctcttc gggagag 137
<210> 157
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nt.BspQI; 格式:tl
<400> 157
ctctcccgct cttcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgaagagc gggagag 137
<210> 158
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nt.BspQI; 格式:bl
<400> 158
ttggccactc ccgaagagcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgctc ttcgggagtg 120
gccaa 125
<210> 159
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nt.BspQI; 格式:tl
<400> 159
ttggccactc ccgctcttcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgaag agcgggagtg 120
gccaa 125
<210> 160
<211> 127
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nt.BstNBI; 格式:bl
<400> 160
ttgcccactc cctctctgcg cgactcgctc gctcggtggg gcctgcggac caaaggtccg 60
cagacggcag agctctgctc tgccggcccc accgagcgag cgagtcgcgc agagagggag 120
tgggcaa 127
<210> 161
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV1; 识别位点:Nt.BstNBI; 格式:tl
<400> 161
ttgccgagtc cctctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcag agagggactc 120
ggcaa 125
<210> 162
<211> 127
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nt.BstNBI; 格式:bl
<400> 162
ttggccactc cctctctgcg cgactcgctc gctcactgag gccgggcgac caaaggtcgc 60
ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagtcgcgc agagagggag 120
tggccaa 127
<210> 163
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV2; 识别位点:Nt.BstNBI; 格式:tl
<400> 163
ttggcgagtc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggactc 120
gccaa 125
<210> 164
<211> 127
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nt.BstNBI; 格式:bl
<400> 164
ttggccactc cctctatgcg cgactcgctc gctcggtggg gcctggcgac caaaggtcgc 60
cagacggacg tgctttgcac gtccggcccc accgagcgag cgagtcgcgc atagagggag 120
tggccaa 127
<210> 165
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV3; 识别位点:Nt.BstNBI; 格式:tl
<400> 165
ttggcgagtc cctctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60
agacggacgt gctttgcacg tccggcccca ccgagcgagc gagtgcgcat agagggactc 120
gccaa 125
<210> 166
<211> 127
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nt.BstNBI; 格式:bl
<400> 166
ttggccactc cctctatgcg cgactcgctc actcactcgg ccctggagac caaaggtctc 60
cagactgccg gcctctggcc ggcagggccg agtgagtgag cgagtcgcgc atagagggag 120
tggccaa 127
<210> 167
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 左; 识别位点:Nt.BstNBI; 格式:tl
<400> 167
ttggcgagtc cctctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagggactc 120
gccaa 125
<210> 168
<211> 127
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nt.BstNBI; 格式:bl
<400> 168
ttggccacat tagctatgcg cgactcgctc actcactcgg ccctggagac caaaggtctc 60
cagactgccg gcctctggcc ggcagggccg agtgagtgag cgagtcgcgc atagagggag 120
tggccaa 127
<210> 169
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV4 右; 识别位点:Nt.BstNBI; 格式:tl
<400> 169
ttggccagag tcgctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagactctg 120
gccaa 125
<210> 170
<211> 139
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nt.BstNBI; 格式:bl
<400> 170
ctctcccccc tgtcgcgact cgctcgctcg ctggctcgtt tgggggggtg gcagctcaaa 60
gagctgccag acgacggccc tctggccgtc gcccccccaa acgagccagc gagcgagcga 120
gtcgcgacag gggggagag 139
<210> 171
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV5; 识别位点:Nt.BstNBI; 格式:tl
<400> 171
ctctcccccg agtcgcgttc gctcgctcgc tggctcgttt gggggggtgg cagctcaaag 60
agctgccaga cgacggccct ctggccgtcg cccccccaaa cgagccagcg agcgagcgaa 120
cgcgactcgg gggagag 137
<210> 172
<211> 127
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nt.BstNBI; 格式:bl
<400> 172
ttggccactc cctctatgcg cgactcgctc gctcggtggg gcctgcggac caaaggtccg 60
cagacggcag agctctgctc tgccggcccc accgagcgag cgagtcgcgc atagagggag 120
tggccaa 127
<210> 173
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 来源:AAV7; 识别位点:Nt.BstNBI; 格式:tl
<400> 173
ttggcgagtc cctctatgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60
agacggcaga gctctgctct gccggcccca ccgagcgagc gagcgcgcat agagggactc 120
gccaa 125
<210> 174
<211> 1636
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 构建体1编码左侧反向重复序列、微型人PGK启动子、turboluc ORF、SV40聚a和右侧反向重复序列
<400> 174
tgcgcgactc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 60
gcccgggcgg cctcagtgag cgagcgagtc gcgcagagag gttaaaacca actagacaac 120
tttgtatatc tagagttggg gttgcgcctt ttccaaggca gccctgggtt tgcgcaggga 180
cgcggctgct ctgggcgtgg ttccgggaaa cgcagcggcg ccgaccctgg gtctcgcaca 240
ttcttcacgt ccgttcgcag cgtcacccgg atcttcgccg ctacccttgt gggccccccg 300
gcgacgcttc ctgctccgcc cctaagtcgg gaaggttcct tgcggttcgc ggcgtgccgg 360
acgtgacaaa cggaagccgc acgtctcact agtaccctcg cagacggaca gcgccaggga 420
gcaatggcag cgcgccgacc gcgatgggct gtggccaata gcggctgctc agcagggcgc 480
gccgagagca gcggccggga aggggcggtg cgggaggcgg ggtgtggggc ggtagtgtgg 540
gccctgttcc tgcccgcgcg gtgttccgca ttctgcaagc ctccggagcg cacgtcggca 600
gtcggctccc tcgttgaccg aatcaccgac ctctctcccc aggcaagttt gtacaaaaaa 660
gcgcggccgc ggcaggctgc caccatggaa accgatacac tgctgctttg ggtacttttg 720
ctgtgggtgc ccggcagtac gggcgacgcc gcacaaccag ctaggagagc agtccggagc 780
ctggtcccct cttccgaggc cgaggctgaa cggggaaagc tgccaggcaa gaaactcccc 840
ttagaggttc tcatcgagct ggaagcaaac gcacgcaagg ccggttgcac taggggctgc 900
ctcatctgcc tcagcaagat caaatgtaca gcaaagatga agaagtatat tcctggccgc 960
tgtgcagact acggaggcga caaaaaaaca ggacaagctg gtatagttgg cgccatcgta 1020
gatatccccg agattagtgg gttcaaggaa atggagccaa tggagcaatt cattgcacag 1080
gttgatagat gtgcggattg cactactggt tgccttaagg gcttggcgaa tgtcaagtgt 1140
agtgatcttc tgaaaaagtg gctacccggc cggtgtgcca ccttcgctga caaaatacag 1200
agcgaagtcg acaatattaa aggacttgcc ggggactaat gatagtgaca caaagtgacg 1260
cgtcctagag ctcgcactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 1320
gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 1380
attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 1440
agcaaggggg aggattggga agagaatagc aggcatgctg gggagggcgc tagcgcagga 1500
acccctttta atggagttgg cgagtccctc tctgcgcgct cgctcgctca ctgaggccgg 1560
gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc 1620
gcgcagagat cgactc 1636
<210> 175
<211> 1796
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 构建体2编码修饰的左侧ITR、人PGK启动子、分泌的turboluc ORF、SV40聚-A、右侧ITR和右侧ITR下游115个碱基对处的切口核酸内切酶的双限制性位点
<400> 175
tgcgcgactc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 60
gcccgggcgg cctcagtgag cgagcgagtc gcgcagagag gttaaaacca actagacaac 120
tttgtatatc tagagttggg gttgcgcctt ttccaaggca gccctgggtt tgcgcaggga 180
cgcggctgct ctgggcgtgg ttccgggaaa cgcagcggcg ccgaccctgg gtctcgcaca 240
ttcttcacgt ccgttcgcag cgtcacccgg atcttcgccg ctacccttgt gggccccccg 300
gcgacgcttc ctgctccgcc cctaagtcgg gaaggttcct tgcggttcgc ggcgtgccgg 360
acgtgacaaa cggaagccgc acgtctcact agtaccctcg cagacggaca gcgccaggga 420
gcaatggcag cgcgccgacc gcgatgggct gtggccaata gcggctgctc agcagggcgc 480
gccgagagca gcggccggga aggggcggtg cgggaggcgg ggtgtggggc ggtagtgtgg 540
gccctgttcc tgcccgcgcg gtgttccgca ttctgcaagc ctccggagcg cacgtcggca 600
gtcggctccc tcgttgaccg aatcaccgac ctctctcccc aggcaagttt gtacaaaaaa 660
gcgcggccgc ggcaggctgc caccatggaa accgatacac tgctgctttg ggtacttttg 720
ctgtgggtgc ccggcagtac gggcgacgcc gcacaaccag ctaggagagc agtccggagc 780
ctggtcccct cttccgaggc cgaggctgaa cggggaaagc tgccaggcaa gaaactcccc 840
ttagaggttc tcatcgagct ggaagcaaac gcacgcaagg ccggttgcac taggggctgc 900
ctcatctgcc tcagcaagat caaatgtaca gcaaagatga agaagtatat tcctggccgc 960
tgtgcagact acggaggcga caaaaaaaca ggacaagctg gtatagttgg cgccatcgta 1020
gatatccccg agattagtgg gttcaaggaa atggagccaa tggagcaatt cattgcacag 1080
gttgatagat gtgcggattg cactactggt tgccttaagg gcttggcgaa tgtcaagtgt 1140
agtgatcttc tgaaaaagtg gctacccggc cggtgtgcca ccttcgctga caaaatacag 1200
agcgaagtcg acaatattaa aggacttgcc ggggactaat gatagtgaca caaagtgacg 1260
cgtcctagag ctcgcactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 1320
gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 1380
attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 1440
agcaaggggg aggattggga agagaatagc aggcatgctg gggagggcgc tagcgcagga 1500
acccctttta atggagttgg cgagtccctc tctgcgcgct cgctcgctca ctgaggccgg 1560
gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc 1620
gcgcagagat cgactcctcg gccacttgga ggggccgggg ggacgacgca atctggagtg 1680
gaaagaaccc ccgtctatgc ggcttaaagc acggccaggg aatagtggat caagtgtact 1740
gacatgtgcc ggagtccctc catgcccaga tcgactccct cgagatatat ggatcc 1796
<210> 176
<211> 23
<212> DNA
<213> AAV 血清型 2 (AAV2)
<220>
<223> AAV2 wt gRNA 用于切割 Cas9
<400> 176
agcgagcgag cgcgcagaga ggg 23
<210> 177
<211> 16
<212> DNA
<213> AAV 血清型 2 (AAV2)
<220>
<223> AAV2 wt gDNA 用于PfAgo
<400> 177
gctcgctcgc tcggtg 16
<210> 178
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Rep AAV1,2,7
<400> 178
gcgcgctcgc tcgctc 16
<210> 179
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Rep AAV3
<400> 179
tgcgcactcg ctcgctc 17
<210> 180
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Rep AAV4
<400> 180
gcgcgctcgc tcactc 16
<210> 181
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Rep AAV5
<400> 181
gttcgctcgc tcgctggctc 20
<210> 182
<211> 10
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> NS1-NSBE3 B19V
<400> 182
ttccggtaca 10
<210> 183
<211> 104
<212> DNA
<213> 人类博卡病毒(Human bocavirus,HBoV)
<220>
<223> HBoV (野生型基因组的核苷酸 129-237) (图1)
<400> 183
tcttggaatc caatatgtct gccggctcag tcatgcctgc gctgcgcgca gcgcgctgcg 60
cgcgcgcatg atctaatcgc cggcagacat attggattcc aaga 104
<210> 184
<211> 109
<212> DNA
<213> B19 parvovirus
<220>
<223> B19 (野生型基因组的核苷酸 139-227) (图1)
<400> 184
gggttggctc tgggccagct tgcttggggt tgccttgaca ctaagacaag cggcgcgccg 60
cttgatctta gtggcacgtc aaccccaagc gctggcccag agccaaccc 109
<210> 185
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> mtDNA OriL (图4)
<400> 185
ttcaaacctg ccggggcttc tcccgccttt tttcccggcg gcgggagaag 50
<210> 186
<211> 99
<212> DNA
<213> 腺相关病毒-1 (AAV1)
<400> 186
aacgggtgag ggagagacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 187
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nb.BbvCI_BL
<400> 187
aacgggtgag ggggagtcgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 188
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nb.BbvCI_TL
<400> 188
aacgggtgag ggcgactccc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 189
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nb.BsmI_BL
<400> 189
aacgggtgag ggacttacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 190
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nb.BsmI_TL
<400> 190
aacgggtgag ggagagacgc gtaagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 191
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nb.BsrDI_BL
<400> 191
aacgggtgag ggcgttacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 192
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nb.BsrDI_TL
<400> 192
aacgggtgag ggagtaacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 193
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nb.BssSI_BL
<400> 193
aacgggtgct cgagagacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 194
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nb.BssSI_TL
<400> 194
aacgggtgag ggagcaccgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 195
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nb.BtsI_BL
<400> 195
aacgggtgag ggcgtcacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 196
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nb.BtsI_TL
<400> 196
aacgggtgag ggagtgacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 197
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nt.AlwI_BL
<400> 197
aacgggtgag ggagctaggc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 198
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nt.AlwI_BL
<400> 198
aacgggtgac ctagagacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 199
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nt.BbvCI_TL
<400> 199
aacgggtgag ggcgactccc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 200
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nt.BbvCI_BL
<400> 200
aacgggtgag ggggagtcgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 201
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nt.BsmAI_TL
<400> 201
aacgggtgac tctgagacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 202
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nt.BsmAI_BL
<400> 202
aacgggtgag gcagagacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 203
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nt.BspQI_TL
<400> 203
aacgggtgag ggcttctcgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 204
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nt.BspQI_BL
<400> 204
aacgggtgag ggcgagaagc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 205
<211> 100
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nt.BstNBI_TL
<400> 205
aacgggtgag ggagagacgc gctgagcgag cgagccaccc cggacgcctg gtttccaggc 60
gtctgccgtc tcgagacgag acggccgggg tggctcgctc 100
<210> 206
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV1_Nt.BstNBI_BL
<400> 206
aacggctcag ggagagacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctc 99
<210> 207
<211> 99
<212> DNA
<213> 腺相关病毒-2 (AAV2)
<400> 207
aaccggtgag ggagagacgc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 208
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nb.BbvCI_BL
<400> 208
aaccggtgag ggggagtcgc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 209
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nb.BbvCI_TL
<400> 209
aaccggtgag ggcgactccc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 210
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nb.BsmI_BL
<400> 210
aaccggtgag ggacttacgc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 211
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nb.BsmI_TL
<400> 211
aaccggtgag ggagagacgc gtaagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 212
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nb.BsrDI_BL
<400> 212
aaccggtgag ggcgttacgc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 213
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nb.BsrDI_TL
<400> 213
aaccggtgag ggagtaacgc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 214
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nb.BssSI_BL
<400> 214
aaccggtgct cgagagacgc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 215
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nb.BssSI_TL
<400> 215
aaccggtgag ggagcaccgc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 216
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nb.BtsI_BL
<400> 216
aaccggtgag ggcgtcacgc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 217
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nb.BtsI_TL
<400> 217
aaccggtgag ggagtgacgc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 218
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nt.AlwI_BL
<400> 218
aaccggtgag ggagctaggc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 219
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nt.AlwI_BL
<400> 219
aaccggtgac ctagagacgc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 220
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nt.BbvCI_TL
<400> 220
aaccggtgag ggcgactccc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 221
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nt.BbvCI_BL
<400> 221
aaccggtgag ggggagtcgc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 222
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nt.BsmAI_TL
<400> 222
aaccggtgac tctgagacgc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 223
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nt.BsmAI_BL
<400> 223
aaccggtgag gcagagacgc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 224
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nt.BspQI_TL
<400> 224
aaccggtgag ggcttctcgc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 225
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nt.BspQI_BL
<400> 225
aaccggtgag ggcgagaagc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 226
<211> 100
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nt.BstNBI_TL
<400> 226
aaccggtgag ggagagacgc gctgagcgag cgagtgactc cggcccgctg gtttccagcg 60
ggctgcgggc ccgaaacggg cccgccggag tcactcgctc 100
<210> 227
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV2_Nt.BstNBI_BL
<400> 227
aaccgctcag ggagagacgc gcgagcgagc gagtgactcc ggcccgctgg tttccagcgg 60
gctgcgggcc cgaaacgggc ccgccggagt cactcgctc 99
<210> 228
<211> 99
<212> DNA
<213> 腺相关病毒-3 (AAV3)
<400> 228
aaccggtgag ggagatacgc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 229
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nb.BbvCI_BL
<400> 229
aaccggtgag ggggagtcgc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 230
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nb.BbvCI_TL
<400> 230
aaccggtgag ggcgactccc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 231
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nb.BsmI_BL
<400> 231
aaccggtgag ggacttacgc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 232
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nb.BsmI_TL
<400> 232
aaccggtgag ggagatacgc gtaagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 233
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nb.BsrDI_BL
<400> 233
aaccggtgag ggcgttacgc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 234
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nb.BsrDI_TL
<400> 234
aaccggtgag ggagtaacgc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 235
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nb.BssSI_BL
<400> 235
aaccggtgct cgagatacgc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 236
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nb.BssSI_TL
<400> 236
aaccggtgag ggagcaccgc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 237
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nb.BtsI_BL
<400> 237
aaccggtgag ggcgtcacgc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 238
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nb.BtsI_TL
<400> 238
aaccggtgag ggagtgacgc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 239
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nt.AlwI_BL
<400> 239
aaccggtgag ggagctaggc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 240
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nt.AlwI_BL
<400> 240
aaccggtgac ctagatacgc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 241
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nt.BbvCI_TL
<400> 241
aaccggtgag ggcgactccc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 242
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nt.BbvCI_BL
<400> 242
aaccggtgag ggggagtcgc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 243
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nt.BsmAI_TL
<400> 243
aaccggtgac tctgatacgc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 244
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nt.BsmAI_BL
<400> 244
aaccggtgag gcagagacgc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 245
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nt.BspQI_TL
<400> 245
aaccggtgag ggcttctcgc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 246
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nt.BspQI_BL
<400> 246
aaccggtgag ggcgagaagc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 247
<211> 100
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nt.BstNBI_TL
<400> 247
aaccggtgag ggagatacgc gctgagcgag cgagccaccc cggaccgctg gtttccagcg 60
gtctgcctgc acgaaacgtg caggccgggg tggctcgctc 100
<210> 248
<211> 99
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV3_Nt.BstNBI_BL
<400> 248
aaccgctcag ggagatacgc gtgagcgagc gagccacccc ggaccgctgg tttccagcgg 60
tctgcctgca cgaaacgtgc aggccggggt ggctcgctc 99
<210> 249
<211> 125
<212> DNA
<213> 腺相关病毒-4_左 (AAV4_左)
<400> 249
aaccggtgag ggagatacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgta tctccctcac 120
cggtt 125
<210> 250
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nb.BbvCI_BL
<400> 250
aaccggtgag ggggagtcgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgac tccccctcac 120
cggtt 125
<210> 251
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nb.BbvCI_TL
<400> 251
aaccggtgag ggcgactccc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgggag tcgccctcac 120
cggtt 125
<210> 252
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nb.BsmI_BL
<400> 252
aaccggtgag ggacttacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgta agtccctcac 120
cggtt 125
<210> 253
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nb.BsmI_TL
<400> 253
aaccggtgag ggagatacgc gtaagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg cttacgcgta tctccctcac 120
cggtt 125
<210> 254
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nb.BsrDI_BL
<400> 254
aaccggtgag ggcgttacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgta acgccctcac 120
cggtt 125
<210> 255
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nb.BsrDI_TL
<400> 255
aaccggtgag ggagtaacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgtt actccctcac 120
cggtt 125
<210> 256
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nb.BssSI_BL
<400> 256
aaccggtgct cgagatacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgta tctcgagcac 120
cggtt 125
<210> 257
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nb.BssSI_TL
<400> 257
aaccggtgag ggagcaccgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcggt gctccctcac 120
cggtt 125
<210> 258
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nb.BtsI_BL
<400> 258
aaccggtgag ggcgtcacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgtg acgccctcac 120
cggtt 125
<210> 259
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nb.BtsI_TL
<400> 259
aaccggtgag ggagtgacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgtc actccctcac 120
cggtt 125
<210> 260
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nt.AlwI_BL
<400> 260
aaccggtgag ggagctaggc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgccta gctccctcac 120
cggtt 125
<210> 261
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nt.AlwI_BL
<400> 261
aaccggtgac ctagatacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgta tctaggtcac 120
cggtt 125
<210> 262
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nt.BbvCI_TL
<400> 262
aaccggtgag ggcgactccc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgggag tcgccctcac 120
cggtt 125
<210> 263
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nt.BbvCI_BL
<400> 263
aaccggtgag ggggagtcgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgac tccccctcac 120
cggtt 125
<210> 264
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nt.BsmAI_TL
<400> 264
aaccggtgac tctgatacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgta tcagagtcac 120
cggtt 125
<210> 265
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nt.BsmAI_BL
<400> 265
aaccggtgag gcagagacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgtc tctgcctcac 120
cggtt 125
<210> 266
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nt.BspQI_TL
<400> 266
aaccggtgag ggcttctcgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgag aagccctcac 120
cggtt 125
<210> 267
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nt.BspQI_BL
<400> 267
aaccggtgag ggcgagaagc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcttc tcgccctcac 120
cggtt 125
<210> 268
<211> 127
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nt.BstNBI_TL
<400> 268
aaccggtgag ggagatacgc gctgagcgag tgagtgagcc gggacctctg gtttccagag 60
gtctgacggc cggagaccgg ccgtcccggc tcactcactc gctcagcgcg tatctccctc 120
accggtt 127
<210> 269
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_左_Nt.BstNBI_BL
<400> 269
aaccgctcag ggagatacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgta tctccctgag 120
cggtt 125
<210> 270
<211> 125
<212> DNA
<213> 腺相关病毒-4_右 (AAV4_右)
<400> 270
aaccggtgta atcgatacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgta tctccctcac 120
cggtt 125
<210> 271
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nb.BbvCI_BL
<400> 271
aaccggtgta atggagtcgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgac tccccctcac 120
cggtt 125
<210> 272
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nb.BbvCI_TL
<400> 272
aaccggtgta atcgactccc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgggag tcgccctcac 120
cggtt 125
<210> 273
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nb.BsmI_BL
<400> 273
aaccggtgta atccttacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgta agtccctcac 120
cggtt 125
<210> 274
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nb.BsmI_TL
<400> 274
aaccggtgta atcgatacgc gtaagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg cttacgcgta tctccctcac 120
cggtt 125
<210> 275
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nb.BsrDI_BL
<400> 275
aaccggtgta atcgttacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgta acgccctcac 120
cggtt 125
<210> 276
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nb.BsrDI_TL
<400> 276
aaccggtgta atcgtaacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgtt actccctcac 120
cggtt 125
<210> 277
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nb.BssSI_BL
<400> 277
aaccggtgct ctcgatacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgta tctcgagcac 120
cggtt 125
<210> 278
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nb.BssSI_TL
<400> 278
aaccggtgta agagcaccgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcggt gctccctcac 120
cggtt 125
<210> 279
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nb.BtsI_BL
<400> 279
aaccggtgta atcgtcacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgtg acgccctcac 120
cggtt 125
<210> 280
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nb.BtsI_TL
<400> 280
aaccggtgta atcgtgacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgtc actccctcac 120
cggtt 125
<210> 281
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nt.AlwI_BL
<400> 281
aaccggtgta atcgctaggc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgccta gctccctcac 120
cggtt 125
<210> 282
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nt.AlwI_BL
<400> 282
aaccggtgtc ctagatacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgta tctaggtcac 120
cggtt 125
<210> 283
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nt.BbvCI_TL
<400> 283
aaccggtgta atcgactccc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgggag tcgccctcac 120
cggtt 125
<210> 284
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nt.BbvCI_BL
<400> 284
aaccggtgta atggagtcgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgac tccccctcac 120
cggtt 125
<210> 285
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nt.BsmAI_TL
<400> 285
aaccggtgtc tctgatacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgta tcagagtcac 120
cggtt 125
<210> 286
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nt.BsmAI_BL
<400> 286
aaccggtgta acagagacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgtc tctgcctcac 120
cggtt 125
<210> 287
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nt.BspQI_TL
<400> 287
aaccggtgta atcttctcgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgag aagccctcac 120
cggtt 125
<210> 288
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nt.BspQI_BL
<400> 288
aaccggtgta atcgagaagc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcttc tcgccctcac 120
cggtt 125
<210> 289
<211> 127
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nt.BstNBI_TL
<400> 289
aaccggtgta atcgatacgc gctgagcgag tgagtgagcc gggacctctg gtttccagag 60
gtctgacggc cggagaccgg ccgtcccggc tcactcactc gctcagcgcg tatctccctc 120
accggtt 127
<210> 290
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV4_右_Nt.BstNBI_BL
<400> 290
aaccggtctc agcgatacgc gcgagcgagt gagtgagccg ggacctctgg tttccagagg 60
tctgacggcc ggagaccggc cgtcccggct cactcactcg ctcgcgcgta tctctgagac 120
cggtt 125
<210> 291
<211> 137
<212> DNA
<213> 腺相关病毒-5 (AAV5)
<400> 291
gagagggggg acagcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgctgtccc ccctctc 137
<210> 292
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nb.BbvCI_BL
<400> 292
gagaggggag tcggcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgccgactc ccctctc 137
<210> 293
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nb.BbvCI_TL
<400> 293
gagaggggcg actccgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcggagtcgc ccctctc 137
<210> 294
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nb.BsmI_BL
<400> 294
gagaggggct tacgcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgcgtaagc ccctctc 137
<210> 295
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nb.BsmI_TL
<400> 295
gagagggggg acagcgtaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
acgctgtccc ccctctc 137
<210> 296
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nb.BsrDI_BL
<400> 296
gagaggcgtt acagcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgctgtaac gcctctc 137
<210> 297
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nb.BsrDI_TL
<400> 297
gagagggggt aacgcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgcgttacc ccctctc 137
<210> 298
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nb.BssSI_BL
<400> 298
gagtgctcgg acagcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgctgtccg agcactc 137
<210> 299
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nb.BssSI_TL
<400> 299
gagagggagc acagcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgctgtgct ccctctc 137
<210> 300
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nb.BtsI_BL
<400> 300
gagaggcgtc acagcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgctgtgac gcctctc 137
<210> 301
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nb.BtsI_TL
<400> 301
gagaggggtg acggcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgccgtcac ccctctc 137
<210> 302
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nt.AlwI_BL
<400> 302
gagagggggg acagcgctag ggagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcccta 120
gcgctgtccc ccctctc 137
<210> 303
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nt.AlwI_BL
<400> 303
gagagggggc ctagcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgctaggcc ccctctc 137
<210> 304
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nt.BbvCI_TL
<400> 304
gagaggggcg actccgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcggagtcgc ccctctc 137
<210> 305
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nt.BbvCI_BL
<400> 305
gagaggggag tcggcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgccgactc ccctctc 137
<210> 306
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nt.BsmAI_TL
<400> 306
gagagggggc tctgcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgcagagcc ccctctc 137
<210> 307
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nt.BsmAI_BL
<400> 307
gagagggggc agagcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgctctgcc ccctctc 137
<210> 308
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nt.BspQI_TL
<400> 308
gagagggctt ctcgcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgcgagaag ccctctc 137
<210> 309
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nt.BspQI_BL
<400> 309
gagagggcga gaagcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgcttctcg ccctctc 137
<210> 310
<211> 139
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nt.BstNBI_TL
<400> 310
gagagggggg acagcgctga gcgagcgagc gaccgagcaa acccccccac cgtcgagttt 60
ctcgacggtc tgctgccggg agaccggcag cgggggggtt tgctcggtcg ctcgctcgct 120
cagcgctgtc ccccctctc 139
<210> 311
<211> 137
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV5_Nt.BstNBI_BL
<400> 311
gagagggggc tcagcgcaag cgagcgagcg accgagcaaa cccccccacc gtcgagtttc 60
tcgacggtct gctgccggga gaccggcagc gggggggttt gctcggtcgc tcgctcgctt 120
gcgctgagcc ccctctc 137
<210> 312
<211> 125
<212> DNA
<213> 腺相关病毒-7 (AAV7)
<400> 312
aaccggtgag ggagatacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcgta tctccctcac 120
cggtt 125
<210> 313
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nb.BbvCI_BL
<400> 313
aaccggtgag ggggagtcgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcgac tccccctcac 120
cggtt 125
<210> 314
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nb.BbvCI_TL
<400> 314
aaccggtgag ggcgactccc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgggag tcgccctcac 120
cggtt 125
<210> 315
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nb.BsmI_BL
<400> 315
aaccggtgag ggacttacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcgta agtccctcac 120
cggtt 125
<210> 316
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nb.BsmI_TL
<400> 316
aaccggtgag ggagatacgc gtaagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg cttacgcgta tctccctcac 120
cggtt 125
<210> 317
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nb.BsrDI_BL
<400> 317
aaccggtgag ggcgttacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcgta acgccctcac 120
cggtt 125
<210> 318
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nb.BsrDI_TL
<400> 318
aaccggtgag ggagtaacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcgtt actccctcac 120
cggtt 125
<210> 319
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nb.BssSI_BL
<400> 319
aaccggtgct cgagatacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcgta tctcgagcac 120
cggtt 125
<210> 320
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nb.BssSI_TL
<400> 320
aaccggtgag ggagcaccgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcggt gctccctcac 120
cggtt 125
<210> 321
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nb.BtsI_BL
<400> 321
aaccggtgag ggcgtcacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcgtg acgccctcac 120
cggtt 125
<210> 322
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nb.BtsI_TL
<400> 322
aaccggtgag ggagtgacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcgtc actccctcac 120
cggtt 125
<210> 323
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nt.AlwI_BL
<400> 323
aaccggtgag ggagctaggc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgccta gctccctcac 120
cggtt 125
<210> 324
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nt.AlwI_BL
<400> 324
aaccggtgac ctagatacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcgta tctaggtcac 120
cggtt 125
<210> 325
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nt.BbvCI_TL
<400> 325
aaccggtgag ggcgactccc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgggag tcgccctcac 120
cggtt 125
<210> 326
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nt.BbvCI_BL
<400> 326
aaccggtgag ggggagtcgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcgac tccccctcac 120
cggtt 125
<210> 327
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nt.BsmAI_TL
<400> 327
aaccggtgac tctgatacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcgta tcagagtcac 120
cggtt 125
<210> 328
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nt.BsmAI_BL
<400> 328
aaccggtgag gcagagacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcgtc tctgcctcac 120
cggtt 125
<210> 329
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nt.BspQI_TL
<400> 329
aaccggtgag ggcttctcgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcgag aagccctcac 120
cggtt 125
<210> 330
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nt.BspQI_BL
<400> 330
aaccggtgag ggcgagaagc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcttc tcgccctcac 120
cggtt 125
<210> 331
<211> 127
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nt.BstNBI_TL
<400> 331
aaccggtgag ggagatacgc gctgagcgag cgagccaccc cggacgcctg gtttccaggc 60
gtctgccgtc tcgagacgag acggccgggg tggctcgctc gctcagcgcg tatctccctc 120
accggtt 127
<210> 332
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV7_Nt.BstNBI_BL
<400> 332
aaccgctcag ggagatacgc gcgagcgagc gagccacccc ggacgcctgg tttccaggcg 60
tctgccgtct cgagacgaga cggccggggt ggctcgctcg ctcgcgcgta tctccctgag 120
cggtt 125
<210> 333
<211> 121
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工 ITR 333
<400> 333
ggccactccc gaagagcgcg ctcgctatct cactgaggcc gggcgaccaa aggtcgcccg 60
acgcccgggc tttgcccggg cggcctcagt gagatagcga gcgcgctctt cgggagtggc 120
c 121
<210> 334
<211> 1656
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 构建体 3
<400> 334
tgcgcgactc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 60
gcccgggcgg cctcagtgag cgagcgagtc gcgcagagag gttaaaacca actagacaac 120
tttgtatatc tagagtaacg ccattttgca aggcatggaa aaataccaaa ccaagaatag 180
agaagttcag atcaagggcg ggtacatgaa aatagctaac gttgggccaa acaggatatc 240
tgcggtgagc agtttcggcc ccggcccggg gccaagaaca gatggtcacc gcagtttcgg 300
ccccggcccg aggccaagaa cagatggtcc ccagatatgg cccaaccctc agcagtttct 360
taagacccat cagatgtttc caggctcccc caaggacctg aaatgaccct gcgccttatt 420
tgaattaacc aatcagcctg cttctcgctt ctgttcgcgc gcttctgctt cccgagctct 480
ataaaagagc tcacaacccc tcactcggcg cgccagtcct ccgattgact gagtgcggcc 540
gcggcaggct gccaccatgg aaaccgatac actgctgctt tgggtacttt tgctgtgggt 600
gcccggcagt acgggcgacg ccgcacaacc agctaggaga gcagtccgga gcctggtccc 660
ctcttccgag gccgaggctg aacggggaaa gctgccaggc aagaaactcc ccttagaggt 720
tctcatcgag ctggaagcaa acgcacgcaa ggccggttgc actaggggct gcctcatctg 780
cctcagcaag atcaaatgta cagcaaagat gaagaagtat attcctggcc gctgtgcaga 840
ctacggaggc gacaaaaaaa caggacaagc tggtatagtt ggcgccatcg tagatatccc 900
cgagattagt gggttcaagg aaatggagcc aatggagcaa ttcattgcac aggttgatag 960
atgtgcggat tgcactactg gttgccttaa gggcttggcg aatgtcaagt gtagtgatct 1020
tctgaaaaag tggctacccg gccggtgtgc caccttcgct gacaaaatac agagcgaagt 1080
cgacaatatt aaaggacttg ccggggacta atgatagtga cacaaagtga cgcgtcctag 1140
agctcgcact gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc 1200
cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc 1260
gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg 1320
ggaggattgg gaagagaata gcaggcatgc tggggagggc gctagcgcag gaaccccttt 1380
taatggagtt ggcgagtccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 1440
aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagag 1500
atcgactcct cggccacttg gaggggccgg ggggacgacg caatctggag tggaaagaac 1560
ccccgtctat gcggcttaaa gcacggccag ggaatagtgg atcaagtgta ctgacatgtg 1620
ccggagtccc tccatgccca gatcgactcc ctcgag 1656
<210> 335
<211> 6433
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DNA 构建体 335
<400> 335
gttcgagatc gctcttcaga agagcgcgga gtcacattcg cgactcgcaa tgcattgcag 60
ggcgagggcg agggccgccc ctacgagggc cacaacaccg tgaagctgaa ggtgaccaag 120
ggcggccccc tgcccttcgc ctgggacatc ctgtcccccc agttccagta cggctccaag 180
gtgtacgtga agcaccccgc cgacatccca gctcggtagc cacctgacgt cgctcttcgc 240
gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg 300
gcggcctcag tgagcgagcg agcgcgaaga gcgggagtga gtggccaaaa agtacccggc 360
cagaaaggaa ccgtaaaacc aactagacag ccggtgactt tgttccccag ctcggttcat 420
tctcaagcct cagacaggag aaccgggact agtatatgag ctccggtgcc cgtcagtggg 480
cagagcgcac atcgcccaca gtccccgaga agttgggggg aggggtcggc aattgaaccg 540
gtgcctagag aaggtggcgc ggggtaaact gggaaagtga tgtcgtgtac tggctccgcc 600
tttttcccga gggtggggga gaaccgtata taagtgcagt agtcgccgtg aacgttcttt 660
ttcgcaacgg gtttgccgcc agaacacagg taagtgccgt gtgtggttcc cgcgggcctg 720
gcctctttac gggttatggc ccttgcgtgc cttgaattac ttccacgccc ctggctgcag 780
tacgtgattc ttgatcccga gcttcgggtt ggaagtgggt gggagagttc gaggccttgc 840
gcttaaggag ccccttcgcc tcgtgcttga gttgaggcct ggcctgggcg ctggggccgc 900
cgcgtgcgaa tctggtggca ccttcgcgcc tgtctcgctg ctttcgataa gtctctagcc 960
atttaaaatt tttgatgacc tgctgcgacg ctttttttct ggcaagatag tcttgtaaat 1020
gcgggccaag atcgatctgc acactggtat ttcggttttt ggggccgcgg gcggcgacgg 1080
ggcccgtgcg tcccagcgca catgttcggc gaggcggggc ctgcgagcgc ggccaccgag 1140
aatcggacgg gggtagtctc aagctggccg gcctgctctg gtgcctggcc tcgcgccgcc 1200
gtgtatcgcc ccgccctggg cggcaaggct ggcccggtcg gcaccagttg cgtgagcgga 1260
aagatggccg cttcccggcc ctgctgcagg gagctcaaaa tggaggacgc ggcgctcggg 1320
agagcgggcg ggtgagacac ccacacaaag gaaaagggcc tttccgtcct cagccgtcgc 1380
ttcatgtgac accacggagt accgggcgcc gtccaggcac ctcgattagt tctcgatcga 1440
gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg gagtttcccc 1500
acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa ttctccttgg 1560
aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca gtggttcaaa 1620
gtttttttct tccatttcag gtgtcgtgag cggccgcggc aggctgccac catggaggat 1680
gccaagaata ttaagaaagg ccctgcccca ttctaccctc tggaagatgg cactgctggt 1740
gagcaactgc acaaggccat gaagaggtat gccctggtcc ctggcacaat tgccttcact 1800
gatgctcaca ttgaggtgga catcacctat gctgaatact ttgagatgtc tgtgaggctg 1860
gcagaagcca tgaaaagata tggactgaac accaaccaca ggattgtggt gtgctctgag 1920
aactctctcc agttcttcat gcctgtgttg ggagccctgt tcattggagt ggctgtggcc 1980
cctgccaatg acatctacaa tgagagagag ctcctgaaca gcatgggcat cagccagcca 2040
actgtggtct ttgtgagcaa gaagggcctg caaaagatcc tgaatgtgca gaagaagctg 2100
cccatcatcc agaagatcat catcatggac agcaagactg actaccaggg cttccagagc 2160
atgtatacct ttgtgaccag ccacctcccc cctggcttca atgagtatga ctttgtgcct 2220
gagagctttg acagggacaa gacaattgct ctgattatga acagctctgg ctccactgga 2280
ctgcccaaag gtgtggctct gccccacaga actgcttgtg tgagattcag ccatgccaga 2340
gaccccatct ttggcaacca gatcatccct gacactgcca tcctgtctgt ggttccattc 2400
catcatggct ttggcatgtt cacaacactg gggtacctga tctgtggctt cagagtggtg 2460
ctgatgtata ggtttgagga ggagctgttt ctgaggagct tgcaagacta caagatccag 2520
tctgccctgc tggtgcccac tctgttcagc ttctttgcca agagcaccct cattgacaag 2580
tatgacctga gcaacctgca tgagattgcc tctggaggag cacccctgag caaggaggtg 2640
ggtgaggctg tggcaaagag gttccatctc ccaggaatca gacagggcta tggcctgact 2700
gagaccacct ctgccatcct catcacccct gaaggagatg acaagcctgg tgctgtgggc 2760
aaggtggttc ccttttttga ggccaaggtg gtggacctgg acactggcaa gaccctggga 2820
gtgaaccaga ggggtgagct gtgtgtgagg ggtcccatga tcatgtctgg ctatgtgaac 2880
aaccctgagg ccaccaatgc cctgattgac aaggatggct ggctgcactc tggtgatatt 2940
gcctactggg atgaggatga gcactttttc attgtggaca ggctgaagag tctcatcaag 3000
tacaaaggct accaagtggc acctgctgag cttgagagca tcctgctcca gcaccccaac 3060
atctttgatg ctggtgtggc tggcctgcct gatgatgatg ctggagagct gcctgctgct 3120
gttgtggttc tggagcatgg aaagaccatg actgagaagg agattgtgga ctatgtggcc 3180
agtcaggtga ccactgccaa gaagctgagg ggaggtgtgg tgtttgtgga tgaggtgcca 3240
aagggtctga ctggcaagct ggatgccaga aagatcagag agatcctgat caaggccaag 3300
aagggaggaa agattgcagt ttaaggatcc tgacacaaag tgacgcgtaa tcaacctctg 3360
gattacaaaa tttgtgaaag attgactggt attcttaact atgttgctcc ttttacgcta 3420
tgtggatacg ctgctttaat gcctttgtat catgctattg cttcccgtat ggctttcatt 3480
ttctcctcct tgtataaatc ctggttgctg tctctttatg aggagttgtg gcccgttgtc 3540
aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg ttggggcttt 3600
gccaccacct gtcagctcct ttccgggact ttcgctttcc ccctccctat tgccacggcg 3660
gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt gggcactgac 3720
aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc 3780
acctggattc tgcgcgggac gtccttctgc tacgtccctt cggccctcaa tccagcggac 3840
cttccttccc gcggcctgct gccggctctg cggcctcttc cgcgtcttcg ccttcgccct 3900
cagacgagtc ggatctccct ttgggccgcc tccccgcacg cgtcctagag ctcgcactgt 3960
gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga 4020
aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag 4080
taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga 4140
agagaatagc aggcatgctg gggagggcgc tagcgcaggg ggaccccaag tgacgattga 4200
accccgattc aggtacccat tggaaatttt aatggagtaa cataactgct ggagtagatg 4260
aagaacctct tggccactcc gctcccgaag agcgcactcg ctcgctcggt ggggcctggc 4320
gaccaaaggt cgccagacgg acgtgctttg cacgtccggc cccaccgagc gagcgagtgc 4380
gctcttcggg ccacttggag gggccggggg gacgacgcaa tctggagtgg aaagaacccc 4440
cgtctatgcg gcttaaagca cggccaggga atagtggatc aagtgtactg acatgtgccg 4500
gcaatgcatt gcgtcccgag tcacattcgc gactctcgac gctcttcaga agagcagctt 4560
agcttcaata gctcaatgat atcggaaaga acatgtgagc aaaaggccag caaaaggcca 4620
ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc 4680
atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc 4740
aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg 4800
gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta 4860
ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg 4920
ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac 4980
acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag 5040
gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat 5100
ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat 5160
ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc 5220
gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt 5280
ggaacgaaaa ctcacgttaa ggggctcttc agaagagcga gtcacattcg cgactctgca 5340
atgcattgcc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 5400
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 5460
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 5520
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 5580
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 5640
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 5700
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 5760
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 5820
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 5880
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 5940
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 6000
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 6060
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 6120
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 6180
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 6240
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 6300
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 6360
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 6420
tccccgaaaa gta 6433
<210> 336
<211> 125
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CpG排除序列
<400> 336
ttggtcactc cctctctgta cactcactca ctcactgatc cctggatacc aaaggtatcc 60
agacacccag tctttgactg ggtgggatca gtgagtgagt gagtgtacag agagggagtg 120
accaa 125
<210> 337
<211> 6545
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 构建体 337
<400> 337
gttcgagatc gctcttcaga agagcgcgga gtcacattcg cgactcgcaa tgcattgcag 60
ggcgagggcg agggccgccc ctacgagggc cacaacaccg tgaagctgaa ggtgaccaag 120
ggcggccccc tgcccttcgc ctgggacatc ctgtcccccc agttccagta cggctccaag 180
gtgtacgtga agcaccccgc cgacatccca gctcggtagc cacctgacgt cgctcttcgg 240
tggttgtaca gacgccatct tggaatccaa tatgtctgcc ggctcagtca tgcctgcgct 300
gcgcgcagcg cgctgcgcgc gcgcatgatc taatcgccgg cagacatatt ggattccaag 360
atggcgtctg tacaaccacc gaagagcgga gtggccaaaa agtacccggc cagaaaggaa 420
ccgtaaaacc aactagacag ccggtgactt tgttccccag ctcggttcat tctcaagcct 480
cagacaggag aaccgggact agtatatgag ctccggtgcc cgtcagtggg cagagcgcac 540
atcgcccaca gtccccgaga agttgggggg aggggtcggc aattgaaccg gtgcctagag 600
aaggtggcgc ggggtaaact gggaaagtga tgtcgtgtac tggctccgcc tttttcccga 660
gggtggggga gaaccgtata taagtgcagt agtcgccgtg aacgttcttt ttcgcaacgg 720
gtttgccgcc agaacacagg taagtgccgt gtgtggttcc cgcgggcctg gcctctttac 780
gggttatggc ccttgcgtgc cttgaattac ttccacgccc ctggctgcag tacgtgattc 840
ttgatcccga gcttcgggtt ggaagtgggt gggagagttc gaggccttgc gcttaaggag 900
ccccttcgcc tcgtgcttga gttgaggcct ggcctgggcg ctggggccgc cgcgtgcgaa 960
tctggtggca ccttcgcgcc tgtctcgctg ctttcgataa gtctctagcc atttaaaatt 1020
tttgatgacc tgctgcgacg ctttttttct ggcaagatag tcttgtaaat gcgggccaag 1080
atcgatctgc acactggtat ttcggttttt ggggccgcgg gcggcgacgg ggcccgtgcg 1140
tcccagcgca catgttcggc gaggcggggc ctgcgagcgc ggccaccgag aatcggacgg 1200
gggtagtctc aagctggccg gcctgctctg gtgcctggcc tcgcgccgcc gtgtatcgcc 1260
ccgccctggg cggcaaggct ggcccggtcg gcaccagttg cgtgagcgga aagatggccg 1320
cttcccggcc ctgctgcagg gagctcaaaa tggaggacgc ggcgctcggg agagcgggcg 1380
ggtgagacac ccacacaaag gaaaagggcc tttccgtcct cagccgtcgc ttcatgtgac 1440
accacggagt accgggcgcc gtccaggcac ctcgattagt tctcgatcga gcttttggag 1500
tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg gagtttcccc acactgagtg 1560
ggtggagact gaagttaggc cagcttggca cttgatgtaa ttctccttgg aatttgccct 1620
ttttgagttt ggatcttggt tcattctcaa gcctcagaca gtggttcaaa gtttttttct 1680
tccatttcag gtgtcgtgag cggccgcggc aggctgccac catggaggat gccaagaata 1740
ttaagaaagg ccctgcccca ttctaccctc tggaagatgg cactgctggt gagcaactgc 1800
acaaggccat gaagaggtat gccctggtcc ctggcacaat tgccttcact gatgctcaca 1860
ttgaggtgga catcacctat gctgaatact ttgagatgtc tgtgaggctg gcagaagcca 1920
tgaaaagata tggactgaac accaaccaca ggattgtggt gtgctctgag aactctctcc 1980
agttcttcat gcctgtgttg ggagccctgt tcattggagt ggctgtggcc cctgccaatg 2040
acatctacaa tgagagagag ctcctgaaca gcatgggcat cagccagcca actgtggtct 2100
ttgtgagcaa gaagggcctg caaaagatcc tgaatgtgca gaagaagctg cccatcatcc 2160
agaagatcat catcatggac agcaagactg actaccaggg cttccagagc atgtatacct 2220
ttgtgaccag ccacctcccc cctggcttca atgagtatga ctttgtgcct gagagctttg 2280
acagggacaa gacaattgct ctgattatga acagctctgg ctccactgga ctgcccaaag 2340
gtgtggctct gccccacaga actgcttgtg tgagattcag ccatgccaga gaccccatct 2400
ttggcaacca gatcatccct gacactgcca tcctgtctgt ggttccattc catcatggct 2460
ttggcatgtt cacaacactg gggtacctga tctgtggctt cagagtggtg ctgatgtata 2520
ggtttgagga ggagctgttt ctgaggagct tgcaagacta caagatccag tctgccctgc 2580
tggtgcccac tctgttcagc ttctttgcca agagcaccct cattgacaag tatgacctga 2640
gcaacctgca tgagattgcc tctggaggag cacccctgag caaggaggtg ggtgaggctg 2700
tggcaaagag gttccatctc ccaggaatca gacagggcta tggcctgact gagaccacct 2760
ctgccatcct catcacccct gaaggagatg acaagcctgg tgctgtgggc aaggtggttc 2820
ccttttttga ggccaaggtg gtggacctgg acactggcaa gaccctggga gtgaaccaga 2880
ggggtgagct gtgtgtgagg ggtcccatga tcatgtctgg ctatgtgaac aaccctgagg 2940
ccaccaatgc cctgattgac aaggatggct ggctgcactc tggtgatatt gcctactggg 3000
atgaggatga gcactttttc attgtggaca ggctgaagag tctcatcaag tacaaaggct 3060
accaagtggc acctgctgag cttgagagca tcctgctcca gcaccccaac atctttgatg 3120
ctggtgtggc tggcctgcct gatgatgatg ctggagagct gcctgctgct gttgtggttc 3180
tggagcatgg aaagaccatg actgagaagg agattgtgga ctatgtggcc agtcaggtga 3240
ccactgccaa gaagctgagg ggaggtgtgg tgtttgtgga tgaggtgcca aagggtctga 3300
ctggcaagct ggatgccaga aagatcagag agatcctgat caaggccaag aagggaggaa 3360
agattgcagt ttaaggatcc tgacacaaag tgacgcgtaa tcaacctctg gattacaaaa 3420
tttgtgaaag attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg 3480
ctgctttaat gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct 3540
tgtataaatc ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg 3600
gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg ttggggcttt gccaccacct 3660
gtcagctcct ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg 3720
ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg 3780
tgttgtcggg gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc 3840
tgcgcgggac gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc 3900
gcggcctgct gccggctctg cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc 3960
ggatctccct ttgggccgcc tccccgcacg cgtcctagag ctcgcactgt gccttctagt 4020
tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 4080
cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 4140
tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agagaatagc 4200
aggcatgctg gggagggcgc tagcgcaggg ggaccccaag tgacgattga accccgattc 4260
aggtacccat tggaaatttt aatggagtaa cataactgct ggagtagatg aagaacctct 4320
tggccactcc gttgcttatg caatcgcgaa actctatatc ttgctcttct taatgtgttg 4380
ttgttgtaca tgcgccatct tagttttata tcagctggcg ccttagttat ataacatgca 4440
tgttatataa ctaaggcgcc agctgatata aaactaagat ggcgcatgta caacaacaac 4500
acattaagaa gagcgccggg gggacgacgc aatctggagt ggaaagaacc cccgtctatg 4560
cggcttaaag cacggccagg gaatagtgga tcaagtgtac tgacatgtgc cggcaatgca 4620
ttgcgtcccg agtcacattc gcgactctcg acgctcttca gaagagcagc ttagcttcaa 4680
tagctcaatg atatcggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 4740
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 4800
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 4860
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 4920
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 4980
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 5040
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 5100
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 5160
acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc 5220
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 5280
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 5340
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 5400
aactcacgtt aaggggctct tcagaagagc gagtcacatt cgcgactctg caatgcattg 5460
ccatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta 5520
aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 5580
aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg 5640
tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc 5700
gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg 5760
agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg 5820
aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag 5880
gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat 5940
caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc 6000
cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc 6060
ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa 6120
ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac 6180
gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt 6240
cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc 6300
gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa 6360
caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca 6420
tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat 6480
acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa 6540
aagta 6545
<210> 338
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 适体 (图5)
<400> 338
atccggcttt aaacgggcaa ctgcgtctca ttcacgttag agactacaac cgtcggat 58
Claims (101)
1.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列或其片段的顶部链5'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列或其片段的顶部链3'悬突。
2.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列的底部链3'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列的底部链5'悬突。
3.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列的顶部链5'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列的底部链5'悬突。
4.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一反向重复序列,其中切口核酸内切酶的第一和第二限制性位点布置在邻近所述第一反向重复序列的相对链上,从而在所述第一反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第一反向重复序列的底部链3'悬突;
b.表达盒;和
c.第二反向重复序列,其中切口核酸内切酶的第三和第四限制性位点布置在邻近所述第二反向重复序列的相对链上,从而在所述第二反向重复序列的顶部链与底部链分离时,切口导致产生了包含所述第二反向重复序列的顶部链3'悬突。
5.根据权利要求1至4中任一项所述的双链DNA分子,其中所述双链DNA分子是分离的DNA分子。
6.根据权利要求1至5中任一项所述的双链DNA分子,其中所述切口核酸内切酶的第一、第二、第三和第四限制性位点均为相同切口核酸内切酶的限制性位点。
7.根据权利要求1至5中任一项所述的双链DNA分子,其中所述第一和所述第二反向重复序列是相同的。
8.根据权利要求1至5中任一项所述的双链DNA分子,其中所述第一和/或所述第二反向重复序列是细小病毒的ITR。
9.根据权利要求1至5中任一项所述的双链DNA分子,其中所述第一和/或所述第二反向重复序列是细小病毒的修饰的ITR。
10.根据权利要求8或9所述的双链DNA分子,其中所述细小病毒是依赖细小病毒、博卡细小病毒、红系细小病毒、原细小病毒或者四细小病毒。
11.根据权利要求9所述的双链DNA分子,其中所述修饰的ITR的核苷酸序列与细小病毒的ITR至少50%、60%、70%、80%、90%、95%、98%或至少99%相同。
12.根据权利要求1或5所述的双链DNA分子,其中
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
其中所述第一切口和所述第四切口是顶部链上的两个产生的切口,其中所述第一切口是更接近于顶部链的5'端的切口,所述第四切口是更接近于顶部链的3'端的切口,并且其中所述第二切口和所述第三切口是底部链上的两个产生的切口,其中所述第三切口是更接近于底部链的5'端的切口,所述第二切口是更接近于底部链的3'端的切口。
13.根据权利要求2或5所述的双链DNA分子,其中
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
其中所述第一切口和所述第四切口是顶部链上的两个产生的切口,其中所述第一切口是更接近于顶部链的5'端的切口,所述第四切口是更接近于顶部链的3'端的切口,并且其中所述第二切口和所述第三切口是底部链上的两个产生的切口,其中所述第三切口是更接近于底部链的5'端的切口,所述第二切口是更接近于底部链的3'端的切口。
14.根据权利要求3或5所述的双链DNA分子,其中
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
其中所述第一切口和所述第四切口是顶部链上的两个产生的切口,其中所述第一切口是更接近于顶部链的5'端的切口,所述第四切口是更接近于顶部链的3'端的切口,并且其中所述第二切口和所述第三切口是底部链上的两个产生的切口,其中所述第三切口是更接近于底部链的5'端的切口,所述第二切口是更接近于底部链的3'端的切口。
15.根据权利要求4或5所述的双链DNA分子,其中
a.所述第一切口在距所述第一反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
b.所述第二切口在距所述第一反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
c.所述第三切口在距所述第二反向重复序列的ITR封闭碱基对的5'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;和/或
d.所述第四切口在距所述第二反向重复序列的ITR封闭碱基对的3'核苷酸1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸内;
其中所述第一切口和所述第四切口是顶部链上的两个产生的切口,其中所述第一切口是更接近于顶部链的5'端的切口,所述第四切口是更接近于顶部链的3'端的切口,并且其中所述第二切口和所述第三切口是底部链上的两个产生的切口,其中所述第三切口是更接近于底部链的5'端的切口,所述第二切口是更接近于底部链的3'端的切口。
16.根据权利要求12至15中任一项所述的双链DNA分子,其中所述第一切口、所述第二切口、所述第三切口和/或所述第四切口位于所述反向重复序列内。
17.根据权利要求12至15中任一项所述的双链DNA分子,其中所述第一切口、所述第二切口、所述第三切口和/或所述第四切口位于所述反向重复序列外。
18.根据以上权利要求中任一项所述的双链DNA分子,其中所述双链DNA分子是质粒。
19.根据权利要求18所述的双链DNA分子,其中所述质粒还包含细菌复制起点。
20.根据权利要求18所述的双链DNA分子,其中所述质粒还包含位于所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的限制性内切酶位点,其中所述第一反向重复序列、第二反向重复序列和所述第一和第二反向重复序列之间的区域中的任一个中均不存在所述限制性内切酶位点。
21.根据权利要求20所述的双链DNA分子,其中用所述限制性内切酶切割导致产生了在有利于所述第一和/或第二反向重复序列退火的条件下在可检测水平不退火的单链悬突。
22.根据权利要求20所述的双链DNA分子,其中所述质粒还包含编码所述限制性内切酶的开放阅读框。
23.根据权利要求22所述的双链DNA分子,其中所述限制性内切酶的表达受诱导型启动子控制。
24.根据权利要求18所述的双链DNA分子,其中所述质粒还包含位于所述第一反向重复序列5'端区域和所述第二反向重复序列3'端区域中的切口核酸内切酶的第五和第六限制性位点,其中所述切口核酸内切酶的第五和第六限制性位点:
a.位于相对链;和
b.在所述双链DNA分子中产生断裂,从而所述断裂的单链悬突在有利于所述第一和/或第二反向重复序列退火的条件下在可检测水平分子间或分子内不退火。
25.根据权利要求24所述的双链DNA分子,其中所述第五和第六切口相隔1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。
26.根据权利要求24所述的双链DNA分子,其中所述切口核酸内切酶的第一、第二、第三、第四、第五和第六限制性位点均为相同切口核酸内切酶的靶标序列。
27.根据以上权利要求中任一项所述的双链DNA分子,其中所述切口核酸内切酶位点中的一种或多种是内源切口核酸内切酶的靶标序列。
28.根据权利要求24至27中任一项所述的双链DNA分子,其中所述质粒还包含识别切口核酸内切酶的第一、第二、第三、第四、第五和/或第六限制性位点的编码切口核酸内切酶的开放阅读框。
29.根据权利要求28所述的双链DNA分子,其中所述切口核酸内切酶的表达受诱导型启动子控制。
30.根据权利要求1至29中任一项所述的双链DNA分子,其中识别切口核酸内切酶的第一、第二、第三和/或第四限制性位点的切口核酸内切酶是Nt.BsmAI;Nt.BtsCI;N.ALwl;N.BstNBI;N.BspD6I;Nb.Mva1269I;Nb.BsrDI;Nt.BtsI;Nt.BsaI;Nt.Bpu10I;Nt.BsmBI;Nb.BbvCI;Nt.BbvCI;或Nt.BspQI。
31.根据权利要求24所述的双链DNA分子,其中识别切口核酸内切酶的第五和第六限制性位点的切口核酸内切酶为:Nt.BsmAI;Nt.BtsCI;N.ALwl;N.BstNBI;N.BspD6I;Nb.Mva1269I;Nb.BsrDI;Nt.BtsI;Nt.BsaI;Nt.Bpu10I;Nt.BsmBI;Nb.BbvCI;Nt.BbvCI;或Nt.BspQI。
32.根据权利要求1至31中任一项所述的双链DNA分子,其中所述表达盒包含可操作性连接至转录单元的启动子。
33.根据权利要求32所述的双链DNA分子,其中所述转录单元包含开放阅读框。
34.根据权利要求32或33所述的双链DNA分子,其中所述表达盒还包含转录后调控元件。
35.根据权利要求32或33所述的双链DNA分子,其中所述表达盒还包含多腺苷酸化和终止信号。
36.根据权利要求32至35中任一项所述的双链DNA分子,其中所述表达盒的大小为至少4kb、至少4.5kb、至少5kb、至少5.5kb、至少6kb、至少6.5kb、至少7kb、至少7.5kb、至少8kb、至少8.5kb、至少9kb、至少9.5kb或者至少10kb。
37.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述底部链的切口;
c.表达盒;
d.所述底部链的切口;和
e.第二发夹反向重复序列。
38.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述顶部链的切口;
c.表达盒;
d.所述顶部链的切口;和
e.第二发夹反向重复序列。
39.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述底部链的切口;
c.表达盒;
d.所述顶部链的切口;和
e.第二发夹反向重复序列。
40.双链DNA分子,其在顶部链的5'至3'方向上包含:
a.第一发夹反向重复序列;
b.所述顶部链的切口;
c.表达盒;
d.所述底部链的切口;和
e.第二发夹反向重复序列。
41.根据权利要求37至40中任一项所述的双链DNA分子,其是分离的DNA分子。
42.根据权利要求37至41中任一项所述的双链DNA分子,其中所述第一和/或所述第二反向重复序列是细小病毒的ITR。
43.根据权利要求37至41中任一项所述的双链DNA分子,其中所述第一和所述第二反向重复序列是相同的。
44.根据权利要求37至41中任一项所述的双链DNA分子,其中所述第一和/或所述第二反向重复序列是细小病毒的修饰的ITR。
45.根据权利要求42或44所述的双链DNA分子,其中所述细小病毒是依赖细小病毒、博卡细小病毒、红系细小病毒、原细小病毒或者四细小病毒。
46.根据权利要求45所述的双链DNA分子,其中所述修饰的ITR的核苷酸序列与细小病毒的ITR至少50%、60%、70%、80%、90%、95%、98%或至少99%相同。
47.根据权利要求37至46中任一项所述的双链DNA分子,其中所述表达盒包含可操作性连接至转录单元的启动子。
48.根据权利要求47所述的双链DNA分子,其中所述转录单元包含开放阅读框。
49.根据权利要求47或48所述的双链DNA分子,其中所述表达盒还包含转录后调控元件。
50.根据权利要求47或48所述的双链DNA分子,其中所述表达盒还包含多腺苷酸化和终止信号。
51.根据权利要求37至50中任一项所述的双链DNA分子,其中所述表达盒的大小为至少4kb、至少4.5kb、至少5kb、至少5.5kb、至少6kb、至少6.5kb、至少7kb、至少7.5kb、至少8kb、至少8.5kb、至少9kb、至少9.5kb或者至少10kb。
52.根据权利要求37至51中任一项所述的双链DNA分子,其中保护所述双链DNA分子抵抗核酸外切酶降解,任选地其中所述核酸外切酶是RecBCD核酸外切酶。
53.根据以上权利要求中任一项所述的双链DNA分子,其中所述双链DNA分子缺少至少一种复制-相关蛋白结合序列(“RABS”)。
54.根据以上权利要求中任一项所述的双链DNA分子,其中所述双链DNA分子缺少复制-相关蛋白(“RAP”)编码序列。
55.根据以上权利要求中任一项所述的双链DNA分子,其中所述双链DNA分子缺少病毒衣壳蛋白编码序列。
56.根据以上权利要求中任一项所述的双链DNA分子,其中所述第一反向重复序列缺少至少一种RABS。
57.根据以上权利要求中任一项所述的双链DNA分子,其中所述第二反向重复序列缺少至少一种RABS。
58.根据以上权利要求中任一项所述的双链DNA分子,其中所述第一反向重复序列的ITR封闭碱基对和所述第二反向重复序列的ITR封闭碱基对之间的DNA序列缺少至少一种RABS。
59.根据以上权利要求中任一项所述的双链DNA分子,其中所述第一反向重复序列缺少至少一种RABS并且所述第二反向重复序列缺少至少一种RABS。
60.根据以上权利要求中任一项所述的双链DNA分子,其中所述双链DNA分子缺少末端解析位点(TRS)。
61.根据以上权利要求中任一项所述的双链DNA分子,其中所述第一反向重复序列缺少TRS。
62.根据以上权利要求中任一项所述的双链DNA分子,其中所述第二反向重复序列缺少TRS。
63.根据以上权利要求中任一项所述的双链DNA分子,其中所述第一反向重复序列的ITR封闭碱基对和所述第二反向重复序列的ITR封闭碱基对之间的DNA序列缺少TRS。
64.根据以上权利要求中任一项所述的双链DNA分子,其中所述第一反向重复序列缺少TRS并且所述第二反向重复序列缺少TRS。
65.根据权利要求53和56至64中任一项所述的双链DNA分子,其中当施用于宿主时,所述双链DNA分子的移动风险比具有至少一种RABS和/或具有TRS的对照DNA分子小100%、95%、90%、85%、80%、75%、70%、65%、60%、55%或50%。
66.根据权利要求53和56至64中任一项所述的双链DNA分子,其缺少TRS,其中当施用于宿主时,所述双链DNA分子的移动风险比具有TRS的对照DNA分子小100%、95%、90%、85%、80%、75%、70%、65%、60%、55%或50%。
67.根据权利要求53和56至64中任一项所述的双链DNA分子,其缺少至少一种RABS并且缺少TRS,其中当施用于宿主时,所述双链DNA分子的移动风险比具有至少一种RABS和TRS的对照DNA分子小100%、95%、90%、85%、80%、75%、70%、65%、60%、55%或50%。
68.根据权利要求5至67中任一项所述的分离的双链DNA分子,其中所述分离的双链DNA分子不含所述双链DNA分子的片段。
69.根据权利要求5至68中任一项所述的分离的双链DNA分子,其中所述双链DNA分子的片段不大于所述分离的双链DNA分子的1%、2%、3%、4%、5%、6%、7%、8%、9%或10%。
70.根据权利要求5至69中任一项所述的分离的双链DNA分子,其中所述分离的双链DNA分子不含非所述双链DNA分子片段的核酸污染物。
71.根据权利要求5至70中任一项所述的分离的双链DNA分子,其中非所述双链DNA分子片段的核酸污染物小于所述分离的双链DNA分子的1%、2%、3%、4%、5%、6%、7%、8%、9%或者10%。
72.根据权利要求5至71中任一项所述的分离的双链DNA分子,其中所述分离的双链DNA分子不含杆状病毒DNA。
73.根据权利要求5至72中任一项所述的分离的双链DNA分子,其中所述杆状病毒DNA小于所述分离的双链DNA分子的1%、2%、3%、4%、5%、6%、7%、8%、9%或10%。
74.递送媒介物,其包含根据权利要求37至73中任一项所述的双链DNA分子。
75.根据权利要求74所述的递送媒介物,其中所述递送媒介物包含杂交体、脂质体或脂质纳米颗粒。
76.制备具有发夹结构末端的DNA分子的方法,其中所述方法包括:
a.在导致所述双链DNA分子扩增的条件下培养包含根据权利要求1至35中任一项所述的双链DNA分子的宿主细胞;
b.从所述宿主细胞释放所述双链DNA分子;
c.将所述双链DNA分子与识别4个限制性位点的一种或多种切口核酸内切酶培育,从而导致产生4个切口;
d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;
e.将所述单链DNA悬突分子内退火并借此在步骤d所产生的DNA片段的两端产生发夹反向重复序列。
77.制备具有发夹结构末端的DNA的方法,其中所述方法包括:
a.在导致所述双链DNA分子扩增的条件下培养包含根据权利要求20所述的双链DNA分子的宿主细胞;
b.从所述宿主细胞释放所述双链DNA分子;
c.将所述双链DNA分子与识别4个限制性位点的一种或多种切口核酸内切酶培育,从而导致产生4个切口;
d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;
e.将所述单链DNA悬突分子内退火并借此在步骤d所产生的DNA片段的两端产生发夹反向重复序列;
f.将步骤d所产生的双链DNA分子或片段与所述限制性内切酶培育并借此切割所述双链DNA分子或所述双链DNA分子的片段;和
g.将所述双链DNA分子的片段与核酸外切酶培育,借此消化除步骤e所产生的片段之外的双链DNA分子片段。
78.制备具有发夹结构末端的DNA的方法,其中所述方法包括:
a.在导致所述双链DNA分子扩增的条件下培养包含根据权利要求24所述的双链DNA分子的宿主细胞;
b.从所述宿主细胞释放所述双链DNA分子;
c.将所述双链DNA分子与识别第一、第二、第三和第四限制性位点的一种或多种切口核酸内切酶培育,从而导致产生4个切口;
d.变性并借此产生包含表达盒并且侧接两个单链DNA悬突的DNA片段;
e.将所述单链DNA悬突分子内退火并借此在步骤d所产生的DNA片段的两端产生发夹反向重复序列;
f.将所述双链DNA分子或步骤d所产生的片段与识别第五和第六限制性位点的一种或多种切口核酸内切酶培育,从而导致在所述双链DNA分子中产生断裂;和
g.将所述双链DNA分子的片段与核酸外切酶培育,借此消化除步骤e所产生的片段之外的双链DNA分子片段。
79.根据权利要求76、77或78所述的方法,还包含:h.用连接酶修复所述切口以形成环状DNA。
80.根据权利要求76至79中任一项所述的方法,其中以其在权利要求中出现的顺序实施所述步骤。
81.根据权利要求76至80中任一项所述的方法,其中所述具有发夹结构末端的DNA由两个发夹结构末端组成。
82.根据权利要求76至81中任一项所述的方法,其中所述具有发夹结构末端的DNA是病毒基因组。
83.根据权利要求82所述的方法,其中所述病毒基因组是细小病毒基因组。
84.根据权利要求83所述的方法,其中所述细小病毒是依赖细小病毒、博卡细小病毒、红系细小病毒、原细小病毒或者四细小病毒。
85.根据权利要求1至73中任一项所述的DNA分子,根据权利要求74和75中任一项所述的递送媒介物,或根据权利要求76至83中任一项所述的方法,其中所述DNA分子:
a.缺少任何功能性RABS;和/或
b.缺少任何功能性TRS;和/或
c.缺少或具有降低的(降低至少50%、60%、70%、80%、90%、95%、98%、99%或至少99.9%)P5 AAV启动子活性;和/或
d.缺少病毒复制所需的任何其它元件。
86.根据权利要求85所述的DNA分子,其中
a.所述DNA分子中的任何RABS缺失或突变为功能非活性的;和/或
b.所述DNA分子中的任何TRS缺失或突变为功能非活性的;和/或
c.任何P5 AAV启动子缺失或突变为功能非活性的;和/或
d.所述DNA分子中病毒复制所需的任何其它元件缺失或突变为功能非活性的。
87.根据权利要求86所述的DNA分子,其中所述缺失仅限于RABS和/或TRS和/或任何P5AAV启动子和/或复制所需的任何其它元件,但是整个茎/环结构不会发生缺失。
88.根据权利要求85至87中任一项所述的DNA分子,其中当所述细胞还感染了从中来源所述DNA分子的ITR的野生型病毒和辅助病毒时,或者其中在这种测定中所述DNA分子的能力降低了至少50%、60%、70%、80%、90%、95%、98%、99%或至少99.9%时,所述DNA分子在细胞中不可检测地复制。
89.根据权利要求88所述的DNA分子,其中所述DNA分子来源于腺病毒相关病毒并且所述野生型病毒是相同的腺病毒相关病毒。
90.根据权利要求89所述的DNA分子,其中所述腺病毒相关病毒是AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAV8或AAV9。
91.根据权利要求1至73中任一项所述的DNA分子,根据权利要求74和75中任一项所述的递送媒介物,或根据权利要求76至83中任一项所述的方法,其中所述表达盒的顶部链的5'末端与所述反向重复序列的3’顶部链末端相隔约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约51、约52、约53、约54、约55、约56、约57、约58、约59、约60、约61、约62、约63、约64、约65、约66、约67、约68、约69、约70、约71、约72、约73、约74、约75、约76、约77、约78、约79、约80、约81、约82、约83、约84、约85、约86、约87、约88、约89、约90、约91、约92、约93、约94、约95、约96、约97、约98、约99、约100个核苷酸、大于100个核苷酸、至少150个核苷酸、至少200个核苷酸、至少300个核苷酸或至少400个核苷酸。
92.根据权利要求1至73中任一项所述的DNA分子,根据权利要求74和75中任一项所述的递送媒介物,或根据权利要求76至83中任一项所述的方法,其中所述表达盒的顶部链的3'末端与所述反向重复序列的5’顶部链末端相隔约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约51、约52、约53、约54、约55、约56、约57、约58、约59、约60、约61、约62、约63、约64、约65、约66、约67、约68、约69、约70、约71、约72、约73、约74、约75、约76、约77、约78、约79、约80、约81、约82、约83、约84、约85、约86、约87、约88、约89、约90、约91、约92、约93、约94、约95、约96、约97、约98、约99、约100个核苷酸、大于100个核苷酸、至少150个核苷酸、至少200个核苷酸、至少300个核苷酸或至少400个核苷酸。
93.根据权利要求37至73中任一项所述的DNA分子,根据权利要求74和75中任一项所述的递送媒介物,或根据权利要求76至83中任一项所述的方法,其中连接1、2、3或全部切口(如由切口核酸内切酶消化产生的切口)。
94.根据权利要求1、5至37和40至73中任一项所述的DNA分子,其中所述底部链相对于所述表达盒中的开放阅读框处于反义取向。
95.根据权利要求2、5至36、38和40至73所述的DNA分子,其中所述顶部链相对于所述表达盒中的开放阅读框处于反义取向。
96.根据权利要求77至84中任一项所述的方法,其中所述DNA分子是根据权利要求94或95所述的DNA分子。
97.DNA分子,其由根据权利要求77至84和96中任一项所述的方法产生。
98.根据权利要求1至73中任一项所述的DNA分子,根据权利要求74和75中任一项所述的递送媒介物,或根据权利要求76至83中任一项所述的方法,其中所述DNA分子:
a.包含缺少任何转录活性的第一反向重复序列;和/或
b.包含缺少任何转录活性的第二反向重复序列;和/或
c.(iii)缺少或具有降低的(降低至少50%、60%、70%、80%、90%、95%、98%、99%或至少99.9%)P5 AAV启动子活性。
99.根据权利要求1至73中任一项所述的DNA分子,根据权利要求74和75中任一项所述的递送媒介物,或根据权利要求76至83中任一项所述的方法,其中所述DNA分子:
a.包含缺少转录活性的第一反向重复序列;和/或
b.包含缺少转录活性的第二反向重复序列;和/或
c.缺少在所述反向重复序列中具有转录活性的任何其它元件。
100.根据权利要求1至73中任一项所述的DNA分子,根据权利要求74和75中任一项所述的递送媒介物,或根据权利要求76至83中任一项所述的方法,其中所述DNA分子:
a.在所述第一反向重复序列中任何CpG基序缺失或突变为转录非活性的;和/或
b.在所述第二反向重复序列中任何CpG基序缺失或突变为转录非活性的;和/或
c.所述反向重复序列中转录活性所需的任何其它元件缺失或突变为功能非活性的。
101.根据权利要求1至73中任一项所述的DNA分子,根据权利要求74和75中任一项所述的递送媒介物,或根据权利要求76至83中任一项所述的方法,其中所述DNA分子:
a.在所述第一反向重复序列中任何CpG基序缺失或突变以降低toll样受体9结合;和/或
b.在所述第二反向重复序列中任何CpG基序缺失或突变以降低toll样受体9结合;和/或
c.在所述反向重复序列中toll样受体9结合所需的任何其它元件缺失或突变为功能无活性的。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063057179P | 2020-07-27 | 2020-07-27 | |
US63/057,179 | 2020-07-27 | ||
US202163139486P | 2021-01-20 | 2021-01-20 | |
US63/139,486 | 2021-01-20 | ||
PCT/EP2021/070884 WO2022023284A1 (en) | 2020-07-27 | 2021-07-26 | Compositions of dna molecules, methods of making therefor, and methods of use thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116234917A true CN116234917A (zh) | 2023-06-06 |
Family
ID=77431273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180066199.6A Pending CN116234917A (zh) | 2020-07-27 | 2021-07-26 | Dna分子组合物及其制备方法和使用方法 |
Country Status (11)
Country | Link |
---|---|
US (3) | US20230272432A1 (zh) |
EP (1) | EP4189098A1 (zh) |
JP (1) | JP2023535632A (zh) |
KR (1) | KR20230056669A (zh) |
CN (1) | CN116234917A (zh) |
AU (1) | AU2021314809A1 (zh) |
BR (1) | BR112023001648A2 (zh) |
CA (1) | CA3189740A1 (zh) |
IL (1) | IL299925A (zh) |
MX (1) | MX2023001109A (zh) |
WO (1) | WO2022023284A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3096741B1 (en) | 2014-01-21 | 2020-09-02 | Anjarium Biosciences AG | Process for the production of hybridosomes |
CN116234917A (zh) | 2020-07-27 | 2023-06-06 | 安杰瑞姆生物科学公司 | Dna分子组合物及其制备方法和使用方法 |
WO2023192492A1 (en) * | 2022-03-31 | 2023-10-05 | The Board Of Trustees Of The Leland Stanford Junior University | Modification-dependent enrichment of dna by genome of origin |
WO2023201364A2 (en) * | 2022-04-15 | 2023-10-19 | Dyno Therapeutics, Inc. | Capsid variants and methods of using the same |
WO2024170778A1 (en) | 2023-02-17 | 2024-08-22 | Anjarium Biosciences Ag | Methods of making dna molecules and compositions and uses thereof |
Family Cites Families (155)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0018120D0 (en) | 2000-07-24 | 2000-09-13 | Fermentas Ab | Nuclease |
US6660475B2 (en) | 2000-12-15 | 2003-12-09 | New England Biolabs, Inc. | Use of site-specific nicking endonucleases to create single-stranded regions and applications thereof |
WO2003055975A2 (en) | 2001-08-23 | 2003-07-10 | New England Biolabs, Inc. | A method for engineering strand-specific, sequence-specific, dna-nicking enzymes |
US7011966B2 (en) | 2003-04-16 | 2006-03-14 | New England Biolabs, Inc. | Method for cloning and expression of AcuI restriction endonuclease and AcuI methylase in E. coli |
US7943303B2 (en) | 2003-12-18 | 2011-05-17 | New England Biolabs, Inc. | Method for engineering strand-specific nicking endonucleases from restriction endonucleases |
ATE537263T1 (de) | 2004-06-07 | 2011-12-15 | Protiva Biotherapeutics Inc | Kationische lipide und verwendungsverfahren |
EP1766035B1 (en) | 2004-06-07 | 2011-12-07 | Protiva Biotherapeutics Inc. | Lipid encapsulated interfering rna |
WO2006007712A1 (en) | 2004-07-19 | 2006-01-26 | Protiva Biotherapeutics, Inc. | Methods comprising polyethylene glycol-lipid conjugates for delivery of therapeutic agents |
WO2006012593A1 (en) | 2004-07-22 | 2006-02-02 | Shuang-Yong Xu | Nicking endonuclease methods and compositions |
EP2992902A1 (en) | 2004-12-27 | 2016-03-09 | Silence Therapeutics GmbH | Lipid complexes coated with peg and their uses |
LT2816118T (lt) | 2005-05-31 | 2018-12-10 | The Regents Of The University Of Colorado, A Body Corporate | Genų pristatymo būdai |
KR101129509B1 (ko) | 2006-10-03 | 2012-04-13 | 알닐람 파마슈티칼스 인코포레이티드 | 지질 함유 조성물 |
CA3044134A1 (en) | 2008-01-02 | 2009-07-09 | Arbutus Biopharma Corporation | Improved compositions and methods for the delivery of nucleic acids |
PL2279254T3 (pl) | 2008-04-15 | 2017-11-30 | Protiva Biotherapeutics Inc. | Nowe preparaty lipidowe do dostarczania kwasów nukleinowych |
WO2009132131A1 (en) | 2008-04-22 | 2009-10-29 | Alnylam Pharmaceuticals, Inc. | Amino lipid based improved lipid formulation |
EP2789691B1 (en) | 2008-08-22 | 2018-08-08 | Sangamo Therapeutics, Inc. | Methods and compositions for targeted single-stranded cleavage and targeted integration |
CA2984026C (en) | 2008-10-09 | 2020-02-11 | Arbutus Biopharma Corporation | Improved amino lipids and methods for the delivery of nucleic acids |
WO2010048536A2 (en) | 2008-10-23 | 2010-04-29 | Alnylam Pharmaceuticals, Inc. | Processes for preparing lipids |
US8709778B2 (en) | 2008-10-28 | 2014-04-29 | Xavier Danthinne | Method of adenoviral vector synthesis |
WO2010054384A1 (en) | 2008-11-10 | 2010-05-14 | Alnylam Pharmaceuticals, Inc. | Lipids and compositions for the delivery of therapeutics |
JP5774486B2 (ja) | 2008-11-10 | 2015-09-09 | テクミラ ファーマシューティカルズ コーポレイションTekmira Pharmaceuticals Corporation | 治療薬を送達するための新規な脂質及び組成物 |
US20120101148A1 (en) | 2009-01-29 | 2012-04-26 | Alnylam Pharmaceuticals, Inc. | lipid formulation |
KR20240015723A (ko) | 2009-05-05 | 2024-02-05 | 알닐람 파마슈티칼스 인코포레이티드 | 지질 조성물 |
CN102625696B (zh) | 2009-06-10 | 2015-06-03 | 阿尔尼拉姆医药品有限公司 | 改进的脂质制剂 |
WO2011000106A1 (en) | 2009-07-01 | 2011-01-06 | Protiva Biotherapeutics, Inc. | Improved cationic lipids and methods for the delivery of therapeutic agents |
US8283333B2 (en) | 2009-07-01 | 2012-10-09 | Protiva Biotherapeutics, Inc. | Lipid formulations for nucleic acid delivery |
US9181295B2 (en) | 2009-08-20 | 2015-11-10 | Sirna Therapeutics, Inc. | Cationic lipids with various head groups for oligonucleotide delivery |
EP2480668A2 (en) | 2009-09-23 | 2012-08-01 | Protiva Biotherapeutics Inc. | Compositions and methods for silencing genes expressed in cancer |
US20130022649A1 (en) | 2009-12-01 | 2013-01-24 | Protiva Biotherapeutics, Inc. | Snalp formulations containing antioxidants |
AU2010328336B2 (en) | 2009-12-07 | 2017-03-02 | Arbutus Biopharma Corporation | Compositions for nucleic acid delivery |
WO2011088081A1 (en) | 2010-01-12 | 2011-07-21 | The University Of North Carolina At Chapel Hill | Restrictive inverted terminal repeats for viral vectors |
WO2011090965A1 (en) | 2010-01-22 | 2011-07-28 | Merck Sharp & Dohme Corp. | Novel cationic lipids for oligonucleotide delivery |
US10077232B2 (en) | 2010-05-12 | 2018-09-18 | Arbutus Biopharma Corporation | Cyclic cationic lipids and methods of use |
CA2799091A1 (en) | 2010-05-12 | 2011-11-17 | Protiva Biotherapeutics, Inc. | Cationic lipids and methods of use thereof |
JP5957646B2 (ja) | 2010-06-04 | 2016-07-27 | サーナ・セラピューティクス・インコーポレイテッドSirna Therapeutics,Inc. | オリゴヌクレオチド送達のための新規な低分子量カチオン性脂質 |
US9006417B2 (en) | 2010-06-30 | 2015-04-14 | Protiva Biotherapeutics, Inc. | Non-liposomal systems for nucleic acid delivery |
WO2012016184A2 (en) | 2010-07-30 | 2012-02-02 | Alnylam Pharmaceuticals, Inc. | Methods and compositions for delivery of active agents |
WO2012024351A2 (en) | 2010-08-16 | 2012-02-23 | Salk Institute For Biological Studies | Adenoviral assembly method |
DK4066856T3 (da) | 2010-08-31 | 2022-12-19 | Glaxosmithkline Biologicals Sa | Pegylerede liposomer til afgivelse af immunogen-kodende RNA |
WO2012028680A1 (en) | 2010-09-02 | 2012-03-08 | Molmed Spa | Semi-stable production of lentiviral vectors |
EP2480678B1 (en) | 2010-09-02 | 2014-02-12 | Molmed SpA | Stable production of lentiviral vectors |
KR101878361B1 (ko) | 2010-09-20 | 2018-08-20 | 시르나 쎄러퓨틱스 인코퍼레이티드 | 올리고뉴클레오티드 전달을 위한 신규 저분자량 양이온성 지질 |
EP2621480B1 (en) | 2010-09-30 | 2018-08-15 | Sirna Therapeutics, Inc. | Low molecular weight cationic lipids for oligonucleotide delivery |
CA2813024A1 (en) | 2010-10-21 | 2012-04-26 | Merck Sharp & Dohme Corp. | Novel low molecular weight cationic lipids for oligonucleotide delivery |
EP2663548B1 (en) | 2011-01-11 | 2017-04-05 | Alnylam Pharmaceuticals, Inc. | Pegylated lipids and their use for drug delivery |
WO2012109667A1 (en) | 2011-02-12 | 2012-08-16 | University Of Iowa Research Foundation | Therapeutic compounds |
EP2500434A1 (en) | 2011-03-12 | 2012-09-19 | Association Institut de Myologie | Capsid-free AAV vectors, compositions, and methods for vector production and gene delivery |
WO2012162210A1 (en) | 2011-05-26 | 2012-11-29 | Merck Sharp & Dohme Corp. | Ring constrained cationic lipids for oligonucleotide delivery |
JP2014520806A (ja) | 2011-07-06 | 2014-08-25 | ノバルティス アーゲー | Rna分子の送達のための有用なn:p比を有するリポソーム |
WO2013016058A1 (en) | 2011-07-22 | 2013-01-31 | Merck Sharp & Dohme Corp. | Novel bis-nitrogen containing cationic lipids for oligonucleotide delivery |
EP2750707B1 (en) | 2011-08-31 | 2018-10-24 | GlaxoSmithKline Biologicals SA | Pegylated liposomes for delivery of immunogen-encoding rna |
EP3456317A1 (en) | 2011-09-27 | 2019-03-20 | Alnylam Pharmaceuticals, Inc. | Di-aliphatic substituted pegylated lipids |
US9463247B2 (en) | 2011-12-07 | 2016-10-11 | Alnylam Pharmaceuticals, Inc. | Branched alkyl and cycloalkyl terminated biodegradable lipids for the delivery of active agents |
JP6305344B2 (ja) | 2011-12-07 | 2018-04-04 | アルニラム・ファーマシューティカルズ・インコーポレーテッド | 活性作用物質の送達のための生分解性脂質 |
US20140308304A1 (en) | 2011-12-07 | 2014-10-16 | Alnylam Pharmaceuticals, Inc. | Lipids for the delivery of active agents |
TWI594767B (zh) | 2011-12-12 | 2017-08-11 | 協和醱酵麒麟有限公司 | 含有陽離子性脂質之藥物傳遞系統用脂質奈米粒子 |
WO2013116126A1 (en) | 2012-02-01 | 2013-08-08 | Merck Sharp & Dohme Corp. | Novel low molecular weight, biodegradable cationic lipids for oligonucleotide delivery |
ES2898912T3 (es) | 2012-02-24 | 2022-03-09 | Arbutus Biopharma Corp | Lípidos catiónicos de trialquilo y métodos para su uso |
AU2013240051B2 (en) | 2012-03-27 | 2017-11-30 | Sirna Therapeutics, Inc. | Diether based biodegradable cationic lipids for siRNA delivery |
CA2900231C (en) | 2013-02-15 | 2019-07-30 | Paul Albert Sieving | Aav8 retinoschisin expression vector for treating x-linked retinoschisis |
US9447433B2 (en) | 2013-03-15 | 2016-09-20 | The University Of North Carolina At Chapel Hill | Synthetic adeno-associated virus inverted terminal repeats |
KR20160032090A (ko) | 2013-06-07 | 2016-03-23 | 더 리전트 오브 더 유니버시티 오브 캘리포니아 | 사이클 아데노신 모노포스페이트-결핍 아데닐일 사이클라아제 및 심부전 치료와 심기능 향상을 위한 조성물 및 방법 |
KR102096796B1 (ko) | 2013-10-22 | 2020-05-27 | 샤이어 휴먼 지네틱 테라피즈 인크. | 메신저 rna의 전달을 위한 지질 제형 |
CN105873902B (zh) | 2013-11-18 | 2019-03-08 | 阿克丘勒斯治疗公司 | 用于rna递送的可电离的阳离子脂质 |
EP4019506A1 (en) | 2013-12-19 | 2022-06-29 | Novartis AG | Lipids and lipid compositions for the delivery of active agents |
PT3083556T (pt) | 2013-12-19 | 2020-03-05 | Novartis Ag | Lípidos e composições lipídicas para a entrega de agentes ativos |
EP3096741B1 (en) | 2014-01-21 | 2020-09-02 | Anjarium Biosciences AG | Process for the production of hybridosomes |
PT3766916T (pt) | 2014-06-25 | 2022-11-28 | Acuitas Therapeutics Inc | Novos lípidos e formulações de nanopartículas lipídicas para distribuição de ácidos nucleicos |
CN104095665B (zh) | 2014-07-15 | 2016-06-08 | 中国人民解放军第二军医大学 | 膜式输尿管结石阻挡取出器 |
CA2959540C (en) | 2014-08-27 | 2020-06-30 | The Usa, As Represented By The Secretary, Dept. Of Health And Human Services | Methods and compositions for treating leber congenital amaurosis |
IL292999A (en) | 2014-11-14 | 2022-07-01 | Voyager Therapeutics Inc | Compositions and methods of treating amyotrophic lateral sclerosis (als) |
CN107207428A (zh) | 2014-11-18 | 2017-09-26 | 阿克丘勒斯治疗公司 | 用于rna递送的可电离阳离子脂质 |
US11697825B2 (en) | 2014-12-12 | 2023-07-11 | Voyager Therapeutics, Inc. | Compositions and methods for the production of scAAV |
WO2016115503A1 (en) | 2015-01-16 | 2016-07-21 | Voyager Therapeutics, Inc. | Central nervous system targeting polynucleotides |
GB201502645D0 (en) | 2015-02-17 | 2015-04-01 | Touchlight Genetics Ltd | Method |
EP3313829B1 (en) | 2015-06-29 | 2024-04-10 | Acuitas Therapeutics Inc. | Lipids and lipid nanoparticle formulations for delivery of nucleic acids |
PT3350157T (pt) | 2015-09-17 | 2022-03-18 | Modernatx Inc | Compostos e composições para administração intracelular de agentes terapêuticos |
WO2017066579A1 (en) | 2015-10-14 | 2017-04-20 | Audentes Therapeutics, Inc. | Nucleic acid molecules containing spacers and methods of use thereof |
FI3368507T3 (fi) | 2015-10-28 | 2023-03-21 | Acuitas Therapeutics Inc | Uusia lipidejä ja lipidinanopartikkeliformulaatioita nukleiinihappojen annostelemiseksi |
PL3386484T3 (pl) | 2015-12-10 | 2022-07-25 | Modernatx, Inc. | Kompozycje i sposoby dostarczania środków terapeutycznych |
EP3397613A1 (en) | 2015-12-30 | 2018-11-07 | Acuitas Therapeutics Inc. | Lipids and lipid nanoparticle formulations for delivery of nucleic acids |
PL3405215T3 (pl) | 2016-01-19 | 2022-10-31 | The Regents Of The University Of California | Sposoby leczenia choroby danona i innych zaburzeń autofagii |
US11066679B2 (en) | 2016-03-03 | 2021-07-20 | University Of Massachusetts | Closed-ended linear duplex DNA for non-viral gene transfer |
RU2764587C2 (ru) | 2016-05-18 | 2022-01-18 | Вояджер Терапьютикс, Инк. | Способы и композиции для лечения хореи гентингтона |
WO2017205739A1 (en) | 2016-05-26 | 2017-11-30 | University Of Iowa Research Foundation | cis AND trans REQUIREMENTS FOR TERMINAL RESOLUTION OF HUMAN BOCAVIRUS 1 |
WO2018004514A1 (en) | 2016-06-27 | 2018-01-04 | Nokia Solutions And Networks Oy | Duplex distance modification and blank nb-iot subcarriers |
US20180020547A1 (en) | 2016-07-13 | 2018-01-18 | Alcatel-Lucent Canada Inc. | Underlying recessed component placement |
EP3538660A1 (en) | 2016-11-09 | 2019-09-18 | Intrexon Corporation | Frataxin expression constructs |
AU2018248304C1 (en) | 2017-04-05 | 2023-02-16 | University Of Massachusetts | Minigene therapy |
WO2018191450A2 (en) | 2017-04-14 | 2018-10-18 | National Taiwan University Hospital | Gene therapy for aadc deficiency |
US20200270635A1 (en) | 2017-05-05 | 2020-08-27 | Voyager Therapeutics, Inc. | Modulatory polynucleotides |
WO2018222926A1 (en) | 2017-05-31 | 2018-12-06 | Ultragenyx Pharmaceutical Inc. | Therapeutics for glycogen storage disease type iii |
CN109252337B (zh) * | 2017-07-14 | 2021-06-04 | 重庆海尔滚筒洗衣机有限公司 | 一种滚筒洗衣机 |
WO2019028306A2 (en) | 2017-08-03 | 2019-02-07 | Voyager Therapeutics, Inc. | COMPOSITIONS AND METHODS FOR ADMINISTRATION OF ADENO-ASSOCIATED VIRUSES |
WO2019032102A1 (en) | 2017-08-09 | 2019-02-14 | The Usa, As Represented By The Secretary, Dept. Of Health And Human Services | LINEAR DUPLEX DNA, WITH CLOSED ENDS OF ADENO-ASSOCIATED VIRUSES AND USES THEREOF |
AU2018313921B2 (en) | 2017-08-09 | 2024-12-19 | Bioverativ Therapeutics Inc. | Nucleic acid molecules and uses thereof |
EP3678710A4 (en) | 2017-09-08 | 2021-06-09 | Generation Bio Co. | MODIFIED CLOSED-END DNA (CEDNA) |
WO2019051289A1 (en) | 2017-09-08 | 2019-03-14 | Generation Bio Co. | FORMULATIONS OF LIPID NANOPARTICLES OF NON-VIRAL CAPSID-FREE DNA VECTORS |
SG11202002396TA (en) | 2017-09-27 | 2020-04-29 | Regenxbio Inc | Treatment of ocular diseases with fully-human post-translationally modified anti-vegf fab |
GB2568255A (en) | 2017-11-08 | 2019-05-15 | Evox Therapeutics Ltd | Exosomes comprising RNA therapeutics |
GB201718681D0 (en) | 2017-11-13 | 2017-12-27 | Evox Therapeutics Ltd | Protein engineered extracellular vesicles |
CN111527200A (zh) * | 2017-12-06 | 2020-08-11 | 世代生物公司 | 使用修饰的封闭端DNA(ceDNA)的基因编辑 |
EP3737755B1 (en) | 2018-01-12 | 2024-08-28 | Camena Bioscience Limited | Method for template-free geometric enzymatic nucleic acid synthesis |
GB201800921D0 (en) | 2018-01-19 | 2018-03-07 | Evox Therapeutics Ltd | Intracellular delivery of target silencing technology |
BR112020013319A2 (pt) | 2018-01-19 | 2020-12-01 | Generation Bio Co. | vetores de dna de extremidade fechada obteníveis a partir de síntese livre de células e processo para obter vetores de cedna |
WO2019161059A1 (en) | 2018-02-14 | 2019-08-22 | Generation Bio Co. | Non-viral dna vectors and uses thereof for antibody and fusion protein production |
BR112020017060A2 (pt) | 2018-02-22 | 2020-12-15 | Generation Bio Co. | Expressão controlada de transgenes usando vetores de dna de extremidade fechada (cedna) |
AU2019226527A1 (en) * | 2018-03-02 | 2020-10-01 | Generation Bio Co. | Closed-ended DNA (ceDNA) vectors for insertion of transgenes at genomic safe harbors (GSH) in humans and murine genomes |
US12054724B2 (en) | 2018-04-10 | 2024-08-06 | President And Fellows Of Harvard College | AAV vectors encoding clarin-1 or GJB2 and uses thereof |
CN119662732A (zh) | 2018-05-08 | 2025-03-21 | 纽洛可科学有限公司 | 抗fam19a5抗体的腺相关病毒(aav)递送 |
TW202015742A (zh) | 2018-05-15 | 2020-05-01 | 美商航海家醫療公司 | 投遞腺相關病毒(aav)之組成物和方法 |
EP3796893A1 (en) | 2018-05-23 | 2021-03-31 | Modernatx, Inc. | Delivery of dna |
EP3810782A2 (en) | 2018-06-22 | 2021-04-28 | Asklepios Biopharmaceutical, Inc. | Vectors for gene delivery that persist within cells |
AU2019307911B2 (en) | 2018-07-20 | 2022-06-09 | The Usa, As Represented By The Secretary, Dept. Of Health And Human Services | Intraocular delivery of gene therapy expression vectors |
PL3833746T3 (pl) | 2018-08-08 | 2023-12-04 | Genethon | Mini-gde do leczenia choroby spichrzeniowej glikogenu iii |
JP7602454B2 (ja) | 2018-08-09 | 2024-12-18 | バイオベラティブ セラピューティクス インコーポレイテッド | 核酸分子及び非ウイルス遺伝子治療のためのそれらの使用 |
WO2020077165A1 (en) | 2018-10-12 | 2020-04-16 | Voyager Therapeutics, Inc. | Compositions and methods for delivery of aav |
UY38407A (es) | 2018-10-15 | 2020-05-29 | Novartis Ag | Anticuerpos estabilizadores de trem2 |
US20210403947A1 (en) | 2018-10-24 | 2021-12-30 | Bristol-Myers Squibb Company | Miniaturized dystrophins and uses thereof |
MA54188A (fr) | 2018-11-09 | 2021-09-15 | Generation Bio Co | Adn à extrémité fermée modifié (cedna) comprenant des répétitions terminales inversées modifiées symétriques |
EP3911757A2 (en) | 2019-01-14 | 2021-11-24 | Camena Bioscience Limited | Compositions and methods for template-free geometric enzymatic nucleic acid synthesis |
EP3914717A4 (en) | 2019-01-24 | 2022-11-16 | Generation Bio Co. | CLOSED END DNA (CEDNA) AND USE IN METHODS OF REDUCING GENOMIC OR NUCLEIC ACID THERAPY IMMUNE RESPONSE |
EP3924477A4 (en) | 2019-02-14 | 2023-03-29 | Metagenomi, Inc. | ENZYMES WITH RUVC DOMAINS |
JP7644014B2 (ja) | 2019-02-15 | 2025-03-11 | ジェネレーション バイオ カンパニー | 閉端DNA(ceDNA)の産生におけるREPタンパク質活性の調節 |
CA3132164A1 (en) | 2019-03-06 | 2020-09-10 | Generation Bio Co. | Closed-ended dna (cedna) and immune modulating compounds |
CA3131130A1 (en) * | 2019-03-06 | 2020-09-10 | Generation Bio Co. | Non-active lipid nanoparticles with non-viral, capsid free dna |
KR20210149702A (ko) | 2019-03-13 | 2021-12-09 | 제너레이션 바이오 컴퍼니 | 비바이러스성 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 치료제 발현을 위한 이의 용도 |
KR20210151785A (ko) | 2019-03-13 | 2021-12-14 | 제너레이션 바이오 컴퍼니 | 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도 |
WO2020198233A1 (en) | 2019-03-25 | 2020-10-01 | The Regents Of The University Of California | Methods of treating tnni3-mediated cardiomyopathy |
BR112021020668A2 (pt) | 2019-04-17 | 2022-01-11 | Codiak Biosciences Inc | Composições de exossomos e aav |
US20220202959A1 (en) | 2019-04-19 | 2022-06-30 | University Of Massachusetts | Gene therapies for usher syndrome (ush2a) |
JP2022529782A (ja) | 2019-04-19 | 2022-06-24 | ユニバーシティ オブ マサチューセッツ | シュタルガルト病(abca4)の遺伝子治療 |
WO2020214797A1 (en) | 2019-04-19 | 2020-10-22 | University Of Massachusetts | Gene therapies for usher syndrome (ush1b) |
EP3959314A4 (en) | 2019-04-26 | 2023-02-08 | Genevant Sciences Gmbh | LIPIDNANOPARTICLES |
WO2020219990A1 (en) | 2019-04-26 | 2020-10-29 | President And Fellows Of Harvard College | Aav vectors encoding mini-pcdh15 and uses thereof |
US20220233720A1 (en) | 2019-05-20 | 2022-07-28 | University Of Massachusetts | Minigene therapy |
WO2020257590A1 (en) | 2019-06-21 | 2020-12-24 | Asklepios Biopharmaceutical, Inc. | Production of vectors using phage origin of replication |
WO2021003195A1 (en) | 2019-06-30 | 2021-01-07 | John Fraser Wright | Recombinant aav vectors with altered immunogencity and methods of making the same |
AU2020315444A1 (en) | 2019-07-17 | 2021-12-23 | Generation Bio Co. | Synthetic production of single-stranded adeno associated viral DNA vectors |
AU2020314865A1 (en) | 2019-07-17 | 2021-12-23 | Generation Bio Co. | Compositions and production of nicked closed-ended DNA vectors |
EP3999642A1 (en) | 2019-07-19 | 2022-05-25 | Flagship Pioneering Innovations VI, LLC | Recombinase compositions and methods of use |
AU2020327960A1 (en) | 2019-08-12 | 2022-02-17 | Generation Bio Co. | Methods and compositions for reducing gene or nucleic acid therapy-related immune responses |
US20230097090A1 (en) | 2019-08-14 | 2023-03-30 | Acuitas Therapeutics, Inc. | Improved lipid nanoparticles for delivery of nucleic acids |
US20220280603A1 (en) | 2019-08-15 | 2022-09-08 | University Of Massachusetts | Targeting of the cytoskeleton as a therapeutic approach for neurodegenerative disease |
JP2022546597A (ja) | 2019-09-06 | 2022-11-04 | ジェネレーション バイオ カンパニー | 閉端dnaおよび切断可能脂質を含む脂質ナノ粒子組成物ならびにそれらの使用方法 |
EP3792367A1 (en) | 2019-09-11 | 2021-03-17 | Universität Bielefeld | Method for the production of raav and method for the in vitro generation of genetically engineered, linear, single-stranded nucleic acid fragments containing itr sequences flanking a gene of interest |
KR20220133854A (ko) | 2019-09-30 | 2022-10-05 | 어플라이드 제네틱스 테크놀로지스 코퍼레이션 | 유전적 청력 상실 치료를 위한 아데노 관련 바이러스(aav) 시스템 |
WO2021072201A1 (en) | 2019-10-11 | 2021-04-15 | University Of Massachusetts | Raav-mediated in vivo delivery of suppressor trnas |
EP4045636A4 (en) | 2019-10-15 | 2023-11-29 | University of Massachusetts | STRATEGY FOR AAV PRODUCTION USING A CELL LINE EXPRESSING AN INDUCTIBLE REP GENE |
AU2020367770A1 (en) | 2019-10-16 | 2022-05-19 | University Of Pittsburgh-Of The Commonwealth System Of Higher Education | Compositions and methods for treating liver disease |
US20230040275A1 (en) | 2019-11-19 | 2023-02-09 | Spark Therapeutics, Inc. | Secretable protein induced immune tolerization and treatment of autoimmune, allergic and other diseases and disorders |
CA3162499A1 (en) | 2019-11-22 | 2021-05-27 | Flagship Pioneering Innovations Vi, Llc | Recombinase compositions and methods of use |
KR20220103968A (ko) | 2019-11-22 | 2022-07-25 | 제너레이션 바이오 컴퍼니 | 이온화 가능한 지질 및 이의 나노입자 조성물 |
WO2021108530A1 (en) | 2019-11-26 | 2021-06-03 | University Of Massachusetts | Recombinant adeno-associated virus for delivery of kh902 (conbercept) and uses thereof |
CN116234917A (zh) | 2020-07-27 | 2023-06-06 | 安杰瑞姆生物科学公司 | Dna分子组合物及其制备方法和使用方法 |
-
2021
- 2021-07-26 CN CN202180066199.6A patent/CN116234917A/zh active Pending
- 2021-07-26 IL IL299925A patent/IL299925A/en unknown
- 2021-07-26 JP JP2023505969A patent/JP2023535632A/ja active Pending
- 2021-07-26 MX MX2023001109A patent/MX2023001109A/es unknown
- 2021-07-26 EP EP21758316.0A patent/EP4189098A1/en active Pending
- 2021-07-26 US US18/018,151 patent/US20230272432A1/en active Pending
- 2021-07-26 BR BR112023001648A patent/BR112023001648A2/pt unknown
- 2021-07-26 AU AU2021314809A patent/AU2021314809A1/en active Pending
- 2021-07-26 KR KR1020237005714A patent/KR20230056669A/ko active Pending
- 2021-07-26 WO PCT/EP2021/070884 patent/WO2022023284A1/en active Application Filing
- 2021-07-26 CA CA3189740A patent/CA3189740A1/en active Pending
- 2021-08-17 US US17/404,249 patent/US11634742B2/en active Active
-
2022
- 2022-11-18 US US18/056,931 patent/US20230323418A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2022023284A1 (en) | 2022-02-03 |
US20220098633A1 (en) | 2022-03-31 |
CA3189740A1 (en) | 2022-02-03 |
IL299925A (en) | 2023-03-01 |
BR112023001648A2 (pt) | 2023-04-04 |
US11634742B2 (en) | 2023-04-25 |
KR20230056669A (ko) | 2023-04-27 |
MX2023001109A (es) | 2023-04-24 |
US20230272432A1 (en) | 2023-08-31 |
EP4189098A1 (en) | 2023-06-07 |
AU2021314809A1 (en) | 2023-02-23 |
JP2023535632A (ja) | 2023-08-18 |
US20230323418A1 (en) | 2023-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116234917A (zh) | Dna分子组合物及其制备方法和使用方法 | |
AU609783B2 (en) | Novel fusion proteins and their purification | |
KR101633477B1 (ko) | 개선된 단백질 발현계 | |
CN111295449B (zh) | 腺病毒载体及其用途 | |
KR102319845B1 (ko) | 조류 숙주 세포에 대한 crispr-cas 시스템 | |
KR102733409B1 (ko) | Rna-가이드 유전자 편집 및 유전자 조절 | |
KR102609858B1 (ko) | 점액다당류증의 치료를 위한 아데노-관련 바이러스 벡터 | |
CN108026523B (zh) | 向导rna组装载体 | |
CN107250163A (zh) | 修饰的葡糖淀粉酶和具有增强的生物产物产生的酵母菌株 | |
CN111836825A (zh) | 优化的植物crispr/cpf1系统 | |
CN113039278A (zh) | 通过指导的内切核酸酶和单链寡核苷酸进行基因组编辑 | |
CN112430622A (zh) | 一种FokI和dCpf1融合蛋白表达载体及其介导的定点基因编辑方法 | |
CN115927299A (zh) | 增加双链rna产生的方法和组合物 | |
CN112175927B (zh) | 一种碱基编辑工具及其用途 | |
KR102287880B1 (ko) | 세포에서 이중 가닥 dna의 표적 부위를 변형시키기 위한 방법 | |
KR20140000711A (ko) | 수크로스 이용에 있어서의 야로위아 리포라이티카에서의 사카로마이세스 세레비지애 suc2 유전자의 용도 | |
RU2730667C2 (ru) | Генотерапевтический ДНК-вектор на основе генотерапевтического ДНК-вектора VTvaf17, несущий целевой ген, выбранный из группы генов KRT5, KRT14, LAMB3, COL7A1, для повышения уровня экспрессии этих целевых генов, способ его получения и применения, штамм Escherichia coli SCS110-AF/VTvaf17-KRT5, или Escherichia coli SCS110-AF/VTvaf17-KRT14, или Escherichia coli SCS110-AF/VTvaf17-LAMB3, или Escherichia coli SCS110-AF/VTvaf17-COL7A1, несущий генотерапевтический ДНК-вектор, способ его получения, способ производства в промышленных масштабах генотерапевтического ДНК-вектора | |
TW202302856A (zh) | 重組aav載體之製造及使用 | |
CN114874332B (zh) | 经修饰的rnf112作为治疗als药物的应用 | |
KR101153845B1 (ko) | Kras G12V RNA를 특이적으로 인지할 수 있는 트랜스-스플라이싱 그룹 I 리보자임 | |
CN116549630A (zh) | 一种由腺相关病毒载体介导表达的抗血管内皮生长因子基因药物及其制备方法和应用 | |
CN113302303A (zh) | 经修饰的丝状真菌宿主细胞 | |
KR20120081079A (ko) | 프로모터용 인핸서 및 이의 용도 | |
KR20120064656A (ko) | Kras G12V RNA를 특이적으로 인지할 수 있는 트랜스-스플라이싱 그룹 I 리보자임 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |