[go: up one dir, main page]

TW201947037A - 最適玉米基因座(二) - Google Patents

最適玉米基因座(二) Download PDF

Info

Publication number
TW201947037A
TW201947037A TW108123305A TW108123305A TW201947037A TW 201947037 A TW201947037 A TW 201947037A TW 108123305 A TW108123305 A TW 108123305A TW 108123305 A TW108123305 A TW 108123305A TW 201947037 A TW201947037 A TW 201947037A
Authority
TW
Taiwan
Prior art keywords
locus
seq
gene
dna
sequence
Prior art date
Application number
TW108123305A
Other languages
English (en)
Other versions
TWI721478B (zh
Inventor
丹特 拉克希米 沙士翠
曹澤惠
斯瑞德哈蘭 斯里拉姆
史蒂芬R 韋伯
德布拉L 坎珀
Original Assignee
美商陶氏農業科學公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商陶氏農業科學公司 filed Critical 美商陶氏農業科學公司
Publication of TW201947037A publication Critical patent/TW201947037A/zh
Application granted granted Critical
Publication of TWI721478B publication Critical patent/TWI721478B/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8273Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Nutrition Science (AREA)
  • Pest Control & Pesticides (AREA)
  • Insects & Arthropods (AREA)
  • Physiology (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Cereal-Derived Products (AREA)
  • Peptides Or Proteins (AREA)

Abstract

如本文揭示,已自玉米植物鑑別出最適原生基因座,該等基因座代表外源性序列靶向插入之最佳位點。

Description

最適玉米基因座(二)
本發明係有關於最適玉米基因座。
相關申請案之交互參考
本申請案依據35 U.S.C.§119(e)主張2013年11月4日申請之美國臨時專利申請案第61/899,598號的權益,該臨時專利申請案之內容以全文引用的方式併入本申請案中。
電子遞交之序列表的參考
序列表之正式文本經由EFS-Web,作為ASCII格式化序列表,以2014年10月30日產生之名為「75607232316_SEQ LIST_ST25.txt」且大小為13百萬位元組之檔案電子提交,且與本說明書同時申請。此ASCII格式化文件中含有之序列表為本說明書之一部分且以全文引用的方式併入本文中。
電子提交之列表的參考
序列表之正式文本經由EFS-Web,作為PDF格式化列表,以2013年11月4日產生之名為「表3」且大小為8百萬位元組之檔案電子提交,且與本說明書同時申請。此PDF格式化文件中含有之列表為本說明書之一部分且以全文引 用的方式併入本文中。
發明背景
在1990年代初,玉米基因組成功地用轉殖基因轉型。在過去二十年間,已發展許多方法來轉型玉米基因組,其中轉殖基因穩定地整合至玉米基因組中。玉米轉型方法之此進展使得能夠成功地將包含農藝性狀之轉殖基因引入玉米基因組內。在1990年代後期昆蟲抗性及除草劑耐受性性狀引入玉米植物內為生產者提供一種新穎便利的用於控制昆蟲及廣譜雜草之技術革新,其在載培耕作方法中為空前的。目前,轉殖基因玉米在全世界可購得,且諸如EnlistTM玉米之新轉殖基因玉米產品針對不斷增加之雜草挑戰提供改善的解決方法。若非玉米轉型方法發展及改善,現代農業措施中利用轉殖基因玉米是不可能的。
然而,當前的玉米轉型方法信賴於轉殖基因隨機插入玉米基因組內。對基因隨機插入基因組中之依賴具有若干缺點。轉殖基因事件可隨機整合在基因轉錄序列內,由此打斷內源性性狀之表現且改變玉米植物之生長及發育。另外,轉殖基因事件可不加區別地整合至玉米基因組中容易基因沉默的位置中,導致第一代或隨後世代之轉殖基因玉米植物中轉殖基因表現降低或完全抑制。最後,轉殖基因隨機整合在玉米基因組內需要相當大之努力及成本來鑑別轉殖基因事件之位置及選擇如所設計進行且未對植物產生農藝學影響之轉殖基因事件。必須不斷地發展新穎 分析以確定諸如玉米事件之各轉殖基因事件之整合轉殖基因的準確位置。玉米轉型方法之隨機性引起整合轉殖基因之「位置效應」,此阻礙玉米轉型方法之效力及效率。
植物之靶向基因組修飾已成為應用與基礎研究之長期而難以攻克之目標。基因及基因堆靶向玉蜀黍基因組中特定位置將提高轉殖基因事件之品質,降低與產生轉殖基因事件相關聯之成本,且提供製造諸如依序基因堆疊之轉殖基因植物產品之新方法。總而言之,轉殖基因靶向特定基因組位點在商業上可能為有益的。近些年,藉由位點特異性核酸酶(例如鋅指核酸酶(ZFN)、大範圍核酸酶、轉錄活化樣效應因子核酸酶(TALENS)及成叢的規律間隔之短迴文重複序列/CRISPR相關核酸酶(CRISPR/Cas)與工程改造之crRNA/tracr RNA))靶向及裂解基因組DNA、誘發靶向之突變誘發、誘發靶向之細胞DNA序列缺失及促進預定基因座內外源性供體DNA聚核苷酸之靶向重組的方法及組合物已顯著發展。參見例如美國專利公開案第20030232410號;第20050208489號;第20050026157號;第20050064474號;及第20060188987號,以及國際專利公開案第WO 2007/014275號,其揭示內容以全文引用的方式併入以達成所有目的。美國專利公開案第20080182332號描述非典型鋅指核酸酶(ZFN)用於植物基因組之靶向修飾的用途,且美國專利公開案第20090205083號描述植物EPSP基因座之ZFN介導之靶向修飾。當前用於外源性DNA靶向插入之方法通常包含植物組織與含有至少一種轉殖基因及位點 特異性核酸酶(例如ZFN)之供體DNA聚核苷酸共同轉型,該位點特異性核酸酶經設計以結合及裂解主動轉錄編碼序列之特定基因座。此使得供體DNA聚核苷酸穩定插入裂解之基因座內,使基因靶向添加在包含主動轉錄編碼序列之特定基因座。
一種替代方法為使轉殖基因靶向玉米基因組內的預選標靶非基因基因座。近年來,已發展若干技術且應用於植物細胞,將轉殖基因靶向傳遞於玉米基因組內。然而,關於適於靶向之基因組位點的屬性知之甚少。歷史上,基因組中非必需基因及病原體(病毒)整合位點已用作靶向基因座。基因組中此類位點之數目相當受限制,且因此需要鑑別及表徵可用於供體聚核苷酸序列靶向之可靶向之最適基因座。除可靶向之外,預期最適基因座為可支持轉殖基因表現及育種應用之中性位點。需要界定鑑別玉米基因組內最適非基因基因座以進行轉殖基因靶向整合之標準的組合物及方法。
發明概要
根據一個實施例,提供一種重組序列,其包含最適非基因玉米基因組序列及外源性序列,其中該外源性序列插入該最適非基因玉米基因組序列中。在一個實施例中,本發明係關於一種重組序列,其包含:至少1Kb且與選自由基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)、基因座_136086_G1(SEQ ID NO:4425)、基因座_203704_G1(SEQ ID NO:2033)、基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_204726_G1(SEQ ID NO:424)、基因座_232228_G1(SEQ ID NO:4529)組成之群的非基因序列具有至少90%、95%或99%序列一致性的核酸序列,其中感興趣的DNA插入該非基因序列中。在一個實施例中,感興趣的DNA插入最適非基因玉米基因組序列中藉由改變與插入位點接近之非基因基因座序列來修飾非基因基因座之初始序列。此類修飾包括例如非基因基因座序列之缺失、倒置、插入及複製。在另一態樣中,一個實施例係關於一種感興趣的DNA,其中該感興趣的DNA插入該非基因序列中。在另一態樣中,一個實施例包含重組序列,其中感興趣的DNA插入在與表8之鋅指標靶位點之近側。在另一態樣中,一個實施例包含重組序列,其中感興趣的DNA插入在表8之鋅指標靶位點處。在另一實施例中,重組序列包含進一步包含分析結構域之插入之感興趣的DNA。在另一實施例中,重組序列包含不編碼肽之插入之感興趣的DNA。在另一實施例中,重組序列包含編碼肽之感興趣的DNA。在又一實施例中,重組序列包 含進一步包含基因表現卡匣之插入之感興趣的DNA。在一個實施例中,基因表現卡匣含有包含殺昆蟲劑抗性基因、除草劑耐受性基因、氮利用效率基因、水利用效率基因、營養品質基因、DNA結合基因及可選擇之標記基因的基因。在另一實施例中,重組序列包含兩個或兩個以上基因表現卡匣。在另一實施例中,重組序列包含兩個或兩個以上該等非基因序列,每一者包含插入之感興趣的DNA以產生兩個或兩個以上重組序列,其中該等兩個或兩個以上重組序列位於同一染色體上。在另一實施例中,重組序列包含感興趣的DNA及/或非基因序列在該感興趣的DNA插入該非基因序列期間經修飾。在另一實施例中,本發明係關於一種玉米植物、玉米植物部分或玉米植物細胞,其包含如下重組序列,該重組序列包含至少1Kb且與選自由基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)、基因座_136086_G1(SEQ ID NO:4425)、基因座_203704_G1(SEQ ID NO:2033)、基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_204726_G1(SEQ ID NO:424)、基因座_232228_G1(SEQ ID NO:4529)組成之群 的非基因序列具有至少90%、95%或99%序列一致性之核酸序列,其中感興趣的DNA插入該非基因序列中。
在另一實施例中,本發明係關於一種製造包含感興趣的DNA之轉殖基因植物細胞之方法。在本發明之另一態樣中,該方法包含選擇與選自由基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)、基因座_136086_G1(SEQ ID NO:4425)、基因座_203704_G1(SEQ ID NO:2033)、基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_204726_G1(SEQ ID NO:424)及基因座_232228_G1(SEQ ID NO:4529)組成之群的標靶非基因玉米基因座具有至少90%、95%或99%序列一致性的標靶非基因玉米基因座;選擇特異性結合及裂解該標靶非基因玉米基因座之位點特異性核酸酶;將該位點特異性核酸酶引入玉米植物細胞中;將該感興趣的DNA引入該植物細胞中;將該感興趣的DNA插入該標靶非基因玉米基因座中;以及選擇包含靶向該非基因基因座之感興趣的DNA的轉殖基因植物細胞。在另一態樣中,一個實施例係關於一種製造轉殖基因植物細胞之方法。在另一實施例中,感興趣的DNA 包含分析結構域。在一個實施例中,感興趣的DNA不編碼肽。在又一實施例中,感興趣的DNA編碼肽。在另一實施例中,感興趣的DNA包含含有轉殖基因之基因表現卡匣。在另一實施例中,感興趣的DNA包含兩個或兩個以上基因表現卡匣。在隨後實施例中,位點特異性核酸酶係選自由以下各者組成之群:鋅指核酸酶、CRISPR核酸酶、TALEN、歸巢核酸內切酶或大範圍核酸酶。在一個實施例中,感興趣的DNA經由同源性介導之修復整合方法整合在該非基因基因座內。在另一實施例中,感興趣的DNA經由非同源末端接合整合方法整合在該非基因基因座內。在另一實施例中,製造轉殖基因植物細胞之方法提供兩個或兩個以上該感興趣的DNA插入兩個或兩個以上該標靶非基因玉米基因座中。在另一實施例中,製造轉殖基因植物細胞之方法包含位於同一染色體上之兩個或兩個以上該標靶非基因玉米基因座。在另一實施例中,製造轉殖基因植物細胞之方法包含感興趣的DNA及/或在該感興趣的DNA插入該非基因序列期間經修飾之非基因序列。
根據一個實施例,本文揭示經純化之玉米聚核苷酸基因座,其中該經純化之序列包含至少1Kb之非基因序列。在一個實施例中,非基因序列低甲基化,例示重組跡象,且位於與玉米基因組中之表現基因區接近之位置。在一個實施例中,非基因序列具有在約1Kb至約8.4Kb範圍內的長度。在一個實施例中,感興趣的DNA包含外源性DNA序列,其包括例如調節序列、限制裂解位點、RNA編碼區 或蛋白質編碼區。在一個實施例中,感興趣的DNA包含含有一或多個轉殖基因之基因表現卡匣。在另一實施例中,該經純化之序列包含與選自由基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)、基因座_136086_G1(SEQ ID NO:4425)、基因座_203704_G1(SEQ ID NO:2033)、基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_204726_G1(SEQ ID NO:424)及基因座_232228_G1(SEQ ID NO:4529)組成之群的非基因序列具有至少90%、95%或99%序列一致性的非基因序列。在另一實施例中,經純化之非基因玉米基因座包含感興趣的DNA,其中該感興趣的DNA插入該非基因序列中。在另一態樣中,一個實施例包含經純化之非基因玉米基因座,其中該感興趣的DNA插入在與表8之鋅指標靶位點之近側。在一個不同態樣中,一個實施例包含經純化之非基因玉米基因座,其中該感興趣的DNA插入選自表8之一對鋅指標靶位點之間。在又一態樣中,一個實施例包含經純化之非基因玉米基因座及插入非基因玉米基因座中之感興趣的DNA,其中該感興趣的DNA包含分析結構域。在另一個態樣中, 一個實施例包含經純化之重組非基因玉米基因座,其中該感興趣的DNA不編碼肽。在隨後態樣中,一個實施例包含經純化之重組非基因玉米基因座,其中該感興趣的DNA編碼肽。在一個實施例中,經純化之重組非基因玉米基因座包含基因表現卡匣,其中該基因卡匣包含包括例如殺昆蟲劑抗性基因、除草劑耐受性基因、氮利用效率基因、水利用效率基因、營養品質基因、DNA結合基因及可選擇之標記基因的基因。在一個實施例中,感興趣的DNA使用位點特異性核酸酶插入非基因玉米基因座中,其中該位點特異性核酸酶係選自由以下各者組成之群:鋅指核酸酶、CRISPR核酸酶、TALEN、歸巢核酸內切酶或大範圍核酸酶。在一個實施例中,該感興趣的DNA經由同源性介導之修復整合方法整合在該非基因序列內。在另一實施例中,該感興趣的DNA經由非同源末端接合整合方法整合在該非基因序列內。在另一實施例中,感興趣的DNA包含兩個或兩個以上基因表現卡匣。在另一實施例中,兩個或兩個以上感興趣的DNA插入兩個或兩個以上該標靶非基因玉米基因座中。在一個實施例中,提供兩個或兩個以上該標靶非基因玉米基因座,其中每一者包含插入之感興趣的DNA以產生兩個或兩個以上重組序列,其中該標靶非基因玉米基因座位於同一染色體上。在另一實施例中,經純化之非基因玉米基因組包含感興趣的DNA及/或在該感興趣的DNA插入該非基因序列期間經修飾之非基因序列。在另一實施例中,感興趣的DNA經由同源性介導之修復或非同源末端 接合修復機制插入。
在另一實施例中,本發明提供一種包含重組序列之植物,該重組序列包含:感興趣的DNA及與非基因序列具有至少90%、95%或99%序列一致性的核酸序列,其中該感興趣的DNA插入該非基因序列中。在另一實施例中,非基因序列係選自由以下各者組成之群:基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)、基因座_136086_G1(SEQ ID NO:4425)、基因座_203704_G1(SEQ ID NO:2033)、基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_204726_G1(SEQ ID NO:424)及基因座_232228_G1(SEQ ID NO:4529)。在另一實施例中,植物包含兩個或兩個以上該等重組序列。在另一實施例中,植物包含位於同一染色體上之兩個重組序列。在另一實施例中,植物包含插入在與表8之鋅指標靶位點之近側的感興趣的DNA。在一個實施例中,植物包含插入在選自表8之一對鋅指標靶位點之間的感興趣的DNA。在一個實施例中,該感興趣的DNA包含分析結構域。在另一實施例中,該感興趣的DNA不編碼肽。在又一實施例中,該感興趣的DNA編 碼肽。在隨後實施例中,該感興趣的DNA包含基因表現卡匣,該基因表現卡匣編碼包括例如殺昆蟲劑抗性基因、除草劑耐受性基因、氮利用效率基因、水利用效率基因、營養品質基因、DNA結合基因及可選擇之標記基因的基因產物。在另一實施例中,植物包含感興趣的DNA及/或在該感興趣的DNA插入該非基因序列期間經修飾之非基因序列。
在一個實施例中,本發明係關於一種重組序列,其包含:至少1Kb且與選自由基因座_137693_G1(SEQ ID NO:387)、基因座_203075_G1(SEQ ID NO:2030)及基因座_204637_G1(SEQ ID NO:2731)組成之群的非基因序列具有至少90%、95%或99%序列一致性的核酸序列,其中感興趣的DNA插入該非基因序列中。
在一個實施例中,本發明係關於一種重組序列,其包含:至少1Kb且與選自由基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)及基因座_232484_G1(SEQ ID NO:2053)組成之群的非基因序列具有至少90%、95%或99%序列一致性的核酸序列,其中感興趣的DNA插入該非基因序列中。
在一個實施例中,本發明係關於一種重組序列,其包含:至少1Kb且與選自由基因座_127268_G1(SEQ ID NO:2709)、基因座_232222_G1(SEQ ID NO:3357)及基因座_204726_G1(SEQ ID NO:424)組成之群的非基因序列具有至少90%、95%或99%序列一致性的核酸序列,其中感興趣 的DNA插入該非基因序列中。
在一個實施例中,本發明係關於一種重組序列,其包含:至少1Kb且與選自由基因座_136086_G1(SEQ ID NO:4425)、基因座_203704_G1(SEQ ID NO:2033)、基因座_291068_G1(SEQ ID NO:3230)、基因座_43577_G1(SEQ ID NO:3428)及基因座_232228_G1(SEQ ID NO:4529)組成之群的非基因序列具有至少90%、95%或99%序列一致性的核酸序列,其中感興趣的DNA插入該非基因序列中。
在一個實施例中,本發明係關於一種重組序列,其包含:至少1Kb且與選自由基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)及基因座_204637_G1(SEQ ID NO:2731)組成之群的非基因序列具有至少90%、95%或99%序列一致性的核酸序列,其中感興趣的DNA插入該非基因序列中。
在一個實施例中,本發明係關於一種重組序列,其包含:至少1Kb且與選自由基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)、基因座_127268_G1(SEQ ID NO:2709)、基因 座_204637_G1(SEQ ID NO:2731)、基因座_232222_G1(SEQ ID NO:3357)及基因座_204726_G1(SEQ ID NO:424)組成之群的非基因序列具有至少90%、95%或99%序列一致性的核酸序列,其中感興趣的DNA插入該非基因序列中。
在一個實施例中,本發明係關於一種重組序列,其包含:至少1Kb且與選自由基因座_136086_G1(SEQ ID NO:4425)、基因座_203704_G1(SEQ ID NO:2033)、基因座_127268_G1(SEQ ID NO:2709)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_204726_G1(SEQ ID NO:424)及基因座_232228_G1(SEQ ID NO:4529)組成之群的非基因序列具有至少90%、95%或99%序列一致性的核酸序列,其中感興趣的DNA插入該非基因序列中。
圖1展示自玉蜀黍(Zea mays)栽培品種B73染色體編號1中獲得之根及芽組織之DNA甲基化概況的波形曲線的截圖樣品。
圖2展示玉蜀黍栽培品種B73基因組之所得低甲基化基因組位置之聚核苷酸序列長度的分佈。
圖3表示5,286個最適玉米基因座之三維圖。主分量分析(PCA)統計方法用以基於特徵值將該組5,286個所鑑別之最適基因座叢集至32個不同叢中(參見實例1)。在PCA過程期間,產生五個主分量(PC),其中前三個PC含有資料集中總變化之約90%。此前三個PCA用以在如圖3中所示之 三維圖中圖示32個叢。
圖4提供指示81個最適基因座之染色體分佈及其在玉米染色體上之相對位置的示意圖。
圖5提供顯示玉蜀黍栽培品種B104及栽培品種Hi-II基因組資料庫內選擇用於靶向驗證之72個最適基因座覆蓋度的圖。
圖6提供指示選擇用於靶向驗證之72個最適基因座之玉蜀黍染色體位置的示意圖。
圖7提供pDAB111845(SEQ ID NO:5418)之質體圖譜。編號元件(亦即5、7、8、9、10、11、12、15、16、25及26)對應於由相應鋅指核酸酶蛋白質識別及裂解之約20至35個鹼基對長之鋅指核酸酶結合序列。此等鋅指結合序列及註釋之「UZI序列」(其為含有限制性位點及用於引子設計或編碼序列之DNA序列的100-150bp模板區)構成通用供體卡匣。
圖8為用於經由非同源末端接合(NHEJ)來整合之通用供體聚核苷酸序列的圖示。提供兩個所建議之載體,其中感興趣的DNA(DNA X)在感興趣的DNA之任一末端包含一或多個(亦即「1-N」)鋅指結合位點(ZFN BS)。垂直箭頭顯示獨特限制性位點且水平箭頭表示潛在PCR引子位點。
圖9為用於經由同源介導之修復(HDR)來整合之通用供體聚核苷酸序列的圖示。感興趣的DNA(DNA X)包含兩個將感興趣的DNA與鋅指核酸酶結合位點(ZFN)側接 之同源序列(HA)區,該等鋅指核酸酶結合位點將DNAX及HA序列括在一起。垂直箭頭顯示獨特限制性位點且水平箭頭表示潛在PCR引子位點。
圖10A-10C展示用於靶向及驗證玉蜀黍最適基因座靶向及驗證內之通用供體聚核苷酸系統整合的構築體。圖10A)為具有如先前圖5之pDAB111845中所示之ZFN對位置的ZFN設計空間。ZFN對用數字標記且對應於由ZFN蛋白質特異性識別以結合及裂解的特定ZFN結合序列。圖10B)為ZFN表現構築體之組態。ZFN表現構築體含有組成性植物啟動子(Zm Ubi1),該啟動子用以推動ZFN蛋白質之表現。ZFN蛋白質含有核定位序列(NLS)、鋅指蛋白質(ZFP-L及ZFP-R,其中L指示左手結合ZFN蛋白質且R指示右手結合蛋白)、Fok-1核酸內切酶(Fok1)及自我水解2A(2A)。圖10C)為用於NHEJ介導之玉蜀黍最適基因座之靶向的通用供體聚核苷酸。Z1-Z6表示對玉蜀黍最適基因座標靶具有特異性之ZFN結合位點。ZFN位點數目可在3-6之間變化。垂直箭頭顯示獨特限制性位點且水平箭頭表示潛在PCR引子位點。通用供體聚核苷酸系統為用於整合在玉蜀黍最適基因座內之供體所通用的短(110bp)序列。
圖11 pDAB8393之質體圖譜。
圖12玉蜀黍所選基因座標靶上之ZFN裂解活性。裂解活性表示為每1百萬個高品質讀數在ZFN裂解位點上具有插入缺失(插入與缺失)之序列數目。
圖13使用基於NHEJ之迅速靶向分析(RTA)法驗 證玉蜀黍所選基因座標靶。
圖14、14B經由隨機整合轉型至玉蜀黍中之質體構築體,其包含用於側接序列分析及轉殖基因表現研究之事件。
圖15 pDAB111846(SEQ ID NO:5419)之質體圖譜。編號元件(亦即1、2、5、6、11、12、15、16、21、22、29及30)對應於由相應鋅指核酸酶蛋白質識別及裂解之約20至35個鹼基對長之鋅指核酸酶結合序列。此等鋅指結合序列及註釋之「UZI序列」(其為含有限制性位點及用於引子設計或編碼序列之DNA序列的100-150bp模板區)構成通用供體卡匣。
圖16 pDAB117415(SEQ ID NO:5420)之質體圖譜。編號元件(亦即ZFN51及ZFN52)對應於由相應鋅指核酸酶蛋白質識別及裂解的約20至35個鹼基對長之鋅指核酸酶結合序列。此等鋅指結合序列及註釋之「UZI序列」(其為含有限制性位點及用於引子設計或編碼序列之DNA序列的100-150bp模板區)構成通用供體卡匣。此質體設計內進一步包括「104113重疊」,其為與質體載體共享同源性的序列,用於質體載體內通用供體卡匣高通量組裝(亦即經由吉普森組裝(Gibson assembly))。
圖17 pDAB117416(SEQ ID NO:5421)之質體圖譜。編號元件(亦即ZFN54及ZFN53)對應於由相應鋅指核酸酶蛋白質識別及裂解之約20至35個鹼基對長的鋅指核酸酶結合序列。此等鋅指結合序列及註釋之「UZI序列」(其為 含有限制性位點及用於引子設計或編碼序列之DNA序列的100-150bp模板區)構成通用供體卡匣。此質體設計內進一步包括「104113重疊」,其為與質體載體共享同源性的序列,用於質體載體內通用供體卡匣高通量組裝(亦即經由吉普森組裝)。
圖18 pDAB117417(SEQ ID NO:5422)之質體圖譜。編號元件(亦即ZFN55)對應於由相應鋅指核酸酶蛋白質識別及裂解之約20至35個鹼基對長的鋅指核酸酶結合序列。此等鋅指結合序列及註釋之「UZI序列」(其為含有限制性位點及用於引子設計或編碼序列之DNA序列的100-150bp模板區)構成通用供體卡匣。此質體設計內進一步包括「104113重疊」,其為與質體載體共享同源性的序列,用於質體載體內通用供體卡匣高通量組裝(亦即經由吉普森組裝)。
圖19 pDAB117419(SEQ ID NO:5423)之質體圖譜。編號元件(亦即ZFN59及ZFN60)對應於由相應鋅指核酸酶蛋白質識別及裂解之約20至35個鹼基對長的鋅指核酸酶結合序列。此等鋅指結合序列及註釋之「UZI序列」(其為含有限制性位點及用於引子設計或編碼序列之DNA序列的100-150bp模板區)構成通用供體卡匣。此質體設計內進一步包括「104113重疊」,其為與質體載體共享同源性的序列,用於質體載體內通用供體卡匣高通量組裝(亦即經由吉普森組裝)。
圖20 pDAB117434(SEQ ID NO:5424)之質體圖 譜。編號元件(亦即ZFN66、ZFN67、ZFN68及ZFN69)對應於由相應鋅指核酸酶蛋白質識別及裂解之約20至35個鹼基對長的鋅指核酸酶結合序列。此等鋅指結合序列及註釋之「UZI序列」(其為含有限制性位點及用於引子設計或編碼序列之DNA序列的100-150bp模板區)構成通用供體卡匣。此質體設計內進一步包括「104113重疊」,其為與質體載體共享同源性的序列,用於質體載體內通用供體卡匣高通量組裝(亦即經由吉普森組裝)。
圖21 pDAB117418(SEQ ID NO:5425)之質體圖譜。編號元件(亦即ZFN56、ZFN57及ZFN58)對應於由相應鋅指核酸酶蛋白質識別及裂解之約20至35個鹼基對長的鋅指核酸酶結合序列。此等鋅指結合序列及註釋之「UZI序列」(其為含有限制性位點及用於引子設計或編碼序列之DNA序列的100-150bp模板區)構成通用供體卡匣。此質體設計內進一步包括「104113重疊」,其為與質體載體共享同源性的序列,用於質體載體內通用供體卡匣高通量組裝(亦即經由吉普森組裝)。
圖22 pDAB117420(SEQ ID NO:5426)之質體圖譜。編號元件(亦即ZFN61及ZFN62)對應於由相應鋅指核酸酶蛋白質識別及裂解之約20至35個鹼基對長的鋅指核酸酶結合序列。此等鋅指結合序列及註釋之「UZI序列」(其為含有限制性位點及用於引子設計或編碼序列之DNA序列的100-150bp模板區)構成通用供體卡匣。此質體設計內進一步包括「104113重疊」,其為與質體載體共享同源性的序 列,用於質體載體內通用供體卡匣高通量組裝(亦即經由吉普森組裝)。
圖23 pDAB117421(SEQ ID NO:5427)之質體圖譜。編號元件(亦即PPL17對3、PPL17對1及PPL17對2)對應於由相應鋅指核酸酶蛋白質識別及裂解之約20至35個鹼基對長的鋅指核酸酶結合序列。此等鋅指結合序列及註釋之「UZI序列」(其為含有限制性位點及用於引子設計或編碼序列之DNA序列的100-150bp模板區)構成通用供體卡匣。此質體設計內進一步包括「104113重疊」,其為與質體載體共享同源性的序列,用於質體載體內通用供體卡匣高通量組裝(亦即經由吉普森組裝)。
圖24A-24C所鑑別之最適非基因玉米基因座之特徵(長度、基因座40Kb內編碼區之表現及重組頻率)的直方圖。圖24A展示最適基因座(OGL)之聚核苷酸序列長度的分佈。圖24B展示表現之核酸序列相對於其與最適基因座(OGL)之接近度(log標度)的分佈。圖24C展示最適非基因玉米基因座相對於其重組頻率之分佈。
圖25所鑑別之最適非基因玉米基因座之特徵(與主動轉錄內源性基因之距離及離著絲點之距離)的直方圖。圖25A展示最適基因座序列相對於其與主動轉錄內源性基因之距離的分佈。圖25B展示最適基因座序列相對於其與染色體著絲點之距離的分佈。
較佳實施例之詳細說明
定義
在描述及主張本發明時,以下術語將根據以下闡述之定義使用。
如本文所用之「約」一詞意謂比所陳述之值或值範圍大或小10%,但不欲將任何值或值範圍指定於僅僅此較廣泛定義。前面有「約」一詞之每個值或值範圍亦意欲涵蓋所陳述之絕對值或值範圍的實施例。
如本文所用之「植物」一詞包括整個植物及植物之任何子代、細胞、組織或一部分。一詞「植物部分」包括植物之任何部分,包括例如且不限於:種子(包括成熟種子及未成熟種子);植物插條;植物細胞;植物細胞培養物;植物器官(例如花粉、胚芽、花、果實、芽、葉子、根、莖及外植體)。植物組織或植物器官可為種子、愈傷組織或組織成結構或功能單元之任何其他植物細胞群。植物細胞或組織培養物能夠再生出自其中獲得細胞或組織的具有植物生理及形態特徵之植物,且再生出具有實質上與植物相同基因型之植物。相比之下,一些植物細胞不能再生以產生植物。植物細胞或組織培養物中之可再生細胞可為胚芽、原生質體、分生細胞、愈傷組織、花粉、葉子、花粉囊、根、根尖、穗絲、花、穀粒、穗、穗軸、皮或桿。
植物部分包括可採伐利用之部分及可用於繁殖子代植物之部分。可用於繁殖之植物部分包括例如且不限於:種子;果實;插條;秧苗;塊莖;及根莖。植物之可採伐利用部分可為植物之任何有用的部分,包括例如且不 限於:花;花粉;秧苗;塊莖;葉子;莖;果實;種子;及根。
植物細胞為植物之結構及生理單元。如本文所用之植物細胞包括原生質體及具有細胞壁之原生質體。植物細胞可呈分離之單細胞或細胞聚集物(例如脆弱的愈傷組織及培養細胞)的形式,且可為更高組織單位之一部分(例如植物組織、植物器官及植物)。因此,植物細胞可為原生質體、產生配子之細胞或可再生成整個植物之細胞或細胞群。因而,在本文中之實施例中包含多個植物細胞且能夠再生成整個植物之種子視為「植物部分」。
如本文所用之「原生質體」一詞係指已完全或部分移除細胞壁,使得脂質雙層膜裸露的植物細胞。通常,原生質體為沒有細胞壁之分離植物細胞,其能夠再生成細胞培養物或整個植物。
如本文所用之「原生」或「天然」一詞定義在自然界中發現之狀態。「原生DNA序列」為在自然界中存在之DNA序列,其由天然方式或傳統的育種技術產生,而非由基因工程改造(例如使用分子生物學/轉型技術)產生。
如本文所用,「內源性序列」定義聚核苷酸、基因或多肽在生物體中或生物體之基因組中之其天然位置時的原生形式。
如本文所用之「分離」一詞意謂已自其天然環境移除。
如本文所用之「純化」一詞係指分子或化合物呈 實質上不含通常與原生或天然環境中該分子或化合物相關聯之污染物的形式分離且意謂由於與原始組合物之其他組分分離,純度已增加。「經純化之核酸」一詞在本文中用以描述已與包括(但不限於)多肽、脂質及碳水化合物之其他化合物分離的核酸序列。
「多肽」、「肽」及「蛋白質」等詞在本文中可互換使用,係指胺基酸殘基之聚合物。該詞亦適用於其中一或多個胺基酸為相應天然存在之胺基酸的化學類似物或經修飾之衍生物的胺基酸聚合物。
如本文所用之「最適玉米基因座」、「最適非基因玉米基因座」、「最適非基因基因座」或「最適基因座(OGL)」等詞可互換使用,表示在玉米植物之核基因組中發現的具有以下特性之原生DNA序列:非基因、低甲基化、可靶向及在與基因區接近之位置中,其中在最適玉米基因座周圍之基因組區域例示重組跡象。
如本文所用之「非基因玉米序列」或「非基因玉米基因組序列」等詞可互換使用,表示在玉米植物之核基因組中發現之具有至少1Kb長度且缺少任何開放閱讀框架、基因序列或基因調節序列的原生DNA序列。此外,非基因玉米序列不包含任何內含子序列(亦即內含子被包括在非基因之定義內)。非基因序列無法轉錄或轉譯成蛋白質。許多植物基因組含有非基因區。基因組之多達95%可為非基因的,且此等區域可主要由重複DNA構成。
如本文所用之「基因區」定義為包含編碼RNA 及/或多肽之開放閱讀框架的聚核苷酸序列。基因區亦可涵蓋參與開放閱讀框架表現之調節的任何可鑑別之相鄰5'及3'非編碼核苷酸序列,達至編碼區域上游約2Kb及編碼區域下游1Kb,但可能更上游或下游。基因區進一步包括可存在於基因區中之任何內含子。此外,基因區可包含單一基因序列,或經短跨距(小於1Kb)之非基因序列打斷之多基因序列。
如本文所用之「感興趣的核酸」、「感興趣的DNA」或「供體」定義為已選擇用於定點、靶向插入玉米基因組中之核酸/DNA序列。感興趣的核酸可具有任何長度,例如2與50,000個核苷酸之間長度(或其間或超過其的任何整數值),較佳約1,000與5,000個核苷酸之間長度(或其間的任何整數值)。感興趣的核酸可包含一或多個基因表現卡匣,該基因表現卡匣進一步包含主動轉錄及/或轉譯基因序列。相反地,感興趣的核酸可包含不包含功能基因表現卡匣或整個基因(例如可簡單包含調節序列,諸如啟動子)的聚核苷酸序列,或可不含有任何可鑑別之基因表現元件或任何主動轉錄基因序列。感興趣的核酸可視情況含有分析結構域。感興趣的核酸插入玉米基因組後,插入之序列稱為「插入之感興趣的DNA」。此外,感興趣的核酸可為DNA或RNA,可為線狀或圓形,且可為單股或雙股。其可呈裸核酸,呈與一或多種傳遞劑(例如脂質體、泊洛沙姆(poloxamer)、用蛋白質囊封之T-股等等)之複合物,或含於細菌或病毒傳遞媒劑(分別諸如根癌土壤桿菌(Agrobacterium tumefaciens)或 腺病毒或腺病毒相關病毒(AAV))中,來傳遞至細胞中。
如本文所用之「分析結構域」一詞定義含有幫助核酸序列靶向插入之功能元件的核酸序列。舉例而言,分析結構域可含有特定設計之限制酶位點、鋅指結合位點、工程改造之著陸墊或工程改造之轉殖基因整合台,且可包含或可不包含基因調節元件或開放閱讀框架。參見例如以全文引用的方式併入本文中之美國專利公開案第20110191899號。
如本文所用之「所選玉米序列」一詞定義玉米之原生基因組DNA序列,其已被選擇用於分析以確定該序列是否有資格作為最適非基因玉米基因座。
如本文所用,關於DNA序列之「低甲基化(hypomethylation)」或「低甲基化(hypomethylated)」等詞定義DNA之既定序列中甲基化DNA核苷酸殘基之減少狀態。通常,相對於在玉米基因組中存在之非基因序列中發現的平均甲基化程度減少之甲基化與甲基化腺嘌呤或胞嘧啶殘基之數目有關。
如本文所用之「可靶向序列」為在核基因組中足夠獨特而允許感興趣的核酸位點特異性地靶向插入一個特定序列中的聚核苷酸序列。
如本文所用之「非重複」序列一詞定義為與玉蜀黍基因組內任何其他序列共享小於40%一致性的至少1Kb長之序列。序列一致性之計算可使用熟習此項技術者已知之任何標準技術確定,包括例如使用基於BLASTTM之同源 性搜索,使用NCBI BLASTTM軟體(2.2.23版),使用預設參數設置操作(Stephen F.Altschul等人(1997),「Gapped BLAST and PSI-BLAST:a new generation of protein database search programs」,Nucleic Acids Res.25:3389-3402),針對玉蜀黍栽培品種B73基因組,掃描所選玉米序列。舉例而言,當分析所選玉米序列(來自玉蜀黍栽培品種B73基因組)時,自此類搜索鑑別之第一個BLASTTM命中表示玉蜀黍栽培品種B73序列本身。鑑別每個所選玉米序列之第二BLASTTM命中且命中之比對覆蓋度(表示為由BLASTTM命中覆蓋之所選玉米序列之百分比)用作玉蜀黍基因組內所選玉米序列之獨特性的量度。第二BLASTTM命中之此等比對覆蓋度在最小0%至最大39.98%之序列一致性範圍內。不考慮在較高序列一致性位準下比對之任何序列。
當關於非基因序列使用時,「在與基因區接近的位置」一詞定義非基因序列相對於基因區之位置。特定言之,分析40Kb鄰域內(亦即在所選最適玉米基因座序列之任一末端上的40Kb內)之基因區數。此分析藉由分析自玉米基因組資料庫提取之玉蜀黍基因組中已知基因之基因註釋資訊及位置來完成。對於5,286個最適非基因玉米基因座每一者,界定在最適基因座序列周圍之40Kb窗口且對位置與此窗口重疊之註釋基因數目進行計數。基因區數目在40Kb鄰域內最小1個基因至最大9個基因的範圍內。
如本文所用之「已知之玉米編碼序列」一詞係指 自玉米基因組資料庫(可得自www.maizegdb.org及Monaco,M.等人,Maize Metabolic Network Construction and Transcriptome Analysis.doi:10.3835/plantgenome2012.09.0025;2013年1月23日線上公告)鑑別的任何聚核苷酸序列,其在內含子序列加工前或後均包含開放閱讀框架,且當置於適當的遺傳調節元件控制下時轉錄成mRNA且視情況轉譯成蛋白質序列。已知之玉米編碼序列可為cDNA序列或基因組序列。在一些情況下,已知之玉米編碼序列可註釋為功能蛋白。在其他情況下,已知之玉米編碼序列可能未註釋。
如本文所用之「預測之玉米編碼序列」一詞係指玉米基因組資料庫中描述的任何表現序列標籤(EST)聚核苷酸序列。EST係自使用寡(dT)引子指導反轉錄酶之第一股合成所構築的cDNA文庫鑑別。所得EST為自cDNA插入物之5'或3'末端獲得之小於500bp的單程測序讀數。多個EST可比對至單一重疊群中。所鑑別之EST序列上載至玉米基因組資料庫,且可經由生物資訊學方法搜索以預測包含當置於適當的基因調節元件控制下時被轉錄成mRNA且視情況轉譯成蛋白質序列之編碼序列的相應基因組聚核苷酸序列。
如本文所用之「重組跡象」一詞係指跨越包含所選玉米序列之染色體區域,任何一對玉蜀黍基因組標記物之間的減數分裂重組頻率。重組頻率係基於標記物之間的遺傳距離(分摩(cM))與標記物之間的物理距離(兆鹼基(Mb))的比率計算。對於具有重組跡象之所選玉米序列,所選玉 米序列必須含有在側接所選玉米序列之兩個標記物之間的至少一個重組事件,如使用自多個映射群體產生之高解析度標記物資料集偵測。(參見例如Jafar Mammadov,Wei Chen,Anastasia Chueva,Karthik Muthuraman,Ruihua Ren,David Meyer,及Siva Kumpatla.2011.Distribution of Recombinant Frequencies across the Maize Genome.52nd Annual Maize Genetics Conference)。
如本文所用之「相對位置值」一詞為定義基因座離其相應染色體著絲點之距離的計算值。對於每個所選玉米序列,量測所選玉米序列之原生位置至其位於之染色體之著絲點的基因組距離(Bp)。染色體內所選玉米序列之相對位置表示為其離著絲點之基因組距離相對於其所位於之特定染色體臂之長度(以Bp量測)的比率。最適非基因玉米基因座資料集之此等相對位置值在基因組距離之最小0.00373至最大0.99908比率範圍內。
如本文所用之「外源性DNA序列」一詞為已自其原生位置移除且插入新的位置中,改變側接已移動之核酸序列之序列的任何核酸序列。舉例而言,外源性DNA序列可包含來自另一物種之序列。
「結合」係指大分子之間(例如蛋白質與核酸之間)的序列特異性相互作用。並非結合相互作用之所有組分均需要為序列特異性的(例如與DNA主鏈中之磷酸酯殘基接觸),只要相互作用總體上為序列特異性即可。此類相互作用一般特徵為解離常數(Kd)。「親和力」係指結合強度: 結合親和力增加與較低結合常數(Kd)有關。
「結合蛋白」為能夠結合於另一分子之蛋白質。結合蛋白可結合於例如DNA分子(DNA結合蛋白)、RNA分子(RNA結合蛋白)及/或蛋白質分子(蛋白質結合蛋白)。在蛋白質結合蛋白情況下,其可結合於本身(形成同型二聚體、同型三聚體等)及/或其可結合於不同蛋白質之一或多個分子。結合蛋白可具有超過一種類型之結合活性。舉例而言,鋅指蛋白質具有DNA結合、RNA結合及蛋白質結合活性。
如本文所用之「鋅指」一詞定義DNA結合蛋白結合結構域內的結構經由鋅離子配位而穩定化之胺基酸序列區域。
「鋅指DNA結合蛋白」(或結合結構域)為以序列特異性方式經由一或多個鋅指結合DNA的蛋白質或較大蛋白質內之結構域,鋅指為結合結構域內的結構經由鋅離子配位而穩定化之胺基酸序列區域。鋅指DNA結合蛋白一詞常常縮寫成鋅指蛋白質或ZFP。鋅指結合結構域可經「工程改造」以結合於預定核苷酸序列。設計及選擇用於工程改造鋅指蛋白質之方法之非限制性實例。設計之鋅指蛋白質為設計/組成主要由理性規範得來的非天然存在之蛋白質。設計之理性規範包括應用替代規則及計算機化算法以處理儲存現有ZFP設計及結合資料之資訊之資料庫中的資訊。參見例如美國專利第6,140,081號;第6,453,242號;第6,534,261號及第6,794,136號;亦參見WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536及WO 03/016496。
「TALE DNA結合結構域」或「TALE」為包含一或多個TALE重複結構域/單元之多肽。重複結構域與TALE結合於其同源標靶DNA序列有關。單一「重複單元」(亦稱為「重複序列」)通常為33-35個胺基酸長,且顯示與天然存在之TALE蛋白質內之其他TALE重複序列的至少一些序列同源性。參見例如以全文引用的方式併入本文中之美國專利公開案第20110301073號。
CRISPR(成叢的規律間隔之短迴文重複序列)/Cas(CRISPR相關)核酸酶系統。簡言之,「CRISPR DNA結合結構域」為與CAS酶一致起作用,可選擇性地識別、結合及裂解基因組DNA之短股RNA分子。CRISPR/Cas系統可經工程改造以在基因組中之所希望標靶產生雙股斷裂(DSB),且DSB之修復可通過使用修復抑制劑引起易出錯修復增加來影響。參見例如Jinek等人(2012)Science 337,第816-821頁,Jinek等人(2013),eLife 2:e00471,及David Segal,(2013)eLife 2:e00563)。
鋅指、CRISPR及TALE結合結構域可例如經由工程改造(改變一或多個胺基酸)天然存在之鋅指的識別螺旋區域來「工程改造」以結合於預定核苷酸序列。類似地,TALE可例如藉由工程改造與DNA結合有關之胺基酸(重複可變二殘基或RVD區域)來「工程改造」以結合於預定核苷酸序列。因此,經工程改造之DNA結合蛋白(鋅指或TALE)為非天然存在之蛋白質。設計及選擇用於工程改造DNA結合蛋白之方法之非限制性實例。設計之DNA結合蛋白為設 計/組成主要由理性規範得來的非天然存在之蛋白質。設計之理性規範包括應用替代規則及計算機化算法以處理儲存現有ZFP及/或TALE設計及結合資料之資訊之資料庫中的資訊。參見例如美國專利6,140,081;6,453,242;及6,534,261;亦參見WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536及WO 03/016496及美國公開案第20110301073號、第20110239315號及第20119145940號。
「所選」鋅指蛋白質、CRISPR或TALE為主要由經驗過程,諸如噬菌體呈現、相互作用捕獲或雜交選擇產生的未在自然界中發現之蛋白質。參見例如美國專利第5,789,538號;第US 5,925,523號;第US 6,007,988號;第US 6,013,453號;第US 6,200,759號;WO 95/19431;WO 96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970及WO 01/88197及WO 02/099084以及美國公開案第20110301073號、第20110239315號及第20119145940號。
「重組」係指兩個聚核苷酸之間的遺傳資訊交換的過程,包括(但不限於)藉由非同源末端接合(NHEJ)及同源重組之供體捕捉。出於本發明之目的,「同源重組(HR)」係指例如在細胞中經由同源性介導之修復機理進行雙股斷裂修復期間所發生的此類交換之特定形式。此過程需要核苷酸序列同源性,使用「供體」分子模擬標靶分子(亦即經歷雙股斷裂之核苷酸序列)之修復,且不同地稱為「非交叉基因轉換」或「短暫區域基因轉換」,因為其導致遺傳資訊 自供體轉移至標靶。不希望受任何特定理論限制,此類轉移可包含在斷裂標靶與供體之間形成的異源雙鏈DNA之錯配校正及/或其中供體用以再合成將變成標靶一部分之遺傳資訊的「合成依賴性股退火」,及/或相關過程。此類特定HR常常引起標靶分子之序列改變,使得供體聚核苷酸之部分或所有序列併入標靶聚核苷酸中。對於HR介導之整合,供體分子含有至少2個具有與基因組(「同源性臂」)最小50-100個鹼基對長度之同源性的區域。參見例如美國專利公開案第20110281361號。
在本發明之方法中,一或多個如本文中描述之靶向核酸酶在預定位點產生標靶序列(例如細胞染色質)中之雙股斷裂,且與斷裂區域中之核苷酸序列具有同源性以進行HR介導之整合或與斷裂區域中之核苷酸序列無同源性以進行NHEJ介導之整合的「供體」聚核苷酸可引入細胞中。雙股斷裂之存在已顯示促進供體序列之整合。供體序列可物理整合,或者供體聚核苷酸用作模板以經由同源重組來修復,使得如供體中之所有或一部分核苷酸序列引入細胞染色質中。因此,細胞染色質中之第一序列可改變,且在某些實施例中,可轉變為供體聚核苷酸中存在之序列。因此,可瞭解「置換(replace)」或「置換(replacement)」一詞之使用表示一個核苷酸序列經另一核苷酸序列置換(亦即資訊意義上序列之置換)且不一定需要一個聚核苷酸經另一個聚核苷酸之物理或化學置換。在本文中描述之任何方法中,其他對之鋅指蛋白質、CRISPRS或TALEN可用 於細胞內額外標靶位點之額外雙股裂解。
本文中描述之任何方法可用於藉由破壞感興趣的基因表現之供體序列的靶向整合來插入任何尺寸之供體及/或使細胞中一或多個標靶序列部分或完全失活。亦提供具有部分或完全失活基因之細胞株。
此外,如本文中描述之靶向整合方法亦可用以整合一或多個外源性序列。外源性核酸序列可包含例如一或多個基因或cDNA分子或任何類型編碼或非編碼序列以及一或多個控制元件(例如啟動子)。另外,外源性核酸序列(轉殖基因)可產生一或多個RNA分子(例如小髮夾RNA(shRNA)、抑制RNA(RNAi)、微型RNA(miRNA)等)或蛋白質。
如本文所用之「裂解」定義DNA分子之磷酸酯-糖主鏈的斷裂。裂解可藉由包括(但不限於)磷酸二酯鍵之酶促或化學水解之各種方法引發。單股裂解與雙股裂解均為可能的,且雙股裂解可作為兩個不同單股裂解事件之結果而發生。DNA裂解可導致鈍端或交錯端產生。在某些實施例中,融合多肽用於靶向之雙股DNA裂解。「裂解結構域」包含具有DNA裂解催化活性之一或多個多肽序列。裂解結構域可含於單一多肽鏈中,或裂解活性可由兩個(兩個以上)多肽締合產生。
「裂解半結構域」為與第二多肽(一致或者不同)一道形成具有裂解活性(較佳雙股裂解活性)之複合物的多肽序列。「第一及第二裂解半結構域」、「+及-裂解半結合域」 及「右及左裂解半結合域」等詞可互換使用,係指二聚化之成對裂解半結合域。
「經工程改造之裂解半結構域」為已經修飾以便與另一裂解半結構域(例如另一工程改造之裂解半結構域)形成專性異型二聚體的裂解半結構域。亦參見美國專利公開案第2005/0064474號、第20070218528號、第2008/0131962號及第2011/0201055號,以全文引用的方式併入本文中。
「標靶位點」或「標靶序列」係指結合分子將結合之核酸一部分,條件為存在足夠進行結合之條件。
核酸包括DNA及RNA,可為單股或雙股;可為線狀、枝狀或圓形;且可具有任何長度。核酸包括能夠形成雙螺旋體之核酸以及形成三螺旋體之核酸。參見例如美國專利第5,176,996號及第5,422,251號。蛋白質包括(但不限於)DNA結合蛋白、轉錄因子、染色質重塑因子、甲基化DNA結合蛋白、聚合酶、甲基酶、去甲基酶、乙醯基酶、去乙醯基酶、激酶、磷酸酶、整合酶、重組酶、連接酶、拓撲異構酶、旋轉酶及解螺旋酶。
「外源性核酸產物」包括聚核苷酸與多肽產物,例如轉錄產物(聚核苷酸,諸如RNA)及轉譯產物(多肽)。
「融合」分子為其中兩個或兩個以上次單元分子例如共價連接之分子。次單元分子可為相同化學類型之分子,或可為不同化學類型之分子。第一類型融合分子之實例包括(但不限於)融合蛋白(例如ZFP DNA結合結構域與裂解結構域之間的融合物)及融合核酸(例如編碼上文描述之 融合蛋白的核酸)。第二類型融合分子之實例包括(但不限於)形成三螺旋體之核酸與多肽之間的融合物及小溝結合物與核酸之間的融合物。細胞中融合蛋白之表現可由融合蛋白傳遞至細胞或藉由編碼融合蛋白之聚核苷酸傳遞至細胞而產生,其中聚核苷酸轉錄,且轉錄本轉譯,產生融合蛋白。反式剪接、多肽裂解及多肽接合亦可與細胞中蛋白質之表現相關。用於聚核苷酸及多肽傳遞至細胞之方法在本發明中別處呈現。
出於本發明之目的,「基因」包括編碼基因產物(參看下文)之DNA區域,以及調節基因產物產生之所有DNA區域,無論此類調節序列是否與編碼及/或轉錄序列相鄰或可操作地連接。因此,基因包括但不一定限於啟動子序列、終止子、轉譯調節序列(諸如核糖體結合位點及內部核糖體進入位點)、強化子、沉默子、絕緣子、邊界元件、複製起點、基質附著位點及基因座控制區域。
「基因表現」係指基因中含有之資訊轉變成基因產物。基因產物可為基因(例如mRNA、tRNA、rRNA、反義RNA、干擾RNA、核糖酶、結構RNA或任何其他類型RNA)之直接轉錄產物或藉由mRNA轉譯產生之蛋白質。基因產物亦包括藉由諸如封端、聚腺苷酸化、甲基化及剪輯之方法修飾的RNA,及藉由例如甲基化、乙醯化、磷酸化、泛素化、ADP核糖基化、肉豆蔻基化及糖基化修飾之蛋白質。
序列一致性:在兩個核酸或多肽序列之情況下如本文所用之「序列一致性」或「一致性」等詞係指兩個序 列中當在指定比較窗口上進行比對以求最大對應時相同的殘基。
如本文所用之「序列一致性百分比」一詞係指藉由在比較窗口上比較兩個最佳比對之序列(例如核酸序列及胺基酸序列)所確定的值,其中為使兩個序列最佳比對,與參考序列(不包含添加或缺失)相比,比較窗口中之序列部分可包含添加或缺失(亦即間隙)。藉由確定兩個序列中存在一致核苷酸或胺基酸殘基之位置的數目以產生匹配位置之數目,將匹配位置之數目除以比較窗口中位置總數且將結果乘以100,得到序列一致性之百分比來計算百分比。
用於比對序列以供比較之方法為此項技術中熟知。各種程式及比對算法描述於例如以下中:Smith及Waterman(1981)Adv.Appl.Math.2:482;Needleman及Wunsch(1970)J.Mol.Biol.48:443;Pearson及Lipman(1988)Proc.Natl.Acad.Sci.U.S.A.85:2444;Higgins及Sharp(1988)Gene 73:237-44;Higgins及Sharp(1989)CABIOS 5:151-3;Corpet等人(1988)Nucleic Acids Res.16:10881-90;Huang等人(1992)Comp.Appl.Biosci.8:155-65;Pearson等人(1994)Methods Mol.Biol.24:307-31;Tatiana等人(1999)FEMS Microbiol.Lett.174:247-50。序列比對方法及同源性計算之詳細討論可見於例如Altschul等人(1990)J.Mol.Biol.215:403-10中。美國國家生物技術資訊中心(National Center for Biotechnology Information,NCBI)基本局部比對搜索工具(BLASTTM;Altschul等人(1990))可得自若干來 源,包括美國國家生物技術資訊中心(Bethesda,MD)及網際網路,結合若干序列分析程式使用。如何使用此程式確定序列一致性之描述可得自網際網路BLASTTM之「幫助」章節。為比較核酸序列,BLASTTM(Blastn)程式之「Blast 2序列」功能可使用預設參數採用。當藉由此方法評估時與參考序列更類似之核酸序列將顯示一致性百分比增加。
特異性雜交/特異性互補:如本文所用之「特異性雜交」及「特異性互補」等詞為指示足夠互補程度,使得核酸分子與標靶核酸分子之間進行穩定及特異性結合的詞。兩個核酸分子之間的雜交包含在兩個核酸分子之核酸序列之間形成反向平行比對。接著兩個分子能夠與相對股上之對應鹼基形成氫鍵,從而形成雙螺旋分子,若雙螺旋分子足夠穩定,則可使用此項技術中熟知之方法偵測。核酸分子不需要為特異性雜交而與其標靶序列100%互補。然而,使雜交具有特異性所必須存在之序列互補性的量隨使用之雜交條件而變。
引起特定嚴格度之雜交條件將視選擇之雜交方法的性質以及雜交核酸序列之組成及長度而變化。一般地,雜交溫度及雜交緩衝液之離子強度(尤其Na+及/或Mg++濃度)將決定雜交嚴格性,不過洗滌時間亦影響嚴格性。關於達到特定嚴格度所需之雜交條件的計算為一般技術者已知,且論述於例如Sambrook等人(編輯)Molecular Cloning:A Laboratory Manual,第2版,第1-3卷,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY, 1989,第9及11章;及Hames及Higgins(編輯)Nucleic Acid Hybridization,IRL Press,Oxford,1985中。關於雜交核酸之進一步詳細說明書及指導可見於例如Tijssen,「Overview of principles of hybridization and the strategy of nucleic acid probe assays,」Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes,第I部分,第2章,Elsevier,NY,1993;及Ausubel等人編輯,Current Protocols in Molecular Biology,第2章,Greene Publishing and Wiley-Interscience,NY,1995中。
如本文所用,「嚴格條件」涵蓋若雜交分子與標靶核酸分子內之序列之間存在小於20%錯配,則將僅僅發生雜交之條件。「嚴格條件」包括其他特定的嚴格程度。因此,如本文所用,「中等嚴格」條件為使具有超過20%序列錯配之分子不雜交的條件;「高嚴格」條件為使具有超過10%錯配之序列不雜交的條件;且「極高嚴格」條件為使具有超過5%錯配之序列不雜交的條件。以下為代表性的非限制性雜交條件。
高嚴格條件(偵測共享至少90%序列一致性之序列):在5x SSC緩衝液(其中SSC緩衝液含有諸如SDS之清潔劑,及如鮭魚精DNA、EDTA等額外試劑)中在65℃下雜交16小時;在2x SSC緩衝液(其中SSC緩衝液含有諸如SDS之清潔劑,及如鮭魚精DNA、EDTA等額外試劑)中在室溫下洗滌兩次,每次15分鐘;及在0.5x SSC緩衝液(其中SSC緩衝液含有諸如SDS之清潔劑,及如鮭魚精DNA、EDTA等額 外試劑)中在65℃下洗滌兩次,每次20分鐘。
中等嚴格條件(偵測共享至少80%序列一致性之序列):在5x-6x SSC緩衝液(其中SSC緩衝液含有諸如SDS之清潔劑,及如鮭魚精DNA、EDTA等額外試劑)中在65-70℃下雜交16-20小時;在2x SSC緩衝液(其中SSC緩衝液含有諸如SDS之清潔劑,及如鮭魚精DNA、EDTA等額外試劑)中在室溫下洗滌兩次,每次5-20分鐘;及在1x SSC緩衝液(其中SSC緩衝液含有諸如SDS之清潔劑,及如鮭魚精DNA、EDTA等額外試劑)中在55-70℃下洗滌兩次,每次30分鐘。
非嚴格控制條件(共享至少50%序列一致性之序列將雜交):在6x SSC緩衝液(其中SSC緩衝液含有諸如SDS之清潔劑,及如鮭魚精DNA、EDTA等額外試劑)中在室溫至55℃下雜交16-20小時;在2x-3x SSC緩衝液(其中SSC緩衝液含有諸如SDS之清潔劑,及如鮭魚精DNA、EDTA等額外試劑)中在室溫至55℃下洗滌至少兩次,每次20-30分鐘。
如本文所用,關於鄰接核酸序列之「實質上同源」或「實質同源性」等詞係指在嚴格條件下與參考核酸序列雜交之鄰接核苷酸序列。舉例而言,實質上與參考核酸序列同源之核酸序列為在嚴格條件(例如上文闡述之中等嚴格條件)下與參考核酸序列雜交之核酸序列。實質上同源序列可具有至少80%序列一致性。舉例而言,實質上同源序列可具有約80%至100%序列一致性,諸如約81%;約82%;約83%;約84%;約85%;約86%;約87%;約88%;約89%;約90%;約91%;約92%;約93%;約94%約95%;約96%; 約97%;約98%;約98.5%;約99%;約99.5%;及約100%。實質同源性之特性與特異性雜交密切相關。舉例而言,當存在足夠互補程度以避免在希望特異性結合之條件下,例如在嚴格雜交條件下核酸與非標靶序列之非特異性結合時,核酸分子為可特異性雜交的。
在一些情況下「同源」可用於指自共同原始DNA序列繼承之第一基因與第二基因的關係。在此類情況下,同源性一詞指示藉由物種化事件分開之基因之間的關係(參見直系同源)或藉由遺傳複製事件分開之基因之間的關係(參見旁系同源)。在其他情況下,「同源」可用於指在一或多個聚核苷酸序列不一定自共同原始DNA序列繼承之此類情況下一或多個聚核苷酸序列之間的序列一致性程度。熟習此項技術者知道「同源」一詞可互換且瞭解該詞之合理應用。
如本文所用之「直系同源(ortholog)」(或「直系同源(orthologous)」)一詞係指兩種或兩種以上物種中自共同原始核苷酸序列進化而來且可在兩個或兩個以上物種中保留相同功能的基因。
如本文所用之「旁系同源」一詞係指藉由基因組內複製而相關之基因。直系同源在進化過程中保留相同的功能,而旁系同源進化新的功能,即使此等新功能與原始基因功能不相關。
如本文所用,當在5'至3'方向上閱讀之序列之每個核苷酸與在3'至5'方向上閱讀之另一個序列之每個核苷 酸互補時,兩個核酸序列分子被認為顯示「完全互補性」。與參考核苷酸序列互補之核苷酸序列將顯示與參考核苷酸序列之反向互補序列一致之序列。此等詞及描述在此項技術中充分定義且一般技術者容易理解。
當確定胺基酸序列之間的序列一致性百分比時,熟習此項技術者熟知藉由比對提供的既定位置中之胺基酸一致性在不影響包含比對序列之多肽的希望特性下可不同。在此等情況下,序列一致性百分比可調整以說明保守取代胺基酸之間的相似性。此等調整為熟習此項技術者熟知且常用。參見例如Myers及Miller(1988)Computer Applications in Biosciences 4:11-7。統計法為此項技術中已知且可用於分析所鑑別之5,286個最適基因座。
作為一個實施例,所鑑別之包含5,286個個別最適基因座序列之最適基因座可經由F分佈檢驗分析。在概率論及統計學中,F分佈為連續概率分佈。F分佈檢驗為具有F分佈之統計顯著性檢驗,且當比較已與資料集擬合之統計模型時使用以鑑別最佳擬合模型。F分佈為連續概率分佈,且又名斯內德克F分佈(Snedecor’s F-distribution)或費歇爾-斯內德克分佈(Fisher-Snedecor distribution)。F分佈常作為檢驗統計量之零分佈出現,在方差分析中最顯著。F分佈為右偏分佈。F分佈為具有最小值0,但無最大值之不對稱分佈。曲線在離0右側不遠處達到峰值,且接著F值愈大,逐漸接近橫軸。F分佈接近,但從不很觸及橫軸。應瞭解,在其他實施例中,此方程式上之變化或實際上不同的方程式 可藉由熟習此項技術者衍生及使用,且可應用於5,286個個別最適基因座序列之分析。
可操作地連接:當第一核苷酸序列與第二核苷酸序列處於功能關係中時,第一核苷酸序列與第二核苷酸序列「可操作地連接」。舉例而言,若啟動子影響編碼序列之轉錄或表現,則啟動子可操作地連接於編碼序列。當重組產生時,可操作地連接之核苷酸序列一般鄰接,且必要時為接合兩個蛋白質編碼區域,在相同的閱讀框中。然而,核苷酸序列無需為可操作地連接而鄰接。
「可操作地連接」一詞當關於調節序列及編碼序列使用時,意謂調節序列影響連接之編碼序列之表現。「調節序列」、「調節元件」或「控制元件」係指影響相關編碼序列轉錄、RNA加工或穩定性或轉譯之時機及程度/量的核苷酸序列。調節序列可包括啟動子;轉譯前導序列;內含子;強化子;莖環結構;阻遏結合序列;終止序列;聚腺苷酸化識別序列等等。特定調節序列可位於可操作地連接於其之編碼序列的上游及/或下游。可操作地連接於編碼序列之特定調節序列亦可位於雙股核酸分子之締合互補股。
當關於兩個或兩個以上胺基酸序列使用時,「可操作地連接」一詞意謂第一胺基酸序列與至少一個其他胺基酸序列處於功能關係。
所揭示之方法及組合物包括融合蛋白,其包含可操作地連接於DNA結合結構域(例如ZFP)之裂解結構域,其中DNA結合結構域藉由結合於玉蜀黍最適基因座中之序列 而將裂解結構域之活性引導至序列附近,因此誘發最適基因座中之雙股斷裂。如本發明中別處所闡述,鋅指結構域可經工程改造以結合於實際上任何希望之序列。因此,一或多個DNA結合結構域可經工程改造以結合於最適基因座中之一或多個序列。包含DNA結合結構域及裂解結構域之融合蛋白在細胞中之表現實現在標靶位點上或附近裂解。
實施例
轉殖基因及轉殖基因堆靶向玉蜀黍基因組中特定位置將提高轉殖基因事件之品質,降低與轉殖基因事件產生相關聯之成本,且提供製造諸如序列基因堆之轉殖基因植物產品之新方法。總而言之,轉殖基因靶向特定基因組位點在商業上可能為有益的。近些年,諸如ZFN、CRISPR及TALEN之位點特異性核酸酶已有顯著發展,該等核酸酶可促進供體聚核苷酸添加至植物及其他基因組中之預選位點。然而,關於適於靶向之基因組位點的屬性知之甚少。歷史上,基因組中不需要之基因及病原體(病毒)整合位點已用作靶向基因座。基因組中此類位點之數目相當受限制,且因此需要鑑別及表徵可用於供體聚核苷酸序列靶向之最適基因座。除可靶向之外,預期最適基因座為可支持轉殖基因表現及繁殖應用之中性位點。
申請者已認識到對於插入位點需要額外標準,且已將此等標準組合以鑑別及選擇玉米基因組中最適於插入外源性序列之位點。出於靶向目的,所選插入位點需要為獨特的且在玉蜀黍基因組的非重複區域中。同樣,最適於 插入之基因組位點應具有最小的不合乎需要之表型效應,且易發生重組事件,從而促進使用傳統的育種技術使基因滲入農藝學上優良株系中。為鑑別滿足所列出之標準的基因座,使用定製之生物信息學方法及基因組規模資料集掃描玉蜀黍基因組,以鑑別具有有益於聚核苷酸供體序列整合及隨後插入之編碼序列表現之特徵的新穎基因座。
I. 非基因玉米基因座之鑑別
根據一個實施例,提供一種鑑別最適非基因玉米基因組序列以插入外源性序列之方法。該方法包含首先鑑別至少1Kb長之低甲基化玉米基因組序列的步驟。在一個實施例中,低甲基化基因組序列為1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、10、11、12、13、14、15、16或17Kb長。在一個實施例中,低甲基化基因組序列為約1至約4Kb長,且在另一個實施例中為約2Kb長。若其在序列內具有小於1% DNA甲基化,則序列視為低甲基化。在一個實施例中,甲基化狀態係基於相對於在正常對照DNA樣品內對應CpG二核苷酸、CHG或CHH三核苷酸上發現之總胞嘧啶的量,在所選玉米序列內一或多個CpG二核苷酸、CHG或CHH三核苷酸上5-甲基胞嘧啶之存在來量測。CHH甲基化指示5-甲基胞嘧啶,接著為多數不為鳥嘌呤之兩個核苷酸,且CHG甲基化係指5-甲基胞嘧啶在腺嘌呤、胸腺嘧啶或胞嘧啶鹼基前,接著為鳥嘌呤。更特定言之,在一個實施例中,所選玉米序列每500個所選玉米序列之核苷酸具有小於1、2或3個甲基化核苷酸。在一個 實施例中,所選玉米序列每500個所選玉米序列之核苷酸在CpG二核苷酸上具有小於一個、兩個或三個5-甲基胞嘧啶。在一個實施例中,所選玉米序列為1至4Kb長且包含1Kb缺少5-甲基胞嘧啶之序列。在一個實施例中,所選玉米序列為1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8或8.5Kb長且其整個長度中含有1或0個甲基化核苷酸。在一個實施例中,所選玉米序列為1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8或8.5Kb長且其整個長度中在CpG二核苷酸上不含5-甲基胞嘧啶。根據一個實施例,所選玉米序列之甲基化可基於來源組織變化。在此類實施例中,用於確定序列是否低甲基化之甲基化程度表示自兩個或兩個以上組織(例如自根及芽)分離之序列中甲基化之平均量。
除要求最適基因組位點低甲基化之外,所選玉米序列必須亦為非基因的。因此,所有低甲基化基因組序列進一步篩選以消除含有基因區之低甲基化序列。此包括任何開放閱讀框架,無論轉錄本是否編碼蛋白質。本發明之最適非基因玉米基因座排除包括基因區之低甲基化基因組序列,包括任何可鑑別的參與調節開放閱讀框架表現之相鄰5'及3'非編碼核苷酸序列及可存在於基因區中之任何內含子。
最適非基因玉米基因座必須亦為已證明重組跡象之序列。在一個實施例中,所選玉米序列必須為如使用自多個映射群體產生之高解析度標記物資料集偵測,已在 側接所選玉米序列之兩個標記物之間偵測到至少一個重組事件的玉米序列。在一個實施例中,側接包含所選玉米序列之0.5、1、1.5Mb玉米基因組序列的該對標記物用以計算所選玉米序列之重組頻率。每對標記物之間的重組頻率(以分摩(cM)量測)比標記物之間的基因組物理距離(Mb)必須超過0cM/Mb。在一個實施例中,包含所選玉米序列之1Mb玉米基因組序列的重組頻率在約0.00041至約4.0範圍內。在一個實施例中,包含所選玉米序列之1Mb玉米基因組序列的重組頻率在約0.5至約5.0範圍內。在一個實施例中,最適基因座為已在所選玉米序列內偵測到重組事件之基因座。
最適非基因玉米基因座亦將為可靶向序列,亦即在玉米基因組中相對獨特,使得靶向所選玉米序列之基因將僅僅在玉米基因組之一個位置中插入的序列。在一個實施例中,最適基因組序列之整個長度與玉米基因組中含有之類似長度之另一序列共享小於30%、35%或40%序列一致性。因此,在一個實施例中,所選玉米序列不可包含與玉米基因組中含有之另一1Kb序列共享超過25%、30%、35%或40%序列一致性的1Kb序列。在另一個實施例中,所選玉米序列不可包含與玉米基因組中含有之另一500bp序列共享超過30%、35%或40%序列一致性的500bp序列。在一個實施例中,所選玉米序列不可包含與玉米基因組中含有之另一1Kb序列共享超過40%序列一致性的1KB序列。
最適非基因玉米基因座亦將接近基因區。更特定言之,所選玉米序列必須位於基因區附近(例如基因區必須 位於側接及鄰接如在原生基因組中發現之所選玉米任一末端之基因組序列的40Kb內)。在一個實施例中,基因區位於處於如在原生玉米基因組中發現之所選玉米序列任一末端的鄰接基因組序列之10、20、30或40Kb內。在一個實施例中,兩個或兩個以上基因區位於側接所選玉米序列兩個末端之鄰接基因組序列之10、20、30或40Kb內。在一個實施例中,1-9個基因區位於側接所選玉米序列兩個末端之鄰接基因組序列之10、20、30或40Kb內。在一個實施例中,兩個或兩個以上基因區位於包含所選玉米序列之20、30或40Kb基因組序列內。在一個實施例中,1-9個基因區位於包含所選玉米序列之40Kb基因組序列內。在一個實施例中,位於側接所選玉米序列之鄰接基因組序列之10、2030或40Kb內的基因區包含在玉蜀黍基因組中的已知基因。
根據一個實施例,提供經修飾之非基因玉米基因座,其中基因座至少1KB長,非基因,不包含甲基化胞嘧啶殘基,具有在涵蓋玉米基因座之1Mb基因組區域上超過0.00041cM/Mb之重組頻率,且玉米基因座之1Kb序列與玉米基因組中含有之任何其他1Kb序列共享小於40%序列一致性,其中藉由插入感興趣的DNA至非基因玉米基因座中來修飾非基因玉米基因座。
根據一個實施例,提供一種用於鑑別最適非基因玉米基因座之方法。在一些實施例中,該方法首先包含篩選玉米基因組以產生第一池之所選玉米序列,其具有1Kb之最小長度且低甲基化,視情況其中基因組序列具有小於 1%甲基化,或其中基因組序列缺乏任何甲基化胞嘧啶殘基。此第一池之所選玉米序列可進一步篩選以消除不滿足對最適非基因玉米基因座之要求的基因座。自第一池之序列消除編碼玉米轉錄本,與類似長度之另一序列共享超過40%或更高序列一致性,不顯示重組跡象,且在所選玉米序列之40Kb內不具有已知之開放閱讀框架之玉米基因組序列,剩下第二池之有資格作為最適非基因玉米基因座之序列。在一個實施例中,自第一池之序列消除在該非基因序列一個末端之40Kb內不具有已知玉米基因或包含已知玉米基因之2Kb上游及/或1Kb下游區之序列的任何所選玉米序列。在一個實施例中,消除在所選玉米序列之40Kb內不含表現蛋白質之已知基因的任何所選玉米序列。在一個實施例中,消除不具有超過0.00041cM/Mb之重組頻率的任何所選玉米序列。
使用此等選擇標準,申請者已鑑別出用作最適非基因玉米基因座的玉蜀黍之精選最適基因座,其序列揭示為SEQ ID NO:1-SEQ ID NO:5,286。本發明亦涵蓋所鑑別之最適非基因玉米基因座的天然變異體或經修飾之衍生物,其中變異或衍生基因座包含與SEQ ID NO:1-SEQ ID NO:5,286之任何序列有1、2、3、4、5、6、7、8、9或10個核苷酸不同的序列。在一個實施例中,根據本發明使用之最適非基因玉米基因座包含選自SEQ ID NO:1-SEQ ID NO:5,286之序列或與選自SEQ ID NO:1-SEQ ID NO:5,286之序列共享90%、91%、92%、93%、94%、95%、96%、97%、 98%或99%序列一致性的序列。
在另一個實施例中,根據本發明使用之最適非基因玉米基因座包含選自任何種類玉米或玉米植物之序列。在另一個實施例中,根據本發明使用之最適非基因玉米基因座包含選自黃色玉米同系繁殖物之序列。因此,黃色玉米同系繁殖物包括凹或硬黃色玉米同系繁殖植物,包括其農藝學上優良變體。在隨後實施例中,根據本發明使用之最適非基因玉米基因座包含選自可轉型玉米株系之序列。在一個實施例中,代表性的可轉型玉米株系包括;Hi-II、B73、B104、Mo 17、W22、A188、H99及其衍生物。熟習此項技術者將瞭解,由於種系發生之分歧,各種類型之玉米株系不含一致的基因組DNA序列,且基因組序列內可存在多態現象或對偶基因變異。在一個實施例中,本發明涵蓋所鑑別之最適非基因玉米基因座的此類多態現象或對偶基因變異,其中多態現象或對偶基因變異包含與SEQ ID NO:1-SEQ ID NO:5,286之任何序列有1、2、3、4、5、6、7、8、9或10個核苷酸不同的序列。在另一個實施例中,本發明涵蓋所鑑別之最適非基因玉米基因座的此類多態現象或對偶基因變異,其中多態現象或對偶基因變異包含與SEQ ID NO:1-SEQ ID NO:5,286之任何序列共享90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列一致性的序列。
包含5,286個個別序列之所鑑別之最適基因座可藉由使用多變數分析方法進一步分析而分類為各種子群。 任何多變數分析統計程式之應用用於揭示一組變數之潛在結構(尺寸)。可使用大量不同類型之多變數算法,例如可使用多元回歸分析、邏輯回歸分析、辨別分析、多變數方差分析(MANOVA)、因子分析(包括共因子分析及主分量分析)、聚類分析、多維標度、對應分析、聯合分析、典型分析、典型相關及結構方程模型來分析資料集。
根據一個實施例,最適非基因玉米基因座使用諸如主分量分析(PCA)之多變數資料分析進一步分析。此處僅僅將給出簡要說明,更多資訊可見於H.Martens,T.Naes,Multivariate Calibration,Wiley,N.Y.,1989中。PCA評估資料之潛在維度(潛在變數),且概述資料中之主導模式及主要傾向。在一個實施例中,最適非基因玉米基因座可經由主分量分析(PCA)統計方法分選成叢。PCA為使用正交變換將一組可能相關變數之觀測結果轉變成稱為主分量之一組線性不相關變數值的數學程序。主分量數目小於或等於初始變數數目。此變換以如下方式定義:第一主分量具有最大可能方差(亦即解釋資料中儘可能多之變化性),且繼而每個後續分量具有在其與前述分量正交(亦即不相關)之約束下可能的最高方差。若資料集共同正常分佈,則保證主分量為獨立的。PCA對初始變數之相對定標敏感。PCA基於實體特徵將一組實體叢集之用途的實例包括;Ciampitti,I.等人,(2012)Crop Science,52(6);2728-2742,Chemometrics:A Practical Guide,Kenneth R.Beebe,Randy J.Pell,及Mary Beth Seasholtz,Wiley-Interscience,第1版,1998,美國專利 第8,385,662號及歐洲專利第2,340,975號。
根據一個實施例,主分量分析(PCA)在5,286個最適玉米基因座上,針對每個鑑別之最適玉米基因座使用以下10個特徵進行:
1. 最適基因座(OGL)周圍低甲基化區域之長度
a. 在用甲基化敏感性限制酶消化基因組DNA之後,使用Illumina/Solexa 1G平行測序資料建立根及芽組織之基因組廣泛甲基化概況(Wang等人,(2009)Genome-Wide and Organ-Specific Landscapes of Epigenetic Modifications and Their Relationships to mRNA and Small RNA Transcriptomes in Maize.Plant Cell 21(4):1053-1069)。與基因組映射之序列指示在映射位置存在DNA甲基化且無映射序列之染色體區段指示不存在甲基化(低甲基化)。使用描述之甲基化概況計算每一OGL周圍之低甲基化區域的長度。
2. OGL周圍1MB區域中之重組率
a. 對於每個OGL,鑑別1Mb窗口內OGL任一邊緣上之一對標記物。跨越染色體,每對標記物之間的重組頻率係基於標記物之間的遺傳距離(分摩(cM))與標記物之間的基因組物理距離(Mb)的比率計算。
3. OGL序列獨特性程度
a. 對於每個OGL,使用基於BLAST之同源性搜索,針對玉蜀黍栽培品種B73基因組掃描OGL之核苷酸序列。因為自玉蜀黍栽培品種B73基因組鑑別此等OGL序列,所以經由此搜索鑑別之第一BLAST命中代表OGL序列本身。鑑別每 個OGL之第二BLAST命中且命中之比對覆蓋度用作玉蜀黍基因組內OGL序列獨特性的量度。
4. OGL與其鄰域中最靠近基因的距離
a. 自玉米基因組資料庫(www.maizegdb.org)提取玉蜀黍栽培品種B73基因組中已知基因之基因註釋資訊及位置。對於每個OGL,鑑別其上游或下游鄰域中最靠近之註釋基因且量測OGL序列與該基因之間的距離(bp)。
5. OGL鄰域中之GC%
a. 對於每個OGL,分析核苷酸序列以估計存在之鳥嘌呤及胞嘧啶鹼基的數目。此計數表示為每個OGL之序列長度的百分比且提供GC%之量度。
6. OGL周圍40Kb鄰域中之基因數目
a. 自玉米基因組資料庫(www.maizegdb.org)提取玉蜀黍栽培品種B73基因組中已知基因之基因註釋資訊及位置。對於每個OGL,定義OGL周圍之40Kb窗口,且計數位置與此窗口重疊之註釋基因的數目。
7. OGL周圍40Kb鄰域中之平均基因表現
a. 藉由使用RNAseq技術分析由玉蜀黍栽培品種B73根及芽組織產生之轉錄組概況分析資料,量測玉米基因之轉錄物表現位準。對於每個OGL,鑑別玉蜀黍栽培品種B73基因組內的存在於OGL周圍40Kb鄰域中之註釋基因。自轉錄組概況提取窗口中每個基因之表現位準且計算平均基因表現位準。
8. OGL周圍核小體占位位準
a. 瞭解特定核苷酸序列之核小體占位位準提供關於染色體功能及序列之基因組背景的資訊。NuPoPTM統計套裝軟體提供一種用於預測任何大小之基因組序列的核小體占位率及最可能核小體定位圖譜的用戶親和軟體工具(Xi,L.,Fondufe-Mittendor,Y.,Xia,L.,Flatow,J.,Widom,J.及Wang,J.-P.,Predicting nucleosome positioning using a duration Hidden Markov Model,BMC Bioinformatics,2010,doi:10.1186/1471-2105-11-346)。對於每個OGL,核苷酸序列提交至NuPoPTM軟體中且計算核小體占位評分。
9. 染色體內相對位置(與著絲點之接近度)
a. 自玉米基因組資料庫(www.maizegdb.org)提取關於每個玉米染色體中著絲點位置及染色體臂長度之資訊。對於每個OGL,量測OGL序列至其定位之染色體著絲點之基因組距離(bp)。染色體內OGL之相對位置表示為相對於其所處之特定染色體臂之長度,其離著絲點之基因組距離的比率。
10. OGL周圍1MB區域中之OGL數目
a. 對於每個OGL,定義OGL位置周圍之1Mb基因組窗口,且計算玉米1Kb OGL資料集中基因組位置與此窗重疊之OGL數目。
每個最適非基因玉米基因座之特徵及屬性評分的結果或值進一步描述於實例2之表3中。所得資料集用於PCA統計方法中以將5,286個所鑑別之最適非基因玉米基因座叢集成叢。在叢集過程期間,在估計最適基因座之「p」 主分量之後,在「p」維歐幾里得空間中將最適基因座分配至32叢之一。每一「p」軸劃分成「k」個間隔。將分配至相同間隔之最適基因座分組在一起以形成叢。使用此分析,將每個PCA軸劃分成兩個間隔,其基於關於實驗性驗證所需要之叢數目的先驗資訊來選擇。所得叢之所有分析及觀測用來自Chemical Computing Group Inc.(Montreal,Quebec,Canada)之Molecular Operating EnvironmentTM(MOE)軟體進行。PCA方法用於基於上述特徵值叢集一組5,286個最適玉米基因座成32個不同叢。
在PCA過程期間,產生五個主分量(PC),其中頭三個PC含有資料集中約90%總變化(表4)。此三個PC用於以三維曲線圖解表示32個叢(參見圖3)。在完成叢集過程之後,自每個叢選擇一個代表性最適基因座。此藉由在每個叢內,藉由計算方法選擇最靠近叢質心的精選最適基因座來進行(表4)。32個代表性最適基因座之染色體位置均一分佈在玉米染色體組中,如圖4中所示。
根據一個實施例,提供一種經純化之最適非基因序列,其中該經純化之序列至少1Kb長且與選自實例8之表15中所述之任何序列的非基因序列具有至少90%、95%或99%序列一致性。在一個實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)、基因座_136086_G1(SEQ ID NO:4425)、基因座_203704_G1(SEQ ID NO:2033)、基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_204726_G1(SEQ ID NO:424)及基因座232228_G1(SEQ ID NO:4529)。在一個實施例中,經純化之序列為至少1Kb長且與選自由以下各者組成之群的非基因序列中存在之序列具有至少90%、95%或99%序列一致性:基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)、基因座_136086_G1(SEQ ID NO:4425)、基因座_203704_G1(SEQ ID NO:2033)、基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_204726_G1(SEQ ID NO:424)及基因座_232228_G1(SEQ ID NO:4529)。在一個實施例中,提供一種經純化之序列,其至少1Kb長且與選自由以下各者組成之群的非基因序列中存在之序列具有至少90%、95%或99%序列一致 性:最適基因座_204637(SEQ ID NO:2731)、最適基因座_136086(SEQ ID NO:4425)、最適基因座_232484(SEQ ID NO:2053)、最適基因座_203075(SEQ ID NO:2030)、最適基因座_3733(SEQ ID NO:1923)、最適基因座_168286(SEQ ID NO:573)、最適基因座_128078(SEQ ID NO:560)、最適基因座_265551(SEQ ID NO:463)、最適基因座_127268(SEQ ID NO:2709)、最適基因座_204726(SEQ ID NO:424)及最適基因座_232222(SEQ ID NO:3357)。在一個實施例中,提供一種經純化之序列,其至少1Kb長且與選自由以下各者組成之群的非基因序列中存在之序列具有至少90%、95%或99%序列一致性:最適基因座_204637(SEQ ID NO:2731)、最適基因座_136086(SEQ ID NO:4425)、最適基因座_232484(SEQ ID NO:2053)、最適基因座_203075(SEQ ID NO:2030)、最適基因座_3733(SEQ ID NO:1923)、最適基因座_168286(SEQ ID NO:573)、最適基因座_128078(SEQ ID NO:560)及最適基因座_265551(SEQ ID NO:463)。在一個實施例中,提供一種經純化之序列,其至少1Kb長且與選自由以下各者組成之群的非基因序列中存在之序列具有至少90%、95%或99%序列一致性:最適基因座_204637(SEQ ID NO:2731)、最適基因座_203075(SEQ ID NO:2030)及最適基因座_128078(SEQ ID NO:560)。
在一個實施例中,提供一種經純化之序列,其包含與選自由以下各者組成之群的非基因序列中存在之序列一致之1Kb序列:最適基因座_204637(SEQ ID NO:2731)、 最適基因座_136086(SEQ ID NO:4425)、最適基因座_232484(SEQ ID NO:2053)、最適基因座_203075(SEQ ID NO:2030)、最適基因座_3733(SEQ ID NO:1923)、最適基因座_168286(SEQ ID NO:573)、最適基因座_128078(SEQ ID NO:560)及最適基因座_265551(SEQ ID NO:463)。在一個實施例中,提供一種經純化之序列,其包含與選自由以下各者組成之群的非基因序列中存在之序列一致之1Kb序列:最適基因座_204637(SEQ ID NO:2731)、最適基因座_203075(SEQ ID NO:2030)及最適基因座_128078(SEQ ID NO:560)。
在一個實施例中,本發明係關於一種重組序列,其包含:至少1Kb且與選自由基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)及基因座_204637_G1(SEQ ID NO:2731)組成之群的非基因序列具有至少90%、95%或99%序列一致性的核酸序列,其中感興趣的DNA插入該非基因序列中。
根據一個實施例,提供一種經修飾之最適非基因玉米基因座,其中該最適非基因玉米基因座已經修飾以包含一或多個核苷酸取代、缺失或插入。在一個實施例中,最適非基因玉米基因座藉由插入感興趣的DNA且視情況伴隨基因座序列之進一步核苷酸複製、缺失或倒置來修飾。
在一個實施例中,待修飾之最適非基因玉米基因座為選自實例8之表15中描述之任何序列的基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)、基因座_136086_G1(SEQ ID NO:4425)、基因座_203704_G1(SEQ ID NO:2033)、基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_204726_G1(SEQ ID NO:424)及基因座_232228_G1(SEQ ID NO:4529)。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_137693_G1(SEQ ID NO:387)之基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_265551_G1(SEQ ID NO:463)之基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_128078_G1(SEQ ID NO:560)之基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_168286_G1(SEQ ID NO:573)之基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_3733_G1(SEQ ID NO:1923) 之基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_203075_G1(SEQ ID NO:2030)之基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_232484_G1(SEQ ID NO:2053)之基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_136086_G1(SEQ ID NO:4425)之基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_203704_G1(SEQ ID NO:2033)之基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_127268_G1(SEQ ID NO:2709)之基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_204637_G1(SEQ ID NO:2731)之基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_291068_G1(SEQ ID NO:3230)之基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_232222_G1(SEQ ID NO:3357)之基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_43577_G1(SEQ ID NO:3428)之基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_204726_G1(SEQ ID NO:424)之基因組序列。在一個實施例中,待修飾之最適非基因玉米基因座為來自基因座_232228_G1(SEQ ID NO:4529)之基因組序列。
在另一實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)、基因座_136086_G1(SEQ ID NO:4425)及基因座_203704_G1(SEQ ID NO:2033)。在另一實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)及基因座_136086_G1(SEQ ID NO:4425)。在另一實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)及基因座_232484_G1(SEQ ID NO:2053)。在另一實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)及基因座_203075_G1(SEQ ID NO:2030)。在另一實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)及基因座_3733_G1(SEQ ID NO:1923)。在另一實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)及基因座_168286_G1(SEQ ID NO:573)。在另一實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)及基因座_128078_G1(SEQ ID NO:560)。在另一實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座_137693_G1(SEQ ID NO:387)及基因座_265551_G1(SEQ ID NO:463)。
在另一實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_204726_G1(SEQ ID NO:424)及基因座_232228_G1(SEQ ID NO:4529)。在另一實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座 _127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)及基因座_204726_G1(SEQ ID NO:424)。在另一實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)及基因座_43577_G1(SEQ ID NO:3428)。在另一實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)及基因座_232222_G1(SEQ ID NO:3357)。在另一實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)及基因座_291068_G1(SEQ ID NO:3230)。在另一實施例中,待修飾之最適非基因玉米基因座為選自以下各者之基因組序列:基因座_127268_G1(SEQ ID NO:2709)及基因座_204637_G1(SEQ ID NO:2731)。
在一個實施例中,最適非基因玉米基因座係選自以下各者之基因組序列:基因座_59517_G1(SEQ ID NO:1)、基因座_159525_G1(SEQ ID NO:199)、基因座_9811_G1(SEQ ID NO:365)、基因座_7507_G1(SEQ ID NO: 543)、基因座_178978_G1(SEQ ID NO:687)、基因座_285621_G1(SEQ ID NO:875)、基因座_221721_G1(SEQ ID NO:1089)、基因座_83937_G1(SEQ ID NO:1233)、基因座_37146_G1(SEQ ID NO:1369)、基因座_156393_G1(SEQ ID NO:1571)、基因座_343678_G1(SEQ ID NO:1795)、基因座_60209_G1(SEQ ID NO:1980)、基因座_282323_G1(SEQ ID NO:2171)、基因座_64542_G1(SEQ ID NO:2349)、基因座_162531_G1(SEQ ID NO:2557)、基因座_337001_G1(SEQ ID NO:2693)、基因座_66202_G1(SEQ ID NO:2855)、基因座_185454_G1(SEQ ID NO:3004)、基因座_239863_G1(SEQ ID NO:3151)、基因座_257541_G1(SEQ ID NO:3289)、基因座_217939_G1(SEQ ID NO:3455)、基因座_326869_G1(SEQ ID NO:3586)、基因座_31710_G1(SEQ ID NO:3731)、基因座_81941_G1(SEQ ID NO:3849)、基因座_198387_G1(SEQ ID NO:3981)、基因座_197372_G1(SEQ ID NO:4192)、基因座_106202_G1(SEQ ID NO:4401)、基因座_232228_G1(SEQ ID NO:4529)、基因座_244324_G1(SEQ ID NO:4646)、基因座_157315_G1(SEQ ID NO:4836)、基因座_137489_G1(SEQ ID NO:5046)及基因座_31764_G1(SEQ ID NO:5162)。
在一個實施例中,最適非基因玉米基因座係選自以下各者之基因組序列:基因座_59517_G1(SEQ ID NO:1)、基因座_25001_G1(SEQ ID NO:100)、基因座_112632_G1(SEQ ID NO:203)、基因座_28905_G1(SEQ ID NO:295)、基因座_129164_G1(SEQ ID NO:384)、基因座_204726_G1(SEQ ID NO:424)、基因座_2425_G1(SEQ ID NO:451)、基因座_122036_G1(SEQ ID NO:547)、基因座_5735_G1(SEQ ID NO:671)、基因座_178978_G1(SEQ ID NO:687)、基因座_288388_G1(SEQ ID NO:781)、基因座_60310_G1(SEQ ID NO:843)、基因座_285621_G1(SEQ ID NO:875)、基因座_243330_G1(SEQ ID NO:967)、基因座_127038_G1(SEQ ID NO:1107)、基因座_262784_G1(SEQ ID NO:1147)、基因座_344662_G1(SEQ ID NO:1190)、基因座_153894_G1(SEQ ID NO:1252)、基因座_28771_G1(SEQ ID NO:1300)、基因座_1098_G1(SEQ ID NO:1371)、基因座_97772_G1(SEQ ID NO:1569)、基因座_156393_G1(SEQ ID NO:1571)、基因座_236662_G1(SEQ ID NO:1663)、基因座_139485_G1(SEQ ID NO:1822)、基因座_301175_G1(SEQ ID NO:1906)、基因座_152337_G1(SEQ ID NO:2003)、基因座_202616_G1(SEQ ID NO:2027)、基因座_203704_G1(SEQ ID NO:2033)、基因座_282323_G1(SEQ ID NO:2171)、基因座_262782_G1(SEQ ID NO:2256)、基因座_64542_G1(SEQ ID NO:2349)、基因座_236455_G1(SEQ ID NO:2428)、基因座_162531_G1(SEQ ID NO:2557)、基因座_301774_G1(SEQ ID NO:2632)、基因座_344663_G1(SEQ ID NO:2649)、基因座_337001_G1(SEQ ID NO:2693)、基因座_204637_G1(SEQ ID NO:2731)、基因座_238100_G1(SEQ ID NO:2753)、基因座 _66202_G1(SEQ ID NO:2855)、基因座_264359_G1(SEQ ID NO:2934)、基因座_282653_G1(SEQ ID NO:3086)、基因座_80282_G1(SEQ ID NO:3139)、基因座_291068_G1(SEQ ID NO:3230)、基因座_56395_G1(SEQ ID NO:3270)、基因座_200497_G1(SEQ ID NO:3334)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_5607_G1(SEQ ID NO:3435)、基因座_114664_G1(SEQ ID NO:3457)、基因座_228254_G1(SEQ ID NO:3497)、基因座_120993_G1(SEQ ID NO:3593)、基因座_53137_G1(SEQ ID NO:3702)、基因座_31710_G1(SEQ ID NO:3731)、基因座_344664_G1(SEQ ID NO:3815)、基因座_81941_G1(SEQ ID NO:3849)、基因座_321514_G1(SEQ ID NO:3939)、基因座_198387_G1(SEQ ID NO:3981)、基因座_301180_G1(SEQ ID NO:4113)、基因座_197372_G1(SEQ ID NO:4192)、基因座_348776_G1(SEQ ID NO:4350)、基因座_244439_G1(SEQ ID NO:4458)、基因座_348258_G1(SEQ ID NO:4487)、基因座_232228_G1(SEQ ID NO:4529)、基因座_322501_G1(SEQ ID NO:4610)、基因座_244324_G1(SEQ ID NO:4646)、基因座_97232_G1(SEQ ID NO:4832)、基因座_157315_G1(SEQ ID NO:4836)、基因座_282499_G1(SEQ ID NO:4953)、基因座_155031_G1(SEQ ID NO:5060)、基因座_301773_G1(SEQ ID NO:5110)、基因座_283161_G1(SEQ ID NO:5213)、基因座_55524_G1(SEQ ID NO: 5264)、基因座_127268_G1(SEQ ID NO:21492709)、基因座_136086_G1(SEQ ID NO:34844425)、基因座_232484_G1(SEQ ID NO:34172053)、基因座_3733_G1(SEQ ID NO:36261923)、基因座_168286_G1(SEQ ID NO:3473571)、基因座_128078_G1(SEQ ID NO:3047560)、基因座_265551_G1(SEQ ID NO:3547463)及基因座_137693_G1(SEQ ID NO:387)。
在一個實施例中,最適非基因玉米基因座用感興趣的DNA靶向,其中感興趣的DNA整合在鋅指核酸酶標靶位點內或與鋅指核酸酶標靶位點接近處。根據一個實施例,最適玉米精選基因座之例示性鋅指標靶位點提供於表8中。根據一個實施例,感興趣的DNA之整合發生在以下例示性標靶位點內或近側:111879ZFN5及111879ZFN7;111885ZFN1及111885ZFN2;SIG115737_31v1及SIG115737_32v1;SIG120523_11v1及SIG120523_12v1;SIG115246_5及SIG115246_6;SIG115636_1v1及SIG115636_2v1;SIG120417_11v1及SIG120417_12v1;SIG120621_15v1及SIG120621_16v1;SIG12078_11v1及SIG12078_12v1;以及SIG157315_1v1及SIG157315_2v1、ZFN_結合_1及ZFN_結合_2、ZFN_結合_3及ZFN_結合_4、ZFN_結合_5及ZFN_結合_6、ZFN_結合_7及ZFN_結合_8、ZFN_結合_9及ZFN_結合_10、ZFN_結合_11及ZFN_結合_12、ZFN_結合_13及ZFN_結合_14、ZFN_結合_15及ZFN_結合_16、ZFN_結合_17及ZFN_結合_18、ZFN_結合_19及 ZFN_結合_20、ZFN_結合_21及ZFN_結合_22、ZFN_結合_23及ZFN_結合_24、ZFN_結合_25及ZFN_結合_26、ZFN_結合_27及ZFN_結合_28、ZFN_結合_29及ZFN_結合_30、ZFN_結合_31及ZFN_結合_32、ZFN_結合_33及ZFN_結合_34、ZFN_結合_35及ZFN_結合_36、ZFN_結合_37及ZFN_結合_38、ZFN_結合_39及ZFN_結合_40、ZFN_結合_41及ZFN_結合_42、ZFN_結合_43及ZFN_結合_44、ZFN_結合_45及ZFN_結合_46、ZFN_結合_47及ZFN_結合_48、ZFN_結合_49及ZFN_結合_50、ZFN_結合_51及ZFN_結合_52、ZFN_結合_53及ZFN_結合_54、ZFN_結合_55及ZFN_結合_56、ZFN_結合_57及ZFN_結合_58、ZFN_結合_59及ZFN_結合_60、ZFN_結合_61及ZFN_結合_62、ZFN_結合_63及ZFN_結合_64、ZFN_結合_65及ZFN_結合_66、ZFN_結合_67及ZFN_結合_68、ZFN_結合_69及ZFN_結合_70、ZFN_結合_71及ZFN_結合_72、ZFN_結合_73及ZFN_結合_74、ZFN_結合_75及ZFN_結合_76、ZFN_結合_77及ZFN_結合_78、ZFN_結合_79及ZFN_結合_80、ZFN_結合_81及ZFN_結合_82、ZFN_結合_83及ZFN_結合_84、ZFN_結合_85及ZFN_結合_86、ZFN_結合_87及ZFN_結合_88、ZFN_結合_89及ZFN_結合_90、ZFN_結合_91及ZFN_結合_92、ZFN_結合_93及ZFN_結合_94、ZFN_結合_95及ZFN_結合_96、ZFN_結合_97及ZFN_結合_98、ZFN_結合_99及ZFN_結合_100、ZFN_結合_101及ZFN_結合_102、ZFN_結合_103及ZFN_結合_104、ZFN_結合_105及ZFN_結合_106、ZFN_結 合_107及ZFN_結合_108、ZFN_結合_109及ZFN_結合_110、ZFN_結合_111及ZFN_結合_112、ZFN_結合_113及ZFN_結合_114、ZFN_結合_115及ZFN_結合_116、ZFN_結合_117及ZFN_結合_118、ZFN_結合_119及ZFN_結合_120、ZFN_結合_121及ZFN_結合_122、ZFN_結合_123及ZFN_結合_124、ZFN_結合_125及ZFN_結合_126、ZFN_結合_127及ZFN_結合_128、ZFN_結合_129及ZFN_結合_130、ZFN_結合_131及ZFN_結合_132。
根據一個實施例,鋅指核酸酶結合於鋅指標靶位點且使獨特的玉米基因組聚核苷酸標靶位點裂解,因此感興趣的DNA在玉米基因組聚核苷酸標靶位點內或近側整合。在一個實施例中,感興趣的DNA在鋅指標靶位點內發生整合可導致重排。根據一個實施例,重排可包含缺失、插入、倒置及重複。在一個實施例中,感興趣的DNA之整合發生在鋅指標靶位點近側。根據實施例之一態樣,DNA之整合在鋅指標靶位點近側,且可整合在離鋅指標靶位點1.5Kb、1.25Kb、1.0Kb、0.75Kb、0.5Kb或0.25Kb內。插入與鋅指標靶位點接近之基因組區域內為此項技術中已知,參見美國專利公開案第2010/0257638 A1號(以全文引用的方式併入本文中)。
根據一個實施例,所選非基因序列包含以下特徵:a)該非基因序列在序列內不含超過1% DNA甲基化;b)該非基因序列具有離玉米染色體著絲點之基因組距 離0.0984至0.973比率之相對位置值;c)該非基因序列具有34.38%至61.2%之鳥嘌呤/胞嘧啶含量百分比;以及d)該非基因序列為約1Kb至約4.9Kb長。
II. 所鑑別之最適非基因玉米基因座之重組衍生物
根據一個實施例,已鑑別玉蜀黍基因座作為插入聚核苷酸供體序列之非常理想位置後,可將一或多個感興趣的核酸插入所鑑別之基因座中。在一個實施例中,感興趣的核酸包含外源性基因序列或其他合乎需要之聚核苷酸供體序列。在另一個實施例中,已鑑別玉蜀黍基因座作為插入聚核苷酸供體序列之非常理想位置後,可視情況除去、切除或移除最適非基因玉米基因座之一或多個感興趣的核酸,隨後感興趣的DNA整合至所鑑別之基因座中。在一個實施例中,感興趣的核酸插入最適非基因玉米基因座中包含外源性基因序列或其他合乎需要之聚核苷酸供體序列的移除、缺失或切除。
本發明進一步關於使用ZFN及聚核苷酸供體構築體靶向整合至精選玉蜀黍基因座中之方法及組合物。除非另外指明,否則用於將感興趣的核酸序列插入最適非基因玉米基因座中之方法使用如在熟習此項技術者技能內的分子生物學、生物化學、染色質結構及分析、細胞培養、重組DNA及相關領域中之習知技術。此等技術在文獻中充分說明。參見例如Sambrook等人MOLECULAR CLONING:A LABORATORY MANUAL,第二版,Cold Spring Harbor Laboratory Press,1989及第三版,2001;Ausubel等人,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,John Wiley & Sons,New York,1987及定期修訂;系列METHODS IN ENZYMOLOGY,Academic Press,San Diego;Wolfe,CHROMATIN STRUCTURE AND FUNCTION,第三版,Academic Press,San Diego,1998;METHODS IN ENZYMOLOGY,第304卷,「Chromatin」(P.M.Wassarman及A.P.Wolffe編輯),Academic Press,San Diego,1999;及METHODS IN MOLECULAR BIOLOGY,第119卷,「Chromatin Protocols」(P.B.Becker編輯)Humana Press,Totowa,1999。
核酸插入玉米基因組中之方法
根據本發明可使用任何熟知之用於將聚核苷酸供體序列及核酸酶序列以DNA構築體形式引入宿主細胞中之程序。此等程序包括使用磷酸鈣轉染、聚凝胺、原生質體融合、PEG、電穿孔、超音波法(例如聲孔效應)、脂質體、顯微注射、裸DNA、質體載體、游離型與整合型病毒性載體以及任何其他熟知之用於選殖基因組DNA、cDNA、合成DNA或其他外來遺傳物質引入宿主細胞中之方法(參見例如Sambrook等人,上文)。僅僅需要所使用之特定核酸插入程序能夠成功地將至少一個基因引入能夠表現所選蛋白質之宿主細胞中。
如上所指出,DNA構築體可藉由各種習知技術引入所需植物物種之基因組中。關於此類技術之評述,參見 例如Weissbach & Weissbach Methods for Plant Molecular Biology(1988,Academic Press,N.Y.)第VIII部分,第421-463頁;及Grierson & Corey,Plant Molecular Biology(1988,第2版),Blackie,London,第7-9章。DNA構築體可使用諸如植物細胞原生質體之電穿孔及顯微注射之技術,藉由用碳化矽纖維攪動(參見例如美國專利5,302,523及5,464,765)直接引入植物細胞之基因組DNA中,或DNA構築體可使用基因槍方法,諸如DNA粒子轟擊直接引入植物組織中(參見例如Klein等人(1987)Nature 327:70-73)。或者,DNA構築體可經由奈米粒子轉型引入植物細胞中(參見例如美國專利公開案第20090104700號,其以全文引用的方式併入本文中)。或者,DNA構築體可與適合的T-DNA邊界/側接區域組合且引入習知根癌土壤桿菌宿主載體中。科學文獻中充分描述根癌土壤桿菌介導之轉型技術,包括二元載體之解除及使用。參見例如Horsch等人(1984)Science 233:496-498,及Fraley等人(1983)Proc.Nat'l.Acad.Sci.USA 80:4803。
另外,可使用非土壤桿菌屬細菌或病毒,諸如根瘤菌屬NGR234、苜蓿中華根瘤菌(Sinorhizoboium meliloti)、百脈根根瘤菌(Mesorhizobium loti)、馬鈴薯病毒X、花椰菜花葉病毒及木薯脈花葉病毒及/或菸草花葉病毒實現基因轉移,參見例如Chung等人(2006)Trends Plant Sci.11(1):1-4。當使用二元T DNA載體(Bevan(1984)Nuc.Acid Res.12:8711-8721)或混合培養程序(Horsch等人 (1985)Science 227:1229-1231)使細胞感染細菌時,根癌土壤桿菌宿主之毒性功能將指導含有構築體及相鄰標記物之T-股插入植物細胞DNA中。一般地,土壤桿菌屬轉型系統用以工程改造雙子葉植物(Bevan等人(1982)Ann.Rev.Genet.16:357-384;Rogers等人(1986)Methods Enzymol.118:627-641)。土壤桿菌屬轉型系統亦可用以轉型以及轉移DNA至單子葉植物及植物細胞。參見美國專利第5,591,616號;Hernalsteen等人(1984)EMBO J.3:3039-3041;Hooykass-Van Slogteren等人(1984)Nature 311:763-764;Grimsley等人(1987)Nature 325:1677-179;Boulton等人(1989)Plant Mol.Biol.12:31-40;及Gould等人(1991)Plant Physiol.95:426-434。
替代基因轉移及轉型方法包括(但不限於)經由鈣、聚乙二醇(PEG)或電穿孔介導之裸DNA吸收的原生質體轉型(參見Paszkowski等人(1984)EMBO J.3:2717-2722,Potrykus等人(1985)Molec.Gen.Genet.199:169-177;Fromm等人(1985)Proc.Nat.Acad.Sci.USA 82:5824-5828;及Shimamoto(1989)Nature 338:274-276)及植物組織之電穿孔(D'Halluin等人(1992)Plant Cell 4:1495-1505)。用於植物細胞轉型之其他方法包括顯微注射、碳化矽介導之DNA吸收(Kaeppler等人(1990)Plant Cell Reporter 9:415-418)及微彈轟擊(參見Klein等人(1988)Proc.Nat.Acad.Sci.USA 85:4305-4309;及Gordon-Kamm等人(1990)Plant Cell 2:603-618)。
在一個實施例中,引入宿主細胞中以靶向插入基因組中之感興趣的核酸在靶向之感興趣的核酸之一或兩個末端上包含同源側接序列。在此類實施例中,同源側接序列含有與玉米基因組序列足夠程度的序列一致性,以支持其與同其具有同源性之基因組序列之間的同源重組。供體與基因組序列之間在70%至100%範圍內的大概25、50、100、200、500、750、1000、1500或2000個核苷酸或更多個核苷酸之序列一致性(或10與200個核苷酸之間的任何整數值或更大)將支持其間的同源重組。
在另一個實施例中,靶向之感興趣的核酸缺乏同源側接序列,且靶向之感興趣的核酸與基因組序列共享低至極低程度之序列一致性。
在細胞染色質中感興趣的區域中之序列靶向重組及/或置換及/或改變的其他實施例中,藉由與外源性「供體」核苷酸序列同源重組,改變染色體序列。若存在與斷裂區域同源之序列,則此類同源重組藉由細胞染色質中雙股斷裂之存在來刺激。細胞染色質中之雙股斷裂亦可刺激非同源末端接合之細胞機制。在本文中描述之任何方法中,第一核苷酸序列(「供體序列」)可含有與感興趣的區域中之基因組序列同源而不一致的序列,由此刺激同源重組,從而在感興趣的區域插入不一致序列。因此,在某些實施例中,與感興趣的區域中之序列同源之供體序列部分顯示與所置換之基因組序列約80、85、90、95、97.5至99%(或其間任何整數)之間的序列一致性。在其他實施例中,供 體與基因組序列之間的同源性高於99%,例如只要超過100個鄰接鹼基對之供體與基因組序列之間1個核苷酸不同即可。
在某些情況下,供體序列之非同源部分可含有在感興趣的區域中不存在之序列,使得新序列引入感興趣的區域中。在這些情況下,非同源序列一般側接50至2,000個鹼基對(或其間任何整數值)或超過2,000之任何數目之鹼基對的與感興趣的區域中之序列同源或一致的序列。在其他實施例中,供體序列不與感興趣的區域同源,且藉由非同源重組機制插入基因組中。
根據一個實施例,鋅指核酸酶(ZFN)用以在靶向基因座中引入雙股斷裂以促進感興趣的核酸之插入。可例如根據美國專利6,453,242中公開之方法選擇所選基因座內用於鋅指結構域結合之標靶位點,該專利之揭示內容併入本文中,其亦揭示用於設計鋅指蛋白質(ZFP)以結合於所選序列之方法。熟習此項技術者將清楚簡單肉眼觀察核苷酸序列亦可用於選擇標靶位點。因此,用於標靶位點選擇之任何方式可用於本文中描述之方法中。
對於ZFP DNA結合結構域,標靶位點一般由複數個相鄰標靶子位點構成。靶向子位點係指可與個別鋅指結合之相鄰四聯體重疊一個核苷酸的序列,通常核苷酸三聯體或者核苷酸四聯體。參見例如WO 02/077227,其揭示內容併入本文中。標靶位點一般具有至少9個核苷酸之長度,且因此由包含至少三個鋅指之鋅指結合結構域結合。然 而,例如4指結合結構域與12核苷酸標靶位點、5指結合結構域與15核苷酸標靶位點或6指結合結構域與18核苷酸標靶位點的結合亦為可能的。如將顯而易見,較大結合結構域(例如7、8、9指或更多)與較長標靶位點之結合亦符合本發明。
根據一個實施例,標靶位點不一定為三個核苷酸之倍數。在發生交叉股相互作用之情況下(參見例如美國專利6,453,242及WO 02/077227),多指結合結構域之一或多個個別鋅指可結合於重疊四聯體子位點。因此,三指蛋白質可結合10核苷酸序列,其中第十個核苷酸屬於末端指結合之四聯體,四指蛋白質可結合13核苷酸序列,其中第十三個核苷酸屬於末端指結合之四聯體等等。
多指結合結構域中個別鋅指之間的胺基酸連接子序列之長度及性質亦影響與標靶序列之結合。舉例而言,多指結合結構域中相鄰鋅指之間的所謂「非典型連接子」、「長連接子」或「結構化連接子」的存在可使該等指結合不緊靠之子位點。此類連接子之非限制性實例描述於例如美國專利第6,479,626號及WO 01/53480中。因此,針對鋅指結合結構域之標靶位點中的一或多個子位點彼此可相隔1、2、3、4、5或更多個核苷酸。一個非限制性實例將為結合於13核苷酸標靶位點的四指結合結構域,該標靶位點依序包含兩個鄰接3核苷酸子位點、插入核苷酸及兩個鄰接三聯體子位點。
雖然自自然界中存在之蛋白質鑑別之DNA結合 多肽通常結合於不連續的核苷酸序列或基元(例如共同識別序列),但此項技術中存在及已知用於修飾許多此類DNA結合多肽以識別不同核苷酸序列或基元之方法。DNA結合多肽包括例如且不限於鋅指DNA結合結構域;白胺酸拉鏈;UPA DNA結合結構域;GAL4;TAL;LexA;Tet阻遏蛋白;LacR;及類固醇激素受體。
在一些實例中,DNA結合多肽為鋅指。個別鋅指基元可設計成能靶向及特異性結合於大範圍DNA位點中之任一者。典型Cys2His2(以及非典型Cys3His)鋅指多肽藉由將α-螺旋插入標靶DNA雙螺旋之大溝中來結合DNA。鋅指對DNA之識別為模組化的;每個指主要接觸標靶中之三個連續鹼基對,且多肽中之幾個關鍵殘基介導識別。藉由在靶向核酸內切酶中包括多個鋅指DNA結合結構域,可進一步增加靶向核酸內切酶之DNA結合特異性(因而亦可增加由此賦予之任何基因調節作用的特異性)。參見例如Urnov等人(2005)Nature 435:646-51。因此,一或多個鋅指DNA結合多肽可經工程改造及使用,使得引入宿主細胞中之靶向核酸內切酶與宿主細胞之基因組內獨特的DNA序列相互作用。較佳地,鋅指蛋白質為非天然存在的,因為其經工程改造以結合於所選標靶位點。參見例如Beerli等人(2002)Nature Biotechnol.20:135-141;Pabo等人(2001)Ann.Rev.Biochem.70:313-340;Isalan等人(2001)Nature Biotechnol.19:656-660;Segal等人(2001)Curr.Opin.Biotechnol.12:632-637;Choo等人(2000)Curr.Opin.Struct.Biol. 10:411-416;美國專利第6,453,242號;第6,534,261號;第6,599,692號;第6,503,717號;第6,689,558號;第7,030,215號;第6,794,136號;第7,067,317號;第7,262,054號;第7,070,934號;第7,361,635號;第7,253,273號;及美國專利公開案第2005/0064474號;第2007/0218528號;第2005/0267061號,均以全文引用的方式併入本文中。
經工程改造之鋅指結合結構域與天然存在之鋅指蛋白質相比,可具有新穎的結合特異性。工程改造方法包括(但不限於)合理設計及各種類型之選擇。合理設計包括例如使用包含三聯體(或四聯體)核苷酸序列及個別鋅指胺基酸序列之資料庫,其中每個三聯體或四聯體核苷酸序列與結合特定三聯體或四聯體序列的鋅指之一或多個胺基酸序列締合。參見例如共同擁有之美國專利6,453,242及6,534,261,以全文引用的方式併入本文中。
或者,DNA結合結構域可來源於核酸酶。舉例而言,已知歸巢核酸內切酶及大範圍核酸酶之識別序列,諸如I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII及I-TevIII。亦參見美國專利第5,420,032號;美國專利第6,833,252號;Belfort等人(1997)Nucleic Acids Res.25:3379-3388;Dujon等人(1989)Gene 82:115-118;Perler等人(1994)Nucleic Acids Res.22,1125-1127;Jasin(1996)Trends Genet.12:224-228;Gimble等人(1996)J.Mol.Biol.263:163-180;Argast等人(1998)J.Mol.Biol.280:345-353及the New England Biolabs目錄。另外,歸巢核酸內切酶及大範圍核酸酶之DNA結合特異性可經工程改造以結合非天然標靶位點。參見例如Chevalier等人(2002)Molec.Cell 10:895-905;Epinat等人(2003)Nucleic Acids Res.31:2952-2962;Ashworth等人(2006)Nature 441:656-659;Paques等人(2007)Current Gene Therapy 7:49-66;美國專利公開案第20070117128號。
作為另一替代物,DNA結合結構域可來源於白胺酸拉鏈蛋白質。白胺酸拉鏈為在作為與基因表現相關聯之重要轉錄因子的許多真核調節蛋白中參與蛋白質-蛋白質相互作用之一類蛋白質。白胺酸拉鏈係指跨越包括動物、植物、酵母等若干領域,在此等轉錄因子中共享之共同結構基元。白胺酸拉鏈藉由結合於特定DNA序列之兩個多肽(同型二聚體或異型二聚體)以白胺酸殘基經由α-螺旋均勻間隔的方式形成,使得兩個多肽之白胺酸殘基在螺旋之相同面上終止。白胺酸拉鏈之DNA結合特異性可用於本文揭示之DNA結合結構域中。
在一些實施例中,DNA結合結構域為自來源於植物病原體黃單孢菌屬(Xanthomona)之TAL效應子工程改造之結構域(參見Miller等人(2011)Nature Biotechnology 29(2):143-8;Boch等人,(2009)Science 2009年10月29日(10.1126/science.117881)以及Moscou及Bogdanove,(2009)Science 2009年10月29日(10.1126/science.1178817);及美國專利公開案第20110239315號、第20110145940號及第 20110301073號)。
CRISPR(成叢的規律間隔之短迴文重複序列)/Cas(CRISPR相關)核酸酶系統為基於可用於基因組工程改造之細菌系統的近來工程改造之核酸酶系統。其係基於許多細菌及古細菌(Archea)之適應性免疫反應的一部分。當病毒或質體侵入細菌時,入侵者之DNA的區段藉由『免疫』反應轉變為CRISPR RNA(crRNA)。接著此crRNA經由部分互補性區域與稱為tracrRNA之另一類型RNA締合,以將Cas9核酸酶引導至標靶DNA中與crRNA同源之稱為「前間區」的區域。Cas9使DNA裂解,在DSB在crRNA轉錄本內含有之20核苷酸引導序列所指定之位點產生鈍端。Cas9需要crRNA與tracrRNA用於位點特異性DNA識別及裂解。此系統現已經工程改造,使得crRNA及tracrRNA可組合成一個分子(「單一引導RNA」),且單一引導RNA之crRNA同等部分可經工程改造以引導Cas9核酸酶來靶向任何所希望之序列(參見Jinek等人(2012)Science 337,第816-821頁,Jinek等人(2013),eLife 2:e00471,及David Segal,(2013)eLife 2:e00563)。因此,CRISPR/Cas系統可經工程改造以在基因組中之所希望標靶產生雙股斷裂(DSB),且DSB之修復可藉由使用修復抑制劑引起易出錯修復增加來影響。
在某些實施例中,Cas蛋白質可為天然存在之Cas蛋白質的「功能衍生物」。原生序列多肽之「功能衍生物」為具有與原生序列多肽一樣之定性生物學性質的化合物。 「功能衍生物」包括(但不限於)原生序列之片段及原生序列多肽及其片段之衍生物,限制條件為其具有與對應原生序列多肽一樣之生物活性。本文中涵蓋之生物活性為功能衍生物能夠將DNA受質水解成片段。「衍生物」一詞涵蓋多肽之胺基酸序列變異體、共價修飾及其融合物。Cas多肽或其片段之適合衍生物包括(但不限於)Cas蛋白質或其片段之突變體、融合物、共價修飾。包括Cas蛋白質或其片段以及Cas蛋白質或其片段之衍生物的Cas蛋白質可自細胞獲得或化學合成或藉由此兩個程序的組合合成。細胞可為天然產生Cas蛋白質之細胞,或天然產生Cas蛋白質之細胞,且經基因工程改造以在較高表現位準下產生內源性Cas蛋白質或自外部引入之核酸產生Cas蛋白質,該核酸編碼與內源性Cas相同或不同的Cas。在一些情況下,細胞不天然產生Cas蛋白質且經基因工程改造以產生Cas蛋白質。Cas蛋白質藉由用Cas核酸酶與引導RNA共同表現而用於哺乳動物細胞中(及推斷在植物細胞內)。兩種形式之引導RNA可用以促進Cas介導之基因組裂解,如Le Cong,F.,等人,(2013)Science 339(6121):819-823中所揭示。
在其他實施例中,DNA結合結構域可與裂解(核酸酶)結構域締合。舉例而言,歸巢核酸內切酶可在其DNA結合特異性上進行修飾,同時保留核酸酶功能。另外,鋅指蛋白質亦可與裂解結構域融合以形成鋅指核酸酶(ZFN)。本文揭示之融合蛋白的裂解結構域部分可自任何核酸內切酶或核酸外切酶獲得。裂解結構域可源自之例示性 核酸內切酶包括(但不限於)限制核酸內切酶及歸巢核酸內切酶。參見例如2002-2003 Catalogue,New England Biolabs,Beverly,MA;及Belfort等人(1997)Nucleic Acids Res.25:3379-3388。已知使DNA裂解之其他酶(例如S1核酸酶;綠豆核酸酶;胰腺DNase I;單子葉植物核酸酶;酵母HO核酸內切酶;亦參見Linn等人(編輯)Nucleases,Cold Spring Harbor Laboratory Press,1993)。已知歸巢核酸內切酶及大範圍核酸酶之非限制性實例包括I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII及I-TevIII。亦參見美國專利第5,420,032號;美國專利第6,833,252號;Belfort等人(1997)Nucleic Acids Res.25:3379-3388;Dujon等人(1989)Gene 82:115-118;Perler等人(1994)Nucleic Acids Res.22,1125-1127;Jasin(1996)Trends Genet.12:224-228;Gimble等人(1996)J.Mol.Biol.263:163-180;Argast等人(1998)J.Mol.Biol.280:345-353及the New England Biolabs目錄。此等酶中之一或多者(或其功能性片段)可用作裂解結構域及裂解半結構域之來源。
限制核酸內切酶(限制酶)存在於許多物種中且能夠序列特異性結合於DNA(在識別位點),且在結合位點上或附近使DNA裂解。某些限制酶(例如IIS類型)使DNA在自識別位點移除之位點裂解且具有可分離的結合及裂解結構域。舉例而言,IIS類型酶FokI催化DNA在一股上自其識別位點9個核苷酸及另一股上自其識別位點13個核苷酸處 進行雙股裂解。參見例如美國專利5,356,802;5,436,150及5,487,994;以及Li等人(1992)Proc.Natl.Acad.Sci.USA 89:4275-4279;Li等人(1993)Proc.Natl.Acad.Sci.USA 90:2764-2768;Kim等人(1994a)Proc.Natl.Acad.Sci.USA 91:883-887;Kim等人(1994b)J.Biol.Chem.269:31,978-31,982。因此,在一個實施例中,融合蛋白包含來自至少一種類型IIS限制酶之裂解結構域(或裂解半結構域)及可工程改造或可未工程改造之一或多個鋅指結合結構域。
裂解結構域可與結合結構域分離的一種例示性IIS類型限制酶為FokI。此特定的酶作為二聚體為活性的。Bitinaite等人(1998)Proc.Natl.Acad.Sci.USA 95:10,570-10,575。因此,出於本發明之目的,用於所揭示之融合蛋白的FokI酶部分視為裂解半結構域。因此,對於使用鋅指-FokI融合物之細胞序列的靶向雙股裂解及/或靶向置換,每一者包含FokI裂解半結構域之兩種融合蛋白可用於復原催化活性之裂解結構域。或者,亦可使用含有鋅指結合結構域及兩個FokI裂解半結構域之單一多肽分子。本發明其他地方提供使用鋅指-FokI融合物之靶向裂解及靶向序列改變的參數。
裂解結構域或裂解半結構域可為保留裂解活性,或保留多聚(例如二聚)能力以形成功能性裂解結構域的蛋白質任何部分。例示性IIS類型限制酶描述於以全文引用的方式併入本文中之國際公開案WO 2007/014275中。
為增強裂解特異性,亦可修飾裂解結構域。在某些實施例中,採用裂解半結構域之變異體,此等變異體使裂解半結構域之均二聚減至最少或防止均二聚。此類經修飾之裂解半結構域的非限制性實例詳細描述於以全文引用的方式併入本文中的WO 2007/014275中。在某些實施例中,裂解結構域包含將均二聚減至最少或防止均二聚的經工程改造之裂解半結構域(亦稱為二聚化結構域突變體)。熟習此項技術者已知此類實施例且例如描述於美國專利公開案第20050064474號、第20060188987號、第20070305346號及第20080131962號中,其揭示內容均以全文引用的方式併入本文中。FokI之位置446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537及538上之胺基酸殘基為影響FokI裂解半結構域之二聚化的所有標靶。
形成專性異型二聚體之FokI的其他工程改造裂解半結構域亦可用於本文中描述之ZFN中。形成專性異型二聚體之FokI之例示性工程改造裂解半結構域包括一對裂解半結構域,其中第一裂解半結構域包括FokI之位置490及538上之胺基酸殘基上的突變且第二裂解半結構域包括胺基酸殘基486及499上之突變。在一個實施例中,490上之突變用Lys(K)置換Glu(E),538上之突變用Lys(K)置換Iso(I);486上之突變用Glu(E)置換Gln(Q);且位置499上之突變用Lys(K)置換Iso(I)。特定言之,本文中描述之工程改造裂解半結構域藉由在一個裂解半結構域中使位置490(E→K) 及538(I→K)突變以產生稱為「E490K:I538K」之工程改造之裂解半結構域且藉由在另一個裂解半結構域中使位置486(Q→E)及499(I→L)突變以產生稱為「Q486E:I499L」之工程改造之裂解半結構域來製備。本文中描述之工程改造之裂解半結構域為專性異型二聚體突變體,其中異常裂解減至最少或消除。參見例如美國專利公開案第2008/0131962號,其揭示內容以全文引用的方式併入以達成所有目的。在某些實施例中,工程改造之裂解半結構域包含位置486、499及496(相對於野生型FokI編號)上突變,例如在位置486上用Glu(E)殘基置換野生型Gln(Q)殘基、在位置499上用Leu(L)殘基置換野生型Iso(I)殘基及在位置496上用Asp(D)或Glu(E)殘基置換野生型Asn(N)殘基之突變(分別亦稱為「ELD」及「ELE」結構域)。在其他實施例中,工程改造之裂解半結構域包含位置490、538及537(相對於野生型FokI編號)上突變,例如在位置490上用Lys(K)殘基置換野生型Glu(E)殘基、在位置538上用Lys(K)殘基置換野生型Iso(I)殘基及在位置537上用Lys(K)或Arg(R)殘基置換野生型His(H)殘基之突變(分別亦稱為「KKK」及「KKR」結構域)。在其他實施例中,工程改造之裂解半結構域包含位置490及537(相對於野生型FokI編號)上突變,例如在位置490上用Lys(K)殘基置換野生型Glu(E)殘基及在位置537上用Lys(K)殘基或Arg(R)殘基置換野生型His(H)殘基之突變(分別亦稱為「KIK」及「KIR」結構域)。(參見美國專利公開案第20110201055號)。在其他實施例中, 工程改造之裂解半結構域包含「Sharkey」及/或「Sharkey」突變(參見Guo等人,(2010)J.Mol.Biol.400(1):96-107)。
本文中描述之工程改造之裂解半結構域可使用任何適合的方法,例如藉由如美國專利公開案第20050064474號、第20080131962號及第20110201055號中所描述之野生型裂解半結構域(FokI)之定點突變誘發製備。或者,核酸酶可在核酸標靶位點使用所謂的「分裂酶」技術活體內組裝(參見例如美國專利公開案第20090068164號)。此類分裂酶之組分可在分開的表現構築體上表現,或可連接在一個開放閱讀框架中,其中個別組分例如藉由自我裂解2A肽或IRES序列分離。組分可為個別鋅指結合結構域或大範圍核酸酶核酸結合結構域之結構域。
核酸酶可在使用之前,例如在如WO 2009/042163及20090068164中所描述之基於酵母之染色體系統中針對活性篩選。可使用此項技術中已知之方法容易地設計核酸酶表現構築體。參見例如美國專利公開案20030232410;20050208489;20050026157;20050064474;20060188987;20060063231;及國際公開案WO 07/014275。核酸酶之表現可在組成性啟動子或可誘導啟動子,例如半乳糖激酶啟動子(其在棉子糖及/或半乳糖存在下活化(去阻遏)且在葡萄糖存在下阻遏)的控制下。
標靶位點之間的距離係指在兩個標靶位點之間,如自彼此最靠近的序列邊緣量測,所插入之核苷酸或核苷酸對的數目。在裂解視兩個鋅指結構域/裂解半結構域 融合分子之結合而定以分隔標靶位點的某些實施例中,兩個標靶位點可在相對的DNA股上。在其他實施例中,兩個標靶位點在相同的DNA股上。對於靶向整合至最適基因座,一或多個ZFP經工程改造以結合預定裂解位點上或附近之標靶位點,且在細胞中表現包含工程改造之DNA結合結構域及裂解結構域的融合蛋白。在融合蛋白之鋅指部分結合於標靶位點時,DNA較佳經由雙股斷裂,接近標靶位點,藉由裂解結構域裂解。
最適基因座中之雙股斷裂的存在促進經由同源重組之外源性序列整合。因此,在一個實施例中,包含待插入靶向基因座中之感興趣的核酸序列的聚核苷酸將包括一或多個與靶向基因座具有同源性之區域以促進同源重組。
除本文中描述之融合分子之外,所選基因組序列之靶向置換亦包含供體序列之引入。聚核苷酸供體序列可在融合蛋白表現之前、與其同時或在其之後引入細胞中。在一個實施例中,供體聚核苷酸與最適基因座具有足夠同源性以支持該供體聚核苷酸與同其具有同源性之最適基因座基因組序列之間的同源重組。供體與基因組序列之間大概25、50、100、200、500、750、1,000、1,500、2,000個核苷酸或更多個核苷酸或10與2,000個核苷酸之間的任何整數值或更大之序列同源性將支持同源重組。在某些實施例中,同源性臂長度小於1,000個鹼基對。在其他實施例中,同源性臂長度小於750個鹼基對。在一個實施例中,供 體聚核苷酸序列可包含含有不與細胞染色質中之感興趣的區域同源之序列的載體分子。供體聚核苷酸分子可含有若干與細胞染色質具有同源性之不連續區域。舉例而言,對於通常不存在於感興趣的區域中之序列的靶向插入,該等序列可存在於供體核酸分子中且側接感興趣的區域中與序列同源之區域。供體聚核苷酸可為DNA或RNA、單股或雙股,且可呈線狀或圓形引入細胞中。參見例如美國專利公開案第20100047805號、第20110281361號、第20110207221號及美國申請案第13/889,162號。若呈線狀形式引入,則可藉由熟習此項技術者已知之方法保護供體序列之末端(例如核酸外切降解)。舉例而言,一或多個二去氧核苷酸殘基添加至線狀分子之3’端及/或自補寡核苷酸接合至一個或兩個末端。參見例如Chang等人(1987)Proc.Natl.Acad.Sci.USA84:4959-4963;Nehls等人(1996)Science272:886-889。用於保護外源性聚核苷酸免於降解的其他方法包括(但不限於)添加末端胺基及使用經修飾之核苷酸間鍵(諸如硫代磷酸酯、胺基磷酸酯及O-甲基核糖或去氧核糖殘基)。
根據一個實施例,提供一種製備轉殖基因玉米植物之方法,其中感興趣的DNA已插入最適非基因玉米基因座中。該方法包含以下步驟:a. 選擇最適非基因玉米基因座作為感興趣的核酸插入之標靶;b. 將位點特異性核酸酶引入玉米植物細胞中,其中該位點特異性核酸酶使該非基因序列裂解; c. 將該感興趣的DNA引入該植物細胞中;以及d. 選擇包含靶向該非基因序列之感興趣的DNA之轉殖基因植物細胞。
根據一個實施例,提供一種製備轉殖基因玉米原生質體細胞之方法,其中感興趣的DNA已插入最適非基因玉米基因座中。該方法包含以下步驟:a. 選擇最適非基因玉米基因座作為感興趣的核酸插入之標靶;b. 將位點特異性核酸酶引入玉米原生質體細胞中,其中該位點特異性核酸酶使該非基因序列裂解;c. 將該感興趣的DNA引入該玉米原生質體細胞中;以及d. 選擇包含靶向該非基因序列之感興趣的DNA之轉殖基因玉米原生質體細胞。
在一個實施例中,位點特異性核酸酶係選自由以下各者組成之群:鋅指核酸酶、CRISPR核酸酶、TALEN核酸酶或大範圍核酸酶,且更特定言之,在一個實施例中,位點特異性核酸酶為鋅指核酸酶。根據一個實施例,感興趣的DNA經由同源性介導之修復整合方法整合在該非基因序列內。或者,在一些實施例中,感興趣的DNA經由非同源末端接合整合方法整合在該非基因序列內。在其他實施例中,感興趣的DNA經先前未描述之整合方法整合在該非基因序列內。在一個實施例中,該方法包含選擇最適非基因玉米基因座用於感興趣的DNA之靶向插入,該最適非基 因玉米基因座具有以下特徵中之2、3、4、5、6、7或8個:a. 該非基因序列至少1Kb長且在序列內不含超過1% DNA甲基化;b. 該非基因序列顯示玉米基因組內0.00041至62.42cM/Mb之重組率;c. 該非基因序列顯示玉米基因組的0至0.962之核小體占位位準;d. 該非基因序列與玉米基因組中含有之任何其他序列共享小於40%序列一致性;e. 該非基因序列具有離玉米染色體著絲點之基因組距離0.00373至0.99908比率之相對位置值;f. 該非基因序列具有25.17%至68.3%之鳥嘌呤/胞嘧啶含量百分比;g. 該非基因序列位於與基因序列接近處;以及h. 包含該非基因序列之玉米基因組序列的1Mb區域包含一或多個其他非基因序列。在一個實施例中,最適非基因玉米基因座係選自叢1、2、3、4、5、6、7、8、9、10、11、2、3、4、5、6、7、8、9、20、21、22、23、24、25、26、27、28、29、30、31或32之基因座。
傳遞
本文所揭示之供者分子經由靶向、同源非依賴性和/或同源依賴性方法整合至細胞之基因組中。對於此類靶向整合,使用核酸酶,例如DNA結合結構域(例如鋅指結合域、CRISPR或TAL效應結構域經工程改造以在預定裂解位 點或附近結合標靶位點)與核酸酶結構域(例如裂解結構域或裂解半結構域)之間的融合物,使基因組在所希望之位置(或位置)裂解。在某些實施例中,各包含DNA結合結構域及裂解半結構域之兩個融合蛋白在細胞中表現,且結合於標靶位點,該等標靶位點以使得復原功能性裂解結構域且DNA在標靶位點附近裂解的方式並列。在一個實施例中,在兩個DNA結合結構域之標靶位點之間出現裂解。DNA結合結構域中之一或兩者可經工程改造。亦參見美國專利第7,888,121號;美國專利公開案20050064474及國際專利公開案WO05/084190、WO05/014791及WO 03/080809。
如本文中所述之核酸酶可作為多肽和/或聚核苷酸引入。舉例而言,各包含編碼前述多肽之一之序列的兩個聚核苷酸可引入細胞中,且當多肽表現且各結合於其標靶序列時,在標靶序列或附近出現裂解。或者,包含編碼兩個融合多肽之序列的單一聚核苷酸引入細胞中。聚核苷酸可為DNA、RNA或任何經修飾之形式或類似物或DNA和/或RNA。
在感興趣的區域中引入雙股斷裂後,經由非同源依賴性方法(例如非同源末端接合(NHEJ)),在如本文中所述之雙股供體分子線性化後,以靶向方式將轉殖基因整合至感興趣的區域中。雙股供體較佳在活體內用核酸酶,例如一或多種用於將雙股斷裂引入基因組中之相同或不同核酸酶線性化。細胞中染色體及供體之同步裂解可限制供體DNA降解(與引入細胞之前供體分子之線性化相比)。用於 供體線性化之核酸酶標靶位點較佳不破壞轉殖基因序列。
轉殖基因可在藉由核酸酶突出物之簡單接合所預期的方向上(稱為「前向」或「AB」取向)或在替代方向上(稱為「反向」或「BA」取向)整合至基因組中。在某些實施例中,在供體及染色體突出物準確接合後,整合轉殖基因。在其他實施例中,BA或AB取向上轉殖基因之整合引起若干核苷酸缺失。
經由諸如此等技術之技術的應用,幾乎任何物種之細胞均可穩定轉型。在一些實施例中,轉型DNA整合至宿主細胞之基因組中。在多細胞物種之情況下,轉殖基因細胞可再生至轉殖基因生物體中。任何此等技術均可用於產生例如在轉殖基因植物之基因組中包含一或多個供體聚核苷酸序列之轉殖基因植物。
在本發明之實施例中,核酸之傳遞可在傳遞DNA、RNA、肽及/或蛋白質或核酸及肽組合至植物細胞的方法中,藉由熟習此項技術者已知之包括例如且(不限於)以下之任何方法引入植物細胞中:原生質體轉型(參見例如美國專利5,508,184);乾燥/抑制介導之DNA吸收(參見例如Potrykus等人(1985)Mol.Gen.Genet.199:183-8);電穿孔(參見例如美國專利5,384,253);用碳化矽纖維攪動(參見例如美國專利5,302,523及5,464,765);土壤桿菌屬介導之轉型(參見例如美國專利5,563,055、5,591,616、5,693,512、5,824,877、5,981,840及6,384,301);加速DNA塗佈之粒子(參見例如美國專利5,015,580、5,550,318、5,538,880、 6,160,208、6,399,861及6,403,865)及奈米粒子、奈米載體及細胞穿透肽(WO201126644A2;WO2009046384A1;WO2008148223A1)。
最廣泛用於將表現載體引入植物中之方法係基於土壤桿菌屬之天然轉型系統。根癌土壤桿菌及毛根土壤桿菌為使植物細胞在基因上轉型之植物病原性土壤細菌。根癌土壤桿菌及毛根土壤桿菌之Ti及Ri質體分別運載負責植物基因轉型之基因。Ti(腫瘤誘發)質體含有稱為T-DNA之大區段,其轉移至轉型植物中。Ti質體之另一區段vir區域負責T-DNA轉移。T-DNA區域以各由末端重複核苷酸序列構成之左側及右側邊界為邊界。在一些經修飾之二元載體中,腫瘤誘發基因已缺失,且vir區域之功能用於轉移以T-DNA邊界序列為邊界之外來DNA。T-區域亦可含有例如用於有效回收轉殖基因植物及細胞之可選標記物及用於插入用於轉移諸如編碼本發明融合蛋白之核酸之序列的多選殖位點。
因而,在一些實施例中,植物轉型載體來源於根癌土壤桿菌之Ti質體(參見例如美國專利第4,536,475號、第4,693,977號、第4,886,937號及第5,501,967號;以及歐洲專利EP 0 122 791)或毛根土壤桿菌之Ri質體。其他植物轉型載體包括例如且(不限於)Herrera-Estrella等人(1983)Nature 303:209-13;Bevan等人(1983),上文;Klee等人(1985)Bio/Technol.3:637-42;以及歐洲專利EP 0 120 516中描述之載體,及來源於任何上述之載體。諸如中華根瘤菌、根瘤 菌屬及中生根瘤菌屬之與植物天然相互作用之其他細菌可經修飾以介導基因轉移至大量不同植物。可使此等植物相關之共生細菌能夠藉由獲取卸甲Ti質體與適合二元載體來轉移基因。
感興趣的核酸
用於靶向插入玉米基因座中的聚核苷酸供體序列長度通常在約10至約5,000個核苷酸範圍內。然而,可使用實質上更長之核苷酸,高達20,000個核苷酸,包括長約5、6、7、8、9、10、11及12Kb之序列。此外,供體序列可包含含有不與置換區域同源之序列的載體分子。在一個實施例中,感興趣的核酸將包括一或多個與靶向基因座共享同源性之區域。一般而言,感興趣的核酸序列之同源區域將與希望重組之基因組序列具有至少50%序列一致性。在某些實施例中,感興趣的核酸之同源區域與位於靶向基因座之序列共享60%、70%、80%、90%、95%、98%、99%或99.9%序列一致性。然而,可存在1%與100%之間的任何值之序列一致性,視感興趣的核酸之長度而定。
感興趣的核酸可含有序列與細胞染色質共享相對高之序列一致性的若干不連續區域。舉例而言,對於靶向基因座中不通常存在之序列的靶向插入,獨特序列可存在於供體核酸分子中且側接與靶向基因座中存在之序列共享相對高之序列一致性的序列區域。
感興趣的核酸亦可插入靶向基因座中以充當後面使用之儲集器。舉例而言,包含與玉米基因組之非基因 區域同源之序列,但含有感興趣的核酸(視情況在誘導性啟動子控制下編碼ZFN)的第一核酸序列可插入靶向基因座中。隨後,第二核酸序列引入細胞中以誘發感興趣的DNA插入最適非基因玉米基因座中。第一核酸序列包含對最適非基因玉米基因座具有特異性之ZFN且第二核酸序列包含感興趣的DNA序列,或反之亦然。在一個實施例中,ZFN將使最適非基因玉米基因座及感興趣的核酸裂解。基因組中之所得雙股斷裂可接著變成自最適基因座釋放之感興趣的核酸之整合位點。或者,可在引入感興趣的DNA之後誘發已位於基因組中之ZFN的表現,以誘發基因組中之雙股斷裂,其接著可變成所引入之感興趣的核酸的整合位點。以此方式,可提高任何感興趣的區域感興趣的DNA之靶向整合的效率,因為該方法不依賴於編碼ZFN之核酸與感興趣的DNA的同時吸收。
感興趣的核酸亦可插入最適非基因玉米基因座中以充當隨後插入之標靶位點。舉例而言,由含有其他ZFN設計之識別位點之DNA序列構成的感興趣的核酸可插入基因座中。隨後,可產生其他ZFN設計且在細胞中表現,使得感興趣的初始核酸裂解且藉由修復或同源重組進行修飾。以此方式,感興趣的核酸之迭代整合可發生在最適非基因玉米基因座。
可插入最適非基因玉米基因座中之示例性外源性序列包括(但不限於)任何多肽編碼序列(例如cDNA)、啟動子、強化子及其他調節序列(例如干擾RNA序列、shRNA 表現卡匣、抗原決定基標籤、標記基因、裂解酶識別位點及各種類型之表現構築體)。此類序列可容易使用標準分子生物學技術(選殖、合成等)獲得及/或可購得。
為表現ZFN,編碼融合蛋白之序列通常次選殖至含有啟動子以引導轉錄之表現載體中。適合原核及真核啟動子為此項技術中所熟知且描述於例如Sambrook等人,Molecular Cloning,A Laboratory Manual(第2版1989;第3版,2001);Kriegler,Gene Transfer and Expression:A Laboratory Manual(1990);以及Current Protocols in Molecular Biology(Ausubel等人,上文)。用於表現ZFN之細菌表現系統可用於例如大腸桿菌(E.coli)、芽孢桿菌屬(Bacillus sp.)及沙門氏菌(Salmonella)中(Palva等人,Gene 22:229-235(1983))。用於此類表現系統之套組可購得。用於哺乳動物細胞、酵母及昆蟲細胞之真核表現系統為熟習此項技術者所熟知且亦可購得。
用於將遺傳物質輸送至細胞中之特定表現載體係根據融合蛋白之預期用途,例如在植物、動物、細菌、真菌、原蟲等中之表現來選擇(參見下文描述之表現載體)。標準細菌及動物表現載體為此項技術中已知且詳細描述於例如美國專利公開案20050064474A1及國際專利公開案WO05/084190、WO05/014791及WO03/080809中。
標準轉染方法可用於產生表現大量蛋白質之細菌、哺乳動物、酵母或昆蟲細胞株,該等蛋白質可接著使用標準技術純化(參見例如Colley等人,J.Biol.Chem. 264:17619-17622(1989);Guide to Protein Purification,in Methods in Enzymology,第182卷(Deutscher編,1990))。根據標準技術進行真核及原核細胞之轉型(參見例如Morrison,J.Bact.132:349-351(1977);Clark-Curtiss & Curtiss,Methods in Enzymology 101:347-362(Wu等人編,1983))。
所揭示之方法及組合物可用於將聚核苷酸供體序列插入預定位置,諸如最適非基因玉米基因座之一。此為適用的,因為引入玉米基因組之轉殖基因的表現關鍵視其整合位點而定。因此,編碼除草劑耐受性、昆蟲抗性、養分、抗生素或治療分子之基因可藉由靶向重組插入。
在一個實施例中,感興趣的核酸與提供對草甘膦(glyphosate)或另一除草劑之額外抗性或耐受性及/或提供對精選昆蟲或疾病之抗性及/或營養增強及/或改善農藝特徵及/或提供適用於餵料、食品、工業、藥學或其他用途之蛋白質或其他產物的基因編碼序列組合或「堆疊」。植物基因組內兩個或兩個以上感興趣的核酸序列之「堆疊」可例如經由習知植物育種,使用用含有感興趣的序列之構築體轉型植物、轉殖基因植物之再轉型或經由同源重組之靶向整合添加新性狀中的兩個或兩個以上事件來實現。
此類感興趣的聚核苷酸供體核苷酸序列包括(但不限於)以下提供之彼等實例:
1. 賦予對害蟲或疾病之抗性的基因或編碼序列(例如iRNA)
(A)植物疾病抗性基因。植物防禦常常由植物中疾病抗 性基因(R)之產物與病原體中對應無毒(Avr)基因之產物之間的特定相互作用活化。植物品種可用選殖之抗性基因轉型以工程改造對特定病原體菌株具抗性之植物。此類基因之實例包括針對葉黴病(Cladosporium fulvum)抗性之番茄Cf-9基因(Jones等人,1994 Science 266:789)、針對丁香假單胞菌(Pseudomonas syringae)致病變種番茄抗性之編碼蛋白激酶之番茄Pto基因(Martin等人,1993 Science 262:1432)及針對丁香假單胞菌抗性之擬南芥屬(Arabidopsis)RSSP2基因(Mindrinos等人,1994 Cell 78:1089)。
(B)蘇雲金桿菌(Bacillus thuringiensis)蛋白質、其衍生物或在其上模型化之合成多肽,諸如Bt δ-內毒素基因之核苷酸序列(Geiser等人,1986 Gene 48:109)及營養期殺蟲(VIP)基因(參見例如Estruch等人(1996)Proc.Natl.Acad.Sci.93:5389-94)。此外,編碼δ-內毒素基因之DNA分子可購自美國菌種保藏中心(American Type Culture Collection)(Rockville,Md.)ATCC寄存編號40098、67136、31995及31998下。
(C)凝集素,諸如若干大花君子蘭結合凝集素基因之核苷酸序列(Van Damme等人,1994 Plant Molec.Biol.24:825)。
(D)維生素結合蛋白,諸如適用作針對昆蟲害蟲之殺幼蟲劑的抗生物素蛋白及抗生物素蛋白同源物。參見美國專利第5,659,026號。
(E)酶抑制劑,例如蛋白酶抑制劑或澱粉酶抑制劑。此 類基因之實例包括稻穀半胱胺酸蛋白酶抑制劑(Abe等人,1987 J.Biol.Chem.262:16793)、菸草蛋白酶抑制劑I(Huub等人,1993 Plant Molec.Biol.21:985)及α-澱粉酶抑制劑(Sumitani等人,1993 Biosci.Biotech.Biochem.57:1243)。
(F)昆蟲特異性激素或費洛蒙,諸如脫皮素及保幼激素、其變異體、基於其之模擬劑或其拮抗劑或促效劑,諸如選殖之保幼激素酯酶(保幼激素之一種失活劑)之桿狀病毒表現(Hammock等人,1990 Nature 344:458)。
(G)昆蟲特異性肽或神經肽,其在表現時干擾受影響害蟲之生理學(J.Biol.Chem.269:9)。此類基因之實例包括昆蟲利尿激素受體(Regan,1994)、在斑點甲蠊(Diploptera punctata)中鑑別之咽側體抑制素(allostatin)(Pratt,1989)及昆蟲特異性之麻痹性神經毒素(美國專利第5,266,361號)。
(H)由蛇、蜂等天然產生之昆蟲特異性毒液,諸如蠍昆蟲毒性肽(Pang,1992 Gene 116:165)。
(I)負責單萜、倍半萜、類固醇、異羥肟酸、苯丙素衍生物或具有殺蟲活性之另一非蛋白質分子的超積累之酶。
(J)與生物活性分子之修飾,包括轉譯後修飾有關之酶:例如糖分解酶、蛋白分解酶、脂解酶、核酸酶、環化酶、轉胺酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、彈性蛋白酶、殼質酶及葡聚糖酶,無論天然還是合成。此類基因之實例包括callas基因(PCT公開申請案WO93/02197)、殼質酶編碼序列(其可為例如自ATCC寄存編號3999637及67152獲得)、菸草鉤蟲殼質酶(Kramer等人, 1993 Insect Molec.Biol.23:691)及歐芹ubi4-2聚泛素基因(Kawalleck等人,1993 Plant Molec.Biol.21:673)。
(K)刺激信號轉導之分子。此類分子之實例包括綠豆調鈣蛋白cDNA純系之核苷酸序列(Botella等人,1994 Plant Molec.Biol.24:757)及玉米調鈣蛋白cDNA純系之核苷酸序列(Griess等人,1994 Plant Physiol.104:1467)。
(L)疏水性力矩肽。參見美國專利第5,659,026號及第5,607,914號;後者教示賦予疾病抗性之合成抗微生物肽。
(M)膜透性酶、通道形成劑或通道阻斷劑,諸如殺菌肽-β溶解肽類似物(Jaynes等人,1993 Plant Sci.89:43),其產生對菸草青枯病菌(Pseudomonas solanacearum)具抗性之轉殖基因菸草植物。
(N)病毒侵襲性蛋白質或自其衍生之複合毒素。舉例而言,轉型植物細胞中病毒外殼蛋白之累積賦予對由外殼蛋白基因來源於之病毒以及由相關病毒實現之病毒感染及/或疾病發展的抗性。在針對苜蓿花葉病毒、胡瓜花葉病毒、菸草線條病毒、馬鈴薯病毒X、馬鈴薯病毒Y、菸草蝕刻病毒、菸草皺屈病害及菸草花葉病毒轉型植物時已賦予外殼蛋白介導之抗性。參見例如Beachy等人(1990)Ann.Rev.Phytopathol.28:451。
(O)昆蟲特異性抗體或自其衍生之免疫毒素。因而,靶向昆蟲腸中關鍵代謝功能之抗體將使受影響酶不活化,從而殺死昆蟲。舉例而言,Taylor等人(1994)Abstract #497,Seventh Int'l.Symposium on Molecular Plant-Microbe Interactions展示經由產生單鏈抗體片段之轉殖基因菸草之酶促失活。
(P)病毒特異性抗體。參見例如Tavladoraki等人(1993)Nature 266:469,其展示保護表現重組抗體基因之轉殖基因植物避免病毒侵襲。
(Q)在自然界中藉由病原體或寄生蟲產生之發育阻滯蛋白。因而,真菌內α-1,4-D聚半乳糖醛酶藉由使植物細胞壁同-α-1,4-D-半乳糖醛酶增溶來促進真菌定殖及植物養分釋放(Lamb等人,1992)Bio/Technology 10:1436。編碼豆內聚半乳糖醛酶抑制蛋白質之基因的選殖及表徵由Toubart等人(1992 Plant J.2:367)描述。
(R)在自然界中藉由植物產生之發育阻滯蛋白,諸如提供對真菌疾病之增加抗性的大麥核糖體不活化基因(Longemann等人,1992).Bio/Technology 10:3305。
(S)RNA干擾,其中RNA分子用於抑制標靶基因之表現。在一個實例中RNA分子為部分或完全雙股,其觸發沉默反應,引起dsRNA裂解成小干擾RNA,隨後併入破壞同源mRNA之靶向複合物中。參見例如Fire等人,美國專利6,506,559;Graham等人6,573,099。
2. 賦予除草劑抗性之基因
(A)編碼對抑制生長點或分生組織之除草劑(諸如咪唑啉酮(imidazalinone)、硫醯苯胺(sulfonanilide)或磺醯脲(sulfonylurea)除草劑)之抗性或耐受性的基因。此類別中之示例性基因編碼突變乙醯乳酸酯合成酶(ALS)(Lee等人, 1988 EMBOJ.7:1241),亦稱為乙醯羥基酸合成酶(AHAS)(Miki等人,1990 Theor.Appl.Genet.80:449)。
(B)編碼對草甘膦之抗性或耐受性的一或多個其他基因,該抗性或耐受性藉由突變EPSP合成酶及aroA基因,或經由代謝失活,藉由諸如DGT-28、2mEPSPS、GAT(草甘膦乙醯基轉移酶)或GOX(草甘膦氧化酶)之基因及其他膦醯基化合物(諸如草銨膦(pat、bar及dsm-2基因)及芳氧基苯氧基丙酸及環己二酮(ACC酶抑制劑編碼基因)賦予。參見例如美國專利第4,940,835號,其揭示可賦予草甘膦抗性之EPSP形式之核苷酸序列。編碼突變aroA基因之DNA分子可在ATCC寄存編號39256下獲得,且突變基因之核苷酸序列揭示於美國專利第4,769,061號中。歐洲專利申請案第0 333 033號及美國專利第4,975,374號揭示賦予諸如L-草胺膦之除草劑抗性之麩醯胺酸合成酶基因的核苷酸序列。草胺膦乙醯轉移酶基因之核苷酸序列提供於歐洲申請案第0 242 246號中。De Greef等人(1989)Bio/Technology 7:61描述表現編碼草胺膦乙醯轉移酶活性之嵌合bar基因的轉殖基因植物之產生。賦予芳氧基苯氧基丙酸及環己二酮(諸如西殺草(sethoxydim)及精吡氟氯禾靈(haloxyfop))抗性之示例性基因為Marshall等人(1992)Theor.Appl.Genet.83:435描述之Accl-S1、Accl-S2及Accl-S3基因。
(C)編碼對抑制光合成之除草劑(諸如三嗪(psbA及gs+基因)及苯基腈(腈水解酶基因))之抗性或耐受性的基因。Przibilla等人(1991)Plant Cell 3:169描述編碼突變psbA基 因之質體用以轉型衣藻屬(Chlamydomona)之用途。用於腈水解酶基因之核苷酸序列揭示於美國專利第4,810,648號中,且含有此等基因之DNA分子可自ATCC寄存編號53435、67441及67442獲得。編碼麩胱甘肽S-轉移酶之DNA的選殖及表現由Hayes等人(1992)Biochem.J.285:173描述。
(D)編碼對結合於羥基苯基丙酮酸雙加氧酶(HPPD)(催化對羥基苯基丙酮酸(HPP)轉化成尿黑酸之反應的酶)之除草劑之抗性或耐受性的基因。此包括除草劑,諸如異噁唑(EP418175、EP470856、EP487352、EP527036、EP560482、EP682659、美國專利第5,424,276號),尤其異噁唑草酮(isoxaflutole)(一種用於玉米之選擇性除草劑)、二酮腈(diketonitrile)(EP496630、EP496631),尤其2-氰基-3-環丙基-1-(2-SO2CH3-4-CF3苯基)丙-1,3-二酮及2-氰基-3-環丙基-1-(2-SO2CH3-4-2,3C12苯基)丙-1,3-二酮、三酮(EP625505、EP625508、美國專利第5,506,195號),尤其磺草酮(sulcotrione)及吡唑啉酯(pyrazolinate)。在植物中產生過多HPPD之基因可提供對此類除草劑之耐受性或抗性,包括例如美國專利第6,268,549號及第6,245,968號及美國專利申請公開案第20030066102號中所描述之基因。
(E)編碼對苯氧基生長素除草劑(諸如2,4-二氯苯氧基乙酸(2,4-D))之抗性或耐受性且亦可賦予對芳氧基苯氧基丙酸酯(AOPP)除草劑之抗性或耐受性的基因。此類基因之實例包括α-酮戊二酸依賴性二加氧酶(aad-1)基因,描述於 美國專利第7,838,733號中。
(F)編碼對苯氧基生長素除草劑(諸如2,4-二氯苯氧基乙酸(2,4-D))之抗性或耐受性且亦可賦予對吡啶氧基生長素除草劑(諸如氟草定(fluroxypyr)或綠草定(triclopyr))抗性或耐受性的基因。此類基因之實例包括α-酮戊二酸依賴性二加氧酶基因(aad-12),描述於WO 2007/053482 A2中。
(G)編碼對麥草畏(dicamba)之抗性或耐受性的基因(參見例如美國專利公開案第20030135879號)。
(H)提供對抑制原卟啉原氧化酶(PPO)之除草劑之抗性或耐受性的基因(參見美國專利第5,767,373號)。
(I)提供對結合於光合體系中心(PS II)核心蛋白質之三嗪除草劑(諸如莠去津(atrazine))及脲衍生物(諸如達有龍(diuron))除草劑之抗性或耐受性的基因(Brussian等人,(1989)EMBO J.1989,8(4):1237-1245)。
3. 賦予或促成增加價值性狀之基因
(A)經修飾之脂肪酸代謝,例如藉由用反義基因或硬脂醯基-ACP去飽和酶使玉米或芸苔屬(Brassica)轉型以增加植物之硬脂酸含量(Knultzon等人,1992)Proc.Nat.Acad.Sci.USA 89:2624。
(B)減少植酸酯含量
(1)引入植酸酶編碼基因,諸如黑麴菌植酸酶基因(Van Hartingsveldt等人,1993 Gene 127:87),增強植酸酯之分解,為轉型植物添加更多游離磷酸鹽。
(2)可引入減少植酸酯含量之基因。在玉米中,此例如 可藉由選殖,接著再引入與負責產生特徵在於低含量植酸之玉米突變體之單對偶基因相關的DNA來實現(Raboy等人,1990 Maydica 35:383)。
(C)例如藉由用編碼改變澱粉支化模式之酶的基因轉型植物所實現的經修飾之碳水化合物組合物。此類酶之實例包括鏈球菌屬黏液果糖基轉移酶基因(Shiroza等人,1988)J.Bacteriol.170:810、枯草桿菌果聚糖蔗糖酶基因(Steinmetz等人,1985 Mol.Gen.Genel.200:220)、地衣芽孢桿菌α-澱粉酶(Pen等人,1992 Bio/Technology 10:292)、番茄轉化酶基因(Elliot等人,1993)、大麥澱粉酶基因(Sogaard等人,1993 J.Biol.Chem.268:22480)及玉米內胚乳澱粉支化酶II(Fisher等人,1993 Plant Physiol.102:10450)。
III. 重組構築體
如本文所揭示,本發明提供重組基因組序列,其包含至少1Kb之最適非基因玉米基因組序列及感興趣的DNA,其中插入之感興趣的DNA插入該非基因序列中。在一個實施例中,感興趣的DNA為分析結構域、賦予害蟲或疾病抗性之基因或編碼序列(例如iRNA)、賦予除草劑抗性之基因或賦予或產生增加價值性狀之基因,且該最適非基因玉米基因組序列包含以下特徵中之1、2、3、4、5、6、7或8個:a. 該非基因序列為約1Kb至約8.3Kb長且不含甲基化聚核苷酸;b. 該非基因序列顯示玉米基因組內0.00041至62.42 cM/Mb之重組率;c. 該非基因序列顯示玉米基因組的0至0.962之核小體占位位準;d. 該非基因序列與玉米基因組中含有之任何其他序列共享小於40%序列一致性;e. 該非基因序列具有離玉米染色體著絲點之基因組距離0.00373至0.99908比率之相對位置值;f. 該非基因序列具有25.17%至68.3%之鳥嘌呤/胞嘧啶含量百分比;g. 該非基因序列位於與包含已知或預測之玉米編碼序列之基因序列接近處,在包含原生非基因序列之鄰接基因組DNA之40Kb內;以及h. 該非基因序列位於包含至少第二非基因序列之玉米基因組序列之1Mb區域中。在一個實施例中,該最適非基因玉米基因組序列進一步表徵為包含1至9個已知或預測之玉米編碼序列之基因區在包含原生非基因序列之鄰接基因組DNA之40Kb內。在一個實施例中,最適非基因玉米基因座係選自叢1、2、3、4、5、6、7、8、9、10、11、2、3、4、5、6、7、8、9、20、21、22、23、24、25、26、27、28、29、30、31或32之基因座。
IV. 轉殖基因植物
根據本發明之一個實施例,亦提供包含重組最適非基因玉米基因座之轉殖基因植物。此類轉殖基因植物可使用熟習此項技術者已知之技術製備。
轉型玉米細胞、愈傷組織、組織或植物可藉由針對由轉型DNA上存在之標記基因編碼的性狀,選擇或篩選經工程改造之植物材料來鑑別及分離。舉例而言,可藉由使經工程改造之植物材料在含有抑制量之抗生素或除草劑的培養基上生長來選擇,轉型基因構築體賦予對該抗生素或除草劑之抗性。此外,轉型細胞亦可藉由針對可存在於重組核酸構築體上之任何可見標記基因(例如黃色螢光蛋白質、綠色螢光蛋白質、紅色螢光蛋白質、β-葡糖醛酸酶、螢光素酶、B或C1基因)之活性篩選來鑑別。此類選擇及篩選方法為熟習此項技術者所熟知。
物理及生物化學方法亦可用來鑑別含有插入之基因構築體的植物或植物細胞轉型體。此等方法包括(但不限於):1)南方分析或PCR擴增,用於偵測及確定重組DNA插入物之結構;2)北方墨點、S1 RNA酶保護、引子延伸或逆轉錄酶-PCR擴增,用於偵測及檢查基因構築體之RNA轉錄物;3)酶分析,用於偵測酶或核糖核酸酶活性,其中此類基因產物由基因構築體編碼;4)蛋白質凝膠電泳、西方墨點技術、免疫沈澱或酶聯免疫分析(ELISA),其中基因構築體產物為蛋白質。諸如原位雜交、酶染色及免疫染色之其他技術亦可用來偵測特定植物器官及組織中重組構築體之存在或表現。用於進行所有此等分析之方法為熟習此項技術者所熟知。
可藉由例如自感興趣的組織中分離之RNA(例如mRNA)之北方墨點法觀測使用本文所揭示之方法之基因操 縱的作用。通常,若mRNA存在或mRNA量已增加,則可假設,正表現對應轉殖基因。可使用量測基因及/或編碼多肽活性之其他方法。可使用不同類型之酶分析,視所用受質及偵測反應產物或副產物增加或減少之方法而定。此外,表現之多肽的含量可以免疫化學方式,亦即ELISA、RIA、EIA及熟習此項技術者熟知之其他基於抗體之分析,諸如藉由電泳偵測分析(用染色或西方墨點法)量測。作為一個非限制性實例,使用ELISA分析偵測AAD-1(芳氧基烷酸酯二加氧酶;參見WO 2005/107437)及PAT(草胺膦-N-乙醯基-轉移酶(PAT))蛋白質描述於以全文引用的方式併入本文中之美國專利公開案第20090093366號中。轉殖基因可選擇性地在一些植物組織中或在一些發育階段表現,或轉殖基因可在實質上所有植物組織中,實質上沿著其整個生命週期表現。然而,任何組合表現模式亦為適用的。
熟習此項技術者將認識到在外源性聚核苷酸供體序列穩定併入轉殖基因植物中且確定可操作之後,其可藉由有性雜交引入其他植物中。可使用大量標準育種技術中之任一者,視雜交之物種而定。
本發明亦涵蓋上述轉殖基因植物之種子,其中種子具有轉殖基因或基因構築體。本發明進一步涵蓋上述轉殖基因植物之子代、純系、細胞株或細胞,其中子代、純系、細胞株或細胞具有插入最適基因座中之轉殖基因或基因構築體。
藉由任何以上轉型技術產生之轉型植物細胞可 經培養以再生整個植物,其具有轉型基因型且因此具有所希望之表現型。此類再生技術依賴於組織培養生長培養基中某些植物激素之操縱,通常依賴於已與所希望之核苷酸序列一起引入之殺生物劑及/或除草劑標記物。自培養之原生質體再生的植物描述於Evans等人,「Protoplasts Isolation and Culture」in Handbook of Plant Cell Culture,第124-176頁,Macmillian Publishing Company,New York,1983;及Binding,Regeneration of Plants,Plant Protoplasts,第21-73頁,CRC Press,Boca Raton,1985中。亦可自植物愈傷組織、外植體、器官、花粉、胚或其部分獲得再生。此類再生技術一般描述於Klee等人(1987)Ann.Rev.of Plant Phys.38:467-486中。
在一些實施例中,包含編碼多肽之核苷酸序列的轉殖基因植物或植物材料展現一或多個以下特徵:在植物細胞中表現多肽;在植物細胞之色素體中表現多肽一部分;將多肽自植物細胞之細胞溶質引至細胞色素體中;多肽在植物細胞中進行色素體特異性表現;及/或多肽定位在植物細胞中。除表現所編碼之多肽外,此類植物可另外具有一或多種所需要之性狀。此類性狀可包括例如:對昆蟲、其他害蟲及致病劑之抗性;對除草劑之耐受性;增強之穩定性、產率或存放期;環境耐受性;醫藥生產;工業產品生產;以及增強營養。
根據一個實施例,提供一種轉殖基因玉米原生質體細胞,其包含重組最適非基因玉米基因座。更特定言之, 提供一種玉米原生質體植物細胞,其包含插入玉米原生質體細胞之最適非基因玉米基因座中的感興趣的DNA,其中該非基因玉米基因座為約1Kb至約8.3Kb長且缺乏任何甲基化核苷酸。在一個實施例中,轉殖基因玉米原生質體細胞包含插入最適非基因玉米基因座中之感興趣的DNA,其中該感興趣的DNA包含分析結構域及/或開放閱讀框架。在一個實施例中,插入之感興趣的DNA編碼肽,且在另一實施例中,感興趣的DNA包含至少一種包含轉殖基因之基因表現卡匣。
根據一個實施例,提供一種轉殖基因玉米植物、玉米植物部分或玉米植物細胞,其包含重組最適非基因玉米基因座。更特定言之,提供一種玉米植物、玉米植物部分或玉米植物細胞,其包含插入玉米植物、玉米植物部分或玉米植物細胞之最適非基因玉米基因座中的感興趣的DNA,其中該非基因玉米基因座為約1Kb至約8.5Kb長且缺乏任何甲基化核苷酸。在一個實施例中,轉殖基因玉米植物、玉米植物部分或玉米植物細胞包含插入最適非基因玉米基因座中之感興趣的DNA,其中該感興趣的DNA包含分析結構域及/或開放閱讀框架。在一個實施例中,插入之感興趣的DNA編碼肽,且在另一實施例中,感興趣的DNA包含至少一種包含轉殖基因之基因表現卡匣。
根據實施例1,提供一種重組序列,其中該重組序列包含至少1Kb且與選自由基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座 _128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)、基因座_136086_G1(SEQ ID NO:4425)、基因座_203704_G1(SEQ ID NO:2033)、基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_204726_G1(SEQ ID NO:424)、基因座_232228_G1(SEQ ID NO:4529)組成之群的非基因序列具有至少90%、95%或99%序列一致性之核酸序列及感興趣的DNA,其中該感興趣的DNA插入該非基因序列中以產生該重組序列。根據實施例2,提供實施例1之重組序列,其中該感興趣的DNA插入在與對非基因序列具有特異性之鋅指標靶位點且更特定言之表8之鋅指標靶位點接近處。根據實施例3,提供實施例1之重組序列,其中該感興趣的DNA插入在對非基因序列具有特異性之一對鋅指標靶位點且更特定言之選自表8之一對鋅指標靶位點之間。根據一個實施例,提供一種重組序列,其中該重組序列由至少1Kb且與選自由以下各者組成之群的非基因序列中存在之序列具有100%序列一致性的核酸序列及感興趣的DNA組成:基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573),loci_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)、基因座_136086_G1(SEQ ID NO:4425)、基因座_203704_G1(SEQ ID NO:2033)、基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_204726_G1(SEQ ID NO:424)、基因座_232228_G1(SEQ ID NO:4529),其中該感興趣的DNA插入該非基因序列中以產生該重組序列。
根據實施例4,提供實施例1、2或3中任一者之重組序列,其中該感興趣的DNA包含分析結構域。根據實施例5,提供實施例1、2或3中任一者之重組序列,其中該感興趣的DNA不編碼肽。根據實施例6,提供實施例1、2或3中任一者之重組序列,其中該感興趣的DNA編碼肽。根據實施例7,提供實施例6之重組序列,其中該感興趣的DNA包含含有殺昆蟲劑抗性基因、除草劑耐受性基因、氮利用效率基因、水利用效率基因、營養品質基因、DNA結合基因及可選擇之標記基因的基因表現卡匣。根據實施例8,提供實施例1至7中任一者之重組序列,其中該感興趣的DNA包含兩個或兩個以上基因表現卡匣。根據實施例9,提供實施例8之重組序列,其中兩個或兩個以上該等非基因序列每一者包含插入之感興趣的DNA以產生兩個或兩個以上重組序列,其中該等兩個或兩個以上重組序列位於同一染色體上。根據實施例10,提供實施例1至9中任一者之重組序列, 其中該感興趣的DNA及/或該非基因序列在該感興趣的DNA插入該非基因序列期間經修飾。根據實施例11,提供一種玉米植物、玉米植物部分或玉米植物細胞,其包含實施例1至10中任一者之重組序列。根據實施例12,提供一種製造包含感興趣的DNA之轉殖基因植物細胞的方法,其中該方法包含選擇與由基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)、基因座_136086_G1(SEQ ID NO:4425)、基因座_203704_G1(SEQ ID NO:2033)、基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_204726_G1(SEQ ID NO:424)、基因座_232228_G1(SEQ ID NO:4529)組成之群具有至少90%、95%或99%序列一致性的標靶非基因玉米基因座;選擇特異性結合及裂解該標靶非基因玉米基因座之位點特異性核酸酶,視情況選自表8之核酸酶;將該位點特異性核酸酶引入玉米植物細胞;將該感興趣的DNA引入該植物細胞中;將該感興趣的DNA插入該標靶非基因玉米基因座;以及選擇包含靶向該非基因基因座之感興趣的DNA的轉殖基因植物細胞。根據實施例18,實施例12之製造轉殖基因植物細胞 的方法,其中該位點特異性核酸酶係選自由以下各者組成之群:鋅指核酸酶、CRISPR核酸酶、TALEN、歸巢核酸內切酶或大範圍核酸酶。根據實施例19,實施例12或18之製造轉殖基因植物細胞的方法,其中該感興趣的DNA經由同源性介導之修復整合方法整合在該非基因基因座內。根據實施例20,實施例12或18之製造轉殖基因植物細胞的方法,其中該感興趣的DNA經由非同源末端接合整合方法整合在該非基因基因座內。根據實施例21,實施例12、18、19或20之製造轉殖基因植物細胞的方法,其中兩個或兩個以上該感興趣的DNA插入兩個或兩個以上該標靶非基因玉米基因座中,視情況其中兩個或兩個以上該標靶非基因玉米基因座位於同一染色體上。
根據實施例1,提供至少1Kb且與選自由以下各者組成之群的非基因序列具有至少90%、95%或99%序列一致性的經純化之非基因玉米序列:基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)、基因座_136086_G1(SEQ ID NO:4425)、基因座_203704_G1(SEQ ID NO:2033)、基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_204726_G1(SEQ ID NO:424)、基因座_232228_G1(SEQ ID NO:4529)。根據一個實施例,提供一種經純化之非基因玉米序列,其中該序列由至少1Kb且與選自由以下各者組成之群的非基因序列中存在之序列具有100%序列一致性的核酸序列組成:基因座_137693_G1(SEQ ID NO:387)、基因座_265551_G1(SEQ ID NO:463)、基因座_128078_G1(SEQ ID NO:560)、基因座_168286_G1(SEQ ID NO:573)、基因座_3733_G1(SEQ ID NO:1923)、基因座_203075_G1(SEQ ID NO:2030)、基因座_232484_G1(SEQ ID NO:2053)、基因座_136086_G1(SEQ ID NO:4425)、基因座_203704_G1(SEQ ID NO:2033)、基因座_127268_G1(SEQ ID NO:2709)、基因座_204637_G1(SEQ ID NO:2731)、基因座_291068_G1(SEQ ID NO:3230)、基因座_232222_G1(SEQ ID NO:3357)、基因座_43577_G1(SEQ ID NO:3428)、基因座_204726_G1(SEQ ID NO:424)、基因座_232228_G1(SEQ ID NO:4529)。
實例
實例1:鑑別玉蜀黍中之可靶向基因座
用生物資訊學方法,使用特定標準,篩選玉蜀黍基因組,以選擇最適基因座用於聚核苷酸供體靶向。使用關於轉殖基因在植物基因組內最佳表現之考慮因素、關於位點特異性DNA結合蛋白對基因組DNA之最佳結合的考慮因素以及轉殖基因植物產品發展需求,來發展用於選擇基因座之特定標準。為鑑別及選擇基因座,使用生物資訊學 方法掃描玉蜀黍基因組之基因組及表觀基因組資料集。篩選基因組及表觀基因組資料集產生符合以下標準之精選基因座:1)低甲基化及超過1Kb長;2)經由位點特異性核酸酶介導之聚核苷酸供體整合,為可靶向的;3)農藝學上中性或非基因的;4)可表現整合之轉殖基因的區域;以及5)在該基因座內/周圍具有重組之區域。因此,使用此等特定標準,鑑別總共5,286個基因座(SEQ ID NO:1-SEQ ID NO:5286)。特定標準進一步詳細描述於下文中。
低甲基化
掃描玉蜀黍基因組以選擇大於1Kb之DNA低甲基化的最適基因座。經由生物資訊學方法,使用IlluminaTM/SolexaTM 1G平行測序資料,檢查自玉蜀黍栽培品種B73分離之芽及根組織的全基因組DNA甲基化程度。資料係根據Wang等人,(2009)Genome-Wide and Organ-Specific Landscapes of Epigenetic Modifications and Their Relationships to mRNA and Small RNA Transcriptomes in Maize.Plant Cell21(4):1053-1069)中指定之方案,由自上述玉蜀黍植物組織分離之基因組DNA產生。此等資料可得自NCBI Genbank寄存編號GEO:GSE15286。收集原始測序讀數且使用如Krueger F,Andrews SR(2011)Bismark:a flexible aligner and methylation caller for Bisulfite-Seq applications.Bioinformatics 27:1571-1572中所描述之BismarkTM映射軟體,與玉蜀黍栽培品種B73參考基因組映射。
基因組中之各胞嘧啶鹼基的甲基化程度計算為映射特定胞嘧啶鹼基位置的甲基化讀數數目相對於映射該位置之讀數總數的百分比。以下假設解釋如何計算玉蜀黍基因組內各鹼基的甲基化程度。舉例而言,考慮在玉蜀黍栽培品種B73參考序列之染色體1中之位置100存在胞嘧啶鹼基。若在位置100總共存在20個映射於胞嘧啶鹼基的讀數且此等讀數中之10個甲基化,則在染色體1中之位置100胞嘧啶鹼基的甲基化程度估計為50%。因此,計算自玉蜀黍之根及芽組織獲得之所有基因組DNA鹼基對的甲基化程度概況。無法恰當地映射玉蜀黍基因組中之獨特位置的讀數匹配玉蜀黍基因組中普遍之重複序列,且在此項技術中稱為顯著甲基化。
使用上述方案,量測玉蜀黍栽培品種B73基因組之甲基化程度。因而,含有甲基化讀數之玉蜀黍基因組區域指示此等玉蜀黍基因組區域甲基化。相反,缺乏甲基化讀數之玉蜀黍基因組區域指示此等玉蜀黍基因組區域非甲基化。來自芽及根組織之非甲基化且不含任何甲基化讀數的玉蜀黍基因組區域視為「低甲基化」區域。為使根及芽甲基化概況可用於觀測,針對每一玉蜀黍栽培品種B73染色體產生波形曲線(http://useast.ensembl.org/info/website/upload/wig.html)。自玉蜀黍栽培品種B73染色體數目1獲得之根及芽組織之DNA甲基化概況的波形曲線之截圖樣品展示在圖1中。
如上文所描述,針對玉蜀黍栽培品種B73根及芽 組織建立的甲基化概況組合成共同甲基化概況且用於鑑別玉蜀黍栽培品種B73基因組中之低甲基化區域。掃描所得玉蜀黍基因組共同甲基化概況以鑑別無甲基化證據,亦即不含映射之甲基化讀數之基因組位置。鑑別低甲基化的比100bp長之基因組DNA區段。藉由確定展示甲基化證據之兩個基因組區域之間的鹼基對總數來計算此等低甲基化區域每一者之特定長度。表1概述經鑑別之低甲基化區域。此外,玉蜀黍栽培品種B73基因組之低甲基化區域之長度分佈展示在圖2中。
玉蜀黍栽培品種B73基因組之此等低甲基化區域經進一步表徵以鑑別及選擇特定基因座,因為此等區域之無甲基化背景指示存在空的染色質。因而,所有隨後分析均在所鑑別之低甲基化區域上進行。
可靶向性
玉蜀黍栽培品種B73中經鑑別之低甲基化位點經進一步分析以確定哪些位點經由聚核苷酸供體之位點特異性核酸酶介導之整合可靶向。此項技術中已知玉蜀黍基因組含有甲基化且具有高序列複製位準之高度重複的長DNA區段。自玉米基因組資料庫收集玉蜀黍基因組中之已 知重複區域的註釋資訊(可得自http://www.maizegdb.org/,及Lawrence,CJ等人(2008)MaizeGDB:The Maize Model Organism Database for Basic,Translational,and Applied Research.Int J Plant Genomics.2008:496957)。
因此,篩選以上鑑別之低甲基化位點以移除與玉米基因組上所註釋之已知重複區域對準的任何位點。通過此第一次篩選之剩餘低甲基化位點隨後使用玉米基因組資料庫之基於BLASTTM之同源性搜索,經由NCBIBLASTTM軟體(2.2.23版)操作,使用預設參數設置來掃描(Stephen F.Altschul等人(1997)Gapped BLAST and PSI-BLAST:a new generation of protein database search programs.Nucleic Acids Res.25:3389-3402)。作為BLASTTM篩選的結果,自進一步分析移除與基因組中之其他地方顯著匹配,具有超過40%之序列比對覆蓋度的任何低甲基化位點。
農藝學上中性或非基因
玉蜀黍栽培品種B73中鑑別之低甲基化位點經進一步分析以確定哪些位點為農藝學上中性或非基因的。因而,對上述低甲基化位點進行篩選以移除重疊或含有任何已知或預測內源性玉蜀黍栽培品種B73編碼序列的任何位點。出於此目的,自玉米基因組資料庫收集已知基因之註釋資料及表現序列標籤(EST)資料之映射資訊(可得自www.maizegdb.org及Monaco,M.等人,Maize Metabolic Network Construction and Transcriptome Analysis.doi:10.3835/plantgenome2012.09.0025;2013年1月23日線 上公告)。亦考慮緊靠開放閱讀框架上游2Kb及下游1Kb的任何基因組區域。此等上游及下游區域可含有已知或未知之對基因功能而言不可或缺之保守調節元件。分析上述低甲基化位點中已知基因(包括2Kb上游及1Kb下游區域)及EST之存在。自下游分析移除與已知基因(包括2Kb上游及1Kb下游區域)或EST對準或重疊的任何低甲基化位點。
表現
玉蜀黍栽培品種B73中鑑別之低甲基化位點經進一步分析以確定哪些位點接近表現之玉米基因。藉由分析使用如下所描述之RNAseqTM技術,自玉蜀黍栽培品種B73根及芽組織產生之轉錄組概況分析資料,量測玉蜀黍基因之轉錄物表現位準:Wang等人,(2009)Genome-Wide and Organ-Specific Landscapes of Epigenetic Modifications and Their Relationships to mRNA and Small RNA Transcriptomes in Maize.Plant Cell.21(4):1053-1069。針對各低甲基化位點,完成分析以鑑別接近低甲基化位點之40Kb區域內存在之任何註釋基因及位於與低甲基化位點接近處之註釋基因的平均表現位準。確定離註釋基因超過40Kb之具有非零平均表現位準的低甲基化位點不接近表現之玉蜀黍基因且自進一步分析移除。
重組
在玉蜀黍栽培品種B73中鑑別之低甲基化位點經進一步分析以確定哪些位點具有重組跡象且可促進最適基因座經由習知育種而基因滲入玉蜀黍之其他株系。在習 知育種期間不同的玉蜀黍基因型按常規雜交以研發含有農藝學上感興趣之性狀的新穎且改善之玉蜀黍株系。因而,經由植物介導之轉殖基因轉型,基因滲入玉蜀黍株系內最適基因座中的農藝性狀應能夠經由在習知植物育種期間進行減數分裂重組而進一步基因滲入其他玉蜀黍株系,尤其優良株系。篩選上述低甲基化位點以鑑別及選擇具有一定減數分裂重組水準之位點。鑑別及移除染色體區域內存在之表徵為重組「冷點」的任何低甲基化位點。在玉蜀黍中,此等冷點係使用自多個映射群體產生之高解析度標記物資料集定義(Jafar Mammadov,Wei Chen,Anastasia Chueva,Karthik Muthuraman,Ruihua Ren,David Meyer,及Siva Kumpatla.2011.Distribution of Recombinant Frequencies across the Maize Genome.52nd Annual Maize Genetics Conference)。
基於標記物之間的遺傳距離(分摩(cM))與標記物之間的物理距離(兆鹼基(Mb))之比率計算跨越染色體,任何一對玉蜀黍基因組標記物之間的減數分裂重組頻率。舉例而言,若一對標記物之間的遺傳距離為1cM且同一對標記物之間的物理距離為2Mb,則確定計算之重組頻率為0.5cM/Mb。對於以上鑑別之各低甲基化位點,選擇一對相隔至少1Mb之標記物且計算重組頻率。此方法用於計算低甲基化位點之重組頻率。藉由進一步分析鑑別及移除重組頻率為0.00041cM/Mb之任何低甲基化位點。選擇包含超過0.00041cM/Mb之重組頻率的剩餘低甲基化區域用於進一 步分析。
最適基因座之鑑別
上述選擇標準之應用可鑑別總共52,885個來自玉蜀黍基因組之最適基因座。表2概述所鑑別之最適基因座之長度。此等最適基因座具有以下特徵:1)長度超過1Kb之低甲基化基因座;2)經由位點特異性核酸酶介導之聚核苷酸供體整合可靶向的基因座;3)在農藝學上中性或非基因的基因座;4)轉殖基因可表現之基因座;以及5)基因座內有重組跡象。表2中描述之所有最適基因座中,僅僅進一步分析超過1Kb之最適基因座且用於供體聚核苷酸序列靶向。此等最適基因座之序列揭示為SEQ ID NO:1-SEQ ID NO:5,286。總體而言,此等最適基因座為玉蜀黍基因組內可由供體聚核苷酸序列靶向的位置,如下文進一步證實。
實例2:針對來自玉蜀黍之叢最適基因座的F分佈及主分量分析
使用F分佈及主分量分析統計方法進一步分析5,286個所鑑別之最適基因座(SEQ ID NO:1-SEQ ID NO:5,286),以定義代表性群體及叢用於最適基因座分組。
F分佈分析
使用連續概率分佈統計分析在統計學上分析所鑑別之5,286個最適基因座。作為連續概率分佈統計分析之一個實施例,完成F分佈檢驗以確定最適基因座之代表性數目。使用熟習此項技術者已知之方程式及方法完成F分佈檢驗分析。關於更多的指導,如K.M Remund,D.Dixon,DL.Wright及LR.Holden.Statistical considerations in seed puritytesting for transgenic traits.Seed Science Research(2001)11,101-119(以引用的方式併入本文中)中所描述之F分佈檢驗分析為F分佈檢驗之一非限制性實例。F分佈檢驗採用最適基因座之隨機取樣,使得跨越5,286個最適基因座,任何無效基因座均勻分佈,且取樣之最適基因座數目為5,286個最適基因座總群體的10%或10%以下。
F分佈分析指示5,286個最適基因座中之72個提供5,286個最適基因座之代表性數目,信賴水準為95%。因此,F分佈分析展示若測試72個最適基因座且所有用供體聚核苷酸序列均可靶向,則此等結果將指示在95%信賴水準下5,286個最適基因座中之96%或96%以上為正的。驗證5,286個最適基因座之總百分比的最佳估計將為72個所測試之最適基因座是否100%可靶向。因此,96%實際上為在95%信賴水準下證實之真實百分比的下限。對於95%信賴水準,此下限係基於F分佈之0.95分位數。(Remund K,Dixon D,Wright D,及Holden L.Statistical considerations in seed purity testing for transgenic traits.Seed Science Research(2001)11,101-119)。
主分量分析
隨後,完成主分量分析(PCA)統計方法以進一步評估及觀測包含5,286個鑑別之最適基因座之資料集的類似性及差異以能夠取樣不同的基因座進行靶向驗證。PCA涉及將較大數目之相關變數變換成較小數目之稱為主分量之不相關變數的數學算法。
在5,286個鑑別之最適基因座上,藉由產生一組可用於描述5,286個鑑別之最適基因座的可計算之特徵或屬性完成PCA。每個特徵在數值上可計算,且特別定義以收集5,286個鑑別之最適基因座的基因組及表觀基因組背景。鑑別每個玉蜀黍最適基因座的一組10個特徵且下文更詳細地描述。
1. 最適基因座之長度
a. 此資料集中最適基因座之長度在最小1,000Bp至最大8,267Bp範圍內。
2. 最適基因座周圍1MB區域中之重組頻率
a. 在玉米中,染色體位置之重組頻率係使用自多個映射群體產生之固有高解析度標記物資料集定義(Jafar Mammadov,Wei Chen,Anastasia Chueva,Karthik Muthuraman,Ruihua Ren,David Meyer,及Siva Kumpatla.2011.Distribution of Recombinant Frequencies across the Maize Genome.52nd Annual Maize Genetics Conference)。
b. 跨越染色體,任何一對標記物之間的重組頻率係基於標記物之間的遺傳距離(分摩(cM))與標記物之間的物理 距離(Mb)的比率計算。舉例而言,若一對標記物之間的遺傳距離為1cM且同一對標記物之間的物理距離為2Mb,則計算之重組頻率為0.5cM/Mb。對於每一個最適基因座,選擇一對相隔至少1Mb之標記物且以此方式計算重組頻率。此等重組值在最小0.00041cM/Mb至最大62.42cM/Mb範圍內。
3. 最適基因座序列獨特性之程度
a. 對於每個最適基因座,使用基於BLASTTM之同源性搜索,使用NCBI BLASTTM軟體(2.2.23版)操作,使用預設參數設置,針對玉蜀黍栽培品種B73基因組掃描最適基因座之核苷酸序列(Stephen F.Altschul等人(1997),「Gapped BLAST and PSI-BLAST:a new generation of protein database search programs」,Nucleic Acids Res.25:3389-3402)。因為自玉蜀黍栽培品種B73基因組鑑別此等最適基因座序列,所以經由此搜索鑑別之第一BLASTTM命中代表玉蜀黍栽培品種B73序列本身。鑑別每個最適基因座序列之第二BLASTTM命中且命中之比對覆蓋度(表示為藉由BLASTTM命中覆蓋之最適基因座百分比)用作玉蜀黍基因組內最適基因座序列獨特性的量度。第二BLASTTM命中之此等比對覆蓋值在最小0%至最大39.98%序列一致性範圍內。不考慮在較高序列一致性位準下比對之任何序列。
4. 最適基因座至其鄰域中最近基因之距離
a. 自玉米基因組資料庫提取玉蜀黍基因組中已知基因之基因註釋資訊及位置(可得自www.maizegdb.org及Monaco,M. 等人,Maize Metabolic Network Construction and Transcriptome Analysis.doi:10.3835/plantgenome2012.09.0025;2013年1月23日線上公告)。對於每個最適基因座,考慮上游與下游位置,鑑別最近註釋基因且量測最適基因座序列與該基因之間的距離(Bp)。舉例而言,若最適基因座位於染色體1位置500至位置1500且與此最適基因座最靠近之基因位於染色體1位置2000至位置3000,則最適基因座至此最靠近基因之距離計算為500Bp。最適基因座資料集之所有5,286個最適基因座的此等值在最小1001Bp至最大34,809Bp範圍內。
5. 最適基因座序列中之GC%
a. 對於每個最適基因座,分析核苷酸序列以估計存在之鳥嘌呤及胞嘧啶鹼基的數目。此數表示為每個最適基因座之序列長度的百分比且提供GC%之量度。玉米最適基因座資料集之此等GC%值在25.17%至68.3%範圍內。
6. 最適基因座序列周圍40Kb鄰域中之基因數目
a. 自玉米基因組資料庫提取玉蜀黍栽培品種B73基因組中已知基因之基因註釋資訊及位置。對於5,286個最適基因座序列中之每一個,界定最適基因座序列周圍之40Kb窗口且計數位置與此窗口重疊之註釋基因的數目。此等值在40Kb鄰域內最小1個基因至最大9個基因範圍內。
7. 最適基因座周圍40Kb鄰域中之平均基因表現
a. 藉由使用RNAseqTM技術,分析由玉蜀黍栽培品種B73根及芽組織產生之可用的轉錄組概況分析資料,量測玉米基因之轉錄物表現位準(Mortazavi,A等人,Mapping and quantifying mammalian transcriptomes by RNA-Seq.Nat.Merhods.5,621-628(2008);Wang等人,Genome-Wide and Organ-Specific Landscapes of Epigenetic Modifications and Their Relationships to mRNA and Small RNA Transcriptomes in Maize.Plant Cell.2009年4月;21(4):1053-1069)。針對每個最適基因座,自玉米基因組資料庫提取玉蜀黍栽培品種B73基因組中已知基因之基因註釋資訊及位置,鑑別玉蜀黍栽培品種B73基因組內存在於最適基因座周圍40Kb鄰域中之註釋基因。自描述於以上提及之引用中的轉錄組概況提取每個基因之表現位準且計算平均基因表現位準。玉蜀黍基因組內所有基因之表現值變化很大。最小表現值為0且最大表現值為2511.397,其中平均表現值為18.489且中位表現值為3.604。5,286個最適基因座資料集所有的平均表現值在最小0.00369至最大2233.06範圍內。
8. 最適基因座周圍之核小體占位位準
a. 瞭解特定核苷酸序列之核小體占位位準提供關於染色體功能及序列之基因組背景的資訊。NuPoPTM統計套裝軟體用於預測任何大小之基因組序列的核小體占位率及最可能核小體定位圖譜(Xi,L.,Fondufe-Mittendor,Y.,Xia,L.,Flatow,J.,Widom,J.及Wang,J.-P.,Predicting nucleosome positioning using a duration Hidden Markov Model,BMC Bioinformatics,2010,doi:10.1186/1471-2105-11-346.)。對於5,286個最適基因座中之每一者,提交核苷酸序列用於用NuPoPTM軟體分析且計算核小體占位評分。玉米最適基因座 資料集之此等核小體占位評分在最小0至最大0.962範圍內。
9. 染色體內相對位置(與著絲點之接近度)
a. 著絲點為染色體上接合兩個姊妹染色分體之區域。著絲點任一邊緣上之染色體部分稱為染色體臂。在公開之玉蜀黍栽培品種B73參考序列中鑑別所有10個玉米染色體上著絲點之基因組位置(Schnable,P.等人,(2009)The B73 maize genome:complexity,diversity and dynamics.Science,326(5956):1112-1115)。自玉米基因組資料庫提取關於每一玉蜀黍染色體中著絲點之位置及染色體臂長度的資訊。對於每一最適基因座,量測最適基因座序列至其所位於之染色體之著絲點的基因組距離(Bp)。染色體內最適基因座之相對位置表示為其與著絲點之基因組距離相對於其處於之特定染色體臂長度的比率。玉米最適基因座資料集之此等相對位置值在基因組距離之最小0.00373至最大0.99908比率範圍內。
10. 1Mb區域中之最適基因座數目
a. 對於每一最適基因座,界定最適基因座位置周圍1Mb基因組窗口且計算此區域內存在或與其重疊之其他額外最適基因座的數目,包括研究中之最適基因座。1Mb中最適基因座數目在最小1至最大22範圍內。
所有5,286個最適基因座均使用上述特徵及屬性分析。每一最適基因座之特徵及屬性評分的結果或值進一步描述於表3中(作為分開的電子申請,以引用的方式併入 本文中)。所得資料集用於PCA統計方法中以將5,286個鑑別之最適基因座叢集成叢。在叢集過程期間,在估計最適基因座之「p」主分量之後,在「p」維歐幾里得空間中將最適基因座分配至32叢之一。每一「p」軸劃分成「k」個間隔。將分配至相同間隔之最適基因座分組在一起以形成叢。使用此分析,將每個PCA軸劃分成兩個間隔,其係基於關於實驗性驗證所需要之叢數目的先驗資訊來選擇。所得叢之所有分析及觀測均用來自Chemical Computing Group Inc.(Montreal,Quebec,Canada)之Molecular OperatingEnvironmentTM(MOE)軟體進行。
PCA方法用於基於上述特徵值將該組5,286個鑑別之最適基因座叢集成32個不同叢。在PCA過程期間,產生五個主分量(PC),其中頭三個PC含有資料集中約90%總變化(表4)。此三個PCA用於以三維曲線圖解表示32個叢(參見圖3)。在完成叢集過程之後,自每個叢選擇一個代表性最適基因座。此藉由在每個叢內選擇最靠近叢質心之精選最適基因座進行(表4)。10個玉米染色體中32個代表性最適基因座的染色體位置均一地分佈且不偏向任何特定基因組位置,如圖4中所示。
用於聚核苷酸供體聚核苷酸序列靶向之72個基因座的最終選擇
自叢集在32個不同叢內之5,286個基因座鑑別總共72個基因座且選擇用於由供體聚核苷酸序列靶向。對於32個叢中之每一者,選擇代表性基因座(最接近如上文表4中所描述之叢質心的32個代表性基因座)及在每個叢內之額外基因座。藉由首先針對由玉蜀黍栽培品種Hi-II(靶向篩選株系)及玉蜀黍栽培品種B104(轉型株系)之基因組DNA序列資料組成之整個基因組資料庫,篩選所有5,286個所選最適基因組序列,選擇額外最適基因座,以確定來自兩個株系之基因組中之覆蓋度(多少最適基因座存在於兩個基因組中)及序列一致性百分比。選擇Hi-II與B104基因組資料 庫中具有100%覆蓋度(在兩個基因組之間比對之最適基因座之整個序列長度)及100%一致性之額外最適基因座用於靶向驗證(圖5)。藉由比較,少數代表性基因座具有低於Hi-II與B104基因組資料庫中100%覆蓋度及一致性的序列一致性(圖5)。在選擇額外最適基因座上,亦考慮其他標準,諸如基因座大小、獨特性程度、GC%含量及最適基因座之染色體分佈。72個所選最適基因座之染色體位置及每個玉蜀黍最適基因座之特定基因組組態分別展示在圖6及表5中。
使用精確基因組工程改造技術已在玉蜀黍基因組中鑑別出一大批5,286個基因組位置為最適基因座以由供體聚核苷酸序列靶向。統計分析方法用以將5,286個所選基因座分組成32個具有類似基因組內容之叢,且鑑別一小類72個所選基因座,代表該組5,286個所選基因座。經由供體聚核苷酸序列靶向,72個代表性基因座證實為最適基因座。藉由針對對上述十組特徵或屬性所產生之數值進行PCA統計分析,將十個特徵或屬性計算成較少維度之PCA分量。因而,PCA分量減少至五個維度,其代表上述十個特徵或屬性(表6)。每一PCA分量相當於上述十個特徵或屬性之組合。自包含五個維度之此等PCA分量,如使用PCA統計分析所計算,確定32個叢。
實例3:玉蜀黍中結合基因座之鋅指的設計
針對代表性基因座之所鑑別DNA序列的鋅指蛋白質如先前所描述來設計。參見例如Urnov等人(2005)Nature 435:646-551。示例性標靶序列及識別螺旋展示在表7(識別螺旋區域設計)及表8(標靶位點)中。表8中,由ZFP識別螺旋接觸的標靶位點中之核苷酸以大寫字母指示,且非接觸核苷酸以小寫字母指示。針對所有上述72個所選基因座,設計鋅指核酸酶(ZFN)標靶位點。發展許多ZFP設計且進行測試以鑑別在最高效率位準下與72個如上文所描述在玉蜀黍中鑑別及選擇之不同代表性基因座標靶位點結合的指。在最高效率位準下與鋅指識別序列結合之特定ZFP識別螺旋(表7)用於玉蜀黍基因組內供體序列之靶向及整合。
將玉蜀黍代表性基因座鋅指設計併入編碼具有至少一個具有CCHC結構之指之蛋白質的鋅指表現載體中。參見美國專利公開案第2008/0182332號。特定言之,每種蛋白質中之剛剛所述指具有用於識別螺旋之CCHC主鏈。非典型鋅指編碼序列經由來源於玉蜀黍之四胺基酸ZC連接子及opaque-2核定位信號融合至IIS型限制酶FokI之核酸酶結構域(Wah等人,(1998)Proc.Natl.Acad.Sci.USA 95:10564-10569序列之胺基酸384-579),以形成鋅指核酸酶(ZFN)。參見美國專利第7,888,121號。選擇各種功能性結構域之鋅指用於活體內使用。在設計、產生及測試以結合於假定基因組標靶位點之許多ZFN中,以上表8中描述之ZFN 被鑑別為具有活體內活性且表徵為能夠有效結合植物中獨特玉蜀黍基因組聚核苷酸標靶位點且使其斷裂。
ZFN構築體組裝
使用此項技術中通常已知之技能及技術(參見例如Ausubel或Maniatis)設計及完成如上所鑑別之含有ZFN基因表現構築體之質體載體。每個ZFN編碼序列融合至編碼opaque-2核定位信號之序列(Maddaloni等人,(1989)Nuc.Acids Res.17:7532),該序列位於鋅指核酸酶之上游。非典型鋅指編碼序列融合至IIS型限制酶FokI之核酸酶結構域(Wah等人(1998)Proc.Natl.Acad.Sci.USA 95:10564-10569之序列之胺基酸384-579)。融合蛋白之表現由來自玉蜀黍泛素基因之強組成性啟動子(其包括5'未轉譯區(UTR))驅動(Toki等人,(1992)Plant Physiology 100;1503-07)。表現卡匣亦包括來自玉蜀黍過氧化酶5基因(Per5)基因之3'UTR(包含轉錄終止子及聚腺苷酸化位點)(美國專利公開案第2004/0158887號)。在選殖至構築體中之兩個鋅指核酸酶融合蛋白之間添加來自明脈扁刺蛾β四體病毒(Thosea asigna virus)之編碼核苷酸序列的自我水解2A(Szymczak等人,(2004)Nat Biotechnol.22:760-760)。
使用IN-FUSIONTM Advantage Technology(Clontech,View,CA)組裝質體載體。自New England BioLabs(Ipswich,MA)獲得限制核酸內切酶且T4 DNA接合酶(Invitrogen,Carlsbad,CA)用於DNA接合。按照供應商說明書,使用NUCLEOSPIN® Plasmid Kit(Macherey-Nagel Inc.,Bethlehem,PA)或Plasmid Midi Kit(Qiagen)進行質體製備。在瓊脂糖三乙酸鹽凝膠電泳之後使用QIAQUICK GEL EXTRACTIONKITTM(Qiagen)分離DNA片段。最初藉由小規模製備DNA之限制消化篩選所有接合反應純系。藉由商業測序供應商(Eurofins MWG Operon,Huntsville,AL)對所選純系之質體DNA測序。使用SEQUENCHERTM軟體(Gene Codes Corp.,Ann Arbor,MI)組裝及分析序列資料。
經由限制酶消化及經由DNA測序構築及確定質體。
經由自動工作流進行鋅指選殖
經由自動DNA構築管道選殖一小類鋅指核酸酶載體。總體而言,自動管道產生具有與先前所述一致之ZFN架構的載體構築。賦予ZFN之DNA結合特異性的每個鋅指單體在KPF胺基酸基元分成2-3個獨特序列。ZFN片段之5’與3’末端均藉由包括BsaI識別位點(GGTCTCN)及衍生之突出物修飾。突出物分佈使得6-8部分組裝將僅僅產生所希望之全長表現純系。經修飾之DNA片段重新合成(Synthetic Genomics Incorporated,La Jolla,CA)。單一玉米主鏈pDAB118791用於所有玉米ZFN構建體中。其含有ZmUbi1啟動子及Opaque2 NLS以及FokI結構域及ZmPer5 3’UTR。選殖在Opaque 2 NLS與FokI結構域之間的為來自枯草桿菌(Bacillus subtilis)之BsaI側接之SacB基因。當假定接合事件塗鋪於含有蔗糖之培養基上時,SacB卡匣充當陰性選擇劑,減少或消除載體主鏈污染。在所有構建體中重複利用 之第二部分為pDAB117462。此載體含有均由BsaI位點側接之第一單體Fok1結構域、t2A反向螺旋序列及第2單體Opaque2 NLS。
使用此等材料作為ZFN DNA部分庫,Freedom Evo 150(TECAN,Mannedorf,Switzerland)操縱75-100ng每一DNA質體之或自2D bar編碼管合成之片段添加至PCR板(ThermoFisher,Waltham,MA)。將補充有牛血清白蛋白(NEB,Ipswich,MA)及T4 DNA接合酶緩衝液(NEB,Ipswich,MA)之BsaI(NEB,Ipswich,MA)及T4 DNA接合酶(NEB,Ipswich,MA)增加至反應物中。反應物在C1000 Touch Thermo Cycler(BioRad,Hercules CA)中循環(25次),其中在37℃下培育3分鐘且在16℃下培育4分鐘。手動或使用Qpix460群落挑選機及LabChip GX(Perkin Elmer,Waltham,MA)將接合材料轉型於Top10 cells(Life Technologies Carlsbad,CA)中且篩選。恰當消化之群落為確定提供用於植物轉型之序列。
通用供體構築體組裝
為支持大多數標靶基因座之快速測試,設計及構築一種新穎的靈活通用之供體系統序列。該通用供體聚核苷酸序列與高通量載體構築方法及分析相容。通用供體系統由至少三個模組化結構域構成:可變ZFN結合結構域、非可變分析及使用者定義特徵之結構域以及用於載體按比例增加之簡單質體主鏈。非可變通用供體聚核苷酸序列為所有供體所共用,且允許設計一組有限的分析,該等分析 可跨越所有玉蜀黍標靶位點使用,因而提供靶向評估之一致性且減少分析循環次數。此等結構域之模組化性質允許高通量供體組裝。另外,通用供體聚核苷酸序列具有旨在簡化下游分析及加強結果解釋之其他獨特特徵。其含有允許PCR產物消化成診斷上所預測之大小的不對稱限制位點序列。移除預期在PCR擴增中有問題的包含二級結構之序列。通用供體聚核苷酸序列的尺寸小(低於3.0Kb)。最終,通用供體聚核苷酸序列構建在高複本pUC19主鏈上,允許大量測試DNA以及時方式積聚。
作為一個實施例,包含通用供體聚核苷酸序列之示例質體提供為SEQ ID NO:5418及圖7。在另一個實施例中,通用供體聚核苷酸序列提供為:pDAB11846,SEQ ID NO:5419,圖15;pDAB117415,SEQ ID NO:5420,圖16;pDAB117416,SEQ ID NO:5421,圖17;pDAB117417,SEQ ID NO:5422,圖18;pDAB117419,SEQ ID NO:5423,圖19;pDAB117434SEQ ID NO:5424,圖20;pDAB117418,SEQ ID NO:5425,圖21;pDAB117420,SEQ ID NO:5426,圖22;及pDAB117421,SEQ ID NO:5427,圖23。在另一實施例中,可構築包含具有功能表現編碼序列或非功能性(無啟動子)表現編碼序列之通用供體聚核苷酸序列的額外序列。
在另一實施例中,通用供體聚核苷酸序列為作為質體傳遞之小2-3Kb模組化供體系統。此為最小供體,包含任何數目之ZFN結合位點、稱為「DNA X」或「UZI序列」(SEQ ID NO:5428)之攜有限制位點及用於引物設計或編碼 序列之DNA序列的短100-150bp模板區域以及簡單質體主鏈(圖8)。在適當ZFN結合位點DNA雙股斷裂後,整個質體經由NHEJ插入;可串聯併入ZFN結合位點。通用供體聚核苷酸序列之此實施例最適合於快速篩選標靶位點及ZFN,且難以擴增之序列在供體中減至最少。
在另一實施例中,通用供體聚核苷酸序列由至少4個模組組成且攜有ZFN結合位點、同源性臂、具有僅約100bp分析片或編碼序列之DNA X。通用供體聚核苷酸序列之此實施例適合於用若干ZFN詢問在多種標靶位點HDR介導之基因插入(圖9)。
在兩種靶向供體插入模式(NHEJ/HDR)下,通用供體聚核苷酸序列可用於具有界定DNA結合結構域之所有靶向分子。因而,當通用供體聚核苷酸序列與適當ZFN表現構築體共同傳遞時,供體載體及玉米基因組在由特定ZFN結合所指定之一個特定位置切割。一旦線性化,供體可藉由NHEJ或HDR併入基因組中。接著載體設計中之不同分析考慮因素可用以確定最大化靶向整合之有效傳遞的鋅指(圖10)。
實例4:玉蜀黍轉型程序
在傳遞至玉蜀黍栽培品種Hi-II原生質體前,按照供應商之說明書,使用PURE YIELD PLASMID MAXIPREP SYSTEM®(Promega Corporation,Madison,WI)或PLASMID MAXI KIT®(Qiagen,Valencia,CA),自大腸桿菌培養物製備每一ZFN構築體之質體DNA。
原生質體分離
玉蜀黍栽培品種Hi-II懸浮液細胞維持在3.5天維持時程下,收集4mL血球容積比(PCV)細胞且轉移至含有20mL酶溶液(0.6% PECTOLYASETM、6% CELLULASETM(「Onozuka」R10;Yakult Pharmaceuticals,Japan)、4mM MES(pH 5.7)、0.6M甘露醇、15mM MgCl2)的50mL無菌圓錐管(Fisher Scientific)中。將培養物加蓋且包裹在PARAFILMTM中,且置放在平台搖椅(Thermo Scientific,Vari Mix平台搖椅)上速度設置10下,在室溫下培育16-18小時,直至原生質體釋放。培育後,在顯微鏡下檢查一滴細胞以檢查消化品質且消化細胞經由100μm細胞過濾器過濾,用10mL W5培養基[2mM MES(pH 5.7)、205mM NaCl、167mM CaCl2、6.7mM KCl]沖洗,接著經由70μm及40μm細胞過濾器過濾。100μm及40μm過濾器用10mL W5培養基沖洗。所過濾之原生質體以及沖洗之培養基收集在50mL離心管中且最終體積為約40mL。隨後8mL「重梯度溶液」[500mM蔗糖、1mM CaCl2、5mM MES(pH6.0)]緩慢添加至原生質體/酶溶液底部中,在具有浮桶式轉頭之離心機中300-350 x g下離心15分鐘。離心後,移除約7-8mL原生質體條帶,用25mL W5洗滌,且在180-200 x g下離心15分鐘。隨後原生質體再懸浮於10mL MMG溶液[4mM MES(pH 5.7)、0.6M甘露醇、15mM MgCl2]中。使用血球計或流式細胞儀對原生質體計數且使用MMG稀釋至每毫升167萬。
使用PEG轉型玉蜀黍栽培品種Hi-II懸浮液培養物衍生 之原生質體
約50萬原生質體(300μl於MMG溶液中)轉移至2mL管中且與40μl DNA混合且在室溫下培育5-10分鐘。隨後,添加300μl新製備之PEG溶液[36% PEG 4000、0.3M甘露醇、0.4M CaCl2],且混合物在室溫下培育15-20分鐘,藉由顛倒週期性混合。在培育之後,緩慢添加1ml W5洗滌液且輕輕混合,且藉由在180-200 x g下離心15分鐘使原生質體成球粒。離心塊再懸浮於1mL WI培養基[4mM MES(pH 5.7)、0.6M甘露醇、20mM KCl]中且含有原生質體之管用鋁箔包裹且在室溫下培育隔夜,約16小時。
ZFN及供體之轉型
對於表5之每個所選基因座,玉蜀黍原生質體用yfp基因表現對照、單獨ZFN、單獨供體及ZFN與供體1:10比率(按重量計)之混合物轉染。用於轉染50萬原生質體之DNA總量為80μg。所有處理均在3或6個複製品中進行。所用之yfp基因表現對照為pDAB8393(圖11),其含有玉蜀黍泛素1啟動子-黃色螢光蛋白質編碼序列-玉蜀黍Per5 3’UTR及稻穀Actin1啟動子-pat編碼序列-玉蜀黍脂肪酶3’UTR基因表現卡匣。為提供每個轉染一致量的總DNA,需要時,鮭魚精或含有yfp基因之質體用作填充劑。在一個典型靶向實驗中,單獨或具有36μg供體之4μg ZFN經轉染且添加適當量之鮭魚精或pUC19質體DNA以使DNA之整體量達至80μg。包括yfp基因表現質體作為填充劑允許跨越多個基因座及複製處理評估轉染品質。
實例5:經由鋅指核酸酶使玉蜀黍中之基因座裂解
在轉染後24小時,藉由在2ml EPPENDORFTM管中在1600rpm下離心來收穫ZFN轉染之玉蜀黍栽培品種Hi-II原生質體,且完全移除上清液。使用QIAGEN PLANT DNA EXTRACTION KITTM(Qiagen,Valencia,CA)自原生質體離心塊提取基因組DNA。所分離之DNA再懸浮於50μL水中且藉由NANODROP®(Invitrogen,Grand Island,NY)測定濃度。藉由樣品在0.8%瓊脂糖凝膠電泳上跑動,評估DNA之完整性。所有樣品均正規化(20-25ng/μL)用於PCR擴增,以產生用於測序之擴增子(Illumina,Inc.,SanDiego,CA)。設計用於自經處理及對照樣品擴增涵蓋每一測試ZFN識別序列之區域的bar編碼之PCR引子且購自IDT(Coralville,IA,HPLC純化)。最佳擴增條件藉由梯度PCR,使用0.2μM適當bar編碼之引子、ACCUPRIME PFXSUPERMIXTM(Invitrogen,Carlsbad,CA)及100ng模板基因組DNA,在23.5μL反應物中鑑別。循環參數為在95℃下初始變性(5分鐘),接著35個變性循環(95℃,15秒)、退火(55-72℃,30秒)、延伸(68℃,1分鐘)及最終延伸(68℃,7分鐘)。在3.5% TAE瓊脂糖凝膠上分析擴增產物且確定每一引物組合之適當退火溫度,且如上文所描述,用於擴增來自對照及ZFN處理之樣品的擴增子。所有擴增子在3.5%瓊脂糖凝膠上純化,於水中溶離且藉由NANODROPTM確定濃度。對於下一代測序,將來自ZFN處理及對應玉米原生質體對照之約100ng PCR擴增子彙集在一起且使用llumina下一代測序(NGS)測 序。
分析適當ZFN在每一玉蜀黍所選基因座之裂解活性。涵蓋ZFN裂解位點之短擴增子自基因組DNA擴增且自ZFN處理及對照原生質體進行Illumina NGS。藉由細胞NHEJ修復路徑,藉由核苷酸在裂解位點之插入或缺失(插入缺失),解析ZFN誘發之裂解或DNA雙股斷裂,因而插入缺失在裂解位點之存在為ZFN活性之量度且藉由NGS測定。使用NGS分析軟體(專利公開案2012-0173,153,DNA序列資料分析)評估標靶特異性ZFN之裂解活性為每1百萬高品質序列具有插入缺失之序列數目(圖12)。針對玉蜀黍所選基因座標靶,觀測到在對照5-100倍範圍內之活性,且藉由展示每一ZFN裂解位點之插入缺失不同佔據面積的序列比對進一步確定。此資料表明玉蜀黍所選基因座經受ZFN裂解。在每一標靶之不同活性反映其染色質狀態及裂解能力以及每一ZFN之表現效率。
實例6:聚核苷酸供體整合之快速靶向分析
使用基於半通量原生質體之快速測試分析方法,驗證玉蜀黍所選基因座標靶內通用供體聚核苷酸序列經由非同源末端接合(NHEJ)介導之供體插入的靶向。對於每一玉蜀黍所選基因座標靶,測試3-6個ZFN設計且藉由下一代測序方法量測ZFN介導之裂解(圖12)及藉由接合進退PCR量測供體插入(圖13)來評估靶向。在兩個分析中為陽性之玉蜀黍所選基因座被鑑別為可靶向基因座。
ZFN供體插入快速測試分析
為確定玉蜀黍所選基因座標靶是否可靶向用於供體插入,ZFN構築體及通用供體聚核苷酸構築體共同傳遞至玉米原生質體,其培育24小時,接著提取基因組DNA用於分析。若表現之ZFN能夠在玉蜀黍所選基因座標靶及供體中切割標靶結合位點,則線性化供體將隨後經由非同源末端接合(NHEJ)路徑插入玉米基因組中裂解之標靶位點中。基於「進退」PCR策略,證實玉蜀黍所選基因座標靶之靶向整合,其中「進」引子識別原生最適基因座上之序列且「退」引子結合於供體DNA內之序列。引子以僅僅當供體DNA插入玉蜀黍所選基因座標靶時,PCR分析將產生具有預期大小之擴增產物的方式設計。在插入接面之5'及3'末端進行進退PCR分析。用於分析整合之聚核苷酸供體序列的引子提供於表9中。
使用巢式「進退」PCR之標靶基因座上ZFN供體插入
使用TAKARA EX TAQHSTM套組(Clonetech,Mountain View,CA)進行所有PCR擴增。第一進退PCR在含有1X TAKARA EX TAQ HSTM緩衝液、0.2mM dNTPs、0.2μM「退」引子(表9)、0.05μM「進」引子(自上述通用供體卡匣設計)、0.75單元TAKARA EX TAQ HSTM聚合酶及10ng提取之玉米原生質體DNA的20μL最終反應體積中進行。隨後使用PCR程式進行反應,該PCR程式由94℃ 2分鐘、20個98℃ 12秒及68℃ 2分鐘、接著72℃ 10分鐘之循環及保持在4℃下組成。最終PCR產物與1KB PLUS DNA LADDERTM(Life Technologies,Grand Island,NY)一起在瓊脂糖凝膠上 跑動以進行觀測。
巢式進退PCR在含有1X TAKARA EX TAQ HSTM緩衝液、0.2mM dNTPs、0.2μM「退」引子(表9)、0.1μM「進」引子(自上述通用供體卡匣設計,表10)、0.75單元之TAKARA EX TAQ HSTM聚合酶及1μL第一PCR產物的20μL最終反應體積中進行。隨後使用PCR程式進行反應,該PCR程式由94℃ 2分鐘、31個98℃ 12秒、66℃ 30秒及68℃ 45秒、接著72℃ 10分鐘之循環及保持在4℃下組成。最終PCR產物與1KB PLUS DNA LADDERTM(Life Technologies,Grand Island,NY)一起在瓊脂糖凝膠上跑動以進行觀測。
在原生質體靶向系統中採用進退PCR分析特別具挑戰性,因為大量質體DNA用於轉染,且大量DNA仍然在原生質體靶向系統中,且隨後與細胞基因組DNA一起提取。殘餘質體DNA可稀釋相對濃度之基因組DNA且減小偵測之整體靈敏度,且亦可為非特異性之異常PCR反應之顯著原因。ZFN誘發之基於NHEJ之供體插入通常以前向或反向取向進行。用於前向取向插入之DNA的進退PCR分析常展現假陽性條帶,可能歸因於標靶及供體中ZFN結合位點周圍之共享同源性區域,此可能引起擴增過程期間未整合供體DNA之引發及延伸。在探測反向取向插入產物之分析中未見到假陽性,且因此進行所有靶向供體整合分析以詢問RTA中之反向供體插入。為進一步增加特異性及減弱背景,亦採用巢式PCR策略。巢式PCR策略使用第二PCR擴增反應,該反應擴增第一PCR反應之第一擴增產物內的較短區域。使用不對稱量之「進」及「退」引子使接合PCR最佳化,進一步用於在所選基因座之快速靶向分析。
在瓊脂糖凝膠上目測進退PCR分析結果。對於表12之所有玉蜀黍所選基因座,「ZFN+供體處理」在5'及3'末端產生近乎預期大小之條帶。對照ZFN或單獨供體處理在PCR中為陰性的,表明該方法針對最適非基因玉米基因座中之至少72個基因座之標靶位點的供體整合特定評分。所有處理均在3-6個複製品中進行且多個複製品中預期PCR產物之存在(在兩個末端
Figure TW201947037A_D0049
2)用於證實靶向。經由NHEJ插入供 體常產生較低強度之副產物,其係因在標靶及/或供體ZFN位點加工線性化末端而產生。此外,觀測到不同ZFN進行靶向整合之效率位準不同,其中一些ZFN產生一致高位準之供體整合,一些ZFN產生低於一致位準之供體整合,且其他ZFN無整合。總體而言,對於所測試之每一玉蜀黍所選基因座標靶,證實在玉蜀黍代表性基因座標靶內一或多個ZFN靶向整合,此證實此等基因座之每一者為可靶向的。此外,每個玉蜀黍所選基因座均適合於精確基因轉型。此等玉蜀黍所選基因座標靶重複驗證多次,每次結果類似,因而證實驗證過程之再現性,包括質體設計及構築、原生質體轉型、樣品加工及樣品分析。
結論
供體質體及設計成特異性裂解玉蜀黍所選基因座標靶之一個ZFN轉染至玉蜀黍栽培品種Hi-II原生質體中且24小時後收穫細胞。藉由進退接合PCR分析自對照、ZFN處理及ZFN與供體處理之原生質體分離的基因組DNA展示作為ZFN裂解基因組DNA之結果,通用供體聚核苷酸靶向插入(表12)。此等研究展示通用供體聚核苷酸系統可用於評估在內源性位點靶向及篩選候選ZFN。最終,基於原生質體之快速靶向分析及新穎通用供體聚核苷酸序列系統提供一種快速篩選基因組標靶及ZFN用於植物中精確基因組工程改造之方法。該等方法可延伸以使用任何引入DNA雙或單股斷裂之核酸酶評估任何相關系統中基因組標靶之位點特異性裂解及供體插入。
實例7:玉蜀黍基因座內聚核苷酸供體序列之表現
隨機整合之玉米轉型事件藉由用美國專利第7,838,733號中所述之含有aad-1轉殖基因之pDAB105817及pEPS1027質體轉型來產生(圖14)。產生大量事件,且分析1,027個穩定事件以經由如美國專利申請案第2012/0258867號中所述之基因組側接分析方法確定是否有任何事件在玉蜀黍所選基因座標靶內含有隨機整合之轉殖基因。因而,223個事件中整合轉殖基因之染色體位置映射在玉蜀黍基因組內。表13資料指示整合轉基因之染色體位置證實整合在低甲基化區域(45-73%)內及下游至少1Kb區域之轉錄單元(啟動子/基因/3'UTR)中(60%)。
映射事件使用實例1及2中所述之最適基因座預測標準(低甲基化區域、獨特區域、非基因、非重複、接近40Kb鄰域中之基因、根/芽中活性表現之證據、重組跡象)進一步分析,且鑑別玉蜀黍所選基因座標靶內的若干隨機整合事件(表14)。舉例而言,已分別使用快速測試分析及藉由植物中靶向證實玉蜀黍所選基因座標靶最適基因座_232222及最適基因座_127268內之靶向。
實驗性玉蜀黍所選基因座標靶之平均長度為約1Kb且在每一玉蜀黍所選基因座標靶觀測到不同程度之aad-1表現(表14)。經由分離之轉殖基因葉子材料的即時PCR分析,在T1植物轉型階段進行平均aad-1表現分析。因而,玉蜀黍基因組內隨機整合事件能夠表現實驗性玉蜀黍所選基因座標靶內的轉殖基因。
實例8:轉殖基因整合之最適非基因玉米基因座
自5,286個最適非基因玉米基因座鑑別出一批最適非基因玉米基因座以選擇多個基因座用於基因表現卡匣之位點特異性靶向及產生基因表現卡匣之堆疊。以下標準用於過濾該池最適非基因玉米基因座且選擇一批最適非基因玉米基因座:
1)長度超過3Kb。最適非基因玉米基因座可在至少兩組基因表現卡匣整合下靶向。
2)0.5至1.0之重組頻率,其低於所鑑別之5,286個最適非基因玉米基因座之平均重組頻率(平均重組頻率為約2.0)。
3)超過所鑑別之5,286個最適非基因玉米基因座之40Kb內內源性基因之平均表現。根及芽組織中40Kb區域內基因之平均表現超過6.30,其為所有最適非基因玉米基因座之第48百分位數。
4)玉蜀黍栽培品種B104與玉蜀黍栽培品種Hi-II之間的序列覆蓋度及序列一致性超過90%。
每個上述標準均應用以選擇一批最適非基因玉米基因座。圖24提供該標準之三個例示性圖,及所選最適非基因玉米基因座如何與其他基因座相比較。使用此標準 鑑別出九個至少3Kb長之最適非基因玉米基因座(最適基因座_137693_G1、最適基因座_265551_G1、最適基因座_128078_G1、最適基因座_168286_G1、最適基因座_3733_G1、最適基因座_203075_G1、最適基因座_232484_G1、最適基因座_136086_G1及最適基因座_203704_G1)。參見表15。藉由將尺寸限制減小至
Figure TW201947037A_D0058
2Kb(最適基因座_291068_G1及最適基因座_43577_G1),鑑別出其他最適非基因玉米基因座,將此等基因座添加至該批最適非基因玉米基因座中。添加另一組最適非基因玉米基因座至該批最適非基因玉米基因座中,因為在此等位點經由土壤桿菌屬轉型而隨機整合之轉殖基因存在表現跡象(最適基因座_232222_G1及最適基因座_127268_G1)。最適基因座_204637_G1及最適基因座_204726_G1基因座因其減數分裂重組單元特徵而添加至該批中。此外,最適基因座_204637_G1及最適基因座_204726_G1已成功靶向用於供體聚核苷酸整合。同樣,該批中包括最適基因座_232228,因為此最適非基因玉米基因座已成功地靶向用於供體聚核苷酸整合且序列長度為3.9Kb。
隨後,針對與接近基因之距離及離著絲點之距離表徵所有最適非基因玉米基因座(圖25)。該批精選最適非基因基因座離接近基因為約1-15Kb,且位於染色體接近末端處(離著絲點之距離>0.70)(表16,圖25)。最終,探測定量性狀基因座之干擾以完全表徵該批最適非基因玉米基因座。
使用上述標準選擇之最適非基因玉米基因座藉由整合含有可選/可報導標記物之基因表現構築體來證實。此基因表現卡匣經由使用位點特異性核酸酶進行基因組靶向而穩定地整合至玉米植物。分析所產生且含有可表現轉殖基因之靶向之最適非基因玉米基因座以鑑別含有全長整合基因表現卡匣之單一複本事件。經由qRT-PCR、西 方墨點、ELISA、LC-MS MS及其他已知之RNA或蛋白質偵測方法對多代植物(例如T1及T2代)分析最適非基因玉米基因座之表現概況。此外,分析最適非基因玉米基因座內之轉殖基因表現卡匣整合對鄰近基因表現的影響。最終,分析最適非基因玉米基因座內之轉殖基因表現卡匣整合對玉米植物之農藝特性的影響。

Claims (12)

  1. 一種包含一重組核酸分子的玉米植物細胞,該重組核酸分子包含一至少1Kb之非基因玉米基因組核酸分子,其中該非基因核酸分子包含下列特徵:a.該非基因核酸分子的甲基化程度係為1%或更少;b.該非基因核酸分子與玉蜀黍( Zea mays)基因組中所含有的任何其他核酸共享小於40%序列一致性;c.該非基因核酸分子位於一已知或預期會表現的玉米編碼核酸之40Kb區內;以及d.該非基因核酸顯示在該玉米基因組內超過0.00041cM/Mb之重組率;其中該非基因核酸分子與選自於由下列所組成之群組的非基因核酸具有至少95%序列一致性:基因座_59517_G1(SEQ ID NO:1),基因座_25001_G1(SEQ ID NO:100),基因座_112632_G1(SEQ ID NO:203),基因座_28905_G1(SEQ ID NO:295),基因座_129164_G1(SEQ ID NO:384),基因座_178978_G1(SEQ ID NO:687),基因座_288388_G1(SEQ ID NO:781),基因座_60310_G1(SEQ ID NO:843), 基因座_243330_G1(SEQ ID NO:967),基因座_344662_G1(SEQ ID NO:1190),基因座_153894_G1(SEQ ID NO:1252),基因座_156393_G1(SEQ ID NO:1571),基因座_236662_G1(SEQ ID NO:1663),基因座_301175_G1(SEQ ID NO:1906),基因座_202616_G1(SEQ ID NO:2027),基因座_282323_G1(SEQ ID NO:2171),基因座_262782_G1(SEQ ID NO:2256),基因座_236455_G1(SEQ ID NO:2428),基因座_301774_G1(SEQ ID NO:2632),基因座_344663_G1(SEQ ID NO:2649),以及基因座_66202_G1(SEQ ID NO:2855);以及一感興趣的DNA,其中該感興趣的DNA被插入於該非基因核酸分子中,以產生該重組核酸分子。
  2. 如請求項1之玉米植物細胞,其滿足下列之至少一者:i.該感興趣的DNA插入在對該非基因核酸分子具有特異性之鋅指標靶位點的1.5Kb、1.25Kb、1.0Kb、0.75Kb、0.5Kb或0.25Kb內,ii.該感興趣的DNA插入在介於對該非基因核酸分子具有特異性之一對鋅指標靶位點之間,iii.該感興趣的DNA包含分析結構域,iv.該感興趣的DNA不編碼肽,v.該感興趣的DNA編碼肽, vi.該感興趣的DNA包含一含有殺昆蟲劑抗性基因、除草劑耐受性基因、氮利用效率基因、水利用效率基因、營養品質基因、DNA結合基因或可選擇之標記基因的基因表現卡匣,或vii.該感興趣的DNA包含兩個或兩個以上基因表現卡匣。
  3. 如請求項1或2之玉米植物細胞,其中該非基因核酸分子係選自於由下列所組成之群組:基因座_59517_G1(SEQ ID NO:1)、基因座_25001_G1(SEQ ID NO:100)、基因座_112632_G1(SEQ ID NO:203)、基因座_178978_G1(SEQ ID NO:687)、基因座_288388_G1(SEQ ID NO:781)、基因座_60310_G1(SEQ ID NO:843)、基因座_243330_G1(SEQ ID NO:967)、基因座_344662_G1(SEQ ID NO:1190)、基因座_153894_G1(SEQ ID NO:1252)、基因座_301175_G1(SEQ ID NO:1906)、基因座_202616_G1(SEQ ID NO:2027)、基因座_282323_G1(SEQ ID NO:2171)、基因座_262782_G1(SEQ ID NO:2256)、基因座_236455_G1(SEQ ID NO:2428)、基因座_301774_G1(SEQ ID NO:2632)、基因座_344663_G1(SEQ ID NO:2649)以及基因座_66202_G1(SEQ ID NO:2855);或是選自於由下列所組成之群組:基因座_344662_G1(SEQ ID NO:1190)、基因座_153894_G1(SEQ ID NO:1252)、基因座_301175_G1(SEQ ID NO:1906)、基 因座_202616_G1(SEQ ID NO:2027)、基因座_282323_G1(SEQ ID NO:2171)、基因座_344663_G1(SEQ ID NO:2649)以及基因座_66202_G1(SEQ ID NO:2855);或是選自於由下列所組成之群組:基因座_301175_G1(SEQ ID NO:1906)、基因座_202616_G1(SEQ ID NO:2027)、基因座_282323_G1(SEQ ID NO:2171)、基因座_262782_G1(SEQ ID NO:2256)、基因座_236455_G1(SEQ ID NO:2428)以及基因座_301774_G1(SEQ ID NO:2632);或是選自於由下列所組成之群組:基因座_59517_G1(SEQ ID NO:1)、基因座_25001_G1(SEQ ID NO:100)、基因座_112632_G1(SEQ ID NO:203)、基因座_153894_G1(SEQ ID NO:1252)、基因座_202616_G1(SEQ ID NO:2027)以及基因座_236455_G1(SEQ ID NO:2428)。
  4. 一種製造一含有感興趣的DNA的轉殖基因玉米植物細胞之方法,該方法包含:a.選擇一標靶非基因玉米基因座,其與選自於由下列所組成之群組的核酸具有至少95%的序列一致性:基因座_59517_G1(SEQ ID NO:1)、基因座_25001_G1(SEQ ID NO:100)、基因座_112632_G1(SEQ ID NO:203)、基因座_28905_G1(SEQ ID NO:295)、基因座_129164_G1(SEQ ID NO:384)、基因座_178978_G1 (SEQ ID NO:687)、基因座_288388_G1(SEQ ID NO:781)、基因座_60310_G1(SEQ ID NO:843)、基因座_243330_G1(SEQ ID NO:967)、基因座_344662_G1(SEQ ID NO:1190)、基因座_204637_G1(SEQ ID NO:2731)、基因座_153894_G1(SEQ ID NO:1252)、基因座_156393_G1(SEQ ID NO:1571)、基因座_236662_G1(SEQ ID NO:1663)、基因座_301175_G1(SEQ ID NO:1906)、基因座_202616_G1(SEQ ID NO:2027)、基因座_282323_G1(SEQ ID NO:2171)、基因座_262782_G1(SEQ ID NO:2256)、基因座_236455_G1(SEQ ID NO:2428)、基因座_301774_G1(SEQ ID NO:2632)、基因座_344663_G1(SEQ ID NO:2649)以及基因座_66202_G1(SEQ ID NO:2855);更進一步,其中:(i)該非基因核酸的甲基化程度係為1%或更少;(ii)該非基因核酸與玉蜀黍基因組中所含有的任何其他核酸共享小於40%序列一致性;(iii)該非基因核酸位於一已知或預期會表現的玉米編碼核酸之40Kb區內;以及(iv)該非基因核酸顯示在玉米基因組內超過0.00041cM/Mb之重組率;b.選擇特異性結合及裂解該標靶非基因玉米基因座之一位點特異性核酸酶;c.將該位點特異性核酸酶引入一玉米植物細胞中; d.將該感興趣的DNA引入該玉米植物細胞中;e.將該感興趣的DNA插入該等標靶非基因玉米基因座中;以及f.選擇包含插入該非基因基因座之該感興趣的DNA的轉殖基因玉米植物細胞。
  5. 如請求項4之製造轉殖基因玉米植物細胞之方法,其滿足下列之至少一者:i.該感興趣的DNA包含分析結構域,ii.該感興趣的DNA不編碼肽,iii.該感興趣的DNA編碼肽,iv.該感興趣的DNA包含一含有轉殖基因之基因表現卡匣,v.該感興趣的DNA包含兩個或兩個以上基因表現卡匣,vi.該位點特異性核酸酶係選自於由下列所組成之群組:鋅指核酸酶、CRISPR核酸酶、TALEN、歸巢核酸內切酶及大範圍核酸酶,vii.該感興趣的DNA經由同源性介導之修復整合方法整合在該非基因玉米基因座內,viii.該感興趣的DNA經由非同源末端接合整合方法整合在該非基因玉米基因座內,ix.兩個或兩個以上該等感興趣的DNA插入兩個或兩個以上該等標靶非基因玉米基因座中;x.兩個或兩個以上該等感興趣的DNA插入兩個或兩 個以上該等標靶非基因玉米基因座中,其中該兩個或兩個以上標靶非基因玉米基因座位於同一染色體上;或xi.該感興趣的DNA在該感興趣的DNA插入該等標靶非基因玉米基因座的期間被修飾。
  6. 一種重組核酸分子,其包含:一至少1Kb之非基因核酸分子,其中該非基因核酸分子與選自於由下列所組成之群組的核酸具有至少95%序列一致性:基因座_59517_G1(SEQ ID NO:1)、基因座_25001_G1(SEQ ID NO:100)、基因座_112632_G1(SEQ ID NO:203)、基因座_28905_G1(SEQ ID NO:295)、基因座_129164_G1(SEQ ID NO:384)、基因座_178978_G1(SEQ ID NO:687)、基因座_288388_G1(SEQ ID NO:781)、基因座_60310_G1(SEQ ID NO:843)、基因座_243330_G1(SEQ ID NO:967)、基因座_344662_G1(SEQ ID NO:1190)、基因座_204637_G1(SEQ ID NO:2731)、基因座_153894_G1(SEQ ID NO:1252)、基因座_156393_G1(SEQ ID NO:1571)、基因座_236662_G1(SEQ ID NO:1663)、基因座_301175_G1(SEQ ID NO:1906)、基因座_202616_G1(SEQ ID NO:2027)、基因座_282323_G1(SEQ ID NO:2171)、基因座_262782_G1(SEQ ID NO:2256)、基因座_236455_G1(SEQ ID NO:2428)、基因座_301774_G1(SEQ ID NO:2632)、基因座_344663_G1(SEQ ID NO:2649)以及基因座_66202_G1(SEQ ID NO:2855),其中該非基因核酸包含下列特徵:a.該非基因核酸分子的甲基化程度係為1%或更少;b.該非基因核酸分子與玉蜀黍基因組中所含有的任何其他核酸共享小於40%序列一致性;c.該非基因核酸分子位於一已知或預期會表現的玉米編碼核酸之40Kb區內;以及d.該非基因核酸分子顯示在玉米基因組內超過0.00041cM/Mb之重組率;以及一感興趣的DNA,其中該感興趣的DNA被插入於該非基因核酸分子中,以產生該重組核酸分子。
  7. 如請求項6之重組核酸分子,其中該非基因核酸分子係選自於由下列所組成之群組:基因座_59517_G1(SEQ ID NO:1)、基因座_25001_G1(SEQ ID NO:100)、基因座_112632_G1(SEQ ID NO:203)、基因座_178978_G1(SEQ ID NO:687)、基因座_288388_G1(SEQ ID NO:781)、基因座_60310_G1(SEQ ID NO:843)、基因座_243330_G1(SEQ ID NO:967)、基因座_344662_G1(SEQ ID NO:1190)、基因座_153894_G1(SEQ ID NO:1252)、基因座_301175_G1(SEQ ID NO:1906)、基因座_202616_G1(SEQ ID NO:2027)、基因座_282323_G1(SEQ ID NO:2171)、基因座_262782_G1(SEQ ID NO:2256)、基因座_236455_G1(SEQ ID NO:2428)、基因座_301774_G1(SEQ ID NO:2632)、基因座_344663_G1(SEQ ID NO:2649)以及基因座_66202_G1(SEQ ID NO:2855);或是選自於由下列所組成之群組:基因座_344662_G1(SEQ ID NO:1190)、基因座_153894_G1(SEQ ID NO:1252)、基因座_301175_G1(SEQ ID NO:1906)、基因座_202616_G1(SEQ ID NO:2027)、基因座_282323_G1(SEQ ID NO:2171)、基因座_344663_G1(SEQ ID NO:2649)以及基因座_66202_G1(SEQ ID NO:2855);或是選自於由下列所組成之群組:基因座_301175_G1(SEQ ID NO:1906)、基因座_202616_G1(SEQ ID NO:2027)、基因座_282323_G1(SEQ ID NO:2171)、基因座_262782_G1(SEQ ID NO:2256)、基因座_236455_G1(SEQ ID NO:2428)以及基因座_301774_G1(SEQ ID NO:2632);或是選自於由下列所組成之群組:基因座_59517_G1(SEQ ID NO:1)、基因座_25001_G1(SEQ ID NO:100)、基因座_112632_G1(SEQ ID NO:203)、基因座_153894_G1(SEQ ID NO:1252)、基因座_202616_G1(SEQ ID NO:2027)以及基因座_236455_G1(SEQ ID NO:2428)。
  8. 如請求項6之重組核酸分子,其滿足下列之至少一者:i.該感興趣的DNA插入在對該非基因核酸分子具有特 異性之鋅指標靶位點的1.5Kb、1.25Kb、1.0Kb、0.75Kb、0.5Kb或0.25Kb內,ii.該感興趣的DNA插入在介於對該非基因核酸分子具有特異性之一對鋅指標靶位點之間,iii.該感興趣的DNA包含分析結構域,iv.該感興趣的DNA不編碼肽,v.該感興趣的DNA編碼肽,或vi.該感興趣的DNA包含一含有殺昆蟲劑抗性基因、除草劑耐受性基因、氮利用效率基因、水利用效率基因、營養品質基因、DNA結合基因或可選擇之標記基因的基因表現卡匣。
  9. 一種包含一重組核酸分子的玉米植物細胞,該重組核酸分子包含:一至少1Kb之非基因核酸分子,其中該非基因核酸分子包含下列特徵:a.該非基因核酸分子的甲基化程度係為1%或更少;b.該非基因核酸分子與玉蜀黍基因組中所含有的任何其他核酸共享小於40%序列一致性;c.該非基因核酸分子位於一已知或預期會表現的玉米編碼核酸之40Kb區內;以及d.該非基因核酸分子顯示在玉米基因組內超過0.00041cM/Mb之重組率,其中該核酸分子與選自於由下列所組成之群組的非基因核酸具有至 少95%序列一致性:基因座_59517_G1(SEQ ID NO:1)、基因座_25001_G1(SEQ ID NO:100)、基因座_112632_G1(SEQ ID NO:203)、基因座_28905_G1(SEQ ID NO:295)、基因座_129164_G1(SEQ ID NO:384)、基因座_178978_G1(SEQ ID NO:687)、基因座_288388_G1(SEQ ID NO:781)、基因座_60310_G1(SEQ ID NO:843)、基因座_243330_G1(SEQ ID NO:967)、基因座_344662_G1(SEQ ID NO:1190)、基因座_204637_G1(SEQ ID NO:2731)、基因座_153894_G1(SEQ ID NO:1252)、基因座_156393_G1(SEQ ID NO:1571)、基因座_236662_G1(SEQ ID NO:1663)、基因座_301175_G1(SEQ ID NO:1906)、基因座_202616_G1(SEQ ID NO:2027)、基因座_282323_G1(SEQ ID NO:2171)、基因座_262782_G1(SEQ ID NO:2256)、基因座_236455_G1(SEQ ID NO:2428)、基因座_301774_G1(SEQ ID NO:2632)、基因座_344663_G1(SEQ ID NO:2649)以及基因座_66202_G1(SEQ ID NO:2855);以及一感興趣的DNA,其中該感興趣的DNA被插入於該非基因核酸分子中,更進一步,其中該感興趣的DNA包 含殺昆蟲劑抗性基因、除草劑耐受性基因、氮利用效率基因、水利用效率基因、營養品質基因、DNA結合基因或可選擇之標記基因。
  10. 如請求項9之植物細胞,其中該植物細胞滿足下列之至少一者:i).該植物細胞包含兩個或兩個以上該等重組核酸分子;ii).該植物細胞包含兩個或兩個以上該等重組核酸分子,其中該等重組核酸分子位於同一染色體上;iii).該感興趣的DNA插入在對該非基因核酸分子具有特異性之鋅指標靶位點的1.5Kb、1.25Kb、1.0Kb、0.75Kb、0.5Kb或0.25Kb內;iv).該感興趣的DNA插入在介於對該非基因核酸分子具有特異性之一對鋅指標靶位點之間;v).該感興趣的DNA包含分析結構域;vi).該感興趣的DNA不編碼肽;vii).該感興趣的DNA編碼肽;viii).該感興趣的DNA包含殺昆蟲劑抗性基因或除草劑耐受性基因;ix).該感興趣的DNA在該感興趣的DNA插入該非基因核酸分子的期間被修飾;或x).該感興趣的DNA包含一含有殺昆蟲劑抗性基因或除草劑耐受性基因的基因表現卡匣。
  11. 如請求項9之植物細胞,其中該植物細胞滿足下列之至少 一者:i).該感興趣的DNA包含殺昆蟲劑抗性基因或除草劑耐受性基因;ii).該感興趣的DNA包含兩個或兩個以上的基因表現卡匣;或iii).該感興趣的DNA包含兩個或兩個以上的基因表現卡匣,其中該感興趣的DNA之每一者包含一殺昆蟲劑抗性基因或除草劑耐受性基因。
  12. 如請求項9之植物細胞,其中該植物細胞包含兩個或兩個以上該等重組核酸分子,其中該等重組核酸分子位於同一染色體上,以及該等重組核酸分子之每一者的該感興趣的DNA包含一基因表現卡匣,該基因表現卡匣含有殺昆蟲劑抗性基因、除草劑耐受性基因、氮利用效率基因、水利用效率基因、營養品質基因、DNA結合基因或可選擇之標記基因。
TW108123305A 2013-11-04 2014-11-03 最適玉米基因座(二) TWI721478B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201361899598P 2013-11-04 2013-11-04
US61/899,598 2013-11-04

Publications (2)

Publication Number Publication Date
TW201947037A true TW201947037A (zh) 2019-12-16
TWI721478B TWI721478B (zh) 2021-03-11

Family

ID=53005410

Family Applications (2)

Application Number Title Priority Date Filing Date
TW108123305A TWI721478B (zh) 2013-11-04 2014-11-03 最適玉米基因座(二)
TW103138078A TWI671404B (zh) 2013-11-04 2014-11-03 最適玉米基因座(二)

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW103138078A TWI671404B (zh) 2013-11-04 2014-11-03 最適玉米基因座(二)

Country Status (20)

Country Link
US (4) US10093940B2 (zh)
EP (1) EP3066110B1 (zh)
JP (2) JP6649261B2 (zh)
KR (1) KR102269371B1 (zh)
CN (1) CN106164085A (zh)
AP (1) AP2016009227A0 (zh)
AR (1) AR098299A1 (zh)
AU (3) AU2014341927B2 (zh)
BR (1) BR102014027442B1 (zh)
CA (1) CA2928855A1 (zh)
CL (1) CL2016001065A1 (zh)
IL (1) IL245351B (zh)
MX (1) MX360318B (zh)
NZ (1) NZ719494A (zh)
RU (2) RU2019128647A (zh)
TW (2) TWI721478B (zh)
UA (1) UA120503C2 (zh)
UY (1) UY35815A (zh)
WO (1) WO2015066636A2 (zh)
ZA (1) ZA201602979B (zh)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EA201391373A1 (ru) 2011-03-23 2014-07-30 Пайонир Хай-Бред Интернэшнл, Инк. Способы получения сложного локуса трансгенных признаков
US10323236B2 (en) 2011-07-22 2019-06-18 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
CN104428414B (zh) * 2012-05-02 2022-01-21 陶氏益农公司 苹果酸脱氢酶的靶向修饰
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
UA120503C2 (uk) * 2013-11-04 2019-12-26 Дау Агросайєнсиз Елелсі Спосіб одержання трансгенної клітини рослини кукурудзи
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
CA2956487A1 (en) 2014-09-12 2016-03-17 E. I. Du Pont De Nemours And Company Generation of site-specific-integration sites for complex trait loci in corn and soybean, and methods of use
CA2969619A1 (en) 2014-12-03 2016-06-09 Agilent Technologies, Inc. Guide rna with chemical modifications
ES2884838T3 (es) 2015-04-06 2021-12-13 Univ Leland Stanford Junior ARN guía químicamente modificados para la regulación génica mediada por CRISPR/CAS
SG10202104041PA (en) 2015-10-23 2021-06-29 Harvard College Nucleobase editors and uses thereof
US10767175B2 (en) 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs
IL264565B2 (en) 2016-08-03 2024-07-01 Harvard College Adenosine nuclear base editors and their uses
CN109804066A (zh) 2016-08-09 2019-05-24 哈佛大学的校长及成员们 可编程cas9-重组酶融合蛋白及其用途
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR102622411B1 (ko) 2016-10-14 2024-01-10 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
CA3057192A1 (en) 2017-03-23 2018-09-27 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
JP2020534795A (ja) 2017-07-28 2020-12-03 プレジデント アンド フェローズ オブ ハーバード カレッジ ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
KR20200121782A (ko) 2017-10-16 2020-10-26 더 브로드 인스티튜트, 인코퍼레이티드 아데노신 염기 편집제의 용도
US12209247B2 (en) 2020-04-21 2025-01-28 Syngenta Crop Protection Ag Targeted insertion sites in the maize genome
US11459577B2 (en) 2017-12-18 2022-10-04 Syngenta Participations Ag Targeted insertion sites in the maize genome
EP3797160A1 (en) 2018-05-23 2021-03-31 The Broad Institute Inc. Base editors and uses thereof
US12281338B2 (en) 2018-10-29 2025-04-22 The Broad Institute, Inc. Nucleobase editors comprising GeoCas9 and uses thereof
US12351837B2 (en) 2019-01-23 2025-07-08 The Broad Institute, Inc. Supernegatively charged proteins and uses thereof
JP7669281B2 (ja) 2019-03-19 2025-04-28 ザ ブロード インスティテュート,インコーポレーテッド 編集ヌクレオチド配列を編集するための方法および組成物
AU2021267940A1 (en) 2020-05-08 2022-12-08 President And Fellows Of Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
US20240011043A1 (en) * 2020-07-31 2024-01-11 Inari Agriculture Technology, Inc. Generation of plants with improved transgenic loci by genome editing
CA3230927A1 (en) 2021-09-10 2023-03-16 Agilent Technologies, Inc. Guide rnas with chemical modification for prime editing

Family Cites Families (155)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4693977A (en) 1982-08-23 1987-09-15 Queen's University At Kingston Enzyme immobilization for producing cephalosporin antibiotics
US4536475A (en) 1982-10-05 1985-08-20 Phytogen Plant vector
US4535060A (en) 1983-01-05 1985-08-13 Calgene, Inc. Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
NZ207765A (en) 1983-04-15 1987-03-06 Lubrizol Genetics Inc Plant expression of transferred dna(t-dna)from plasmids associated with agrobacterium sp
US4886937A (en) 1985-05-20 1989-12-12 North Carolina State University Method for transforming pine
US4940835A (en) 1985-10-29 1990-07-10 Monsanto Company Glyphosate-resistant plants
US4810648A (en) 1986-01-08 1989-03-07 Rhone Poulenc Agrochimie Haloarylnitrile degrading gene, its use, and cells containing the gene
ES2018274T5 (es) 1986-03-11 1996-12-16 Plant Genetic Systems Nv Celulas vegetales resistentes a los inhibidores de glutamina sintetasa, preparadas por ingenieria genetica.
US4975374A (en) 1986-03-18 1990-12-04 The General Hospital Corporation Expression of wild type and mutant glutamine synthetase in foreign hosts
US5422251A (en) 1986-11-26 1995-06-06 Princeton University Triple-stranded nucleic acids
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
EP0270496B1 (de) 1986-12-05 1993-03-17 Ciba-Geigy Ag Verbessertes Verfahren zur Transformation von pflanzlichen Protoplasten
EP0333033A1 (en) 1988-03-09 1989-09-20 Meiji Seika Kaisha Ltd. Glutamine synthesis gene and glutamine synthetase
US5416011A (en) 1988-07-22 1995-05-16 Monsanto Company Method for soybean transformation and regeneration
DE3834738A1 (de) 1988-10-12 1990-04-19 Basf Lacke & Farben Verfahren zur herstellung eines mehrschichtigen ueberzuges, waessrige beschichtungszusammensetzungen, wasserverduennbare polyacrylatharze und verfahren zur herstellung von wasserverduennbaren polyacrylatharzen
US5176996A (en) 1988-12-20 1993-01-05 Baylor College Of Medicine Method for making synthetic oligonucleotides which bind specifically to target sites on duplex DNA molecules, by forming a colinear triplex, the synthetic oligonucleotides and methods of use
US5302523A (en) 1989-06-21 1994-04-12 Zeneca Limited Transformation of plant cells
US5501967A (en) 1989-07-26 1996-03-26 Mogen International, N.V./Rijksuniversiteit Te Leiden Process for the site-directed integration of DNA into the genome of plants
US7705215B1 (en) 1990-04-17 2010-04-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
US5550318A (en) 1990-04-17 1996-08-27 Dekalb Genetics Corporation Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof
GB8920519D0 (en) 1989-09-11 1989-10-25 Rhone Poulenc Ltd New compositions of matter
GB9017539D0 (en) 1990-08-10 1990-09-26 Rhone Poulenc Agriculture New compositions of matter
US5484956A (en) 1990-01-22 1996-01-16 Dekalb Genetics Corporation Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin
CA2074355C (en) 1990-01-22 2008-10-28 Ronald C. Lundquist Method of producing fertile transgenic corn plants
US6403865B1 (en) 1990-08-24 2002-06-11 Syngenta Investment Corp. Method of producing transgenic maize using direct transformation of commercially important genotypes
JP2859427B2 (ja) 1990-11-21 1999-02-17 株式会社東芝 超電導コイル装置
US5384253A (en) 1990-12-28 1995-01-24 Dekalb Genetics Corporation Genetic transformation of maize cells by electroporation of cells pretreated with pectin degrading enzymes
GB9101659D0 (en) 1991-01-25 1991-03-06 Rhone Poulenc Agriculture Compositions of matter
GB9310203D0 (en) 1993-05-18 1993-06-30 Rhone Poulenc Agriculture Compositions of new matter
GB9101660D0 (en) 1991-01-25 1991-03-06 Rhone Poulenc Agriculture New compositions of matter
GB9115377D0 (en) 1991-07-17 1991-09-04 Rhone Poulenc Agriculture New compositions of matter
GB9115909D0 (en) 1991-07-23 1991-09-04 Nickerson Int Seed Recombinant dna
GB9116834D0 (en) 1991-08-05 1991-09-18 Rhone Poulenc Agriculture Compositions of new matter
US5420032A (en) 1991-12-23 1995-05-30 Universitge Laval Homing endonuclease which originates from chlamydomonas eugametos and recognizes and cleaves a 15, 17 or 19 degenerate double stranded nucleotide sequence
US5334753A (en) 1992-03-12 1994-08-02 Rhone-Poulenc Agriculture Ltd Processes for preparing ortho-substituted benzoic acids
DK39692D0 (da) 1992-03-25 1992-03-25 Danisco Biologisk materiale
US5356802A (en) 1992-04-03 1994-10-18 The Johns Hopkins University Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
US5487994A (en) 1992-04-03 1996-01-30 The Johns Hopkins University Insertion and deletion mutants of FokI restriction endonuclease
US5792632A (en) 1992-05-05 1998-08-11 Institut Pasteur Nucleotide sequence encoding the enzyme I-SceI and the uses thereof
ATE398679T1 (de) 1992-07-07 2008-07-15 Japan Tobacco Inc Verfahren zur transformation einer monokotyledon pflanze
EP0652965A1 (en) 1992-07-27 1995-05-17 Pioneer Hi-Bred International, Inc. An improved method of agrobacterium-mediated transformation of cultured soybean cells
US5607914A (en) 1993-01-13 1997-03-04 Pioneer Hi-Bred International, Inc. Synthetic antimicrobial peptides
GB9302071D0 (en) 1993-02-03 1993-03-24 Rhone Poulenc Agriculture Compositions of matter
ATE172718T1 (de) 1993-05-18 1998-11-15 Rhone Poulenc Agriculture 2-cyan-1,3-dion-derivate und ihre verwendung als herbizid
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US6242568B1 (en) 1994-01-18 2001-06-05 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
AU704601B2 (en) 1994-01-18 1999-04-29 Scripps Research Institute, The Zinc finger protein derivatives and methods therefor
US5767373A (en) 1994-06-16 1998-06-16 Novartis Finance Corporation Manipulation of protoporphyrinogen oxidase enzyme activity in eukaryotic organisms
GB9824544D0 (en) 1998-11-09 1999-01-06 Medical Res Council Screening system
ATE407205T1 (de) 1994-08-20 2008-09-15 Gendaq Ltd Verbesserung in bezug auf bindungsproteine bei der erkennung von dna
US5506195A (en) 1994-11-01 1996-04-09 Zeneca Limited Selective 1,3-cyclohexanedione corn herbicide
US5789538A (en) 1995-02-03 1998-08-04 Massachusetts Institute Of Technology Zinc finger proteins with high affinity new DNA binding specificities
US5659026A (en) 1995-03-24 1997-08-19 Pioneer Hi-Bred International ALS3 promoter
US5994627A (en) 1995-03-31 1999-11-30 Common Wealth Scientific And Industrial Research Organisation Genetic sequences conferring nematode resistance in plants and uses therefor
FR2734842B1 (fr) 1995-06-02 1998-02-27 Rhone Poulenc Agrochimie Sequence adn d'un gene de l'hydroxy-phenyl pyruvate dioxygenase et obtention de plantes contenant un gene de l'hydroxy-phenyl pyruvate dioxygenase, tolerantes a certains herbicides
US5693512A (en) 1996-03-01 1997-12-02 The Ohio State Research Foundation Method for transforming plant tissue by sonication
AU3644697A (en) 1996-06-27 1998-01-14 E.I. Du Pont De Nemours And Company Plant gene for (p)-hydroxyphenylpyruvate dioxygenase
US5925523A (en) 1996-08-23 1999-07-20 President & Fellows Of Harvard College Intraction trap assay, reagents and uses thereof
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
GB2338237B (en) 1997-02-18 2001-02-28 Actinova Ltd In vitro peptide or protein expression library
US7105724B2 (en) 1997-04-04 2006-09-12 Board Of Regents Of University Of Nebraska Methods and materials for making and using transgenic dicamba-degrading organisms
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
GB9710807D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
US6245968B1 (en) 1997-11-07 2001-06-12 Aventis Cropscience S.A. Mutated hydroxyphenylpyruvate dioxygenase, DNA sequence and isolation of plants which contain such a gene and which are tolerant to herbicides
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
ATE466952T1 (de) 1998-03-02 2010-05-15 Massachusetts Inst Technology Poly-zinkfinger-proteine mit verbesserten linkern
AUPP249298A0 (en) 1998-03-20 1998-04-23 Ag-Gene Australia Limited Synthetic genes and genetic constructs comprising same I
US6140081A (en) 1998-10-16 2000-10-31 The Scripps Research Institute Zinc finger binding domains for GNN
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US7070934B2 (en) 1999-01-12 2006-07-04 Sangamo Biosciences, Inc. Ligand-controlled regulation of endogenous gene expression
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
JP2002534129A (ja) 1999-01-14 2002-10-15 モンサント テクノロジー エルエルシー ダイズ形質転換方法
US7030215B2 (en) 1999-03-24 2006-04-18 Sangamo Biosciences, Inc. Position dependent recognition of GNN nucleotide triplets by zinc fingers
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
AU776576B2 (en) 1999-12-06 2004-09-16 Sangamo Biosciences, Inc. Methods of using randomized libraries of zinc finger proteins for the identification of gene function
EP1250424B1 (en) 2000-01-24 2007-02-28 Gendaq, Ltd. Nucleic acid binding polypeptides characterized by flexible linkers connected nucleic acid binding modules
AU2001250774B2 (en) 2000-02-08 2005-01-27 Sangamo Biosciences, Inc. Cells expressing zinc finger proteins for drug discovery
US20020061512A1 (en) 2000-02-18 2002-05-23 Kim Jin-Soo Zinc finger domains and methods of identifying same
US20030044787A1 (en) 2000-05-16 2003-03-06 Joung J. Keith Methods and compositions for interaction trap assays
JP2002060786A (ja) 2000-08-23 2002-02-26 Kao Corp 硬質表面用殺菌防汚剤
GB0025225D0 (en) * 2000-10-14 2000-11-29 Cambridge Advanced Tech Plant cell death system
US7067317B2 (en) 2000-12-07 2006-06-27 Sangamo Biosciences, Inc. Regulation of angiogenesis with zinc finger proteins
GB0108491D0 (en) 2001-04-04 2001-05-23 Gendaq Ltd Engineering zinc fingers
AU2002336373A1 (en) 2001-08-20 2003-03-03 The Scripps Research Institute Zinc finger binding domains for cnn
WO2003054189A2 (de) * 2001-12-20 2003-07-03 Sungene Gmbh & Co. Kgaa Verfahren zur transformation von pflanzlichen plastiden
US7262054B2 (en) 2002-01-22 2007-08-28 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
CN100575485C (zh) 2002-01-23 2009-12-30 犹他大学研究基金会 使用锌指核酸酶的定向染色体诱变
AU2003218382B2 (en) 2002-03-21 2007-12-13 Sangamo Therapeutics, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7179902B2 (en) 2002-06-27 2007-02-20 Dow Agrosciences Llc Use of regulatory sequences in transgenic plants
US7361635B2 (en) 2002-08-29 2008-04-22 Sangamo Biosciences, Inc. Simultaneous modulation of multiple genes
CA2497913C (en) 2002-09-05 2014-06-03 California Institute Of Technology Use of chimeric nucleases to stimulate gene targeting
CA2662092C (en) 2003-04-29 2012-07-17 Pioneer Hi-Bred International, Inc. Novel glyphosate-n-acetyltransferase (gat) genes
WO2005003359A1 (ja) 2003-07-08 2005-01-13 Japan Science And Technology Corporation トランスジェニック生物を作製する方法およびシステム
CA2534296C (en) 2003-08-08 2013-03-26 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
JP2007505551A (ja) 2003-09-10 2007-03-08 コニンクリユケ フィリップス エレクトロニクス エヌ.ブイ. セル配列を用いた可変インピーダンス回路
US7972854B2 (en) 2004-02-05 2011-07-05 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
WO2005100392A2 (en) 2004-04-08 2005-10-27 Sangamo Biosciences, Inc. Treatment of neuropathic pain with zinc finger proteins
CA2561714A1 (en) 2004-04-08 2005-10-27 Sangamo Biosciences, Inc. Methods and compositions for treating neuropathic and neurodegenerative conditions
ES2407857T5 (es) 2004-04-30 2017-07-31 Dow Agrosciences Llc Nuevo gen de resistencia a los herbicidas
AU2005287278B2 (en) 2004-09-16 2011-08-04 Sangamo Biosciences, Inc. Compositions and methods for protein production
WO2006121866A2 (en) 2005-05-05 2006-11-16 The Arizona Board Of Regents On Behalf Of The University Of Arizona Sequence enabled reassembly (seer) - a novel method for visualizing specific dna sequences
CN101273141B (zh) 2005-07-26 2013-03-27 桑格摩生物科学股份有限公司 外源核酸序列的靶向整合和表达
US8021867B2 (en) 2005-10-18 2011-09-20 Duke University Rationally-designed meganucleases with altered sequence specificity and DNA-binding affinity
CN103361316B (zh) 2005-10-28 2017-05-17 美国陶氏益农公司 新除草剂抗性基因
US7629455B2 (en) * 2005-12-07 2009-12-08 Monsanto Technology Llc Zea mays NFB2 promoter
EP2018435B1 (en) 2006-05-17 2012-07-11 Pioneer Hi-Bred International Inc. Artificial plant minichromosomes
ATE462783T1 (de) 2006-05-25 2010-04-15 Sangamo Biosciences Inc Variante foki-spaltungshälften-domänen
JP2010500029A (ja) 2006-08-11 2010-01-07 ダウ アグロサイエンシィズ エルエルシー ジンクフィンガーヌクレアーゼ媒介相同組換え
BRPI0720048A8 (pt) 2006-12-14 2023-02-07 Dow Agrosciences Llc Proteínas de dedo de zinco não-canônicas otimizadas
BRPI0814244B1 (pt) 2007-06-07 2018-10-09 Agriculture And Agri Food Canada método para obtenção de uma planta geneticamente engenheirada
CN101849010A (zh) 2007-06-29 2010-09-29 先锋高级育种国际公司 用于改变单子叶植物细胞的基因组的方法
US9506120B2 (en) 2007-09-27 2016-11-29 Sangamo Biosciences, Inc. Rapid in vivo identification of biologically active nucleases
CA2937438C (en) 2007-09-27 2020-07-07 Dow Agrosciences Llc Engineered zinc finger proteins targeting 5-enolpyruvyl shikimate-3-phosphate synthase genes
US8722410B2 (en) 2007-10-05 2014-05-13 Dow Agrosciences, Llc. Methods for transferring molecular substances into plant cells
AU2008317354B2 (en) 2007-10-25 2014-04-10 Ospedale San Raffaele S.R.L. Methods and compositions for targeted integration
DE102007056956B4 (de) 2007-11-27 2009-10-29 Moosbauer, Peter, Dipl.-Ing.(FH) Schaltung zur Regelung der Stromversorgung eines Verbrauchers und Verfahren zum Betrieb einer Schaltung
US9029636B2 (en) 2008-02-05 2015-05-12 Monsanto Technology Llc Isolated novel nucleic acid and protein molecules from soy and methods of using those molecules to generate transgenic plants with enhanced agronomic traits
CA2720903C (en) 2008-04-14 2019-01-15 Sangamo Biosciences, Inc. Linear donor constructs for targeted integration
US8703489B2 (en) 2008-08-22 2014-04-22 Sangamo Biosciences, Inc. Methods and compositions for targeted single-stranded cleavage and targeted integration
CN102202948B (zh) 2008-10-28 2014-05-07 株式会社爱德克斯 用于控制车辆行驶的设备
WO2010077319A1 (en) 2008-12-17 2010-07-08 Dow Agrosciences Llc Targeted integration into the zp15 locus
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US8385662B1 (en) 2009-04-30 2013-02-26 Google Inc. Principal component analysis based seed generation for clustering analysis
KR102262704B1 (ko) 2009-08-11 2021-06-09 상가모 테라퓨틱스, 인코포레이티드 표적화 변형에 대한 동형접합성 유기체
CN102573452B (zh) 2009-08-19 2015-07-22 陶氏益农公司 Aad-1事件das-40278-9、相关的转基因玉米品系及其事件特异性鉴定
ES2710179T3 (es) 2009-09-07 2019-04-23 Nobel Biocare Services Ag Conjunto de implantación
BR112012009668B1 (pt) 2009-10-22 2022-08-16 Dow Agrosciences Llc Proteína de dedo de zinco que não ocorre naturalmente e proteína de fusão compreendendo a mesma
CA2781375C (en) 2009-11-24 2020-05-05 Dow Agrosciences Llc Aad-12 event 416, related transgenic soybean lines, and event-specific identification thereof
EP2510096B2 (en) 2009-12-10 2018-02-07 Regents of the University of Minnesota Tal effector-mediated dna modification
GB201000184D0 (en) 2010-01-07 2010-02-24 Plant Bioscience Ltd Methods and compositions for altering temperature sensing in eukaryotic organisms
JP5874949B2 (ja) * 2010-01-15 2016-03-02 トヨタ自動車株式会社 変異体植物、その製造方法及び遺伝的組換え頻度を上昇させる方法
CN106086047B (zh) 2010-01-22 2021-07-06 陶氏益农公司 靶向基因组改造
EP2525658B1 (de) 2010-01-22 2017-03-01 Bayer Intellectual Property GmbH Akarizide und/oder insektizide wirkstoffkombinationen
PH12012501490A1 (en) 2010-01-22 2017-05-12 Dow Agrosciences Llc Engineered landing pads for gene targeting in plants
AR080022A1 (es) 2010-01-26 2012-03-07 Pioneer Hi Bred Int Secuencias de polinucleotidos y polipeptidos asociadas con la tolerancia a los herbicidas
AU2011213242B2 (en) 2010-02-08 2015-01-29 Sangamo Therapeutics, Inc. Engineered cleavage half-domains
US9255259B2 (en) 2010-02-09 2016-02-09 Sangamo Biosciences, Inc. Targeted genomic modification with partially single-stranded donor molecules
AU2011256838B2 (en) 2010-05-17 2014-10-09 Sangamo Therapeutics, Inc. Novel DNA-binding proteins and uses thereof
WO2011159369A1 (en) * 2010-06-14 2011-12-22 Iowa State University Research Foundation, Inc. Nuclease activity of tal effector and foki fusion protein
CA2822289A1 (en) 2010-12-21 2012-06-28 E. I. Du Pont De Nemours And Company Plant gene expression modulatory sequences from maize
CA2823061A1 (en) 2010-12-29 2012-07-05 Dow Agrosciences Llc Data analysis of dna sequences
AU2012240460B2 (en) 2011-04-05 2016-07-07 Dow Agrosciences Llc High through-put analysis of transgene borders
CN104272311B (zh) 2012-02-08 2018-08-28 陶氏益农公司 Dna序列的数据分析
WO2013144663A2 (en) 2012-03-27 2013-10-03 Rudjer Boskovic Institute Method of determination of neutral dna sequences in the genome, system for targeting sequences obtained thereby and methods for use thereof
US11039586B2 (en) 2013-03-15 2021-06-22 Monsanto Technology Llc Creation and transmission of megaloci
US9909131B2 (en) * 2013-11-04 2018-03-06 Dow Agrosciences Llc Optimal soybean loci
UA120503C2 (uk) * 2013-11-04 2019-12-26 Дау Агросайєнсиз Елелсі Спосіб одержання трансгенної клітини рослини кукурудзи
EP3638795A4 (en) * 2017-06-15 2021-01-20 Syngenta Participations AG MZIR098 CORN ELITE EVENT
US10648951B2 (en) 2017-11-14 2020-05-12 Ge Sensing & Inspection Technologies Gmbh Classification of ultrasonic indications using pattern recognition

Also Published As

Publication number Publication date
EP3066110A2 (en) 2016-09-14
WO2015066636A3 (en) 2015-06-25
CL2016001065A1 (es) 2016-10-14
CN106164085A (zh) 2016-11-23
AU2014341927A1 (en) 2016-05-19
KR20160079866A (ko) 2016-07-06
IL245351A0 (en) 2016-06-30
UA120503C2 (uk) 2019-12-26
AU2018201717A1 (en) 2018-04-05
BR102014027442A8 (pt) 2021-09-14
RU2019128647A (ru) 2019-11-05
JP6649261B2 (ja) 2020-02-19
US20190024100A1 (en) 2019-01-24
JP2016534759A (ja) 2016-11-10
BR102014027442B1 (pt) 2022-09-27
US10093940B2 (en) 2018-10-09
AU2020204196A1 (en) 2020-07-16
AU2020204196B2 (en) 2022-06-02
TW201518503A (zh) 2015-05-16
US11198882B2 (en) 2021-12-14
BR102014027442A2 (pt) 2016-09-20
RU2016122067A3 (zh) 2018-07-05
JP2020058342A (ja) 2020-04-16
KR102269371B1 (ko) 2021-06-28
TWI721478B (zh) 2021-03-11
NZ719494A (en) 2017-09-29
EP3066110A4 (en) 2017-04-26
US20220162624A1 (en) 2022-05-26
AP2016009227A0 (en) 2016-05-31
IL245351B (en) 2019-02-28
ZA201602979B (en) 2019-09-25
UY35815A (es) 2015-05-29
RU2714251C2 (ru) 2020-02-13
CA2928855A1 (en) 2015-05-07
MX2016005875A (es) 2016-10-13
MX360318B (es) 2018-10-29
WO2015066636A2 (en) 2015-05-07
AR098299A1 (es) 2016-05-26
AU2018201717B2 (en) 2020-03-26
EP3066110B1 (en) 2021-12-29
US12018263B2 (en) 2024-06-25
RU2016122067A (ru) 2017-12-11
TWI671404B (zh) 2019-09-11
US20240336930A1 (en) 2024-10-10
AU2014341927B2 (en) 2017-12-14
US20150128310A1 (en) 2015-05-07

Similar Documents

Publication Publication Date Title
US12018263B2 (en) Optimal maize loci
US20240360460A1 (en) Optimal soybean loci
US11149287B2 (en) Optimal soybean loci
US11098317B2 (en) Optimal maize loci

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees