[go: up one dir, main page]

CN101855239A - 合成的重复蛋白及其生产和用途 - Google Patents

合成的重复蛋白及其生产和用途 Download PDF

Info

Publication number
CN101855239A
CN101855239A CN200880020810A CN200880020810A CN101855239A CN 101855239 A CN101855239 A CN 101855239A CN 200880020810 A CN200880020810 A CN 200880020810A CN 200880020810 A CN200880020810 A CN 200880020810A CN 101855239 A CN101855239 A CN 101855239A
Authority
CN
China
Prior art keywords
gly
ala
ser
pro
ggt
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200880020810A
Other languages
English (en)
Other versions
CN101855239B (zh
Inventor
B·利布曼
M·费尔
D·许梅里希
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF SE
Original Assignee
BASF SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF SE filed Critical BASF SE
Publication of CN101855239A publication Critical patent/CN101855239A/zh
Application granted granted Critical
Publication of CN101855239B publication Critical patent/CN101855239B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43563Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
    • C07K14/43577Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from flies
    • C07K14/43581Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from flies from Drosophila
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K20/00Accessory food factors for animal feeding-stuffs
    • A23K20/10Organic substances
    • A23K20/142Amino acids; Derivatives thereof
    • A23K20/147Polymeric derivatives, e.g. peptides or proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K8/00Cosmetics or similar toiletry preparations
    • A61K8/18Cosmetics or similar toiletry preparations characterised by the composition
    • A61K8/30Cosmetics or similar toiletry preparations characterised by the composition containing organic compounds
    • A61K8/64Proteins; Peptides; Derivatives or degradation products thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61QSPECIFIC USE OF COSMETICS OR SIMILAR TOILETRY PREPARATIONS
    • A61Q19/00Preparations for care of the skin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43513Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae
    • C07K14/43518Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae from spiders
    • DTEXTILES; PAPER
    • D06TREATMENT OF TEXTILES OR THE LIKE; LAUNDERING; FLEXIBLE MATERIALS NOT OTHERWISE PROVIDED FOR
    • D06MTREATMENT, NOT PROVIDED FOR ELSEWHERE IN CLASS D06, OF FIBRES, THREADS, YARNS, FABRICS, FEATHERS OR FIBROUS GOODS MADE FROM SUCH MATERIALS
    • D06M15/00Treating fibres, threads, yarns, fabrics, or fibrous goods made from such materials, with macromolecular compounds; Such treatment combined with mechanical treatment
    • D06M15/01Treating fibres, threads, yarns, fabrics, or fibrous goods made from such materials, with macromolecular compounds; Such treatment combined with mechanical treatment with natural macromolecular compounds or derivatives thereof
    • D06M15/15Proteins or derivatives thereof
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21HPULP COMPOSITIONS; PREPARATION THEREOF NOT COVERED BY SUBCLASSES D21C OR D21D; IMPREGNATING OR COATING OF PAPER; TREATMENT OF FINISHED PAPER NOT COVERED BY CLASS B31 OR SUBCLASS D21G; PAPER NOT OTHERWISE PROVIDED FOR
    • D21H17/00Non-fibrous material added to the pulp, characterised by its constitution; Paper-impregnating material characterised by its constitution
    • D21H17/20Macromolecular organic compounds
    • D21H17/21Macromolecular organic compounds of natural origin; Derivatives thereof
    • D21H17/22Proteins
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21HPULP COMPOSITIONS; PREPARATION THEREOF NOT COVERED BY SUBCLASSES D21C OR D21D; IMPREGNATING OR COATING OF PAPER; TREATMENT OF FINISHED PAPER NOT COVERED BY CLASS B31 OR SUBCLASS D21G; PAPER NOT OTHERWISE PROVIDED FOR
    • D21H19/00Coated paper; Coating material
    • D21H19/36Coatings with pigments
    • D21H19/44Coatings with pigments characterised by the other ingredients, e.g. the binder or dispersing agent
    • D21H19/50Proteins

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Insects & Arthropods (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Polymers & Plastics (AREA)
  • Veterinary Medicine (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Toxicology (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Public Health (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Animal Husbandry (AREA)
  • Birds (AREA)
  • Epidemiology (AREA)
  • Dermatology (AREA)
  • Textile Engineering (AREA)
  • Food Science & Technology (AREA)
  • Peptides Or Proteins (AREA)
  • Coloring Foods And Improving Nutritive Qualities (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicinal Preparation (AREA)
  • Cosmetics (AREA)

Abstract

具有重复单元的重复蛋白,包含共有序列(I)X1 X2 X3 X4 S X5 X6 Y G其中X1是G、Y、A或NX2是G、L、QX3是R、K、T或PX4是P、A、T或SX5是D、T或SX6是S、Q或T,和共有序列(II)Z1 Z2(Z3A)nZ4 Z5 Z6其中Z1是S、Q、N、T或GZ2不是氨基酸或为AZ3是A或GZ4为不是氨基酸、为A或SZ5是G、S、Q、N或TZ6是G、P、S、Q、N或Tn是天然的整数,其中2≤n≤12。

Description

合成的重复蛋白及其生产和用途
本发明涉及新型合成重复蛋白及其生产和用途。
背景技术
WO 2004/104043描述了衍生自节枝弹性蛋白的重复序列的合成的生物弹性体,和其用途。同样的描述了由节枝弹性蛋白序列和来自其它蛋白质,例如蛛丝的序列组成的杂种分子。
在文献中描述了不同重复蛋白的特性。例如,公知节枝弹性蛋白具有良好的弹性特性和高比例的弹性储能(回弹力)(Gosline等人,Philosophical Transactions of the Royal Society of London SeriesB:Biological Science,357(1418):121:32,2002)。蛛丝尤其由于其高拉伸强度和韧度而被公知(Gosline等人,J Exp Biol.;202(Pt 23):3295-303(1999))。
发明描述
本发明涉及具有重复单元的重复蛋白,所述重复单元包含
共有序列(I)
X1 X2 X3 X4 S X5 X6 Y G
其中
X1是G、Y、A或N
X2是G、L、Q
X3是R、K、T或P
X4是P、A、T或S
X5是D、T或S
X6是S、Q或T,和
共有序列(II)
Z1 Z2(Z3A)nZ4 Z5 Z6
其中
Z1是S、Q、N、T或G
Z2不是氨基酸或为A
Z3是A或G
Z4为不是氨基酸、为A或S
Z5是G、S、Q、N或T
Z6是G、P、S、Q、N或T
n是自然的整数,其中2≤n≤12。
根据本发明的重复蛋白表征为至少60%,优选至少80%的氨基酸序列由重复单元组成。
重复单元是长度为7-100,优选12-60,和特别优选15-40个氨基酸的氨基酸序列,其通过相同的序列或具有70%,优选至少80%,和特别优选至少90%同一性的变异而在蛋白质中多个存在。根据本发明的重复蛋白可以包含单个或多个不同氨基酸序列的相同拷贝或变异。
可以通过接头连接重复单元,所述接头包含优选1-30个氨基酸,特别优选1-20个氨基酸。接头的氨基酸序列可以衍生自其它蛋白质,优选结构蛋白,或可以不具有任何天然模型或是完全不存在的。
可以将任意数目,优选1-100个,特别优选10-65个,和最优选15-35个的重复单元连接在一起。
如本文使用的,术语共有序列指包含在特定位置频繁出现的氨基酸的氨基酸序列,其中其它氨基酸没有任何具体定义,而是在通常使用氨基酸的单字母密码的位置用占位符X代替。本文使用的氨基酸的单字母密码是本领域技术人员公知的。
在一个实施方案中,在重复蛋白质的60%,优选至少80%的重复单元中,共有序列(I)与共有序列(II)的比例是小于5且大于2。
在一个实施方案中,在重复蛋白质的60%,优选至少80%的重复单元中,共有序列(I)与共有序列(II)的比例是2或小于2和大于1,优选2。
在一个实施方案中,在重复蛋白质的60%,优选至少80%的重复单元中,共有序列(I)与共有序列(II)的比例是1或小于1和大于1,优选1。
在一个实施方案中,重复蛋白质的60%,优选至少80%的重复单元包含子序列GGRPSDTYG或GGRPSSSYG。
在一个实施方案中,根据本发明的重复蛋白质的60%,优选至少80%的重复单元包含序列基序An或(GA)m,其中A=丙氨酸,G=甘氨酸,n=2-12,m=2-10,优选n=5-10,m=4-8和特别优选n=7-9,m=6-7。
在另一个实施方案中,重复蛋白质包含重复单元PGSSAAAAAAAASGPGQGQGQGQGQGGRPSDTYG或SAAAAAAAAGPGGGNGGRPSDTYGAPGGGNGGRPSSSYG。
在另一个实施方案中,根据本发明的重复蛋白质在氨基末端或羧基末端包含长度为4-30,和特别优选5-15个氨基酸的肽序列,其被用于通过免疫印迹检测所述蛋白或通过亲和色谱用于纯化所述蛋白。这类肽序列的非限制性实例是6x His标签(HHHHHH)、T7标签(MASMTGGQQMG)、S标签(KETAAAKFERQHMDS)、c-Myc标签(EQKLISEEDL)、Strep标签(WSHPQFEK)和HA标签(YPYDVPDYA)(Terpe;Appl Microbiol Biotechnol;60(5):523-33(2003))。可以将氨基酸序列插入在根据本发明的蛋白质和另外的肽序列之间,其使所述肽序列能够被化学或酶促移除。
在另一个实施方案中,重复蛋白质的氨基酸序列对应于SEQ ID NO 2或这一序列的部分。
在另一个实施方案中,重复蛋白的氨基酸序列对应于SEQ ID NO 4或这一序列的部分。
根据本发明的重复蛋白具有惊人的新特性。这些新特性涉及,例如,蛋白水溶液的稳定性和组装特性。此外,发现新型重复蛋白赋予化妆品或皮肤病学组合物有利的特性,特别是能够提高吸水或软化作用。新型重复蛋白还具有类似良好的膜形成物的作用和特别具有低的表面密度。
因此本发明还涉及新型重复蛋白单体或其组装产物在化妆品、人和动物营养品中用于物质配方、精制纸、皮革和织物和表面涂料的用途。
可以通过表达具有分子生物修饰以获得根据本发明的结构的天然基因序列产生重复蛋白。分离和修饰天然基因序列的方法是本领域技术人员公知的。
优选通过表达合成产生的基因序列产生重复蛋白。产生合成基因序列的一个可能性描述在Huemmerich等人,Biochemistry.43(42):13604-12,(2004)中。
本发明还涉及编码以上所述蛋白质的核酸序列。优选的核酸序列是SEQ ID NO 1和SEQ ID NO 3。
本发明还涉及包含以上提到的核酸序列的表达载体。术语表达载体通常指可以被引入宿主生物体和在那里使期望的核苷酸序列能够被表达的基因元件。表达载体的实例是质粒、噬菌体或病毒。表达载体优选包含调节元件,例如启动子或增强子,对应的编码核苷酸序列、转录起始子和转录终止子,和能够使载体被扩增的元件。
蛋白质的表达系统是众所周知的,已经被描述于Sambrook等人:Molecular cloning:A Laboratory Manual;3rd Ed.Cold Spring HarbourLaboratory Press;Cold Spring Harbour(2001)。
原核表达生物的非限制性实例是大肠杆菌(Escherichia coli)、枯草芽孢杆菌(Bacillus subtilis)、巨大芽孢杆菌(Bacillus megaterium)、谷氨酸棒状杆菌(Corynebacterium glutamicum)和其它。真核表达生物的非限制性实例是酵母例如酿酒酵母(Saccharomyces cerevisiae)、巴斯德毕赤酵母(Pichia pastoris)和其它,丝状真菌例如黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、构巢曲霉(Aspergillus nidulans)、木霉菌(Trichoderma reesei)、顶头孢霉(Acremonium chrysogenum)和其它,哺乳动物细胞例如HeLa-细胞、COS细胞、CHO细胞和其它,昆虫细胞,例如Sf9细胞、MEL细胞和其它,植物或植物细胞例如块茎茄属(Solanum tuberosum)、烟草属(Nicotiana)和其它。
本发明还涉及组装重复蛋白质以给出蛋白质微珠(microbead)、纳米原纤维(nanofibril)、凝胶和膜。
可以优选的通过以下所述加工产生蛋白质微珠。
重复蛋白被溶解在第一溶剂中。可以使用的溶剂的实例是水性盐溶液。特别合适的是高浓缩的盐溶液,具有超过2,特别是超过4,和特别优选超过5摩尔的浓度,其离子比钠离子和氯离子具有更显著的离液序列高的特性。这类盐溶液的实例是6M硫氰酸胍或9M溴化锂。而且,可以使用有机溶剂溶解重复蛋白。特别合适的是氟化醇或环烃类。这些的实例是六氟异丙醇和环己烷。可以在所述溶剂中制备蛋白质微珠。或者,可以用另一溶剂,例如低浓度(c<0.5M)盐溶液通过透析或稀释置换此溶剂。溶解蛋白的最终浓度应该在0.1-100mg/ml之间。在其中进行该过程的温度通常是0-80,优选5-50,和特别优选10-40℃。
当使用含水溶液时,可以向所述溶液另外加入缓冲液,优选在pH 4-10,特别优选5-9,尤其优选6-8.5的范围。
加入添加剂诱导相分离,产生在溶剂和添加剂的混合物中乳化的富含蛋白质相。由于表面效应,乳化的富蛋白微滴呈圆形。由溶剂、添加剂和蛋白质浓度的选择的结果决定,该蛋白质微珠的平均直径可以确定为从0.1μm至50μm的数值。
可以使用的添加物是首先与第一溶剂溶和、接着诱导富蛋白质相形成的任何物质。如果在有机溶剂中形成微珠,那么具有比该溶剂(例如甲苯)更低极性的有机物质对于此是合适的。在含水溶液中,可以使用其离子比钠离子和氯离子具有更显著的稳定氢键能力(cosmotropic)特性的盐(例如,硫酸铵;磷酸钾)作为添加剂。由添加剂的类型决定,添加剂的终浓度应该是基于蛋白质溶液以重量计在1%和50%之间。
通过固化(curing)固定富蛋白质微滴,保持其圆形。这里的固定是基于有力的分子间相互作用的形成。相互作用的类型可以是非共价的(例如,由于形成分子间β-片层结晶),或共价的(例如,由于化学交联)。可以通过添加剂和/或加入另一合适物质进行固化。固化发生在0和80℃之间,优选在5和60℃之间。
所述其它物质可以是化学交联剂。这里的化学交联剂指其中至少两个化学反应基团经由接头彼此连接的分子。其实例是巯基反应基团(例如,马来酰亚胺、吡啶二硫化物、α-卤代乙酰、乙烯基砜、硫酸根合(sulfato)烷基砜(优选硫酸根合乙基砜)、胺反应基团(例如,琥珀酰亚胺酯、碳化二亚胺、羟甲基膦、酰亚胺酯、PFP酯、醛类、异硫氰酸盐等)、羧基反应基团(例如,胺等)、羟基反应基团(例如,异氰酸盐等)、非选择性基团(例如,芳基叠氮化合物等)、和光激活基团(例如,全氟苯基叠氮化物等)。这些反应基团可以与在蛋白质中存在的胺、巯基、羧基或羟基基团形成共价键。
也可以通过使用在氨基酸残基之间形成共价键的物质固化微珠。这一实例是过氧硫酸氢铵和三(2,2’-双吡啶基)二氯钌(II)的组合,其在可见光影响下介导二酪氨酸的形成。
用合适的其它溶剂,例如水洗涤稳定化的微珠,然后通过技术人员熟悉的操作,例如,通过冻干或喷雾干燥来干燥。用扫描电子显微镜检查成功的微珠形成。
产生微珠的操作允许疏水活性的化合物被包封,由此配制进微珠中。这一操作包括两个步骤。在第一步骤中,疏水活性化合物和重复蛋白被溶解在共享的相中。为此目的,可以通过溶剂或溶剂混合物直接溶解活性物质和重复蛋白。或者,该活性物质和重复蛋白可以先被溶解在不同溶剂,而后溶剂可以彼此混合,再产生共享的相。该共享的相可以是分子分散相或胶体分散相。
如果疏水活性物质和蛋白质不能在共享的溶剂或溶剂混合物中溶解,则在不同溶剂中溶解疏水活性物质和蛋白质,接着混合两个溶液是特别有利的。在这一方式中,也可以通过此操作将已经溶解在合适溶剂中的活性物质,稀释进入所述活性物质不可溶的不同溶剂,来制备疏水活性物质的胶体分散溶液。
由于蛋白质通常在水中具有良好的溶解度,优选用含水溶液、以及水和易与水混溶的有机溶剂的混合物操作。合适的易与水混溶的溶剂的实例是醇类,例如甲醇、乙醇和异丙醇,氟化醇,例如六氟异丙醇和三氟乙醇,链烷酮例如丙酮,或亚砜类,例如,二甲基亚砜,或甲酰胺类,例如二甲基甲酰胺,或其它有机溶剂,例如,四氢呋喃和乙腈或N-甲基-2-吡咯烷酮。通常,可以用其中可以溶解根据本发明的蛋白质的任何溶剂和溶剂混合物操作。合适溶剂的实例是氟化醇,例如,六氟异丙醇或三氟乙醇,离子液体,例如,EMIM乙酸盐、离液序列高的盐的水溶液,例如,尿素、盐酸胍、硫氰酸胍,或有机酸,例如,甲酸,还有这些溶剂与其它有机溶剂的混合物。可以与蛋白质的溶剂混合的溶剂的实例尤其是,例如,醇类,例如甲醇、乙醇和异丙醇,链烷酮,例如丙酮,亚砜类例如,诸如二甲基亚砜,甲酰胺类例如二甲基甲酰胺,卤代烷例如二氯甲烷,或其它有机溶剂,例如诸如四氢呋喃。
在第二步骤中,在共享的活性物质-蛋白质溶液中诱导相分离随后固化微珠。根据先前制备纯蛋白质微珠所述的相同原则进行这一操作。在微珠形成期间,疏水活性物质与根据本发明的重复蛋白质相互作用。
尽管也可能涉及氢桥、离子相互作用和范德瓦耳斯相互作用,在疏水活性物质和蛋白质之间的相互作用是基本基于其疏水特性。疏水活性物质可以结合于微珠表面、包封在其中,或同时以两种方式与微珠结合。可以通过在组装混合物中耗尽溶解的活性物质,来测定疏水活性物质与微珠的结合。可以通过其特性的定量分析测量该活性物质的浓度。因此,例如,可以通过光度计方法分析光吸收的活性物质的结合。为此目的,例如,通过测量有色活性物质的光吸收测定微珠的染色、或该制剂混合物的蛋白质-活性物质耗尽相的脱色。也可以用这些方法测定在微珠中活性物质的比例。
可以通过解吸进入合适的溶剂、通过蛋白酶降解微珠、或通过合适溶剂溶解微珠,从微珠释放活性物质。适合解吸的溶剂为活性物质可以溶解于其中的任何溶剂或溶剂混合物。合适的蛋白酶可以以专门的蛋白酶的形式特异性地加入蛋白质微珠悬浮液,或合适的蛋白酶可能在效应分子作用的期望位点天然存在,例如,皮肤蛋白酶、胃肠道蛋白酶,例如胃或肠的蛋白酶,或通过微生物释放的蛋白酶。能够溶解微珠的溶剂是,例如,氟化醇类,例如,六氟异丙醇或三氟乙醇,离子液体,例如,EMIM乙酸盐、离液序列高的盐的水溶液,例如,尿素、盐酸胍和硫氰酸胍,或有机酸,例如,甲酸,还有这些溶剂与其它有机溶剂的混合物。可以例如,经由用活性物质占据的密度和微珠大小或其体积对面积比率,来控制效应分子的释放速率和动力学。
在合适的条件下,可以从根据本发明的重复蛋白制备纳米原纤维。在等于或高于1mg/ml纳米的原纤维浓度下,通过凝胶样稠化水性蛋白溶液,纳米原纤维在在宏观水平显示其自身的形成。
组装蛋白质纳米原纤维的起点是具有蛋白质浓度为0.1-400mg/ml,优选1-100mg/ml,和特别优选5-20mg/ml的重复蛋白的水溶液。可以用,优选范围在pH 4-10,特别优选5-9,尤其优选6-8.5的缓冲液与水溶液混合。在数周期间内该组装过程自动发生。其可以通过加入减少溶液极性的水溶的有机溶剂而被加速。这些溶剂的实例是醇类,例如乙醇和甲醇。溶剂的终浓度应该在基于蛋白质溶液以重量计1%和50%之间。
用合适溶剂,例如水,洗涤组装的蛋白质纳米原纤维,接着通过技术人员熟悉的操作,例如,通过冻干法、接触干燥或喷雾干燥进行干燥。在透射电子显微镜或扫描原子力显微镜帮助下检测纤维的成功形成。
在合适条件下,可以从根据本发明的重复蛋白质制备膜。为此目的,将重复蛋白质溶解在第一溶剂中。可以使用的溶剂的实例是含水盐溶液。特别合适的是具有超过2,特别是超过4,和特别优选超过5摩尔浓度的高浓度盐溶液,其离子比钠离子和氯离子具有更显著的离液序列高的特性。这类盐溶液的实例是6M硫氰酸胍或9M溴化锂。还可以使用有机溶剂溶解重复蛋白。特别合适的是氟化醇或环烃类。其实例是六氟异丙醇和环己烷。只要其不包含任何非挥发性物质,可以在所述第一溶剂中制备膜。包含非挥发性成分的溶剂必须由不包含任何非挥发性物质的另一溶剂置换,例如通过透析。从其中可以形成膜的优选的挥发性溶剂是六氟异丙醇、环己烷、甲酸和水。溶解的蛋白质的终浓度应该在1-200mg/ml之间,优选在20-150mg/ml之间,和特别优选50-100mg/ml之间。进行操作的温度通常是0-80,优选5-50,和特别优选10-40℃。
在挥发性溶剂中溶解的重复蛋白被平铺于光滑表面。溶剂在室温蒸发,留下蛋白膜。
新鲜制备的蛋白膜通常是水溶的。可以通过将其与诱导在膜内形成稳定的二级、三级和四级结构的物质孵育来稳定膜。这类物质的实例是醇类,例如,甲醇和乙醇,或其离子比钠离子和氯离子具有更显著的稳定氢键能力特性的盐溶液(例如,硫酸铵、磷酸钾)。在膜被稳定化之后,可以用合适溶剂,例如,醇类或水洗涤,然后干燥。
本发明还涉及由根据本发明的重复蛋白与效应分子偶联组成的分子。效应分子指具有特定、可预期作用的分子。他们可以是蛋白质样分子,例如酶或非产生蛋白质(non-proteinogenic)的分子,例如染料、光稳定剂、维生素、维生素原、抗氧化剂和脂肪酸、调节剂或包含金属离子的化合物。
效应分子被连接于重复蛋白。在效应分子和蛋白质之间的连接可以是共价键,和基于离子或范德瓦耳斯相互作用或疏水相互作用或氢键或吸附的连接。
效应分子可以是经由重复蛋白的多肽序列的侧链,特别是经由氨基官能团或羟基官能团或羧基官能团或巯基官能团共价连接。优选经由一个或多个赖氨酸残基的氨基官能团,经由一个或多个谷氨酸或天冬氨酸残基的羧基官能团,经由一个或多个半胱氨酸残基的巯基官能团,或经由重复蛋白的N-末端或C-末端官能团进行连接。也可能在除了在氨基酸序列中存在的氨基酸官能团之外将具有合适官能团的氨基酸(例如,半胱氨酸、赖氨酸、天冬氨酸、谷氨酸)添加或插入序列,或用这类氨基酸官能团替代重复蛋白的氨基酸。
效应分子可以被直接连接于重复蛋白,即,通过已经存在的两个化学官能团的共价连接。这涉及连接重复蛋白的上述化学官能团和在效应分子中存在的反应基团。这类反应基团的实例是巯基-反应基团,例如,马来酰亚胺、吡啶二硫化物、α-卤代乙酰、乙烯基砜、硫酸根合(sulfato)烷基砜(优选硫酸根合乙基砜)、胺反应基团(例如,琥珀酰亚胺酯、碳化二亚胺、羟甲基膦、酰亚胺酯、PFP酯、醛类、异硫氰酸盐等)、羧基反应基团(例如,胺等)、羟基反应基团(例如,异氰酸盐等)、非选择性基团(例如,芳基叠氮化物等)、和光激活基团(例如,全氟苯基叠氮化物等)。
如果根据本发明的重复蛋白和效应子的待偶联官能团的反应性对于直接偶联过低,则可以通过技术人员熟悉的方法激活所述官能团(例如,用碳化二亚胺激活羧基官能团)。
然而,连接也可以经由“接头”,即至少双功能分子发生,其用一个或多个官能团结合于效应分子和用一个或多个不同的官能团结合于重复蛋白。使用这类特定的接头使连接与期望的效应分子精确的匹配。此外,这使能够在确定的方式中将多个效应分子连接于重复蛋白。
使用的接头取决于待偶联的官能度。合适的实例是这样的分子,其通过以下方式偶联于重复蛋白,巯基反应基团例如马来酰亚胺、吡啶二硫化物、α-卤代乙酰、乙烯基砜、硫酸根合(sulfato)烷基砜(优选硫酸根合乙基砜)、胺反应基团(例如,琥珀酰亚胺酯、碳化二亚胺、羟甲基膦、酰亚胺酯、PFP酯、醛类、异硫氰酸盐等)、羧基反应基团(例如,胺等)、羟基反应基团(例如,异氰酸盐等)、非选择性基团(例如,芳基叠氮化物等)、和光激活基团(例如,全氟苯基叠氮化物等);通过以下方式偶联于效应分子
-巯基反应基团例如马来酰亚胺、吡啶二硫化物、α-卤代乙酰、乙烯基砜、硫酸根合(sulfato)烷基砜(优选硫酸根合乙基砜)
-胺反应基团(例如,琥珀酰亚胺酯、碳化二亚胺、羟甲基膦、酰亚胺酯、PFP酯、醛类、异硫氰酸盐等)
-糖或氧化的糖反应基团(例如,酰肼类等)
-羧基反应基团(例如,胺等)
-羟基反应基团(例如,异氰酸盐等)
-胸腺嘧啶反应基团(例如,补骨脂素等)
-非选择性基团(例如,芳基叠氮化物等)
-光激活基团(例如,全氟苯基叠氮化物等)
-金属络合基团(例如,EDTA、6×His、铁蛋白)
-抗体和抗体片段(例如,单链抗体、抗体的F(ab)片段、催化抗体)。
接头的化学官能团可以通过间隔基元件被连接。间隔基元件可以由,例如,烷基链、乙二醇和聚乙烯二醇构成。
特别优选具有蛋白酶、酯酶、脂肪酶、磷酸酶、水解酶的潜在切割位点的接头元件和/或间隔基元件,即,其为可酶促切割的。
可以在根据本发明的分子中使用的可酶促切割的接头的实例是在例如WO 98/01406中提及,其整体作为参考引入。
特别优选的接头和间隔基是可热切割或可光切割的。相应的化学结构是技术人员公知的,并整合在分子的效应分子和重复蛋白部分之间。
如果该效应分子由多肽序列组成,则效应子和重复蛋白可以通过“融合”蛋白而被连接,即,使用连续的多肽序列,其由效应子子序列和重复蛋白子序列组成。
也可在效应子和重复蛋白之间并入“间隔基元件”,例如具有蛋白酶、脂肪酶、酯酶、磷酸酶、水解酶的潜在切割位点的多肽序列,或能够使融合蛋白被容易的纯化的寡肽和多肽序列,例如,“His”标签,即,寡聚组氨酸残基。
共价或非共价偶联于重复蛋白的效应分子在其结合形式可以是有活性的。但是,或者,偶联于重复蛋白的效应分子也可以从所述重复蛋白被释放。
可以通过切割特异性引入的可切割间隔基或偶联的接头从重复蛋白释放共价偶联的效应分子,可切割间隔基或偶联的接头可以是,例如,可以热切割的、光切割的或酶促切割的,或通过蛋白水解降解(例如通过蛋白酶)的。
实施例
实施例1
产生重复蛋白R16(SEQ ID NO:2)
根据在Huemmerich等人;Biochemistry 43(42):13604-12,(2004)中所述方法通过以下的合成寡核苷酸R的多聚化来多聚化编码重复蛋白R16的合成基因:ggcccgggttctagcgcggctgcagccgcggcagctgcgtccggcccgggtcagggccagggtcagggtcaaggccagggtggccgtccttctgacacctac
以产生16mer,克隆进入表达载体pET21a(Novagen)。在大肠杆菌BLR[DE3](Novagen)菌株中进行表达。
在pO2>20%和pH=6.8下分批补料发酵(fed batch)进行生长和蛋白质合成。
培养基
8升         水
230g        酵母提取物
150g        细菌胰蛋白胨
30g         甘油(99%)
20g         磷酸二氢钾(KH2PO4)
50g         硫酸铵((NH4)2SO4)
10.5g       硫酸镁七水合物(MgSO4*7 H2O)
1.0g        二水氯化钙(CaCl2*2 H2O)
100ml       微量盐溶液(Trace salt solution)
            用水填充至9.7升
            用25%强度的NaOH调节pH至6.8
3ml         Tego KS 911(止泡剂;Goldschmidt产品)
1g          氨苄西林
微量盐溶液:
5升            水
200.00g        一水柠檬酸
55.00g         ZnSO4*7 H2O
42.50g         (NH4)2Fe(SO4)2*6 H2O
15.00g         MnSO4*H2O
4.00g          CuSO4*5 H2O
1.25g          CoSO4*7 H2O
补料溶液
800g    水
30g     一水柠檬酸
60g     硫酸钠(Na2SO4)
4.5g    (NH4)2Fe(SO4)2*6 H2O
3400g    甘油99.5%
在基础培养基中的甘油用尽之后,以100ml/h速率开始持续的补料。
在细菌培养物已经达到光密度OD600=40之后,通过加入1mM异丙基β-D-半乳糖硫吡喃糖苷诱导蛋白质合成。此时,培养温度从37℃降低至32℃。在诱导7小时后收集细胞。
根据下列操作方法纯化蛋白质:
在5ml的每克湿生物质20mM MOPS(3-(N-吗啉代)丙磺酸)pH 7.0中重悬浮细胞沉淀
在1400巴高压匀浆器中裂解细胞
在5000×g离心30分钟
用5ml的每克湿生物质50mM Tris/HCl pH 8.0;100mM NaCl,0.5mM乙二胺四乙酸盐(EDTA),0.1%Triton X-100的溶液洗涤沉淀
用5ml的每克湿生物质50mM Tris/HCl pH 8.0;100mM NaCl,0.5mM乙二胺四乙酸盐(EDTA)洗涤沉淀物
通过加入每克沉淀1.6g的硫氰酸胍(GdmSCN)(终浓度:6 M GdmSCN)溶解沉淀
在5000×g离心60分钟
对5mM磷酸钾pH 7.0透析上清液
在5000×g离心30分钟
在室温通过加入1/4体积的4M硫酸铵从上清液沉淀蛋白质1小时
用8M尿素洗涤沉淀
用水2次洗涤沉淀
冻干
冻干蛋白可以被贮存在-20℃
为了使用蛋白质,在6M GdmSCN中重构冻干的蛋白质和对5mM磷酸钾pH 7.0透析
光度计测定溶液中的蛋白质含量(E(280;1mg/ml=0.42)
通过聚丙烯酰胺凝胶(SDS PAGE)和蛋白印迹分析(图1)和通过荧光光谱法(图2)检测蛋白质的纯度
从10升发酵液中回收20g的纯R16蛋白,纯度>95%。
实施例2
生产重复蛋白S16(SEQ ID NO:4)
根据在Huemmerich等人;Biochemistry 43(42):13604-12,(2004)中所述方法通过以下的合成寡核苷酸S的多聚化来多聚化编码重复蛋白S16的合成基因:ggttctgcggctgcagccgcggcagctgcgggtccgggcggtggcaacggtggccgtccgtctgacacctacggtgcgccgggtggcggtaacggtggccgtccttcttcctcttac
以产生16mer,克隆进入表达载体pET21a(Novagen)。在大肠杆菌BLR[DE3](Novagen)菌株中进行表达。
在pO2>20%和pH=6.8下分批补料发酵进行生长和蛋白质合成。
培养基
8升      水
230g     酵母提取物
150g     细菌胰蛋白胨
30g      甘油(99%)
20g      磷酸二氢钾(KH2PO4)
50g      硫酸铵((NH4)2SO4)
10.5g    硫酸镁七水合物(MgSO4*7 H2O)
1.0g     二水氯化钙(CaCl2*2 H2O)
100ml    微量盐溶液
         用水填充至9.7升
         用25%强度的NaOH调节pH强度至6.8
3ml     Tego KS 911(止泡剂;Goldschmidt产品)
1g      氨苄西林
微量盐溶液:
5升         水
200.00g     一水柠檬酸
55.00g      ZnSO4*7 H2O
42.50g      (NH4)2Fe(SO4)2*6 H2O
15.00g      MnSO4*H2O
4.00g       CuSO4*5 H2O
1.25g       CoSO4*7 H2O
补料溶液
800g      水
30g       一水柠檬酸
60g      硫酸钠(Na2SO4)
4.5g     (NH4)2Fe(SO4)2*6 H2O
3400g    甘油99.5%
在基础培养基中的甘油用尽之后,以100ml/h速率开始持续的补料。
在细菌培养物已经达到光密度OD600=40之后,通过加入1mM异丙基β-D-半乳糖硫吡喃糖苷诱导蛋白质合成。此时,培养温度从37℃降低至25℃。在诱导4小时后收集细胞。
根据下列操作方法纯化蛋白质:
在5ml的每克湿生物质20mM MOPS(3-(N-吗啉代)丙磺酸)pH 7.0中重悬浮细胞沉淀
在1400巴高压匀浆器中裂解细胞
在5000×g离心30分钟
在80℃孵育上清液20分钟
在5000×g离心30分钟
在室温通过加入1体积的4M硫酸铵从上清液沉淀蛋白质1小时
用8M尿素洗涤沉淀
用水2次洗涤沉淀
冻干
冻干蛋白可以被贮存在-20℃
为了使用蛋白质,在6M GdmSCN中重构硫酸铵沉淀和对5mM磷酸钾pH 7.0透析
光度计测定溶液中的蛋白质含量(E(280;1mg/ml)=0.76)
通过聚丙烯酰胺凝胶(SDS PAGE)和蛋白印迹分析(图1)和通过荧光光谱法(图2)检测蛋白质的纯度
从10升发酵液中回收1.4g的纯S16蛋白。
实施例3
从重复蛋白R16和S16形成蛋白质微珠
操作方案
以10mg/ml的终浓度在6M硫氰酸胍中溶解冻干的R16或S16
在室温对1M磷酸钾pH 7.0透析
用水洗涤
冻干。
用有稳定氢键能力的(cosmotropic)磷酸钾代替离液序列高的(chaotropic)硫氰酸胍来诱导R16或S16微粒的形成。或者,可以通过对5mM磷酸钾透析除去硫氰酸胍。通过加入1/4体积的4M硫酸铵或1/2体积的磷酸钾诱导微粒形成。
操作方案
以15mg/ml的终浓度在6M硫氰酸胍中溶解冻干的R16或S16
在4℃对5mM磷酸钾pH 7.0透析
在10 000×g离心30分钟除去沉淀
调节蛋白质浓度至10mg/ml
加入1/4体积的4M硫酸铵或1/2体积的1M磷酸钾
在室温孵育1小时
用水洗涤
冻干。
在扫描电子显微镜帮助下检测成功的微粒形成(图3+4)。
实施例4
S16微粒的稳定化
S16微粒形成的操作包括由磷酸钾或硫酸铵诱导的相分离,和继之通过形成稳定的二级结构稳定富蛋白质相。尚未固化的富蛋白质微滴可以通过其在4M尿素中不同的稳定性实验性的与稳定的微粒相区分。检测稳定化的动力学。
操作方案
在5mM磷酸钾pH 7.0中制备含水的10mg/ml S16-溶液
在时刻0用1/4体积的4M硫酸铵沉淀S16蛋白质
在时刻t除去蛋白质悬浮物沉淀的部分,将其与相同体积的8M尿素混合
在600nm来测量样品的消光值作为散射的定量测量。
通过沉淀产生的样品的混浊可以通过确立4M浓度的尿素在30分钟内被反转。40分钟之后,经此处理的混浊仍存在。因此可以推断在此期间在富蛋白质相中已经形成这样的结构,其在4M尿素中是稳定的(图5)。
实施例5
在R16和S16微粒中包封β-胡萝卜素
为了证明R16和S16微粒是活性物质的合适的载体和制剂辅药,通过例如将β-胡萝卜素作为低水溶性活性物质包封入R16和S16微粒中。
为此目的,在10%四氢呋喃(THF)和90%N-甲基-2-吡咯烷酮(NMP)中用50μl的0.9mg/ml β-胡萝卜素溶液与在5mM磷酸钾(pH 8.0)中的500μl的10mg/ml R16或S16溶液混合。此后,通过加入275μl的4M硫酸铵溶液诱导微粒的形成。
在R16和S16微粒形成期间,从溶液中移去β-胡萝卜素。已经通过离心除去的微粒呈现黄-橙黄色。用水洗涤微粒,在此操作期间β-胡萝卜素保持与微粒结合,然后冻干。冻干之后,通过扫描电子显微镜分析负载的R16或S16微粒(图6+7)。在电子显微镜图像中,负载的微粒(图6+7)显示与未负载微粒(图3+4)非常相似的形态,由此清楚可见微粒和β-胡萝卜素形成共享的固相。
实施例6
R16微粒的水吸收
重复蛋白的微粒可以从空气吸收水并释放水,因此可以例如在化妆品应用中作为水分调节物质。
为了证明,将事先已经贮存在-20℃的0.4g的R16微粒在真空下干燥16小时和测定干燥重量。继之在室温和100%湿度贮存导致在66天内重量缓慢增加44%(图8)。在真空中的除去干燥重现了初始的干重量。
实施例7
R16和S16的凝胶形成
操作方案:
以20mg/ml的终浓度在6M硫氰酸胍中溶解冻干的R16或S16
在4℃对5mM磷酸钾pH 7.0透析
在10 000×g离心30分钟除去沉淀
制备含有2.5mM磷酸钾pH 7.0,10mg/ml R16或S16蛋白质和40%体积比乙醇的溶液
在室温孵育。
该溶液在4-5天内得到凝胶样、混浊态。
实施例8
R16和S16的膜形成
操作方案:
以100mg/ml的终浓度在六氟异丙醇中溶解冻干的R16或S16
在光滑的聚苯乙烯表面上平铺300μl
在室温蒸发六氟异丙醇
用1M磷酸钾pH 7.0覆盖蛋白质膜5分钟
用水2次洗涤
在空气中干燥。
这一处理导致透明的、水不溶的蛋白质膜。R16的干膜是脆的,而S16的膜具有软质(flexible)特性。
图例
图1.纯化的蛋白质R16和S16的分析。制备蛋白质的水溶液和在聚丙烯酰胺凝胶上电泳分离。通过用染料考马斯亮蓝(C)染色或通过用特异性结合T7肽标签(其与两个蛋白质氨基末端连接)免疫印迹法(WB)检测该蛋白质。
图2.通过荧光光谱法对纯化的R16和S16的纯化分析。R16和S16不包含氨基酸色氨酸,而存在酪氨酸。相反,色氨酸在大肠杆菌蛋白质中以平均1.5%的频率存在。荧光光谱法可以选择性的检测蛋白质样品中色氨酸的存在,因而检测在R16或S16制品中的污染。尽管酪氨酸和色氨酸都被280nm波长的光(蓝色)激发,但295nm的光(洋红色)只激发色氨酸。R16和S16样品呈现典型的酪氨酸荧光,而没有表明可检测的色氨酸存在,说明蛋白质样品的高纯度。
图3.R16微粒。通过在6M GdmSCN中10mg/ml R16溶液对1M磷酸钾溶液pH 7.0透析获得微粒,通过扫描电子显微镜分析。
图4.S16微粒。通过在6M GdmSCN中10mg/ml S16溶液对1M磷酸钾溶液pH 7.0透析获得微粒,通过扫描电子显微镜分析。
图5.S16微粒的稳定化。通过在时刻t=0加入1/4体积的硫酸铵沉淀含水的10mg/ml S16溶液。在确定的时间点,取出部分,确立4M尿素的浓度,在600nm测量消光度作为散射的定性测量,从而测量存在的稳定蛋白质颗粒。
图6.具有0.8%β-胡萝卜素的R16微粒。通过加入4M硫酸铵溶液至6M GdmSCN中的10mg/ml R16和0.08mg/ml β-胡萝卜素获得微粒,通过扫描电子显微镜分析。
图7.具有0.8%β-胡萝卜素的S16微粒。通过加入4M硫酸铵溶液至6M GdmSCN中的10mg/ml R16和0.08mg/ml β-胡萝卜素获得微粒,通过扫描电子显微镜分析。
图8.R16微粒的吸湿性。通过在R16微粒在100%湿度重量的增加测量水的吸收。
序列表
<110>巴斯夫欧洲公司
 
<120>合成的重复蛋白及其生产和用途
 
<130>PF59335
 
<160>4
 
<170>PatentIn version 3.1
 
<210>1
 
<211>1680
 
<212>DNA
 
<213>人工序列
 
<220>
 
<223>″R16重复蛋白的基因″
 
<220>
 
<221>CDS
 
<222>(1)..(1680)
 
<223>
 
<400>1
 
atg gct agc atg act ggt gga cag caa atg ggt cgc gga tcc atg ggc      48
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly
1               5                   10                  15
ccg ggt tct agc gcg gct gca gcc gcg gca gct gcg tcc ggc ccg ggt      96
Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly
            20                  25                  30
cag ggc cag ggt cag ggt caa ggc cag ggt ggc cgt cct tct gac acc    144
Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr
        35                  40                  45
tac ggc ccg ggt tct agc gcg gct gca gcc gcg gca gct gcg tcc ggc    192
Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly
    50                  55                  60
ccg ggt cag ggc cag ggt cag ggt caa ggc cag ggt ggc cgt cct tct    240
Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser
65                  70                  75                  80
gac acc tac ggc ccg ggt tct agc gcg gct gca gcc gcg gca gct gcg    288
Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala
                85                  90                  95
tcc ggc ccg ggt cag ggc cag ggt cag ggt caa ggc cag ggt ggc cgt    336
Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg
            100                 105                 110
cct tct gac acc tac ggc ccg ggt tct agc gcg gct gca gcc gcg gca    384
Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala
        115                 120                 125
gct gcg tcc ggc ccg ggt cag ggc cag ggt cag ggt caa ggc cag ggt    432
Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly
    130                 135                 140
ggc cgt cct tct gac acc tac ggc ccg ggt tct agc gcg gct gca gcc    480
Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala
145                 150                 155                 160
gcg gca gct gcg tcc ggc ccg ggt cag ggc cag ggt cag ggt caa ggc    528
Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly
                165                 170                 175
cag ggt ggc cgt cct tct gac acc tac ggc ccg ggt tct agc gcg gct    576
Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala
            180                 185                 190
gca gcc gcg gca gct gcg tcc ggc ccg ggt cag ggc cag ggt cag ggt    624
Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly
        195                 200                 205
caa ggc cag ggt ggc cgt cct tct gac acc tac ggc ccg ggt tct agc    672
Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser
    210                 215                 220
gcg gct gca gcc gcg gca gct gcg tcc ggc ccg ggt cag ggc cag ggt    720
Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly
225                 230                 235                 240
cag ggt caa ggc cag ggt ggc cgt cct tct gac acc tac ggc ccg ggt    768
Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly
                245                 250                 255
tct agc gcg gct gca gcc gcg gca gct gcg tcc ggc ccg ggt cag ggc    816
Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly
             260                265                 270
cag ggt cag ggt caa ggc cag ggt ggc cgt cct tct gac acc tac ggc    864
Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly
        275                 280                 285
ccg ggt tct agc gcg gct gca gcc gcg gca gct gcg tcc ggc ccg ggt    912
Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly
    290                 295                 300
cag ggc cag ggt cag ggt caa ggc cag ggt ggc cgt cct tct gac acc    960
Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr
305                 310                 315                 320
tac ggc ccg ggt tct agc gcg gct gca gcc gcg gca gct gcg tcc ggc   1008
Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly
                325                 330                 335
ccg ggt cag ggc cag ggt cag ggt caa ggc cag ggt ggc cgt cct tct   1056
Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser
            340                 345                 350
gac acc tac ggc ccg ggt tct agc gcg gct gca gcc gcg gca gct gcg   1104
Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala
        355                 360                 365
tcc ggc ccg ggt cag ggc cag ggt cag ggt caa ggc cag ggt ggc cgt   1152
Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg
    370                 375                 380
cct tct gac acc tac ggc ccg ggt tct agc gcg gct gca gcc gcg gca   1200
Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala
385                 390                 395                 400
gct gcg tcc ggc ccg ggt cag ggc cag ggt cag ggt caa ggc cag ggt    1248
Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly
                405                 410                 415
ggc cgt cct tct gac acc tac ggc ccg ggt tct agc gcg gct gca gcc    1296
Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala
            420                 425                 430
gcg gca gct gcg tcc ggc ccg ggt cag ggc cag ggt cag ggt caa ggc    1344
Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly
        435                 440                 445
cag ggt ggc cgt cct tct gac acc tac ggc ccg ggt tct agc gcg gct    1392
Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala
    450                 455                 460
gca gcc gcg gca gct gcg tcc ggc ccg ggt cag ggc cag ggt cag ggt    1440
Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly
465                 470                 475                 480
caa ggc cag ggt ggc cgt cct tct gac acc tac ggc ccg ggt tct agc    1488
Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser
                485                 490                 495
gcg gct gca gcc gcg gca gct gcg tcc ggc ccg ggt cag ggc cag ggt    1536
Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly
            500                 505                 510
cag ggt caa ggc cag ggt ggc cgt cct tct gac acc tac ggc ccg ggt    1584
Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly
        515                 520                 525
tct agc gcg gct gca gcc gcg gca gct gcg tcc ggc ccg ggt cag ggc    1632
Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly
    530                 535                 540
cag ggt cag ggt caa ggc cag ggt ggc cgt cct tct gac acc tac ggc    1680
Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly
545                 550                 555                 560
 
<210>2
<211>560
 
<212>PRT
 
<213>人工序列
 
<220>
 
<223>″R16重复蛋白的基因″
 
<400>2
 
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly
1               5                   10                  15
Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly
            20                  25                  30
Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr
        35                  40                  45
Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly
    50                  55                  60
Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser
65                  70                  75                  80
Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala
                85                  90                  95
Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg
            100                 105                 110
Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala
        115                 120                 125
Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly
    130                 135                 140
Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala
145                 150                 155                 160
Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly
                165                 170                 175
Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala
            180                 185                 190
Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly
        195                 200                 205
Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser
    210                 215                 220
Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly
225                 230                 235                 240
Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly
                245                 250                 255
Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly
            260                 265                 270
Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly
        275                 280                 285
Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly
    290                 295                 300
Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr
305                 310                 315                 320
Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly
                325                 330                 335
Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser
            340                 345                 350
Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala
        355                 360                 365
Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg
    370                 375                 380
Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala
385                 390                 395                 400
Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly Gln Gly
                405                 410                 415
Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala Ala Ala
            420                 425                 430
Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly Gln Gly
        435                 440                 445
Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser Ala Ala
    450                 455                 460
Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly Gln Gly
465                 470                 475                 480
Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly Ser Ser
                485                 490                 495
Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly Gln Gly
            500                 505                 510
Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly Pro Gly
        515                 520                 525
Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly Gln Gly
    530                 535                 540
Gln Gly Gln Gly Gln Gly Gln Gly Gly Arg Pro Ser Asp Thr Tyr Gly
545                 550                 555                 560
 
<210>3
 
<211>1920
 
<212>DNA
 
<213>人工序列
 
<220>
 
<223>″S16重复蛋白的基因″
 
<220>
<221>CDS
 
<222>(1)..(1920)
 
<223>
 
<400>3
atg gct agc atg act ggt gga cag caa atg ggt cgc gga tcc atg ggt      48
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly
1               5                   10                  15
tct gcg gct gca gcc gcg gca gct gcg ggt ccg ggc ggt ggc aac ggt      96
Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Gly Asn Gly
            20                  25                  30
ggc cgt ccg tct gac acc tac ggt gcg ccg ggt ggc ggt aac ggt ggc     144
Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
        35                  40                  45
cgt cct tct tcc tct tac ggt tct gcg gct gca gcc gcg gca gct gcg     192
Arg Pro Ser Ser Ser Tyr Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala
    50                  55                  60
ggt ccg ggc ggt ggc aac ggt ggc cgt ccg tct gac acc tac ggt gcg     240
Gly Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala
65                  70                  75                  80
ccg ggt ggc ggt aac ggt ggc cgt cct tct tcc tct tac ggt tct gcg     288
Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ser Ala
                85                  90                  95
gct gca gcc gcg gca gct gcg ggt ccg ggc ggt ggc aac ggt ggc cgt     336
Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Gly Asn Gly Gly Arg
            100                 105                 110
ccg tct gac acc tac ggt gcg ccg ggt ggc ggt aac ggt ggc cgt cct     384
Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro
        115                 120                 125
tct tcc tct tac ggt tct gcg gct gca gcc gcg gca gct gcg ggt ccg     432
Ser Ser Ser Tyr Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro
    130                 135                 140
ggc ggt ggc aac ggt ggc cgt ccg tct gac acc tac ggt gcg ccg ggt     480
Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly
145             150                     155                 160
ggc ggt aac ggt ggc cgt cct tct tcc tct tac ggt tct gcg gct gca    528
Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ser Ala Ala Ala
                165                 170                 175
gcc gcg gca gct gcg ggt ccg ggc ggt ggc aac ggt ggc cgt ccg tct    576
Ala Ala Ala Ala Ala Gly Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser
            180                 185                 190
gac acc tac ggt gcg ccg ggt ggc ggt aac ggt ggc cgt cct tct tcc    624
Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser
        195                 200                 205
tct tac ggt tct gcg gct gca gcc gcg gca gct gcg ggt ccg ggc ggt    672
Ser Tyr Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly
    210                 215                 220
ggc aac ggt ggc cgt ccg tct gac acc tac ggt gcg ccg ggt ggc ggt    720
Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly
225                 230                 235                 240
aac ggt ggc cgt cct tct tcc tct tac ggt tct gcg gct gca gcc gcg    768
Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ser Ala Ala Ala Ala Ala
                245                 250                 255
gca gct gcg ggt ccg ggc ggt ggc aac ggt ggc cgt ccg tct gac acc    816
Ala Ala Ala Gly Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr
            260                 265                 270
tac ggt gcg ccg ggt ggc ggt aac ggt ggc cgt cct tct tcc tct tac    864
Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr
        275                 280                 285
ggt tct gcg gct gca gcc gcg gca gct gcg ggt ccg ggc ggt ggc aac    912
Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Gly Asn
    290                 295                 300
ggt ggc cgt ccg tct gac acc tac ggt gcg ccg ggt ggc ggt aac ggt    960
Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly
305                 310                 315                 320
ggc cgt cct tct tcc tct tac ggt tct gcg gct gca gcc gcg gca gct   1008
Gly Arg Pro Ser Ser Ser Tyr Gly Ser Ala Ala Ala Ala Ala Ala Ala
                325                 330                 335
gcg ggt ccg ggc ggt ggc aac ggt ggc cgt ccg tct gac acc tac ggt    1056
Ala Gly Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly
            340                 345                 350
gcg ccg ggt ggc ggt aac ggt ggc cgt cct tct tcc tct tac ggt tct    1104
Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ser
        355                 360                 365
gcg gct gca gcc gcg gca gct gcg ggt ccg ggc ggt ggc aac ggt ggc    1152
Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Gly Asn Gly Gly
    370                 375                 380
cgt ccg tct gac acc tac ggt gcg ccg ggt ggc ggt aac ggt ggc cgt    1200
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg
385                 390                 395                 400
cct tct tcc tct tac ggt tct gcg gct gca gcc gcg gca gct gcg ggt    1248
Pro Ser Ser Ser Tyr Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly
                405                 410                 415
ccg ggc ggt ggc aac ggt ggc cgt ccg tct gac acc tac ggt gcg ccg    1296
Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro
            420                 425                 430
ggt ggc ggt aac ggt ggc cgt cct tct tcc tct tac ggt tct gcg gct    1344
Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ser Ala Ala
        435                 440                 445
gca gcc gcg gca gct gcg ggt ccg ggc ggt ggc aac ggt ggc cgt ccg    1392
Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Gly Asn Gly Gly Arg Pro
    450                 455                 460
tct gac acc tac ggt gcg ccg ggt ggc ggt aac ggt ggc cgt cct tct    1440
Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser
465                 470                 475                 480
tcc tct tac ggt tct gcg gct gca gcc gcg gca gct gcg ggt ccg ggc    1488
Ser Ser Tyr Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly
                485                 490                 495
ggt ggc aac ggt ggc cgt ccg tct gac acc tac ggt gcg ccg ggt ggc    1536
Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly
            500                 505                 510
ggt aac ggt ggc cgt cct tct tcc tct tac ggt tct gcg gct gca gcc    1584
Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ser Ala Ala Ala Ala
        515                 520                 525
gcg gca gct gcg ggt ccg ggc ggt ggc aac ggt ggc cgt ccg tct gac    1632
Ala Ala Ala Ala Gly Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp
    530                 535                 540
acc tac ggt gcg ccg ggt ggc ggt aac ggt ggc cgt cct tct tcc tct    1680
Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser
545                 550                 555                 560
tac ggt tct gcg gct gca gcc gcg gca gct gcg ggt ccg ggc ggt ggc    1728
Tyr Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Gly
                565                 570                 575
aac ggt ggc cgt ccg tct gac acc tac ggt gcg ccg ggt ggc ggt aac    1776
Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn
            580                 585                 590
ggt ggc cgt cct tct tcc tct tac ggt tct gcg gct gca gcc gcg gca    1824
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ser Ala Ala Ala Ala Ala Ala
        595                 600                 605
gct gcg ggt ccg ggc ggt ggc aac ggt ggc cgt ccg tct gac acc tac    1872
Ala Ala Gly Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr
    610                 615                 620
ggt gcg ccg ggt ggc ggt aac ggt ggc cgt cct tct tcc tct tac ggc    1920
Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly
625                 630                 635                 640
 
<210>4
 
<211>640
 
<212>PRT
 
<213>人工序列
<220>
 
<223>″S16重复蛋白的基因″
 
<400>4
 
Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly
1               5                   10                  15
Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Gly Asn Gly
            20                  25                  30
Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly
        35                  40                  45
Arg Pro Ser Ser Ser Tyr Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala
    50                  55                  60
Gly Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala
65                  70                  75                  80
Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ser Ala
                85                  90                  95
Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Gly Asn Gly Gly Arg
            100                 105                 110
Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro
        115                 120                 125
Ser Ser Ser Tyr Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro
    130                 135                 140
Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly
145                 150                 155                 160
Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ser Ala Ala Ala
                165                 170                 175
Ala Ala Ala Ala Ala Gly Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser
            180                 185                 190
Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser
        195                 200                 205
Ser Tyr Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly
    210                 215                 220
Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly
225                 230                 235                 240
Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ser Ala Ala Ala Ala Ala
                245                 250                 255
Ala Ala Ala Gly Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr
            260                 265                 270
Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr
        275                 280                 285
Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Gly Asn
    290                 295                 300
Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly
305                 310                 315                 320
Gly Arg Pro Ser Ser Ser Tyr Gly Ser Ala Ala Ala Ala Ala Ala Ala
            325                 330                 335
Ala Gly Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly
            340                 345                 350
Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ser
        355                 360                 365
Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Gly Asn Gly Gly
    370                 375                 380
Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg
385                 390                 395                 400
Pro Ser Ser Ser Tyr Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly
                405                 410                 415
Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro
            420                 425                 430
Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ser Ala Ala
        435                 440                 445
Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Gly Asn Gly Gly Arg Pro
    450                         455                         460
Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser
465                 470                 475                 480
Ser Ser Tyr Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly
                485                 490                 495
Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly
            500                 505                 510
Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ser Ala Ala Ala Ala
        515                 520                 525
Ala Ala Ala Ala Gly Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp
    530                 535                 540
Thr Tyr Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser
545                 550                 555                 560
Tyr Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Gly
                565                 570                 575
Asn Gly Gly Arg Pro Ser Asp Thr Tyr Gly Ala Pro Gly Gly Gly Asn
            580                 585                 590
Gly Gly Arg Pro Ser Ser Ser Tyr Gly Ser Ala Ala Ala Ala Ala Ala
        595                 600                 605
Ala Ala Gly Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Asp Thr Tyr
    610                 615                 620
Gly Ala Pro Gly Gly Gly Asn Gly Gly Arg Pro Ser Ser Ser Tyr Gly
625                 630                 635                 640

Claims (13)

1.具有重复单元的重复蛋白,包含共有序列(I)
X1X2X3X4S X5X6Y G
其中
X1是G、Y、A或N
X2是G、L、Q
X3是R、K、T或P
X4是P、A、T或S
X5是D、T或S
X6是S、Q或T,和
共有序列(II)
Z1Z2(Z3A)nZ4Z5Z6
其中
Z1是S、Q、N、T或G
Z2不是氨基酸或为A
Z3是A或G
Z4为不是氨基酸、为A或S
Z5是G、S、Q、N或T
Z6是G、P、S、Q、N或T
n是天然的整数,其中2≤n≤12。
2.根据权利要求1的重复蛋白,包含10-30个重复单元。
3.根据权利要求1的重复蛋白,包含重复单元PGSSAAAAAAAASGPGQGQGQGQGQGGRPSDTYG。
4.根据权利要求1的重复蛋白,包含重复单元SAAAAAAAAGPGGGNGGRPSDTYGAPGGGNGGRPSSSYG。
5.根据权利要求1的重复蛋白,其中所述蛋白质包含氨基酸序列SEQID NO:2或4。
6.编码根据权利要求1-5的任一项的重复蛋白的核酸序列。
7.包含权利要求6的核酸序列的宿主生物体。
8.产生根据权利要求1-5的任一项的重复蛋白的过程,其中通过根据权利要求7的宿主生物体产生该蛋白质,随后分离。
9.根据权利要求1-5的任一项的重复蛋白在化妆品中的用途。
10.根据权利要求1-5的任一项的重复蛋白用于活性物质和效应子配方的用途。
11.根据权利要求1-5的任一项的重复蛋白用于精制纸、皮革和织物的用途。
12.根据权利要求1-5的任一项的重复蛋白用于表面涂料的用途。
13.根据权利要求1-5的任一项的重复蛋白在人和动物营养中的用途。
CN2008800208106A 2007-06-20 2008-06-16 合成的重复蛋白及其生产和用途 Expired - Fee Related CN101855239B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP07110696 2007-06-20
EP07110696.7 2007-06-20
PCT/EP2008/057526 WO2008155304A1 (de) 2007-06-20 2008-06-16 Synthetische repetitive proteine, deren herstellung und verwendung

Publications (2)

Publication Number Publication Date
CN101855239A true CN101855239A (zh) 2010-10-06
CN101855239B CN101855239B (zh) 2013-11-06

Family

ID=39739577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008800208106A Expired - Fee Related CN101855239B (zh) 2007-06-20 2008-06-16 合成的重复蛋白及其生产和用途

Country Status (9)

Country Link
US (1) US8367803B2 (zh)
EP (1) EP2164864B1 (zh)
JP (1) JP5743542B2 (zh)
CN (1) CN101855239B (zh)
AU (1) AU2008265231B2 (zh)
CA (1) CA2690658C (zh)
ES (1) ES2530190T3 (zh)
IL (1) IL202327A (zh)
WO (1) WO2008155304A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112399861A (zh) * 2018-07-18 2021-02-23 保尔特纺织品公司 在极性非水性溶剂中的交联的弹性体蛋白质及其用途

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2008265231B2 (en) * 2007-06-20 2014-05-01 Basf Se Synthetic repetitive proteins, the production and use thereof
CN102176905A (zh) * 2008-08-08 2011-09-07 巴斯夫欧洲公司 具有受控释放的活性成分的含活性成分的纤维层状结构,其用途及其生产方法
EP2328567A2 (de) * 2008-08-08 2011-06-08 Basf Se Wirkstoffhaltige fasernflächengebilde auf basis von biopolymeren, ihre anwendungen und verfahren zu ihrer herstellung
NZ596735A (en) 2009-06-03 2013-10-25 Basf Se Recombinant production of peptides
JP5889199B2 (ja) 2009-11-30 2016-03-22 アーエムシルク ゲーエムベーハー 化合物の制御送達及び持続送達のためのシルク粒子
US9217017B2 (en) 2009-12-08 2015-12-22 Amsilk Gmbh Silk protein coatings
WO2011113446A1 (en) 2010-03-17 2011-09-22 Amsilk Gmbh Method for production of polypeptide containing fibres
US8877903B2 (en) 2010-03-31 2014-11-04 Amsilk Gmbh Separation of insoluble target proteins
EP2609109A2 (de) 2010-08-26 2013-07-03 Basf Se Verfahren zur herstellung hochkonzentrierter lösungen von selbstassemblierenden proteinen
DE102011105372A1 (de) 2011-06-20 2012-12-20 Carl Freudenberg Kg Stabile, wässrige Protein-Lösung oder Protein-Dispersion, Verfahren zur Herstellung der stabilen, wässrigen Lösung oder Dispersion und Verfahren zur Herstellung von Form-oder Flächengebilden, Imprägnierungen oder Beschichtungen aus der stabilen, wässrigen Protein-Lösung oder Protein-Dispersion sowie deren Verwendung
DE102011105369A1 (de) 2011-06-20 2012-12-20 Carl Freudenberg Kg Stabile, wässrige Protein-Lösung oder Protein-Dispersion, Verfahren zur Herstellung der stabilen, wässrigen Lösung oder Dispersion und Verfahren zur Herstellung von Form- oder Flächengebilden, Imprägnierungen oder Beschichtungen aus der stabilen, wässrigen Protein-Lösung oder Protein-Dispersion sowie deren Verwendung
EP2885015B1 (en) 2012-08-17 2022-09-28 AMSilk GmbH Use of self-assembling polypeptides as tissue adhesives
US10072152B2 (en) 2012-09-06 2018-09-11 Amsilk Gmbh Methods for producing high toughness silk fibres
WO2015178466A1 (ja) 2014-05-21 2015-11-26 味の素株式会社 フィブロイン様タンパク質の製造法
JP7001345B2 (ja) * 2017-01-17 2022-02-03 マクセルフロンティア株式会社 回折レンズおよびそれを用いた車載用灯具

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0707645B1 (en) * 1993-06-15 2003-11-05 E.I. Du Pont De Nemours And Company Novel, recombinantly produced spider silk analogs
DE19626762A1 (de) 1996-07-03 1998-01-08 Basf Ag Enzymatisch spaltbare Linker für Festphasensynthesen
EP2284195A1 (en) * 2001-09-18 2011-02-16 Carnegie Institution Of Washington Fusion proteins useful for detecting analytes
US7060260B2 (en) 2003-02-20 2006-06-13 E.I. Du Pont De Nemours And Company Water-soluble silk proteins in compositions for skin care, hair care or hair coloring
US7297678B2 (en) * 2003-03-12 2007-11-20 Genencor International, Inc. Use of repeat sequence protein polymers in personal care compositions
CA2524710C (en) * 2003-05-14 2012-07-31 Dow Corning Corporation Controlled release of active agents utilizing repeat sequence protein polymers
AU2003902474A0 (en) * 2003-05-21 2003-06-05 Commonwealth Scientific And Industrial Research Organisation A bioelastomer i
AU2003902483A0 (en) 2003-05-21 2003-06-05 Commonwealth Scientific And Industrial Research Organisation A bioelastomer ii
US8030024B2 (en) * 2004-06-25 2011-10-04 Amsilk Gmbh Synthesis of spider dragline and/or flagelliform proteins
EP1609801A1 (en) * 2004-06-25 2005-12-28 Technische Universität München Proteins of natural origin and materials made therefrom
DK1773875T3 (en) * 2004-07-22 2014-12-15 Amsilk Gmbh RECOMBINANT spider silk
EP1815246A4 (en) * 2004-10-14 2009-12-16 Carnegie Inst Of Washington DEVELOPING SENSORS SENSITIVE TO FLUORESCENCE ENERGY RESONANCE TRANSFER (FRET) AND METHODS OF USING THE SAME
DE602005002654T2 (de) * 2005-08-01 2008-06-19 Technische Universität München Prozess zur Herstellung von Nano- und Mikrokapseln aus Spinnenseidenprotein
CA2619917C (en) * 2005-08-29 2013-04-23 Technische Universitaet Muenchen Modified spider silk proteins
DE102005043609A1 (de) * 2005-09-13 2007-03-22 Technische Universität München Verfahren und Vorrichtung zur Herstellung eines Fadens aus Seidenproteinen
EP1787995A1 (en) * 2005-11-17 2007-05-23 Technische Universität München Recombinant mussel byssus protein
CA2630903A1 (en) * 2005-11-24 2007-12-27 Basf Se Keratin-binding effector molecules, and method for the production thereof
US20090099075A1 (en) * 2005-11-24 2009-04-16 Basf Se Chimeric Keratin-Binding Effector Proteins
EP1968642A2 (de) * 2005-11-24 2008-09-17 Basf Se Keratinbindende effektormoleküle und verfahren zu deren herstellung durch kopplung keratinbindender polypeptide mit carboxylgruppen oder sulfonsäuregruppen tragenden effektormolekülen
CA2638870A1 (en) * 2006-01-20 2007-07-26 Basf Se Use of protein microbeads in cosmetics
EP1852470A1 (en) * 2006-05-03 2007-11-07 Technische Universität München Multilayer Silk Protein Films
WO2007141131A1 (en) * 2006-06-08 2007-12-13 Technische Universitaet Muenchen Microfluidic device for controlled aggregation of spider silk
WO2008055931A1 (de) * 2006-11-08 2008-05-15 Basf Se Verwendung von natürlichen, rekombinanten und synthetischen resilinen in der kosmetik
AU2008265231B2 (en) * 2007-06-20 2014-05-01 Basf Se Synthetic repetitive proteins, the production and use thereof
CN101903011B (zh) * 2007-12-21 2014-08-06 巴斯夫欧洲公司 含肽的抗头皮屑组合物
CN102176905A (zh) * 2008-08-08 2011-09-07 巴斯夫欧洲公司 具有受控释放的活性成分的含活性成分的纤维层状结构,其用途及其生产方法
EP2328567A2 (de) * 2008-08-08 2011-06-08 Basf Se Wirkstoffhaltige fasernflächengebilde auf basis von biopolymeren, ihre anwendungen und verfahren zu ihrer herstellung

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112399861A (zh) * 2018-07-18 2021-02-23 保尔特纺织品公司 在极性非水性溶剂中的交联的弹性体蛋白质及其用途
US12268275B2 (en) 2018-07-18 2025-04-08 Bolt Threads, Inc. Cross-linked elastomeric proteins in polar nonaqueous solvents and uses thereof

Also Published As

Publication number Publication date
IL202327A0 (en) 2011-08-01
ES2530190T3 (es) 2015-02-27
US20100216189A1 (en) 2010-08-26
EP2164864A1 (de) 2010-03-24
US8367803B2 (en) 2013-02-05
WO2008155304A1 (de) 2008-12-24
EP2164864B1 (de) 2014-12-03
JP2010530231A (ja) 2010-09-09
AU2008265231A1 (en) 2008-12-24
CA2690658A1 (en) 2008-12-24
JP5743542B2 (ja) 2015-07-01
AU2008265231B2 (en) 2014-05-01
IL202327A (en) 2015-05-31
CN101855239B (zh) 2013-11-06
CA2690658C (en) 2016-08-09

Similar Documents

Publication Publication Date Title
CN101855239B (zh) 合成的重复蛋白及其生产和用途
Zhang et al. Formation of silk fibroin nanoparticles in water-miscible organic solvent and their characterization
FI108727B (fi) Menetelmä oikein sitoutuneet kystiinisillat omaavan proinsuliinin saamiseksi
JP5980679B2 (ja) 絹ドープを製造するプロセス
JP2004534137A (ja) ケラチン系製品およびその製造方法
JP2009515540A (ja) コラーゲン類似組み換えタンパク質の製造
CN111333715B (zh) 一种类i型胶原蛋白纤维的制备方法
CN113150075B (zh) 一种环状聚精氨酸穿膜肽分子及其合成方法和应用
MXPA01011561A (es) Deshidratacion rapida de proteinas.
KR20040077553A (ko) 견 단백질로부터 세포 생육 펩티드의 추출과 이용
CN113512094A (zh) 一种共价光交联多肽、共价光交联多肽自组装形成的胶原蛋白仿生材料
WO2004044172A2 (en) A method for purifying and recovering silk proteins in soluble form and uses thereof
WO2013120143A1 (en) Method of promoting the formation of cross-links between coiled coil silk proteins
CN110294793B (zh) Sumo荧光探针及其制备方法
KR100335702B1 (ko) 실크펩타이드 및 그 제조방법
JP3762991B2 (ja) アミノ酸吸着材およびアミノ酸の回収方法
CN113773397B (zh) 一种德谷胰岛素的制备方法
JP3393379B2 (ja) アミノ酸吸着材およびアミノ酸の回収方法
CN113527517A (zh) 一种犹素探针的合成方法
KR20170120810A (ko) 실리카 합성을 위한 재조합 단백질 및 이의 용도
CN108070021B (zh) 可组装成高度有序纳米纤维的小分子肽及组装构建高度有序纳米纤维的方法
JP2000045182A (ja) 抗菌性繊維および繊維・皮革用抗菌加工剤
CN114181993B (zh) 产生基于类泛素或泛素蛋白的生化工具的方法
JP2657694B2 (ja) 化学修飾酵素ならびにペプチド合成方法
Liu et al. Resource Utilization of Bovine Hair Recycling from Enzymatic Unhairing during Leather Manufacturing: Alkali-Protease Synergistic Preparation of Keratin and its in Vitro Antioxidant Activity

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20131106

Termination date: 20190616