[go: up one dir, main page]

CN101238222B - 作为2型糖尿病风险诊断标记物的tcf7l2基因的遗传变异体 - Google Patents

作为2型糖尿病风险诊断标记物的tcf7l2基因的遗传变异体 Download PDF

Info

Publication number
CN101238222B
CN101238222B CN2006800221296A CN200680022129A CN101238222B CN 101238222 B CN101238222 B CN 101238222B CN 2006800221296 A CN2006800221296 A CN 2006800221296A CN 200680022129 A CN200680022129 A CN 200680022129A CN 101238222 B CN101238222 B CN 101238222B
Authority
CN
China
Prior art keywords
tcf7l2
diabetes
type
nucleic acid
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006800221296A
Other languages
English (en)
Other versions
CN101238222A (zh
Inventor
斯特鲁安·F·A·格兰特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Decode Genetics ehf
Original Assignee
Decode Genetics ehf
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Decode Genetics ehf filed Critical Decode Genetics ehf
Publication of CN101238222A publication Critical patent/CN101238222A/zh
Application granted granted Critical
Publication of CN101238222B publication Critical patent/CN101238222B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/08Drugs for disorders of the metabolism for glucose homeostasis
    • A61P3/10Drugs for disorders of the metabolism for glucose homeostasis for hyperglycaemia, e.g. antidiabetics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • C12N15/1006Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Microbiology (AREA)
  • Diabetes (AREA)
  • Biomedical Technology (AREA)
  • Endocrinology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Emergency Medicine (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Hematology (AREA)
  • Obesity (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

关联分析显示基因TCF7L2多态性是II型糖尿病的易感基因。本文描述了糖尿病易感性的诊断方法,糖尿病易感性降低的诊断方法和预防糖尿病的方法,以及II型糖尿病的治疗方法。

Description

作为2型糖尿病风险诊断标记物的TCF7L2基因的遗传变异体
发明背景
糖尿病,一种糖利用减少、脂和蛋白利用增加的代谢疾病,由胰岛素的绝对或者相对缺乏引起。在更严重的情况下,糖尿病的特点在于长期高血糖,糖尿,水和电解质损失,酮酸中毒和昏迷。长期并发症包括神经病变、视网膜病、肾病、大小血管全身退行性病变的发展和感染易感性的增加。糖尿病最常见的类型是II型,非胰岛素依赖型糖尿病,其特征在于高血糖由受损的胰岛素分泌和靶组织中胰岛素抵抗造成。遗传和环境因素都对这种疾病有作用。例如,肥胖在疾病发展过程中起着重要作用。II型糖尿病经常是渐进发病糖尿病的温和形式。
II型糖尿病对健康的影响是巨大的。在1995年,全球范围内存在1亿3500万成年糖尿病患者。预计在2025年接近3亿人将患有糖尿病(King H.,等人,Diabetes Care,21(9):1414-1431(1998))。在冰岛,成年群体中II型糖尿病的患病率是2.5%(Vilbergsson,S.,等人,Diabet.Med.,14(6):491-498(1997)),这包括大约5,000个年龄在34岁以上患有这种疾病的人。这种疾病的高患病率和增加的患病人口数目显示,更精确界定涉及II型糖尿病的遗传因素以定义相关风险系数的医疗需要还没有得到满足。还需要用于预防II型糖尿病的治疗剂。
发明概述
本发明涉及通过评估某些与TCF7L2基因(转录因子7-样2(T-细胞特定的,HMG-盒),过去称为TCF4基因(T-细胞转录因子4))有关的标记物或者单倍型,诊断II型糖尿病易感性增加的方法,以及诊断II型糖尿病易感性降低或者诊断对II型糖尿病的防护的方法。该方法包括检测与TCF7L2基因外显子4LD块相关的遗传标记物。
第一个方面,本发明涉及在个体中诊断II型糖尿病易感性的方法,包括对从个体获得的核酸样品进行与TCF7L2外显子4LD块相关的标记物或者单倍型的分析,其中标记物或者单倍型的存在指示II型糖尿病易感性。在一个实施方式中,标记物或者单倍型包括至少一种选自表6所列的标记物。在另一种实施方式中,标记物或者单倍型是标记物。
在一个优选的实施方式中,标记物或者单倍型指示II型糖尿病易感性的增加。易感性增加存在于一个实施方式中,表征为相对危险度至少为1.2,包括相对危险度至少为1.3和相对危险度至少为1.4。在一个实施方式中,标记物选自DG10S478,rs12255372,rs7895340,rs11196205,rs7901695,rs7903146,rs12243326,和rs4506565,其中DG10S478的非-0等位基因(例如,-4,4,8,12,16,20,或者其他非-0等位基因),rs12255372的T等位基因;rs7895340的A等位基因;rs11196205的C等位基因;rs7901695的C等位基因rs7903146的T等位基因;rs12243326的C等位基因;或者rs4506565的T等位基因的存在,指示II型糖尿病易感性的增加。在一个优选的实施方式中,标记物选自DG10S478和rs7903146,其中DG10S478的非-0等位基因或者rs7903146的T等位基因的存在指示II型糖尿病易感性的增加。在另一个优选的实施方式中,标记物是rs7903146,其中rs7903146的T等位基因的存在指示II型糖尿病易感性的增加。
在另一个优选的实施方式中,标记物或者单倍型指示II型糖尿病易感性降低。易感性的降低存在于一个实施方式中,表征为相对危险度小于0.8,包括相对危险度小于0.7。在一个实施例中,标记物选自DG10S478,rs12255372,rs7895340,rs11196205,rs7901695,rs7903146,rs12243326,和rs4506565,其中DG10S478的0等位基因,SNPrs12255372的G等位基因;rs7895340的G等位基因;rs11196205的G等位基因rs7901695的T等位基因;rs7903146的C等位基因;rs12243326的T等位基因;或者rs4506565的A等位基因的存在,指示II型糖尿病易感性降低。在一个优选的实施方式中,标记物是DG10S478,其中DG10S478的0等位基因的存在指示II型糖尿病易感性降低。在另一个优选的实施方式中,标记物是rs7903146,其中rs7903146的C等位基因的存在指示II型糖尿病易感性降低。
第二个方面,本发明涉及一种分析来自个体的样品以检测II型糖尿病易感性的试剂盒,其中所述试剂盒包括用于检测与TCF7L2外显子4LD块相关的一种或者多种标记物一或者多种的试剂。在一个实施方式中,一种或者多种试剂包括至少一种连续核苷酸序列,所述核苷酸序列与包括至少一种标记物的区域完全互补,所述标记物与TCF7L2外显子4LD块相关。在一个实施方式中,一或者多种标记物选自DG10S478,rs 12255372,rs7895340,rs11196205,rs7901695,rs7903146,rs12243326,和rs4506565。在一个优选的实施方式中,一或者多种标记物是DG10S478或者rs7903146。在另一个优选的实施方式中,标记物是rs7903146的C等位基因。
另一方面,本发明涉及一种评定个体对TCF7L2治疗剂反应可能性的方法,包括:检测与TCF7L2外显子4LD块相关的标记物,其中所述标记物存在指示对TCF7L2治疗剂阳性反应的可能性。在一个实施方式中,标记物选自DG10S478,rs12255372,rs7895340,rs11196205,rs7901695,rs7903146,rs12243326,和rs4506565。在另一个实施方式中,标记是标记物DG10S478或者标记物rs7903146,其中DG10S478的非-0等位基因或者rs7903146的T等位基因的存在指示对TCF7L2治疗剂阳性反应的可能性。
本发明的另一个方面涉及利用TCF7L2治疗剂制备治疗II型糖尿病的药物。在一个实施方式中,TCF7L2治疗剂是一种改变Wnt信号途径或者钙粘蛋白途径中活性的药剂。在另一个实施例中,TCF7L2治疗剂是一种选自药剂表中所列的组中的药剂。
附图简述
根据下列对本发明优选实施例更详细的说明,本发明的上述和其他目标、特征和优点将更容易理解。
图1描述了在HapMap project Build 16中感兴趣的TCF7L2区域相对SNPs的连锁不平衡(LD)。215.9kb基因跨越7个LD块,如黑色箭头示意图所示(根据NCBI RefSeq),箭头显示转录的方向;外显子被标识,外显子4被加亮。DG10S478位于染色体10上TCF7L2基因内含子3内的114.46Mb(NCBI Build 34),在包括内含子3的一部分、外显子4的全部和内含子4的一部分的74.9kb块内(此处称为″TCF7L2外显子4LD块″)。等距而不是根据其物理位置绘制SNP标记物的曲线。图显示LD的两个检测值-即D′(图左上部分)和r2(右下部分)。
发明详述
下面是本发明优选实施方式的说明。
与II型糖尿病相关的基因座
II型糖尿病的特点在于高血糖,这可能通过例如受损的胰岛素分泌、周边组织中胰岛素抵抗和肝脏中增加的葡萄糖排出等机制发生。大多数II型糖尿病患者患有长期高血糖的严重并发症,包括肾病、神经病变、视网膜病和心血管疾病的加速发展。当前世界范围II型糖尿病的患病率是6%,但预计在未来十年将会上升(1)。II型糖尿病患病率的这种增加归因于人口年龄的增加和肥胖的上升。
有证据说明遗传组分与患II型糖尿病风险有关,包括不同种族的组间患病率的差异(2,3),单卵双生比异卵双生双胞胎更高的同病率(4,5)和欧洲人群中II型糖尿病的同胞(sibling)相对危险度(λs)大约为3.5(6)。
迄今为止存在两种用于寻找II型糖尿病相关基因的方法。候选基因内的单核苷酸多态性(SNPs)已经被用于检测相关性,并且通常,不被复制或者只造成II型糖尿病轻型风险-最广泛报道的是过氧物酶体增殖物激活的受体gamma基因(PPARG2)中保护性的Pro 12AIa多态性(7)和内向矫正性钾通道,亚族J,成员11基因(KIR6.2)的风险多态性(8)。
在患有常见型II型糖尿病家族中进行基因组范围的连锁扫描已经得到几个基因座,国际科研社团的主要注意力集中于许多人群中观察到的染色体1、12和20上的基因座(6)。这些基因座内的基因还有待发掘。但是,在墨西哥裔美国人中,从染色体2q的基因座分离出钙蛋白酶10(CAPN10)基因;这代表迄今为止通过位置克隆鉴定的与常见型II型糖尿病有关的唯一基因(9)。罕见的孟德尔型II型糖尿病,即青年发病的成人型糖尿病(MODY),通过位置克隆获得6个基因(6)。
我们过去报道了在冰岛人群中染色体5q与II型糖尿病基因组范围的显著连锁(10);在相同的研究中,我们还报道与10q和12q连锁的指示性证据。在墨西哥裔美国人中也观察到与10q区域的连锁(11)。
与II型糖尿病相关的转录因子7-样2基因(TCF7L2)
本发明涉及编码T-细胞转录因子4(TCF4-官方基因命名TCF7L2)基因内II型糖尿病相关LD块(“TCF7L2外显子4LD块”)的鉴定。TCF7L2外显子4LD块内的几个标记物,包括微卫星DG10S478和SNP标记物rs7903146和rs12255372,已经被发现与II型糖尿病有关。最先在冰岛群体中发现DG10S478相关性(P=1.3×10-9;相对危险度=1.45;人群归因危险度=22.7%)的原始观察,随后在丹麦II型糖尿病群体和美国白种人群体中得到重复。DG10S478位于10q25.2上TCF7L2基因的内含子3中,在明确限定的74.9kb LD块内,所述LD块包含内含子3的一部分,外显子4的全部和内含子4的一部分。TCF7L2基因产物是一种包含高迁移率族(HMG)盒的转录因子,它在Wnt信号途径亦称为APC3/β-连环蛋白/TCF途径中起作用。通过Wnt途径成员β-连环蛋白和糖原合酶激酶-3beta,TCF7L2介导胰高血糖素原基因表达(血液葡萄糖稳态中的关键成员)细胞类型-特定的调节(12)。此外,通过抑制生脂转录因子CCAAT/增强子结合蛋白alpha(C/EBPalpha)和过氧物酶体增殖物激活的受体gamma(PPARgamma),Wnt信号维持前成脂肪细胞在未分化状态(13)。当前成脂肪细胞中的Wnt信号被显性失活TCF7L2的过表达阻止时,这些细胞分化成脂肪细胞(13)。此外,有报道称,通过与结肠癌细胞中的β-连环蛋白和TCF7L2的物理相互作用,Wnt/β-连环蛋白信号途径以PPARgamma活性作为靶标(14)。多功能β-连环蛋白对通过结合钙粘蛋白介导细胞粘着也很重要(15)。
作为这些发现的结果,现在已有II型糖尿病易感性的诊断方法,以及II型糖尿病易感性降低的诊断方法和/或对II型糖尿病的防护的方法。在本发明优选的实施方式中,诊断方法用于鉴定特定等位基因的存在,包括标记物DG10S478的0等位基因(与II型糖尿病易感性降低相关,是保护性抵抗II型糖尿病的等位基因);标记物DG10S478的非-0等位基因(例如,-4,4,8,12,16或者20,或者其他等位基因)(与II型糖尿病易感性相关);SNP rs12255372的G等位基因(与II型糖尿病易感性降低相关,是保护性抵抗II型糖尿病的等位基因);SNP rs12255372的T等位基因(与II型糖尿病易感性相关);SNPrs7895340的G等位基因(与II型糖尿病易感性降低相关,是保护性抵抗II型糖尿病的等位基因);SNP rs7895340的A等位基因(与II型糖尿病易感性相关);SNP rs11196205的G等位基因(与II型糖尿病易感性降低相关,是保护性抵抗II型糖尿病的等位基因);SNPrs11196205的C等位基因(与II型糖尿病易感性相关);SNP rs7901695的T等位基因(与II型糖尿病易感性降低相关,是保护性抵抗II型糖尿病的等位基因);SNP s7901695的C等位基因(与II型糖尿病易感性相关);SNPrs7903146的C等位基因(与II型糖尿病易感性降低相关,是保护性抵抗II型糖尿病的等位基因);SNP rs7903146的T等位基因(与II型糖尿病易感性相关);SNP rs12243326的C等位基因(与II型糖尿病易感性相关);和SNP rs4506565的T等位基因(与II型糖尿病易感性相关)。在本发明的其他实施方式中,利用本文所述的方法鉴定的其他标记物或者SNPs,可用于II型糖尿病易感性的诊断,还可用于II型糖尿病易感性降低的诊断或者用于鉴定保护性抵抗II型糖尿病的等位基因。下面介绍的诊断分析方法可用于鉴定这些特定特定等位基因的存在或者缺失。
诊断分析
诸如本文所述的那些核酸、探针、引物和抗体可用于II型糖尿病易感性的各种诊断方法,以及试剂盒(例如,用于II型糖尿病易感性的诊断)。类似地,本文所述的核酸、探针、引物和抗体可用于II型糖尿病易感性降低的各种诊断方法,以及保护性抵抗II型糖尿病的诊断方法和试剂盒。一方面,试剂盒包括可用于扩增感兴趣的标记物的引物。
在本发明的一个方面,通过检测本文所述的TCF7L2核酸的多态性(例如,标记物DG10S478或者SNP rs12255372,rs7895340,rs11196205,rs7901695,rs7903146,rs12243326,rs4506565内的等位基因),进行II型糖尿病易感性的诊断。多态性可以是TCF7L2核酸的改变,例如单个核苷酸或者不止一个核苷酸的插入或者缺失,导致移码;至少一个核苷酸的改变,导致编码的氨基酸的改变;至少一个核苷酸的改变,导致终止密码子的提前产生;几个核苷酸的缺失,导致核苷酸编码的一个或者多个氨基酸的缺失;一个或者几个核苷酸的插入,例如通过不等重组或者基因转换,导致基因编码序列的中断;全部或者部分基因的重复;全部或者部分基因的转座;或者全部或者部分基因的重排。单个基因可以存在不止一种的这类改变。这类序列改变引起TCF7L2核酸编码多肽的差异。例如,如果差异是移码改变,移码可能导致编码氨基酸的改变,和/或可能导致终止密码子的提前产生,产生截短多肽。此外,与疾病或者病症相关的多态性,或者对与TCF7L2核酸相关的疾病或者病症相关的易感性,可能是一个或者多个核苷酸的同义突变(即,不导致TCF7L2核酸编码多肽改变的突变)。这类多态性可以改变剪接位点,影响mRNA的稳定性或者转运,或者影响基因的转录或者翻译。具有上述任意改变或者突变的TCF7L2核酸在此处被称为“突变的核酸”。
在诊断II型糖尿病易感性的第一种方法中,可以使用杂交方法,例如Southern分析,Northern分析或者原位杂交(参见Current Protocolsin Molecular Biology,Ausubel,F.等人,eds,John Wiley & Sons,包括1999年所有增引)。例如,来自待测患者(“待测个体”)基因组DNA、RNA或者cDNA的生物样品(“待测样品”),取自个体(RNA和cDNA只能用于外显子标记物),例如怀疑患有II型糖尿病、对II型糖尿病敏感或者易感,或者携带II型糖尿病缺陷的个体。个体可能是成年人,儿童,或者胎儿。待测样品可以来自任何来源,包括基因组DNA,例如血液样品,羊水样品,脑脊液样品,或者皮、肌肉、口腔或者结膜粘膜、胎盘、胃肠道或者其他器官的组织样品。通过适当方法,例如通过羊膜穿刺术或者绒膜绒毛取样,可以获得来自胎儿细胞或者组织的DNA待测样品。然后检测DNA、RNA或者cDNA样品,确定TCF7L2核酸是否存在多态性,和/或确定存在何种TCF7L2编码的剪接变体。通过基因组DNA、RNA或者cDNA内基因与核酸探针的杂交,可以显示多态性或者剪接变体的存在。此处使用的“核酸探针”,可以是DNA探针或者RNA探针;核酸探针可以包含,例如至少一个TCF7L2核酸多态性和/或包含编码TCF7L2核酸特定剪接变体的核酸。探针可以是上述任意的核酸分子(例如,基因或者核酸,片段,包括基因或者核酸的载体,探针或者引物,等等)。
为诊断II糖尿病型的易感性,将包含TCF7L2核酸的待测样品与至少一种核酸探针接触,形成杂交样品。优选的检测mRNA或者基因组DNA的探针是能够与本文所述的mRNA或者基因组DNA序列杂交的标记核酸探针。核酸探针可以是,例如,全长核酸分子,或者其一部分,例如长度至少为15、30、50、100、250或者500个核苷酸并且在严谨条件下能够与合适的mRNA或者基因组DNA特定杂交的寡聚核苷酸。用于本发明诊断方法的合适探针如上所述(参见例如,在标题“本发明的核酸”下描述的探针和引物)。
杂交样品保存在允许核酸探针与TCF7L2核酸特定杂交的条件下。此处使用的“特定杂交”表示准确杂交(例如,没有错配)。特定杂交可以在高度严谨条件或者中度严谨条件下进行,例如上面所述。在特别优选的方面,用于特定杂交的杂交条件是高严谨性。
如果存在特定杂交,则利用标准方法检测。如果核酸探针和待测样品的TCF7L2核酸之间发生特定杂交,则TCF7L2具有多态性,或者是存在于核酸探针中的剪接变体。在该方法中可以同时使用不止一个核酸探针。任意一个核酸探针的特定杂交指示TCF7L2核酸的多态性,或者编码特定剪接变体的TCF7L2核酸的存在,可用于诊断II型糖尿病易感性,或者用于诊断II型糖尿病易感性的降低(或者指示抵抗II型糖尿病的保护性等位基因)。
在Northern分析(参见Current Protocols in Molecular Biology,Ausubel,F.等人,eds.,John Wiley & Sons,supra)中,上述杂交方法被用于鉴定多态性或者特定剪接变体的存在,所述多态性或者特定剪接变体与II型糖尿病易感性相关或者与II型糖尿病易感性降低相关。对Northern分析,RNA待测样品通过适当方法取自个体。如上所述的核酸探针与个体RNA的特定杂交提示TCF7L2核酸的多态性,或者TCF7L2核酸编码的特定剪接变体的存在,因此可用于诊断II型糖尿病易感性,或者II型糖尿病易感性的降低(或者指示抵抗II型糖尿病的保护性等位基因)。
使用核酸探针的典型实例,参见,例如,美国专利号5,288,611和4,851,330。
此外,在上述杂交方法中可使用肽核酸(PNA)探针替代核酸探针。PNA是一种DNA模拟物,具有肽-样无机骨架,例如N-(2-氨基乙基)甘氨酸单位,一种有机碱(A,G,C,T或者U)通过甲叉羰基接头与甘氨酸上的氮连接(参见,例如,Nielsen,P.E.等人,BioconjugateChemistry 5,American Chemical Society,p.1(1994))。可以设计PNA探针与TCF7L2核酸特定杂交。PNA探针与TCF7L2核酸的杂交可以用于诊断II型糖尿病的易感性或者II型糖尿病易感性的降低(或者指示抵抗II型糖尿病的保护性等位基因)。
在本发明的另一种方法中,如果基因的改变(突变)或者多态性导致限制性内切位点的产生或者消失,利用限制性消化的突变分析可用于检测基因突变。包括基因组DNA的待测样品从个体获得。聚合酶链式反应(PCR)可用于扩增来自待测个体测试样品基因组DNA中的TCF7L2核酸(和,必要时,侧翼序列)。按所述(参见Current Protocolsin Molecular Biology,supra)进行RFLP分析。相关DNA片段的消化模式提示TCF7L2核酸突变或者多态性的存在或者缺失,因此指示II型糖尿病易感性或者II型糖尿病易感性降低(或者指示抵抗II型糖尿病的保护性等位基因)的存在或者缺失。
也可以用序列分析检测TCF7L2核酸的特定多态性。DNA或者RNA待测样品取自待测个体。如果需要,也可以用PCR或者其他合适的方法扩增基因或者核酸,和/或其侧翼序列。利用标准方法检测TCF7L2核酸序列,或者核酸的片段,或者cDNA,或者cDNA的片段,或者mRNA,或者mRNA的片段。根据情况,将核酸,核酸片段,cDNA,cDNA片段,mRNA或者mRNA片段的序列与基因或者cDNA或者mRNA的已知核酸序列比较。TCF7L2多态性的存在指示个体具有II型糖尿病易感性或者II型糖尿病易感性的降低(或者指示抵抗II型糖尿病的保护性等位基因)。
通过利用扩增寡聚核苷酸与等位基因-特定寡聚核苷酸(ASO)探针的斑点杂交,也可以使用等位基因-特定寡聚核苷酸检测TCF7L2核酸多态性的存在(参见,例如,Saiki,R.等人,Nature 324:163-166(1986))。“等位基因-特定寡聚核苷酸”(此处也称为“等位基因-特定寡聚核苷酸探针”)是大约10-50碱基对的寡聚核苷酸,优选的大约15-30碱基对,所述寡聚核苷酸与TCF7L2核酸特定杂交,并且包括与II型糖尿病易感性相关的多态性或者与II型糖尿病易感性降低(或者指示抵抗II型糖尿病保护性等位基因)相关的多态性。利用标准方法(参见Current Protocols in Molecular Biology,supra)可以制备对特定TCF7L2核酸多态性特定的等位基因-特定寡聚核苷酸探针。为鉴定与II型糖尿病相关基因的多态性,从个体获得DNA待测样品。PCR可用于扩增TCF7L2核酸及其侧翼序列的全部或者片段。利用标准方法(参见Current Protocols in Molecular Biology,supra),包括扩增TCF7L2核酸(或者基因或者核酸的片段)的DNA被斑点印迹,斑点与寡聚核苷酸探针接触。然后检测探针与扩增的TCF7L2核酸特定杂交的存在。等位基因-特定寡聚核苷酸探针与个体DNA的杂交提示TCF7L2核酸多态性,因此指示II型糖尿病易感性或者指示II型糖尿病易感性的降低(或者指示抵抗II型糖尿病的保护性等位基因)。
本发明还提供与基因或者核酸的对照或者变异等位基因杂交的等位基因-特定寡聚核苷酸,所述基因或者核酸包括单核苷酸多态性或者与其互补。这些寡聚核苷酸可以是探针或者引物。
等位基因-特定引物与靶DNA重叠多态性的位点杂交,只起始引物显示完全互补的等位基因形式的扩增。参见Gibbs,Nucleic Acid Res.17,2427-2448(1989)。这种引物与第二引物联用,所述第二引物在远端位点杂交。扩增起始于两个引物,产生可检测的产物,这提示存在特定等位基因形式。通常用第二对引物作为对照,其中一个在多态性位点显示单个碱基错配,另一个显示与远端位点的完全互补。单碱基错配阻止扩增,没有可检测的产物形成。当错配包括在与多态性比对的寡聚核苷酸的3′-最远端位置内,这种方法最适用,因为这个位置对从引物延伸是最具不稳定作用的(参见,例如,WO93/22456)。
通过添加这种类似物作为锁核酸(LNAs),引物和探针的大小可以减少到只有8个碱基。LNAs是双环DNA类似物一个新的类型,其中呋喃糖环的2′和4′位置通过O-甲叉(氧-LNA),S-甲叉(硫-LNA)或者氨基甲叉(氨基-LNA)基团连接。所有这些LNA变异体的共同点是对互补核酸的亲和力,据报道迄今为止这是DNA类似物中最高的。例如,在分别与互补DNA或者RNA的复合物中,特定的所有氧-LNA九聚物分别具有64EC和74EC的熔解温度,与此相对,相应DNA九聚物的DNA和RNA的熔解温度均是28EC。当LNA单体与标准DNA或者RNA单体联用时,Tm也有显著增加。对于引物和探针,根据在何处包括LNA单体(例如,3′端,5′端,或者在中间),Tm可以显著增加。
另一方面,与个体靶核酸序列片段互补的寡聚核苷酸探针的阵列可用于鉴定TCF7L2核酸多态性。例如,一方面,可以使用寡聚核苷酸阵列。寡聚核苷酸阵列通常包括大量不同的寡聚核苷酸探针,所述探针偶联在底物表面不同的已知位置。这些寡核苷酸阵列,也称为“GenechipsTM”,在本领域中被广泛描述,例如美国专利号5,143,854和PCT专利公开号WO 90/15070和92/10092。通常利用机械合成法或者光导向的合成法,包括照相平版印刷方法和固相寡聚核苷酸合成法的组合,可以产生这些阵列。参见Fodor等人,Science 251:767-777(1991),Pirrung等人,美国专利号5,143,854(还可参见PCT申请号WO 90/15070)和Fodor等人,PCT公开号WO 92/10092和美国专利号5,424,186,所有教导在此引入作为参考。利用机械合成法合成这些阵列的技术描述于,例如美国专利号5,384,261;所有教导在此引入作为参考。在另一个实施例中,可以使用线性阵列。
一旦制备出寡聚核苷酸阵列,将感兴趣的核酸与阵列杂交,扫描多态性。杂交和扫描通常的按照此处的方法以及描述于,例如,公开的PCT申请号WO92/10092和WO95/11995,和美国专利号5,424,186的方法进行,所有教导在此引入作为参考,总之,包括一种或者多种先前鉴定的多态性标记物的靶核酸序列通过公知的扩增技术进行扩增,例如,PCR。通常,这涉及引物序列的使用,所述引物序列从多态性上下游与靶序列的两条链互补。也可以使用不对称PCR技术。扩增的靶,通常包括标记,然后在合适条件下与阵列杂交。当阵列杂交完成和洗涤后,扫描阵列以检测与靶序列杂交的阵列上的位置。扫描获得的杂交数据通常是作为阵列上位置的函数的荧光强度形式。
尽管主要以单一检测块方式描述,例如,用于检测单个多态性,阵列可以包括多重检测块,因此能够分析多个、特定特定多态性。另一方面,通常应理解检测块可以组合到单一阵列内或者多个、独立的阵列,这样在靶与阵列杂交期间,可以使用变化的、最优条件。例如,通常需要提供检测与那些位于基因组序列A-T富集片段区的多态性分开的那些位于基因组序列G-C延伸区内的多态性。这允许对各种情况杂交条件的单独进行最优化。
寡聚核苷酸阵列用于多态性检测的其他应用可见于,例如,在美国专利号5,858,659和5,837,832,全部教导在此引入作为参考。可以使用其他的核酸分析方法检测II型糖尿病基因或者II型糖尿病基因编码变异体中的多态性。典型的方法包括直接人工测序(Church和Gilbert,Proc.Natl.Acad.Sci USA 81:1991-1995(1988);Sanger,F.等人,Proc.Natl.Acad.Sci USA 74:5463-5467(1977);Beavis等人,美国专利号5,288,644);自动荧光测序;单链构象多态性检测(SSCP);夹板变性凝胶电泳(CDGE);变性梯度凝胶电泳(DGGE)(Sheffield,V.C.等人,Proc.Natl Acad.Sci USA 86:232-236(1989)),迁移率分析(Orita,M.等人,Proc.Natl Acad.Sci USA 86:2766-2770(1989)),限制性酶切分析(Flavell等人,Cell 15:25(1978);Geever,等人,Proc.Natl.Acad.SciUSA 78:5081(1981));异质双链分析;化学错配切割(CMC)(Cotton等人,Proc.Natl.Acad.Sci USA 85:4397-4401(1985));RNase保护试验(Myers,R.M.等人,Science 230:1242(1985));识别核苷酸错配的多肽的使用,例如E.coli mutS蛋白;例如等位基因-特定PCR。
在本发明的一个方面,II型糖尿病易感性或者II型糖尿病易感性降低(或者指示抵抗II型糖尿病的保护性等位基因)的诊断,也可以通过定量PCR(动态热循环)的表达分析实现。利用TaqMan
Figure 2006800221296_0
检测,这项技术可以鉴定TCF7L2核酸编码的多肽或者TCF7L2核酸编码的剪接变体的表达或者组成中改变的存在。TaqMan探针还可用于鉴定多态性以及患者是纯合子还是杂合体。此外,变异体表达可以量化为物理不同或者功能不同的。
在本发明的另一个方面,II型糖尿病易感性或者II型糖尿病易感性降低(或者指示抵抗II型糖尿病保护性等位基因)的诊断,可以通过各种方法,包括酶联免疫吸附(ELISAs),Western印迹,免测沉淀和免疫荧光法,检测TCF7L2多肽的表达和/或组成来实现。对个体待测样品分析TCF7L2核酸编码的多肽的表达中改变和/或组成中改变的存在,或者TCF7L2核酸编码的特定特定变异体的存在。在TCF7L2核酸编码多肽表达中的改变可能是,例如,定量的多肽表达(即,产生多肽的数量)的改变;TCF7L2核酸编码多肽的组成的改变是定性的多肽表达(例如,改变的TCF7L2多肽或者不同剪接变体的表达)的改变。在一个优选的方面,II型糖尿病易感性或者II型糖尿病易感性降低的诊断,可以通过检测TCF7L2核酸编码的特定特定剪接变体或者剪接变体的特定模式来实现。
这两种改变(定量的和定性的)均可以存在。此处使用的术语多肽表达或者组成中的“改变”,是指待测样品中表达或者组成的改变,与对照样品中TCF7L2核酸编码多肽的表达或者组成比较。对照样品是与待测样品对应的样品(例如,来自相同种类的细胞),并且来自不受II型糖尿病易感性影响的个体。与对照样品相比,待测样品中多肽的表达或者组成的改变指示II型糖尿病的易感性。类似地,与对照样品相比,待测样品中一种或多种不同剪接变体的存在,或者待测样品中不同剪接变体显著地不同数量的存在指示II型糖尿病的易感性。可以使用检测TCF7L2核酸编码多肽的表达或者组成的不同的方法,包括:光谱法,比色法,电泳,等电点聚焦,和免疫测定(例如,David等人,美国专利号4,376,110),例如免疫印迹(还可参见Current Protocolsin Molecular Biology,尤其是第10章)。例如,一方面,可以使用能够结合多肽的抗体(例如,如上所述),优选具有可检测标记的抗体。抗体可以是多克隆的,或者更优选的,单克隆的。可以使用完整的抗体,或者其片段(例如,Fab或者F(ab′)2)。术语“标记的”,就探针或者抗体而言,意图是包括探针或者抗体的直接标记,通过将可检测物质偶联(即,物理连接)到探针或者抗体,以及探针或者抗体的间接标记,通过与直接标记的另一种试剂的反应。间接标记的实例包括利用荧光标记的第二抗体和用生物素末端标记DNA探针检测第一抗体,因此它可以利用荧光标记的链亲和素进行检测。
利用如上所述的与突变TCF7L2核酸编码的多肽特定结合的抗体,或者与非突变核酸编码多肽特定结合的抗体,或者与核酸编码的特定特定剪接变体特定结合的抗体的Western印迹分析,可用于鉴定待测样品中特定剪接变体或者多态性的或者突变的TCF7L2核酸编码的多肽的存在,或者待测样品中特定剪接变体或者非多态性的或者非突变的核酸编码多肽的缺失。多态性的或者突变的核酸编码多肽的存在,或者非多态性的或者非突变的核酸编码多肽的缺失,以及TCF7L2核酸编码的特定剪接变体的存在(或者缺失),可用于诊断II型糖尿病的易感性。
在这种方法的一方面,待测样品中TCF7L2核酸编码多肽的水平或者数量与对照样品中TCF7L2编码多肽的水平或者数量进行比较。待测样品中多肽的水平或者数量比对照样品中多肽的水平或者数量更高或者更低,以致差异是统计上有显著意义的,提示TCF7L2核酸编码多肽表达的改变,可用于诊断II型糖尿病的易感性。此外,待测样品中TCF7L2核酸编码的多肽的组成与对照样品中TCF7L2核酸编码多肽的组成进行比较(例如,不同剪接变体的存在)。与对照样品中多肽组成比较,待测样品中多肽组成的差异可用于诊断II型糖尿病的易感性。在另一方面,在待测样品和对照样品中均可检定多肽的水平或者数量和组成。待测样品中多肽的数量或者水平相对对照样品的差异;待测样品中组成相对对照样品的差异;或者数量或者水平的差异,和组成的差异,指示II型糖尿病的易感性。
当与对照(疾病)样品比较时,相同方法可以相反地用于鉴定差异的存在。与对照的差异指示糖尿病易感性的降低,和/或指示抵抗II型糖尿病的保护性等位基因。
标记物和单倍型的评估
显示遗传多样性个体的种群具有不相同的基因组。此外,基因组在基因组许多位置显示个体之间的序列变化;换言之,在种群中存在许多多态性位点。在有些情况下,没有选择参考等位基因,对多态性位点的不同等位基因做出参考。此外,参考序列可指特定定多态性位点。有时参考等位基因是指“野生型”等位基因,它通常被选作第一个测序的等位基因或者作为来自“未患病”个体的等位基因(例如,不显示疾病或者异常表型的个体)。不同于参考的等位基因称为“变异”等位基因。
本文所述的“标记物”是指表征为特定的变异等位基因(即多态性位点)的基因组序列。标记物可以包括基因组内发现的任意变异类型的任意等位基因,包括SNPs,微卫星,插入,缺失,重复和易位。
此处报道的SNP命名是指官方参考SNP(rs)ID识别标签,由国家生物技术信息中心(NCBI)分配给每个独特的SNP。
本文所述的“单倍型”是指基因组DNA链的片段,其特征在于沿片段排列的遗传标记物(“等位基因”)的特定组合。在某一实施方式中,单倍型可以包括一种或者更多等位基因,两种或者更多等位基因,三种或者更多等位基因,四种或者更多等位基因,或者五种或者更多等位基因。遗传标记物是在与TCF7L2外显子4LD块相关“多态性位点”的特定特定“等位基因”。本文使用的“TCF7L2外显子4LD块”是指Chr10q上的LD块,其中观察到变异与II型糖尿病的相关性。该LD块的NCBI Build 34位置是114,413,084-114,488,013bp。本文所述的术语“易感性”包括增加的易感性和降低的易感性。因此,本发明的特定特定标记物和/或单倍型可以表征为II型糖尿病易感性的增加,其特征是相对危险度大于1。造成II型糖尿病易感性增加的标记物和/或单倍型还可以被认为是“具有风险”,因为它们显示疾病风险的增加。此外,本发明的标记物和/或单倍型可以表征为II型糖尿病易感性的降低,其特征是相对危险度小于1。
种群(或者自然群体或者合成群体,例如,合成分子文库)中其位置上可能具有超过一个序列的核苷酸位置在本文中被称为“多态性位点”。当多态性位点长度是单核苷酸时,该位点称为单核苷酸多态性(SNP)。例如,如果在特定特定染色体位置,群体的一个成员具有腺嘌呤而该群体的另一个成员在相同位置具有胸腺嘧啶,则这个位置是多态性位点,和更具体地,该多态性位点是SNP。当它们位于SNP检测中的多态性位点时,本文所述的SNP标记物的等位基因是指碱基A、C、G或者T。本领域技术人员明白通过检测或者阅读相反链,各种情况下都可以检测互补等位基因。因此,对包括A/G多态性的多态性位点,采用的检测可以测定两个可能碱基的百分比或者比例,即A和G。此外,通过设计测定DNA模板上相反链的检测法,可以测定互补碱基T/C的百分比或者比例。定量的(例如,按照相对危险度)相同结果将从任意DNA链(+链或者-链)的检测获得。多态性位点允许基于取代、插入或者缺失的序列差异。例如,多态性微卫星在特定定位点具有多个小碱基重复(例如CA重复),其中普通群体中重复长度的数目不同。本文中与多态性位点有关的各种形式的序列被称为多态性位点的“等位基因”。因此,在早先的实例中,SNP包括了腺嘌呤等位基因和胸腺嘧啶等位基因。发现的位于TCF7L2外显子4LD块内,与II型糖尿病相关的SNPs和微卫星标记物描述于表2-7。
通常,参考序列是指特定序列。不同于参考的等位基因称为“变异”等位基因。例如,NCBI Build 34位置114413084和114488013之间(等于74929bp,或者74.9kb)的参考基因组DNA序列,这是指染色体10内的位置,本文中描述为SEQ ID NO:1。本文使用的变异序列,是指不同于SEQ ID NO:1的序列,但基本上是相似的。组成与TCF7L2外显子4LD块相关单倍型的遗传标记物是变异体。其他变异体可以包括影响多肽例如TCF7L2基因编码多肽的变化。当与参考核苷酸序列比较时,这些序列差异可以包括单个核苷酸或者不止一个核苷酸的插入或者缺失。这种序列差异可以导致移码;至少一个核苷酸的改变,导致编码氨基酸的改变;至少一个核苷酸的改变,导致终止密码子的提前产生;几个核苷酸的缺失,可以导致一个或者多个核苷酸编码氨基酸的缺失;一个或者几个核苷酸的插入,例如通过不等重组或者基因转换,可以导致读码框编码序列的中断;全部或者部分序列的复制;转座;或者核苷酸序列的重排,如本文详细所述。这种序列变化改变核酸编码的多肽。例如,如果核酸序列的变化造成移码,移码可能导致编码氨基酸的改变,和/或可能导致提前终止密码子的产生,产生截短多肽。此外,II型糖尿病相关多态性或者II型糖尿病易感性可能是一种或者多种核苷酸的同义变化(即,不导致氨基酸序列改变的变化)。这类多态性可能,例如,改变剪接位点,影响mRNA的稳定性或者转运,或者影响编码多肽的转录或者翻译。它还可能改变DNA来增加结构变化的可能性,例如在肿瘤的体细胞水平发生的扩增或者缺失。参考核苷酸序列编码的多肽是具有特定特定参考氨基酸序列的“参考”多肽,变异等位基因编码的多肽是指具有变异氨基酸序列的“变异”多肽。
多态性微卫星在特定特定位点具有长度在2-8个核苷酸(例如CA重复)的多个小的碱基重复,,其中普通群体中重复长度的数目不同。Indel是一种常见的多态性形式,包括小的插入或者缺失,通常只有几个核苷酸长度。
本文描述的单倍型是在多态性位点具有特定等位基因的不同遗传标记物的组合,例如SNPs和微卫星。单倍型可能包括不同遗传标记物的组合,因此,可以通过本领域已知的检测多态性位点序列的方法检测单倍型。例如,可以使用检测SNPs和/或微卫星标记物存在的基因分型标准技术,例如基于荧光的技术(Chen,X.等人,Genome Res.9(5):492-98(1999)),PCR,LCR,巢式PCR和用于核酸扩增的其他技术。可以在风险单倍型中鉴定到这些标记物和SNPs。鉴定相关标记物和SNPs的一些方法包括使用连锁不平衡(LD)和/或LOD值。
在本文描述的一些方法中,具有患II型糖尿病风险的个体是鉴定出风险标记物或者单倍型的个体。在一方面,风险标记物或者单倍型是指造成II型糖尿病风险(或者易感性)显著增加的标记物或者单倍型。在一个实施方式中,通过相对危险度测定标记物或者单倍型相关的显著度。在另一个实施方式中,显著度利用百分比测定。在一个实施方式中,显著增加的风险测定为相对危险度至少是约1.2,包括但不限于:1.2,1.3,1.4,1.5,1.6,1.7,1.8和1.9。在另一个实施方式中,至少为1.2的相对危险度是显著的。在另一个实施方式中,至少为大约1.5的相对危险度是显著的。在另一个实施方式中,风险显著增加到至少大约1.7是显著的。在另一个实施方式中,风险显著增加至少大约20%,包括但不限于大约25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%和98%。在另一个实施方式中,风险显著增加至少大约50%。
在本发明的其他实施方式中,标记物或者单倍型造成II型糖尿病风险的降低(易感性降低)。在一个实施方式中,显著降低的风险测定为相对危险度小于0.9,包括但不限于0.9,0.8,0.7,0.6,0.5和0.4。在另一个实施方式中,显著的相对危险度小于0.7。在另一个实施方式中,风险(或者易感性)降低至少大约20%,包括但不限于大约25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%和98%。在另一个实施方式中,风险显著下降至少大约30%。
因此,术语“II型糖尿病易感性”表示II型糖尿病增加的风险或者易感性或者降低的风险或者易感性,当某一等位基因、标记物、SNP或者单倍型存在时,数量是显著的;显著度按上述方法测定。本文使用的术语“降低的风险”、“降低的易感性”和“保护”表示当某一其他等位基因、标记物、SNP和/或某一其他单倍型存在时,相对危险度相应降低。但是应了解,鉴定增减的风险是否是医学显著的还依赖于各种因素,包括特定疾病,标记物或者单倍型,并且通常还包括环境因素。
TCF7L2基因内或者包括部分TCF7L2基因的风险标记物或者单倍型,是相对于健康个体(对照)中存在的频率,在具有患II型糖尿病风险个体(患病的)中存在频率更高的标记物或者单倍型,其中标记物或者单倍型的存在指示II型糖尿病易感性。简单相关检验的一个实例是对2×2表进行的Fisher精确检验。从大量染色体中构建染色体群组的2×2表,所述染色体可以包括标记物或者单倍型两者,只包括标记物或者单倍型中的一个而不包括另一个,和标记物或者单倍型都不包括。
在本发明的某些方面,风险标记物或者单倍型是与II型糖尿病显著相关的TCF7L2内或者邻近TCF7L2的风险标记物或者单倍型。在其他方面,风险标记物或者单倍型包括TCF7L2内或者邻近TCF7L2的风险标记物或者单倍型,TCF7L2与II型糖尿病易感性显著相关。在本发明的特定实施方式中,如本文描述,标记物或者单倍型与TCF7L2外显子4LD块相关。
可以使用检测SNPs和/或微卫星标记物存在的基因分型标准技术,例如基于荧光的技术(Chen,等人,Genome Res.9,492(1999)),PCR,LCR,巢式PCR和用于核酸扩增的其他技术。在优选的方面,该方法包括检定个体中SNPs和/或微卫星的存在或者频率,所述SNPs和/或微卫星在TCF7L2基因内或者包括部分TCF7L2基因,其中SNPs和/或微卫星相对健康对照个体的过度或者更高频率指示个体是II型糖尿病易感的。这种SNPs和标记物可以用作筛选工具的单倍型。可以在风险单倍型中鉴定这些标记物和SNPs。例如,风险单倍型可以包括微卫星标记物和/或SNPs,例如标记物DG10S478和/或SNP rs12255372,rs7895340,rs11196205,rs7901695,rs7903146,rs12243326或者rs4506565。风险单倍型的存在指示II型糖尿病易感性的增加,从而提示个体属于本文所述治疗方法的目标人群。
易感性变异体的鉴定
利用期望最大化算法可以估计患者组和对照组中单倍型的频率(Dempster A.等人,J.R.Stat.Soc.B,39:1-38(1977))。可以使用能够处理缺失基因型和相不确定性的这种实现算法。在零假设下,患者和对照被认为具有相同频率。利用相似方法,检验另一种假设,其中可能包括本文所述标记物的候选风险单倍型在患者中具有比对照更高的频率,而这两组中其他单倍型频率的比例被认为是相同的。在这两个假设下相似性分别被最大化,对应1-df似然比统计值被用于评定统计显著性。
为了寻找连锁区域内的风险和保护性标记物和单倍型,例如,研究基因分型的标记物所有可能组合的相关性,假设这些标记物跨越实际区域。组合的患者和对照组可随机分成两组,与原始患者和对照组规模相同。然后重复标记物和单倍型分析,确定记录的最显著的p-值。可以重复这种随机化方案,例如,超过100次以构建p-值的经验分布。在一个优选的实施方式中,<0.05的p-值提示显著的标记物和/或单倍型关联。
下面详细讨论单倍型分析。
单倍型分析
单倍型分析的一种常用方法涉及利用NEsted MOdels的似然推断(Gretarsdottir S.,等人,Nat.Genet.35:131-38(2003))。在程序NEMO中进行该方法,适合多种多态性标记物、SNPs和微卫星。方法和软件是特意设计用于病例对照研究,其目的是鉴定造成不同风险的单倍型组。它还是研究LD结构的工具。在NEMO中,借助EM算法,对将其作为缺失-数据问题的观测数据,直接计算最大似然估计值、似然比和p-值。
检测信息
即使对观测数据直接计算基于相似性的似然比检验可以被信赖得出正确的p-值,所述观测数据已捕获因为相不确定性和缺失基因型导致的信息丢失,但仍有兴趣了解因为信息不完整导致多少信息丢失。单倍型分析的信息测量法描述于Nicolae和Kong(Technical Report 537,Department of Statistics,University of Statistics,University of Chicago;Biometrics,60(2):368-75(2004)),作为设定用于连锁分析的信息测量法的自然延伸,在NEMO中应用。
统计分析
对单一标记物与疾病的关联,Fisher精确检验可用于计算各个个体等位基因的双边p-值。全部p-值表现为未校正的,用于多重比较,除非特别标出。显示的频率(对微卫星,SNPs和单倍型)是与载体频率相对的等位基因的频率。为了最小化患者亲缘性造成的任何偏差,所述患者作为家族被征集用于连锁分析,一级和二级亲属可以从患者列表中除去。此外,可以重复检验以通过延长差异调整过程而进行患者中任意剩余亲缘性的关联修正,该过程描述于Risch,N.& Teng,J.(Genome Res.,8:1273-1288(1998)))),和对血缘关系进行DNA收集合并(pooling)(ibid),这样它可以被用于普通家族关系,提供校正和未校正的p-值用于比较。与预期一致,差异通常非常小。为了评定多重检验修正的单一标记物关联的显著度,我们可以利用相同基因型数据进行随机性检验。患者和对照的群组可以随机分配,多次重复关联分析(例如,直到500,000次),p-值是重复检验的分数,所述重复检验得到一些标记等位基因的p-值小于或者等于利用原始患者和对照群组观察到的p-值。
对单一标记物和单倍型分析,相对危险度(RR)和群体归因危险度(PAR)可以利用乘法模型(单倍型相对危险度模型)计算(Terwilliger,J.D.& Ott,J,Hum.Hered.42:337-46(1992)和FaIk,CT.& Rubinstein,P,Ann.Hum.Genet.51(Pt 5j:227-33(1987))),即,人携带两个等位基因/单倍型的风险倍增。例如,如果RR是A相对于a的风险,则纯合子AA的风险是杂合子Aa风险的RR倍,是纯合子aa风险的RR2倍。乘法模型具有良好特性,可以简化分析和计算-单倍型是独立的,即在患病群体以及对照群体内Hardy-Weinberg平衡。因此,患病的和对照的单倍型计数均具有多项分布,但在另外假设下具有不同的单倍型频率。具体地,对两个单倍型hi和hj,风险(hi)/风险(hj)=风险(fi/pi)/风险(fj/pj),其中f和p分别表示在患病群体和对照群体中的频率。如果真实模型不是倍增的,会存在一些功能损失,除极端情况外损失倾向于适度的。最重要地,p值总是有效的,因为它们根据零假设计算。
利用NEMO的连锁不平衡
利用D′和R2的标准定义可以计算标记物对之间的LD(Lewontin,R.,Genetics 49:49-67(1964);Hill,W.G.& Robertson,A.Theor.Appl.Genet.22:226-231(1968))。利用NEMO,通过最大似然法估算两个标记等位基因组合的频率,通过似然比检验计算连锁平衡的偏差。采用边缘等位基因可能性加权,通过计算两个标记物所有可能等位基因组合的平均值,将D′和R2的定义延伸至包括微卫星。当描绘出全部标记物组合以说明特定区域中的LD结构,我们将D′绘制在左上角,p-值绘制在右下角。如果需要,在LD图中标记物可以绘制成等距离的而不是根据它们的物理位置。
连锁分析的统计方法
多点、只在患者中有的等位基因-共用方法(Multipoint,affected-only allele-sharing methods)可用于分析来评定连锁证据。结果,LOD值和非参数的连锁(NPL)值,可以利用程序Allegro获得(Gudbjartsson等人,Nat.Genet.25:12-3(2000))。我们的基线连锁分析利用Spairs评分函数(Whittemore,A.S.,Halpern,J.Biometrics 50:118-27(1994);Kruglyak L.等人,Am.J.Hum.Genet 55:1347-63(1996)),指数等位基因-共用模式(Kong,A.和Cox,NJ.,Am.J.Hum.Genet.61:1179-88(1997))和家族权重计算方法,所述权重计算方法是在log级别,处于相同地加权各患病对和相同地加权各家族之间中途。我们使用的信息测量是Allegro程序输出值的一部分,如果标记物基因型是完全不提供信息的,则信息值等于零,如果在患病的亲属间基因型测定了精确数量的共享等位基因,则信息值等于一(Gretarsdottir等人,Am.J.Hum.Genet.,70:593-603(2002))。用两种不同方法计算p-值,这里报道的是较不显著的结果。第一个p-值可以根据大样本理论计算;在无连锁的零假设下Zlr=□(2[loge(10)LOD])的分布大约是标准正态变量(Kong,A.和Cox,N.J.,Am.J.Hum.Genet.61:1179-88(1997))。通过观察到的LOD值与其在零假设下完整数据取样分布的比较,可以计算第二个p值(例如,Gudbjartsson等人,Nat.Genet.25:12-3(2000))。当数据由好几个家族组成时,这两个p值倾向于非常相似。
易感性基因座的单倍型和“单倍型块”定义
在一些实施方式中,标记物和单倍型分析涉及定义基于“单倍型块”的候选易感性基因座(也称为“LD块”)。已经有报道,部分人基因组可以分解成包含一些常见单倍型的系列离散的单倍型块;对于这些块,连锁不平衡数据几乎没有提供数据表明重组(参见,例如,Wall,J.D.和Pritchard,J.K.,Nature Reviews Genetics 4:587-597(2003);Daly,M.等人,Nature Genet.29:229-232(2001);Gabriel,S.B.等人,Science 296:2225-2229(2002);Patil,N.等人.,Science 294:1719-1723(2001);Dawson,E.等人,Nature 418:544-548(2002);Phillips,M.S.等人,Nature Genet.35:382-387(2003))。
主要有两种定义这些单倍型块的方法:块可以定义为具有有限单倍型多样性的DNA区域(参见,例如,Daly,M.等人,Nature Genet.29:229-232(2001);Patil,N.等人,Science 294:1719-1723(2001);Dawson,E.等人,Nature 418:544-54%(2002);Zhang,K.等人,Proc.Natl.Acad.Sci.USA 99:7335-7339(2002)),或者是利用连锁不平衡鉴定的在过渡带之间具有广泛历史重组的区域(参见,例如,Gabriel,S.B.等人,Science 296:2225-2229(2002);Phillips,M.S.等人,Nature Genet.33:382-387(2003);Wang,N.等人,Am.J.Hum.Genet.77:1227-1234(2002);Stumpf,M.P.,和Goldstein,D.B.,Curr.Biol.73:1-8(2003))。本文使用的术语“单倍型块”或者“LD块”包括任意一种特征定义的块。
单倍型块鉴定的典型方法公开于,例如,美国公开的专利申请号20030099964,20030170665,20040023237和20040146870。单倍型块可以方便的用于对表型和单倍型情况之间的关联性作图。在各单倍型块中可以鉴定主要单倍型,然后可以鉴定出一组“标签”SNPs或者标记物(需要最小组的SNPs或者标记物以区别单倍型)。然后这些标签SNPs或者标记物可用于鉴定来自各组个体的样品,以便鉴定表型和单倍型之间的关联性。如果需要,相邻单倍型块可以同时评定,因为单倍型块间可能存在连锁不平衡。
单倍型和诊断
如本文所述,包括这种标记物的一些标记物和单倍型被发现可用于II型糖尿病易感性的测定-即发现它们可用于II型糖尿病易感性的诊断。发现特定标记物和单倍型在患有II型糖尿病的个体中的频率比没有II型糖尿病的个体中的频率更高。因此,这些标记物和单倍型具有在个体中检测II型糖尿病或者II型糖尿病易感性的预测价值。发现包括一些标签标记物的单倍型块(即TCF7L2外显子4LD块)在患有II型糖尿病的个体中的频率比在没有II型糖尿病的个体中的频率更高。因此,这些单倍型块内的“风险”标签标记物也具有在个体中检测II型糖尿病或者II型糖尿病易感性的预测价值。单倍型或者LD块内的“风险”标签标记物还可以包括区分单倍型的其他标记物,因为这些标记物类似的具有检测II型糖尿病或者II型糖尿病易感性的预测价值。作为人类基因组单倍型块结构的结果,与单倍型块(LD块)相关的大量标记物或者其他变异体和/或包括这种标记物或者变异体的单倍型可以被认为与某一特征和/或表型相关。因此,位于本文定义的TCF7L2外显子4LD块内或者与TCF7L2外显子4LD块具有强LD(特征为r2大于0.2)的标记物和/或单倍型可能与II型糖尿病相关(即它们造成增加或减少的II型糖尿病易感性)。这包括本文描述的标记物(表6),但还可能包括与表6所列的一个或者多个标记物具有强LD(特征为r2大于0.2)的其他标记物。可以通过本领域技术人员公知的方法鉴定这类其他变异体,例如通过对特定个体组LD块A基因组区域进行DNA测序,本发明也包括这类其他变异体。
如本文所述,发现TCF7L2外显子4LD块内的一些标记物的频率在患有II型糖尿病的个体中降低,包括两种或更多表13、20和21所列的那些标记物的单倍型也被发现在患有II型糖尿病的个体中频率降低。因此这些标记物和单倍型对II型糖尿病是保护性的,即它们造成携带这些标记物和/或单倍型的个体患II型糖尿病的风险降低。
本文描述的单倍型和标记物,在一些情况下,是不同遗传标记物的组合,例如,SNPs和微卫星。因此,可以通过本领域已知的和/或本文所述的检测多态性位点序列的方法检测单倍型。此外,利用标准技术可以验证某些单倍型或者标记物组和疾病表型之间的相关性。简单的相关性检验的一个典型实例是对2×2表进行Fisher精确检验。
在特定实施方式中,与TCF7L2外显子4LD块相关的标记物或者单倍型,是相对于其在健康个体(对照)中存在的频率,在具有患II型糖尿病风险个体(患病的)中存在频率更高的标记物或者单倍型,其中标记物或者单倍型的存在指示II型糖尿病或者II型糖尿病易感性。在其他实施方式中,与TCF7L2外显子4LD块相关的一个或者多个标记物具有连锁不平衡的风险标签标记物,是相对于健康个体(对照)中存在的频率,在具有患II型糖尿病风险个体(患病的)中存在频率更高的标签标记物,其中标签标记物的存在指示II型糖尿病增加的易感性。在其他实施方式中,与TCF7L2外显子4LD块相关的一个或者多个标记物具有连锁不平衡的风险标签标记物,是相对于健康个体(对照)中存在的频率,在具有患II型糖尿病风险个体中存在频率更高的标记物,其中标记物的存在指示II型糖尿病易感性。
在本文描述的一些方法中,具有患II型糖尿病风险的个体是鉴定出风险标记物或者单倍型的个体。在一个实施方式中,标记物或者单倍型关联性的强度采用相对危险度(RR)来测定。RR是携带标记物或者单倍型的一个拷贝个体的发病率相对不携带标记物或者单倍型个体的发病率的比例。这个比例相当于携带两个拷贝标记物或者单倍型个体的发病率相对携带一个拷贝标记物或者单倍型个体的发病率的比例。在一个实施方式中,标记物或者单倍型具有至少为1.2相对危险度。在其他实施方式中,标记物或者单倍型具有至少1.3,至少1.4,至少1.5,至少2.0,至少2.5,至少3.0,至少3.5,至少4.0,或者至少5.0的相对危险度。
在本发明的其他方法中,患II型糖尿病风险降低(或者易感性降低)的个体是鉴定出保护性标记物或者单倍型的个体。在这种情况下,相对危险度(RR)小于1。在一个实施方式中,标记物或者单倍型具有小于0.9的相对危险度。在另一个实施方式中,标记物或者单倍型具有的相对危险度小于0.8,小于0.7,小于0.6,小于0.5或者小于0.4。
遗传检验的实用性
与造成发展II型糖尿病风险的遗传变异有关的知识,为能够区分患病风险增加个体(即风险变异体携带者)和患病风险降低个体(即保护性变异体的携带者)的遗传-检验提供了可能。对属于上述两组的个体进行遗传检验的核心价值,是在早期诊断疾病的可能性,以及给临床医生提供关于疾病预后/侵袭性信息,以便能够采用最合适的治疗方法。例如,II型糖尿病遗传检验的应用使在早期检测疾病成为可能,这导致在早期就可以进行治疗检查,从而可以最小化疾病的有害作用和II型糖尿病造成的严重健康后果。
治疗方法
在本发明的另一个实施方式中,该方法可用于治疗II型糖尿病。本文使用的术语“治疗”不仅指改善II型糖尿病相关症状,而且还指预防或者延缓II型糖尿病的发病;减轻II型糖尿病症状的严重程度或者频率;和/或减轻与其他药物联合治疗的必要性,所述其他药物用来改善II型糖尿病的相关症状。一方面,待接受治疗的个体是II型糖尿病易感的(增加风险)的个体(例如,具有以下等位基因存在的个体:标记物DG10S478除了0等位基因以外其他等位基因的存在;SNPrs12255372的T等位基因的存在;SNP rs7895340的A等位基因的存在;SNP rs11196205的C等位基因的存在;SNP rs7901695的C等位基因的存在;SNP rs7903146的T等位基因的存在;SNP rs12243326的C等位基因的存在;或者SNP rs4506565的T等位基因的存在)。
在本发明的其他实施方式中,该方法可用于治疗其他TCF7L2相关的疾病或者病症。TCF7L2治疗剂可以用于II型糖尿病的治疗方法,以及其他TCF7L2相关疾病或者病症的治疗方法。
治疗方法(预防和/或治疗的)使用TCF7L2治疗剂。“TCF7L2治疗剂”是一种直接地或者间接改变(例如,增强或者抑制)TCF7L2的多肽活性和/或核酸表达(例如,通过改变与TCF7L2相互作用蛋白的活性或者核酸表达,例如Wnt信号途径或者钙粘蛋白途径中的蛋白(例如,beta-连环蛋白))的药剂。在某些实施方式中,TCF7L2治疗剂改变TCF7L2的活性和/或核酸表达。
TCF7L2治疗剂可以通过各种方法改变TCF7L2多肽活性或者核酸表达,例如,通过提供额外TCF7L2多肽或者通过上调TCF7L2核酸的转录或者翻译;通过改变TCF7L2多肽的翻译后加工;通过改变TCF7L2剪接变异体的转录;或者通过干扰TCF7L2多肽活性(例如,通过结合TCF7L2多肽),或者通过结合与TCF7L2相互作用的另一个多肽,通过改变TCF7L2核酸的(例如,下调)表达、转录或者翻译,或者通过改变(例如,激动或者拮抗)活性。
典型的TCF7L2治疗剂包括下列物质:本文描述的核酸或者其片段或者其衍生物,特别是编码本文描述多肽的核苷酸和包括这类核酸的载体(例如,基因,cDNA,和/或mRNA,例如编码TCF7L2多肽或者活性片段或者其衍生物的核酸,或者寡聚核苷酸;或者其互补物,或者片段或者其衍生物,和/或II型糖尿病核酸或者片段或者其衍生物编码的其他剪接变异体);本文描述的多肽和/或TCF7L2核酸或者片段或者其衍生物编码的剪接变异体;其他多肽(例如,TCF7L2受体);TCF7L2结合剂;或者影响(例如,增加或者降低)活性的药剂,抗体,例如抗突变TCF7L2多肽的抗体,或者抗非突变TCF7L2多肽的抗体,或者抗上述TCF7L2核酸编码的特定剪接变异体的抗体;模拟肽;融合蛋白或者其前体药物;核酶;其他小分子;和其他改变(例如,增强或者抑制)TCF7L2核酸表达的药剂,或者调节TCF7L2剪接变异体转录的药剂(例如,影响那个剪接变异体表达,或者影响各剪接变异体表达数量的药剂)。其他典型的TCF7L2治疗剂包括影响胰岛素信号和/或胰高血糖素,GLP-1或者GIP信号的化合物。如果需要,可以同时使用不止一种TCF7L2治疗剂。
在优选的实施方式中,TCF7L2治疗剂是干扰TCF7L2活性的药剂,例如,干扰TCF7L2结合或者TCF7L2与beta-连环蛋白或其他蛋白相互作用的药剂(参见,例如,Fasolini,等人,J.Biol.Chem278(23):21092-06(2003))。其他TCF7L2治疗剂包括影响Wnt信号途径的药剂或者影响钙粘蛋白途径的药剂。典型药剂包括例如那些用于癌症治疗的药剂,包括,例如,蛋白例如DKK蛋白;APC的beta-连环蛋白结合结构域或者Axin;因子例如IDAX,AXAM和ICAT;反义寡聚核苷酸或者干扰RNA(RNAi),例如伴随Vitravene的使用;溶瘤细胞病毒载体;和其他化合物(参见,例如,Luu等人,Current CancerDrug Targets 4:6530671(2004));小分子拮抗剂,包括,例如,ZTM00990,PKF118-310,PKF 118-744,PKF115-584,PKF222-815,CGPO49090,NPDDG39.024和NPDDG1.024,如Lepourcelet等人所述(参见,例如,Lepourcelet等人,Cancer Cell 5:91-102(2004));美国专利6,762,185中描述的化合物;美国专利申请20040005313,20040072831,20040247593,或者20050059628中描述的化合物。其他典型的TCF7L2治疗剂包括gsk3抑制剂,包括,例如,在美国专利6,057,117;6,153,618;6,417,185;6,465,231;6,489,344;6,512,102;6,608,063;6,716,624;6,800,632;和公开的美国专利申请20030008866;20030077798;20030130289;20030207883;2000092535;和200500851中描述的那些gsk3抑制剂。说明书中引用的所有参考文献、专利和专利申请的全部教导在此完整引入。
其他典型的TCF7L2治疗剂如下面药剂表所示。
药剂表
Figure 2006800221296A00800011
Figure 2006800221296A00800021
NSD=结构未公开(在Iddb3中)
以治疗有效量(即,如上述足以“治疗”的数量)的TCF7L2治疗剂给药。对特定个体病症或者疾病治疗有效的剂量依赖于疾病的症状和严重程度,这可以通过标准临床技术来确定。此外,可以选择体外或者体内检测帮助确定最适剂量范围。剂型中使用的精确剂量还依赖于给药途径和疾病或者病症的严重性,这应该根据医师的判断和各个患者的情况来决定。可以从来自体外或者动物模型检测系统的剂量反应曲线推断出有效剂量。
在一个实施方式中,可以使用核酸(例如,编码TCF7L2多肽的核酸);或者编码TCF7L2多肽或者剪接变异体、衍生物或者其片段的其他核酸,单独的或者在如上所述的药物组合物中。例如,编码TCF7L2多肽的TCF7L2基因或者核酸或者cDNA,独立的或包括在载体内,可以被导入细胞(体外或体内),这样细胞产生天然的TCF7L2多肽。必要时,已经转化了基因或者cDNA或者包括基因、核酸或者cDNA的载体的细胞可以被导入(或者再导入)患有疾病的个体。因此,本身缺乏天然TCF7L2表达和活性,或者具有突变的TCF7L2表达和活性,或者具有疾病相关TCF7L2剪接变异体表达的细胞,可以被工程化表达TCF7L2多肽或者TCF7L2多肽的活性片段(或者TCF7L2多肽的不同变异体)。在某些实施方式中,编码TCF7L2多肽或者活性片段或者其衍生物的核酸,可以被导入表达载体,例如病毒载体,然后载体可以导入动物的合适细胞中。可以使用其他基因转移系统,包括病毒和非病毒转移系统。此外,还可以使用非病毒基因转移方法,例如磷酸钙共沉淀,机械技术(例如,微量注射);经由脂质体膜融合介导的转移;或者直接DNA吸收。
此外,在本发明的另一个实施方式中,本发明的核酸;与本发明核酸互补的核酸;或者这类核酸的一部分(例如,如下所述的寡聚核苷酸),可用于“反义”治疗,其中在原位给药或者产生与II型糖尿病基因的mRNA和/或基因组DNA特异杂交的核酸(例如,寡聚核苷酸)。与mRNA和/或DNA特异杂交的反义核酸抑制TCF7L2多肽的表达,例如,通过抑制翻译和/或转录。反义核酸的结合可以通过常规碱基对互补,或者,例如,就结合DNA双链而言,通过在双螺旋大沟内的特异相互作用。
本发明的反义构建体可以例如作为上述表达质粒被输送。当质粒在细胞中转录时,产生与编码TCF7L2多肽的mRNA和/或DNA的部分片段互补的RNA。此外,反义构建体可以是离体产生并被导入细胞的寡聚核苷酸探针;然后它通过与多肽的mRNA和/或基因组DNA的杂交抑制表达。在一个实施方式中,寡聚核苷酸探针是修饰的寡聚核苷酸,能够抵抗内源核酸酶,例如核酸外切酶和/或核酸内切酶,因此它们在体内是稳定的。用作反义寡聚核苷酸的示例性核酸分子是DNA的氨基磷酸酯,硫代磷酸酯和甲基膦酸酯类似物(还可参见美国专利号5,176,996;5,264,564;和5,256,775)。此外,用于反义治疗的寡聚物的常见构建方法还描述于,例如,Van der Krol等人,(BioTechniques6:958-976(1988));和Stein等人,(Cancer Res.48:2659-2668(1988))。就反义DNA而言,来自翻译起始位点的寡聚脱氧核糖核苷酸是优选的。
为进行反义治疗,设计与编码TCF7L2基因的mRNA互补的寡聚核苷酸(mRNA,cDNA或者DNA)。反义寡聚核苷酸与TCF7L2 mRNA转录产物结合,并阻止翻译。完全互补,虽然是优选的,但不是必须的。本文所指的与RNA部分“互补”的序列,表示序列具有足够的互补性能够与RNA杂交形成稳定的双链;就双链反义核酸来说,因此可以检测双链DNA的单链,或者也可以检测三链形成。杂交能力取决于互补程度和反义核酸长度,如上面详细所述。通常,杂交核酸越长,就可以包含与RNA更多的碱基错配,仍然能够形成稳定的双链(或者三链,根据情况而定)。本领域技术人员能够利用标准方法确定可耐受的错配度。
用于反义治疗的寡聚核苷酸可以是DNA,RNA或者其嵌合混合物或者衍生物或者修饰形式,单链或者双链的。可以在例如碱基基团,糖基团或者磷酸盐骨架上对寡聚核苷酸进行修饰,以提高分子、杂交的稳定性。寡聚核苷酸可以包括其他附加基团例如肽(例如体内用于定位到宿主细胞受体),或者促进穿过细胞膜转运(参见,例如,Letsinger等人,Proc.Natl.Acad.Sci USA 86:6553-6556(1989);Lemaitre等人,Proc.Natl.Acad.Sci USA 84:648-652(1987);PCT国际公开号:WO88/09810)或者(参见,例如,PCT国际公开号:WO 89/10134)血脑屏障转运的药剂,或者杂交触发断裂剂(参加,例如,Krol等人,BioTechniques 6:958-976(1988))或者嵌入剂(参见,例如,Zon,Pharm.Res.5:539-549(1988))。所以,寡聚核苷酸可以结合到另一个分子上(例如,肽,杂交触发交联剂,转运试剂,杂交触发断裂剂)。
反义分子被递送到体内表达TCF7L2的细胞。可以使用多种方法将反义DNA或者RNA递送到细胞;例如,反义分子可以直接注射到组织部位,或者设计定位到目标细胞的修饰反义分子(例如,与肽或者抗体连接的反义分子,所述肽或者抗体特异结合目标细胞表面表达的受体或者抗原)可以全身给药。此外,在一个优选的实施方式中,使用重组DNA构建体,其中反义寡聚核苷酸置于强启动子控制下(例如,pol III或者pol II)。利用这类构建体转染患者的靶细胞,可以引起足量单链RNAs的转录,它们将与内源TCF7L2转录产物形成互补碱基对,从而阻止TCF7L2 mRNA的翻译。例如,载体可以导入体内,因此它被细胞摄取并指导反义RNA的转录。这类载体可以保留为附加体或者与染色体整合,只要它能够转录产生所需的反义RNA。这类载体可以通过本领域和上述的标准的DNA重组技术方法进行构建。例如,质粒,粘粒,YAC或者病毒载体可用于制备能够直接导入组织部位的重组DNA构建体。此外,可以使用选择性感染目标组织的病毒载体,这种情况下可以通过其他途径实现给药(例如,全身性的)。
利用靶向同源重组,灭活或者“敲除”基因、核酸或者其启动子,也也可以减少内源TCF7L2多肽的表达(例如,参见Smithies等人,Nature317:230-234(1985);Thomas & Capecchi,Cell 51:503-512(1987);Thompson等人,Cell 5:313-321(1989))。例如,可以使用与内源基因或者核酸(或者编码核酸区域或者调节区域)同源的DNA侧翼的突变、无功能的基因或者核酸(或者完全无关的DNA序列),包括或者不包括选择标记物和/或负选择标记物,转染体内表达基因或者核酸的细胞。通过插入靶向同源重组的DNA构建体,引起基因或者核酸的灭活。重组DNA构建体可以直接给药,或者利用如上所述的合适载体在体内定位到所需部位。此外,利用相似方法可以增加非突变基因或者核酸的表达:靶向同源重组可用于插入DNA构建体,所述DNA构建体在细胞内包括非突变的功能基因或者核酸,代替上述突变的TCF7L2。在另一个实施方式中,靶向同源重组可用于插入包括一种核酸的DNA构建体,所述核酸编码与细胞中存在的不同的II型糖尿病多肽变异体。
此外,通过将互补脱氧核糖核苷酸序列定位到TCF7L2核酸的调节区域(即,TCF7L2启动子和/或增强子)形成三螺旋结构,阻止体内靶细胞中TCF7L2核酸的转录,内源TCF7L2核酸的表达可以被降低(一般参见,Helene,C,Anticancer Drug Des.,6(6):569-84(1991);Helene,C.等人.,Ann.N.Y.Acad.Sci 660:27-36(1992);和Maher,L.J.,Bioassays 14(12):807-15(1992))。同样地,本文描述的反义构建体,通过拮抗TCF7L2蛋白的正常生物活性,可用于组织处理,例如,组织分化,体内和体外组织培养。此外,反义技术(例如,反义分子的显微注射,或者和质粒转染,所述质粒的转录产物是II型糖尿病基因mRNA或者基因序列的反义序列),可用于研究疾病进展中的TCF7L2功能或者TCF7L2与其结合剂的相互作用,以及成人组织中TCF7L2的正常细胞功能或者TCF7L2与其结合剂的相互作用。这类技术可用于细胞培养中,但也可用于转基因动物的制备。
在本发明的另一个实施方式中,本文描述的其他TCF7L2治疗剂还可用于II型糖尿病基因的治疗。治疗剂可以在上述组合物中,或者单独给药。它们可以全身给药,或者定位到特定组织。治疗剂可以通过各种方法制备,包括化学合成;重组产生;体内产生(例如,转基因动物,例如美国专利号:4,873,316,Meade等人),例如,并可以用本文描述的那些标准方法分离。
还可以使用任意上述治疗方法的组合(例如,非突变多肽给药和针对TCF7L2突变mRNA的反义治疗联用;TCF7L2核酸编码第一种剪接变异体给药和针对TCF7L2核酸编码第二种剪接的反义治疗联用)。
评定对TCF7L2治疗剂反应可能性的方法
本发明还涉及评定个体对TCF7L2治疗剂反应可能性的方法。在该方法中,评定和TCF7L2基因相关的标记物或者单倍型,如上所述涉及评定个体对II型糖尿病的易感性。与II型糖尿病易感性(增加的风险)相关的等位基因,标记物,SNP或者单倍型(例如,标记物DG10S478除了0等位基因以外其他等位基因;SNP rs12255372的T等位基因;SNP rs7895340的A等位基因;SNP rs11196205的C等位基因;SNPrs7901695的C等位基因;SNP rs7903146的T等位基因;SNP rs12243326的C等位基因;或者SNP rs4506565的T等位基因;TCF7L2外显子4LD块相关标记物,例如TCF7L2外显子4LD块相关的风险单倍型);指示对TCF7L2治疗剂阳性反应的可能性。“阳性反应的可能性”表示个体比不具有本文所述II型糖尿病易感性(增加的风险)相关等位基因、标记物、SNP或者单倍型的个体更可能对TCF7L2治疗剂显示阳性反应。对TCF7L2治疗剂的“阳性反应”是显示II型糖尿病治疗的生理反应。如上所述,“治疗”不仅指改善II型糖尿病相关症状,而且还指预防或者延缓II型糖尿病的发病;减轻II型糖尿病症状的严重程度或者频率;和/或减轻与其他药物联合治疗的必要性,所述其他药物用来改善II型糖尿病的相关症状。
药物组合物
本发明还涉及药物组合物,包括改变TCF7L2活性或者另外影响Wnt信号途径或者钙粘蛋白途径,或者可用作TCF7L2治疗剂的药物。药物组合物还可以与生理上可接受的载体或者赋形剂一起制备成药物组合物。载体和组合物是无菌的。剂型应当适合给药方式。
合适的药学可接受的载体包括但不限于,水,盐溶液(例如,NaCl),盐水,缓冲盐水,醇,甘油,乙醇,阿拉伯树胶,植物油,苯甲醇,聚乙二醇,明胶,糖例如乳糖,直链淀粉或者淀粉,葡萄糖,硬脂酸镁,滑石,硅酸,粘性石蜡,芳香油,脂肪酸酯,羟甲纤维素,聚乙烯吡咯烷酮,等等,以及其组合。如果需要,药物制剂可以与辅料混合,例如,润滑剂,防腐剂,稳定剂,湿润剂,乳化剂,用于影响渗透压的盐,缓冲液,着色剂,调味剂和/或芳香物质和类似物,它们均不与活性药剂产生有害反应。
如果需要,组合物还可以包括少量湿润或者乳化剂,或者pH缓冲剂。组合物可以是液体溶液,悬浮液,乳剂,片剂,药丸,胶囊,缓释剂型,或者粉末。组合物可以与常规粘合剂和载体例如三酸甘油酯制备为栓剂。口服剂型可以包括标准载体例如药物等级的甘露醇,乳糖,淀粉,硬脂酸镁,聚乙烯吡咯烷酮,糖精钠,纤维素,碳酸镁,等等。
导入这些组合物的方法包括,但不限于,真皮内的,肌肉的,腹内的,眼内的,静脉内的,皮下的,局部的,口服的和鼻内的。其他合适的导入方法还包括基因治疗(如下所述),可充电或者可生物降解装置,粒子加速装置(“基因枪”)和缓释聚合装置。本发明的药物组合物还可以作为与其他药剂联合治疗的一部分给药。
组合物可以按照常规步骤制备适于给药人类的药物组合物。例如,用于静脉内给药的组合物通常是无菌等渗水相缓冲液中的溶液。当必要时,组合物还可以包括增溶剂和局部麻醉剂,以便在注射部位镇痛。通常,成分是被分别供给或者混合为单位剂型形式,例如,作为密闭容器例如安瓿或者标记活性药剂数量的小袋(sachette)中的冻干粉末或者无水浓缩物。当组合物通过输液给药时,它可以在包含无菌药物等级水、盐水或者葡萄糖/水的输液瓶中配制。当组合物通过注射给药时,可以提供包含灭菌注射水或者盐水的安瓿,这样在给药前就可以将成分混合。
对于局部施用,可以使用非喷雾形式,包括一种载体的粘性的至半固体或者固体形式,所述载体适于局部施用并且其动态粘滞度优选的大于水。合适制剂包括但不限于溶液,悬浮液,乳剂,乳膏剂,软膏,粉末,灌肠剂,洗液,溶胶,搽剂,油膏剂,气雾剂,等等,如果需要,它们被灭菌或者与辅料混合,例如,防腐剂,稳定剂,湿润剂,缓冲液或者用于影响渗透压的盐,等等。药剂可以整合到化妆品制剂中。对于局部施用,可喷雾的气雾剂也是合适的,其中活性成分,优选的与固体或者液体惰性载体材料组合,包装在挤瓶中或者与增压的挥发性、通常是气体的喷射剂混合,例如压缩空气。
本文描述的药剂可以配制为中性或者盐形式。药学可接受的盐包括那些与自由氨基形成的盐,例如源自盐酸,磷酸,醋酸,草酸,酒石酸,等等的盐,和那些与自由羧基形成的盐,例如来自钠,钾,铵,钙,氢氧化铁,异丙胺,三乙胺,2-乙基氨基乙醇,组氨酸,普鲁卡因,等等的盐。
给药治疗有效量的药剂。药剂的治疗有效量部分取决于疾病的性质和/或症状的程度,可以通过标准临床技术确定,此外,可以任选选用体外或者体内检测帮助确定最适剂量范围。制剂中使用的精确剂量还取决于给药途径和症状的严重性,这应该根据医师的判断和各个患者的情况来决定。可以从来自体外或者动物模型检测系统的剂量反应曲线外推出有效剂量。
本发明还提供药物包装或者试剂盒,包括一个或者多个装满本发明药物组合物中一种或者多种成分的容器。可选的这类容器中还可以包括管理药物或者生物制品生产、使用或者销售的政府部门出具的通告,该通告表明政府批准用于人类给药的制备、使用或者销售。包装或者试剂盒可以标注关于给药方式,药物给药顺序(例如,分别、连续或者同时)或者类似的相关信息。包装或者试剂盒还可以包括一些方法提醒患者采取治疗。包装或者试剂盒可以是组合治疗的单一单位剂量,或者它可以是多个单位剂量。具体的,药剂可以是单独的,以任意组合混合的,存在于单个小瓶或者片剂中的。药剂组装成泡状包装或者其他配药装置中是优选的。对本发明的目的来说,单位剂量是为了表示一种剂量,所述剂量取决于各种药剂的个体药效学,在标准时程按FDA批准的剂量给药。
筛选试验和由此鉴定的药剂
本发明还提供鉴定药剂(例如,融合蛋白,多肽,模拟肽,前体药物,受体,结合剂,抗体,小分子或者其他药物,或者核酶)的方法,所述药剂改变(例如,增加或者降低)TCF7L2的活性,或者与TCF7L2或者Wnt信号途径或者钙粘蛋白途径的其他成员(例如,beta-连环蛋白)相互作用。例如,在某些实施方式中,这类药剂可以与TCF7L2结合;对例如TCF7L2的活性具有刺激或者抑制效果;或者改变(例如,增强或者抑制)TCF7L2与Wnt信号途径其他成员或者与钙粘蛋白途径成员相互作用的能力,或者改变TCF7L2的翻译后加工。在其他实施方式中,这类药剂改变Wnt信号途径或者钙粘蛋白途径的活性或者功能。
在一个实施方式中,本发明提供筛选与TCF7L2蛋白(或者其生物活性部分)结合或者改变其活性的候选或者待测药剂的方法,以及通过该方法鉴定的药剂。待测药剂可以利用本领域已知的的组合文库方法中的任意一种方法来获得,包括:生物文库;空间寻址平行固相或者液相文库;需要去卷积(deconvolution)的合成文库方法;‘一-珠一-化合物′(′one-bead one-compound′)文库方法;和利用亲和层析选择法的合成文库。生物文库方法限于多肽文库,而其他4种方法适于多肽、非肽寡聚物或者化合物的小分子文库(Lam,K.S.,AnticancerDrug Des.12:145(1997))。
在一个实施方式中,为鉴定改变TCF7L2活性的药剂,包含或者表达TCF7L2或者其片段或者衍生物的细胞、细胞裂解产物或者溶液,可以与待测药剂接触;或者,蛋白可以直接与待测药剂接触。TCF7L2活性的水平(数量)被测定(例如,直接或者间接地检测TCF7L2活性的水平(数量)),并与对照(即,在待测药剂不存在的条件下TCF7L2蛋白或者其活性片段或者衍生物活性的水平)活性的水平比较。如果药剂存在时活性水平不同于药剂不存在时的活性水平,并且差值是统计上有显著意义的,则该药剂是改变TCF7L2活性的药剂。活性水平相对于对照的增加,表示该药剂是增强活性的药剂(是激动剂)。类似地,活性水平相对于对照的降低,表示该药剂是抑制活性的药剂(是拮抗剂)。在另一个实施方式中,待测药剂存在条件下TCF7L2或者其衍生物或者片段活性的水平与先前建立的对照水平进行比较。如果药剂存在条件下活性水平与对照水平的差值统计上有显著意义,则表示药剂改变TCF7L2的活性。
本发明还涉及鉴定药剂(例如,反义核酸,融合蛋白,多肽,模拟肽,前体药物,受体,结合剂,抗体,小分子或者其他药物,或者核酶)的检测法,所述药剂改变(例如,增加或者降低)TCF7L2基因的表达(例如,转录或者翻译),或者与TCF7L2的相互作用,以及涉及通过该检测法鉴定的药剂。例如,包含编码TCF7L2的核酸的溶液可以与待测药剂接触。溶液可以包括,例如,包含核酸的细胞或者包含核酸的细胞裂解产物;此外,溶液可以是包括核酸转录/翻译必需成分的其他溶液。如果需要,还可以使用未悬浮在溶液中的细胞。TCF7L2表达的水平和/或模式(例如,mRNA或者蛋白表达的水平和/或模式,例如不同剪接变异体的水平和/或模式)被测定,与对照表达的水平和/或模式(即,待测药剂不存在时TCF7L2表达的水平和/或模式)进行比较。如果药剂存在时的水平和/或模式与药剂不存在时的水平和/或模式有差异,并且差值在统计上有显著意义或者以统计上有显著意义的方式不同,则该药剂是改变II型糖尿病基因表达的药剂。TCF7L2表达的增强表示该药剂是TCF7L2活性的激动剂。类似地,TCF7L2表达的抑制表示该药剂是TCF7L2活性的拮抗剂。在另一个实施方式中,待测药剂存在条件下TCF7L2多肽(例如,不同的剪接变异体)的水平和/或模式与先前建立的对照水平和/或模式进行比较。如果药剂存在条件下水平和/或模式与对照水平和/或模式有差异,其差值在统计上有显著意义或者以统计上有显著意义的方式不同,则表示药剂改变TCF7L2表达。
在本发明的另一个实施方式中,利用包含编码TCF7L2基因启动子区域的核酸或者与报告基因可操作连接的核酸的细胞、细胞裂解产物或者溶液,可以鉴定出改变TCF7L2表达或者与TCF7L2或者与Wnt信号途径或者钙粘蛋白途径其他成员相互作用的药剂。与待测药剂接触后,测定报告基因的表达水平(例如,mRNA或者蛋白表达的水平),与对照的表达水平(即,待测药剂不存在条件下报告基因的表达水平)进行比较。如果药剂存在时水平与药剂不存在时的水平有差异,其差值是统计上有显著意义的或者是以统计上有显著意义的方式不同,则该药剂是改变TCF7L2表达的药剂,因为显示它具有改变基因表达的能力,所述基因与TCF7L2基因启动子可操作的连接。报告基因表达的增强表示该药剂是TCF7L2活性的激动剂。类似地,报告基因表达的抑制表示该药剂是TCF7L2活性的拮抗剂。在另一个实施方式中,待测药剂存在条件下报告基因表达的水平与先前建立的对照水平进行比较。如果药剂存在条件下水平与对照水平有差异,其差值在统计上有显著意义或者以统计上有显著意义的方式不同,表示该药剂改变表达。
利用上述这些方法可以轻易的鉴定改变TCF7L2编码的不同剪接变异体量(例如,增强第一种剪接变异体活性的药剂,和抑制第二种剪接变异体活性的药剂)的药剂,以及是第一种剪接变异体活性激动剂和第二种剪接变异体活性拮抗剂的药剂。
在本发明的其他实施方式中,该检测可用于评定待测药剂对TCF7L2结合剂相关多肽活性的影响。例如,表达与TCF7L2多肽相互作用的化合物(本文中称为“TCF7L2结合剂”,它可以是与TCF7L2多肽直接或者间接作用的多肽或者其他分子,例如Wnt信号途径的成员或者钙粘蛋白途径的成员)的细胞,在待测药剂存在条件下与TCF7L2接触,检测待测药剂改变TCF7L2和TCF7L2结合剂相互作用的能力。此外,可以使用包含TCF7L2结合剂的细胞裂解产物或者溶液。通过干扰或者增强TCF7L2与TCF7L2结合剂结合、交联或者另外相互作用的能力,与TCF7L2或者TCF7L2结合剂结合的药剂可以改变相互作用。检测待测药剂结合TCF7L2或者TCF7L2结合剂的能力可以通过下述方法实现,例如,将待测药剂与放射性同位素或者酶标记物偶联,这样的话待测药剂与多肽的结合可以通过直接或者间接检测125I,35S,14C或者3H标记,和放射性直接计数或者闪烁计数的放射性同位素检测。此外,待测药剂可以酶联标记有,例如,辣根过氧化酶,碱性磷酸酶,或者荧光素酶,和通过测定适合底物向产物的转化检测的酶标记物。在本发明范围内的还包括检测待测药剂与多肽相互作用的能力,所述相互作用物都没有进行标记。例如,微生理计可用于检测待测药剂与TCF7L2或者TCF7L2结合剂的相互作用,所述待测药剂,TCF7L2或者TCF7L2结合剂都没有进行标记。McConnell,H.M.等人,Science257:1906-1912(1992)。本文使用的“微生理计”(例如,CytosensorTM)是一种分析仪器,利用光寻址电位传感器(LAPS)测量细胞酸化其环境的速率。酸化速率的变化可用作配体和多肽之间相互作用的指示剂。
因此,这些受体可用于筛选作为激动剂或者拮抗剂的化合物,以用于II型糖尿病易感性的治疗或者研究。可以设计药物调控TCF7L2活化,从而可用于调控信号途径和下游基因的转录事件。
在本发明的另一个实施方式中,检测法可用于鉴定与TCF7L2相互作用的多肽。例如,例如Fields和Song(Fields,S.和Song,O.,Nature340:245-246(1989))描述的酵母双杂系统可用于鉴定与TCF7L2相互作用的多肽。在这类酵母双杂系统中,载体的构建是基于转录因子的灵活性,所述转录因子具有两个功能结构域(DNA结合结构域和转录活化结构域)。如果两个结构域是分离的但融合到两个不同但彼此相互作用的蛋白,可以实现转录激活,特定标记物(例如,营养标记物的转录例如His和Ade,或者显色标记物例如lacZ)的转录可用于鉴定相互作用和翻译激活的存在。例如,在本发明的方法中,使用的第一种载体包括编码DNA结合结构域以及TCF7L2,剪接变异体,或者其片段或者衍生物的核酸,使用的第二种载体包括编码转录激活结构域的核酸以及编码一种多肽的核酸,所述多肽可能与TCF7L2或者剪接变异体或者其片段或者衍生物相互作用。在合适条件(例如,例如Clontech(Palo Alto,California,USA)的MatchmakerTM系统中使用的交配条件)下孵育包含第一种和第二种载体的酵母,就可以鉴定表达感兴趣的标记物的菌落。检查这些菌落可以鉴定与TCF7L2或者其片段或者衍生物相互作用的多肽。这类多肽可以用作改变TCF7L2表达活性的药剂,如与治疗方法相关方面所述。
在本发明上述检测法的不止一个实施方式中,可能需要将TCF7L2基因,TCF7L2蛋白,TCF7L2结合剂(例如,Wnt信号途径或者钙粘蛋白途径的其他成员),或者检测法中的其他组分固定到固相支持物上,以便促进一种或者两种蛋白复合与非复合形式的分离,以及适应检测自动化。在待测药剂存在或者不存在的条件下,待测药剂与蛋白的结合,或者蛋白与结合剂的相互作用,可以在任何适于包含反应物的容器中进行。这类容器的实例包括微量滴定板,试管和微量离心管。在一个实施方式中,可以提供融合蛋白(例如,谷胱甘肽-S-转移酶融合蛋白),其添加一个TCF7L2,TCF7L2蛋白或者TCF7L2结合剂结合到基质或者其他固相支持物上的结构域。
在另一个实施方式中,采用一种方法鉴定本发明核酸分子的表达调节物,其中包含TCF7L2的细胞,细胞裂解产物或者溶液与待测药剂接触,然后检测细胞,细胞裂解产物或者溶液中相应mRNA或者多肽(例如剪接变异体)的表达。待测药剂存在条件下相应mRNA或者多肽的表达水平与待测药剂不存在条件下mRNA或者多肽的表达水平进行比较。基于这种比较,待测药剂可以被鉴定为表达调节物。例如,待测药剂存在条件下比其缺失条件下mRNA或者多肽的表达更高(统计上显著的更高),则待测药剂被鉴定为mRNA或者多肽表达的激发剂或者增强剂。此外,待测药剂存在条件下比其缺失条件下mRNA或者多肽的表达更低(统计上显著的更低),则待测药剂被鉴定为mRNA或者多肽表达的抑制剂。可以采用本文描述的检测mRNA或者多肽的方法检测细胞中mRNA或者多肽的表达水平。
本发明还涉及利用上述筛选检测方法鉴定的新的药剂。因此,在本文所述治疗方法中进一步使用本文所述鉴定的药剂也在本发明的范围内。例如,通过将蛋白或者核酸(或者包括多肽或者核酸的细胞)与本文所述鉴定的药剂接触,本文所述鉴定的药剂可用于改变TCF7L2基因编码蛋白的活性,或者改变TCF7L2的表达。
本发明的核酸
TCF7L2核酸,部分和变异体
本发明还涉及包括人TCF7L2的分离的核酸分子。本发明的TCF7L2核酸分子可以是RNA,例如,mRNA,或者DNA,例如cDNA和基因组DNA。DNA分子可以是双链或者单链;单链RNA或者DNA可以是编码或者正义链,或者非编码或者反义链。核酸分子可以包括全部或者部分基因编码序列,还可以包括其他非编码序列,例如内含子和非编码3′和5′序列(例如,包括调控序列)。
此外,本发明的核酸分子可以融合到标记物序列,例如,编码一种多肽的序列,其帮助多肽的分离或者纯化。这类序列包括,但不限于,编码谷胱甘肽-S-转移酶(GST)融合蛋白和编码流感血凝素A(HA)多肽标记物的序列。
本文使用的“分离的”核酸分子,是指那些与,通常位于基因或者核苷酸序列(如在基因组序列内)侧翼的核酸分离和/或已经完全或者部分从其他转录序列纯化(例如,在RNA文库内)。例如,本发明的分离核酸,相对于其天然产生的复杂细胞环境,或者当通过重组技术产生时的培养基,或者当化学合成时化学前体或者其他化学制剂,是基本上分离的。在有些情况下,分离的材料将成为组合物(例如,包含其他物质的粗提物),缓冲系统或者试剂混合物的一部分。在其他情况下,材料可以纯化到例如通过PAGE或者柱层析法例如HPLC检测基本均一的。优选的,分离的核酸分子包括至少大约50,80或者90%(摩尔比)的所有存在的高分子种类。就基因组DNA而言,术语“分离的”还指与染色体分离的核酸分子,所述染色体与基因组DNA是天然关联的。例如,分离核酸分子可以包含小于大约5kb但不限于4kb,3kb,2kb,1kb,0.5kb或者0.1kb的核苷酸,其在细胞基因组DNA内核酸分子的侧翼,所述细胞是核酸分子的来源。
核酸分子可以融合到其他编码或者调控序列,仍然被看作是分离的。因此,包括在载体内的重组DNA属于本文使用的“分离的”定义。此外,分离核酸分子包括异源宿主细胞内的重组DNA分子,以及溶液中部分或者基本上纯化的DNA分子。“分离的”核酸分子还包括本发明DNA分子的体内和体外RNA转录产物。分离的核酸分子可以包括化学或者重组方法合成的核酸分子或者核酸序列。因此,包括在载体内的重组DNA属于本文使用的“分离的”定义。此外,分离的核酸分子包括异源生物内的重组DNA分子,以及溶液中部分或者基本上纯化的DNA分子。本发明DNA分子的体内和体外RNA转录产物也包括在“分离的”核酸序列中。这类分离核酸分子可用于编码多肽的制备,作为分离同源序列(例如,来自其他哺乳动物种类)的探针,用于基因作图(例如,通过与染色体的原位杂交),或者用于检测组织中基因的表达(例如,人组织),例如通过Northern或者Southern印迹分析。
本发明还涉及核酸分子,所述核酸分子不必在自然界被发现,但其编码TCF7L2多肽,或者TCF7L2多肽的其他剪接变异体或者其多态性变异体。因此,例如,本发明涉及包括一种不同于天然存在的核苷酸序列的DNA分子,所述序列由于遗传密码的简并性,编码本发明的TCF7L2多肽。本发明还包括编码部分(片段)或者编码变异体多肽的核酸分子,所述变异体多肽例如TCF7L2多肽的类似物或者衍生物。这类变异体可以是天然存在的,例如等位基因变异或者单核苷酸多态性,或者非天然存在的,例如通过不同诱变剂和诱变处理进行诱导。预计的变异包括,但不限于,一个或多个核苷酸的添加,缺失和取代,这引起保守或者非保守氨基酸的改变,包括添加和缺失。优选的核苷酸(和/或生成的氨基酸)改变是沉默或者保守的;即,它们不改变TCF7L2多肽的特征或者活性。一方面,核酸序列是包括一种或者多种多态性微卫星标记物的片段。另一方面,核苷酸序列是包括一种或者多种TCF7L2基因单核苷酸多态性的片段。
本发明核酸分子的其他改变可以包括,例如,标记,甲基化,核苷酸间修饰例如无电荷键(例如,膦酸甲酯,磷酸三酯,磷酸酰胺,氨基甲酸酯),带电荷键(例如,硫代磷酸酯,二硫代磷酸酯),侧基(例如,多肽),嵌入剂(例如,吖啶,补骨脂素),螯合剂,烷化剂(alkylators),和修饰键(例如,alpha异头核酸)。合成分子也被包括在内,所述合成分子模拟核酸分子通过氢键作用和其他化学相互作用与指定序列结合的能力。这类分子包括,例如,那些分子骨架上肽键代替磷酸酯键的分子。
本发明还涉及在高严谨性杂交条件下与本文所述核苷酸序列杂交的核酸分子(例如,与编码多肽的核苷酸序列特定杂交的核酸分子,该多肽是本文描述的或者具有上述多肽的活性),例如选择性杂交。一方面,本发明包括本文所述的变异体,该变异体在高严谨性杂交条件(例如,选择性杂交)下与编码氨基酸序列或者其多态性变异体的核苷酸序列杂交。另一方面,在高严谨性杂交条件下杂交的变异体具有TCF7L2多肽的活性。
这类核酸分子可以通过特异杂交(例如,在高严谨性条件下)进行检测和/或分离。本文使用的“特异杂交”是指第一种核酸与第二种核酸以某种方式杂交的能力,所述方式使第一种核酸不与第二种核酸以外的所有核酸杂交(例如,当样品中第一种核酸与第二种核酸的相似性比任意其他核酸都要高时,才进行杂交)。杂交的“严谨性条件”是本领域的术语,是指孵育和洗涤条件,例如温度和缓冲液浓度条件,允许特定核酸与第二种核酸的杂交;第一种核酸可以与第二种核酸完全(即,100%)互补,或者第一种和第二种核酸的互补程度比完全互补低(例如,70%,75%,85%,90%,95%)。例如,某些高严谨性条件可以区分完全互补的核酸和互补性稍低的核酸。“高严谨性条件”,“中等严谨性条件”和“低严谨性条件”,以及核酸杂交方法阐述于Current Protocols in Molecular Biology的2.10.1-2.10.16页和6.3.1-6.3.6页(Ausubel,F.等人,″Current Protocols in MolecularBiology″,John Wiley & Sons,(1998)),和Kraus,M.和Aaronson,S.,Methods Enzymol,200:546-556(1991)。
通过比对序列用于最优的比较目的(例如,缺口可以导入至第一个序列的序列用于最优比对),可以确定两种核苷酸或者氨基酸序列同源性或者同一性的百分比。然后比较对应位置的核苷酸或者氨基酸,两个序列之间的百分相同比是序列共有的相同位置的数目的函数(即,%同一性=相同位置的数目/位置的总数×100)。当一个序列中的一个位置被另一个序列对应位置上相同的核苷酸或者氨基酸残基占据时,则上述分子在该位置是同源的。本文使用的核酸或者氨基酸“同源性”等同于核酸或者氨基酸“同一性”。某些情况下,用于比较目的而比对的序列的长度至少是参照序列长度的30%,例如,至少40%,某些情况下至少60%,和其他情况下至少70%,80%,90%或者95%。两个序列的有效比较可以利用公知方法进行,例如,利用一种数学算法。这类数学算法一个优选的、非限制性实例描述于Karlin等人,Proc.Natl.Acad.Sci USA 90:5873-5877(1993)。这种算法被整合到NBLAST和XBLAST程序(2.0版本),描述于Altschul等人,Nucleic Acids Res.25:389-3402(1997)。当使用BLAST和Gapped BLAST程序时,可以使用相应程序(例如,NBLAST)的缺省参数。一种情况下,序列比较的参数设为值=100,字长(W)=12,或者可以改变(例如,W=5或W=20)。
用于序列比较的数学算法的另一个优选、非限制性实例是Myers和Miller的算法,CABIOS 4(1):11-17(1988)。这种算法被整合到ALIGN程序(2.0版本),属于GCG序列比对程序包的一部分(Accelrys,Cambridge,UK)。当利用ALIGN程序比较氨基酸序列时,可以使用PAM 120权重残差表(weight residue table),间隙长度罚分(gap lengthpenalty)12,和缺口罚分(gap penalty)4。其他用于序列分析的算法是本领域公知的,包括Torellis和Robotti描述的ADVANCE和ADAM,Comput.Appl.Biosci.10:3-5(1994);以及Pearson和Lipman描述的FASTA,Proc.Natl.Acad.Sci.USA 85:2444-8(1988)。
另一方面,两个氨基酸序列间的同一性百分比可以利用GCG程序包中的GAP程序计算,使用BLOSUM63矩阵或者PAM250矩阵,缺口权重(gap weight)为12、10、8、6或者4,长度权重(length weight)为2、3或者4。另一方面,两个核酸序列间的同一性百分比可以利用GCG程序包中的GAP程序计算,使用缺口权重(gap weight)50和长度权重(length weight)3。
本发明还提供分离的核酸分子,所述核酸分子包含在高严谨性条件下与TCF7L2核苷酸序列或者这种序列的互补序列杂交的片段或者部分,还提供分离的核酸分子,所述核酸分子包含在高严谨性条件下与编码氨基酸序列或者其多态性变异体的核苷酸序列杂交的片段或者部分。本发明的核酸片段长度是至少大约15,优选的至少大约18,20,23或者25个核苷酸,并且长度可以是30,40,50,100,200或者更多个核苷酸。越长的片段,例如,长度是30或者更多个核苷酸,其编码本文所述抗原多肽,对例如下文所述的抗体生产是非常有用的。
探针和引物
在相关方面,本发明的核酸片段用作例如本文所述检测法中的探针或者引物。“探针”或者“引物”是以碱基特异方式与核酸分子互补链杂交的寡聚核苷酸。这类探针和引物包括多肽核酸,如Nielsen等人描述,Science 254:1497-1500(1991)。
探针或者引物包括与核酸分子的至少大约15个,例如大约20-25个,和在一些情况下大约40、50或者75个连续核苷酸杂交的核苷酸序列区域,所述核酸分子包括TCF7L2或者其多态性变异体的连续核苷酸序列。在其他情况下,探针或者引物包括100个或者更少的核苷酸,在一些情况下从6到50个核苷酸,例如从12到30个核苷酸。在其他情况下,探针或者引物与连续核苷酸序列或者连续核苷酸序列的互补序列至少有70%的相似性,例如至少80%同一性,在一些情况下至少90%同一性,和在其他情况下至少95%同一性,或者甚至能够与连续核苷酸序列或者连续核苷酸序列的互补序列选择性杂交。通常,探针或者引物还包括标记物,例如,放射性同位素,荧光化合物,酶,或者酶辅因子。
利用标准分子生物学技术和本文提供的序列信息,可以鉴定和分离如上所述的本发明核酸分子。例如,根据TCF7L2或者该序列的互补序列设计的,或者根据编码本文提供的一种或者多种氨基酸序列的核苷酸序列设计的合成寡聚核苷酸引物,利用聚合酶链式反应扩增和分离核酸分子。通产参见PCR Technology:Principles and Applications forDNA Amplification(ed.H.A.Erlich,Freeman Press,NY,NY,1992);PCR Protocols:A Guide to Methods and Applications(Eds.Innis等人,Academic Press,San Diego,CA,1990);Mattila等人,Nucl.Acids Res.19:4967(1991);Eckert等人,PCR Methods and Applications 1:17(1991);PCR(eds.McPherson等人,IRL Press,Oxford);和美国专利4,683,202。可以利用cDNA,mRNA或者基因组DNA作为模板扩增核酸分子,克隆到合适载体,通过DNA序列分析进行表征。
其他合适的扩增方法包括连接酶链式反应(LCR)(参见Wu和Wallace,Genomics 4:560(1989),Landegren等人,Science 241:1077(1988),转录扩增(Kwoh等人,Proc.Natl.Acad.Sd.USA 86:1173(1989)),和自主序列复制(Guatelli等人,Proc.Nat.Acad.Sd.USA 87:1874(1990))和依赖核酸的序列扩增(NASBA)。后两个扩增方法涉及基于等温转录的等温反应,产生的扩增产物为单链RNA(ssRNA)和双链DNA(dsDNA),比例分别为大约30或者100比1。
扩增的DNA可以被标记,例如,放射性标记,并用作筛选cDNA文库的探针,所述cDNA文库来自人细胞,在zap表达,ZIPLOX或者其他合适载体中的mRNA。可以分离相应克隆,体内切割后获得DNA,利用本领域公知的方法可以对克隆的插入物进行单向或者双向测序,鉴定编码合适分子量多肽的正确读码框。例如,利用商品化供应的公知方法可以对本发明核酸分子的核苷酸序列进行直接分析。参见,例如,Sambrook等人,Molecular Cloning,A Laboratory Manual(2nd Ed.,CSHP,New York 1989);Zyskind等人.,Recombinant DNA LaboratoryManual,(Acad.Press,1988))。此外,荧光方法也可用于分析核酸(Chen等人,Genome Res.9,492(1999))和多肽。利用这些或者相似方法,多肽和编码多肽的DNA可以被分离、测序和表征。
本发明的反义核酸分子可以根据TCF7L2核苷酸序列和/或互补序列或者部分核苷酸序列设计,按照本领域公知的步骤,利用化学合成和酶连接反应构建。例如,反义核酸分子(例如,反义寡聚核苷酸)可以利用天然存在的核苷酸或者不同修饰的核苷酸化学合成,所述修饰是为了提高分子的生物稳定性或者提高反义和正义核酸之间形成的双链的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。此外,反义核酸分子可以利用表达载体生物合成,在所述载体中沿反义方向已经亚克隆了核酸分子(即,从插入的核酸分子转录的RNA对于感兴趣的靶核酸是反义方向)。
核酸序列还可以用于与患者的内源DNA序列进行比较,以鉴定如上所述的一种或者多种病症,并且可以用作探针,这样就可以从样品中杂交和发现相关DNA序列或者排除已知序列。核酸序列还可以用于产生遗传指纹法的引物,利用DNA免疫技术生产抗-多肽抗体,以及作为抗原产生抗-DNA抗体或者激发免疫应答。本文鉴定的核苷酸序列的部分或者片段(和对应的完整基因序列)可在许多方面应用,例如多核苷酸试剂。例如,这些序列可用于:(i)在染色体上对它们各自的基因作图;和,因此,定位与遗传疾病相关的基因区域;(ii)从少量生物样品中鉴定个体(组织分型);和(iii)帮助生物样品的法医鉴定。此外,本发明的核苷酸序列可用于鉴定和表达重组多肽,所述重组多肽用于分析、表征或者治疗用途,或者作为组织标记物,其中对应多肽组成性表达,在组织分化期间表达或者在患病状态下表达。该核酸序列还可用作本文所述筛选和/或诊断方法中的试剂,还可以作为本文所述筛选和/或诊断方法所用试剂盒(例如,试剂盒)的组分。
用于诊断方法的试剂盒(例如,reagent kits)包括在本文所述任意方法中适用的组分,包括例如,本文描述的杂交探针或者引物(例如,标记的探针或者引物),检测标记分子的试剂,限制性酶(例如,用于RFLP分析),等位基因特异的寡聚核苷酸,与突变或者非突变(天然)TCF7L2多肽结合的抗体,包括TCF7L2核酸或者TCF7L2的一部分的核酸扩增工具,或者如本文描述的分析TCF7L2核酸或者分析TCF7L2多肽氨基酸序列的核酸序列的工具,等等。一方面,诊断II型糖尿病易感性的试剂盒可以包括用于扩增TCF7L2核酸内区域的引物,所述区域包含在患有II型糖尿病或者II型糖尿病易感的个体频率更高的标记物DG10S478,SNP rs12255372,rs895340,rs11196205,rs7901695,rs7903146,rs12243326和/或rs4506565,或者风险单倍型。可以根据SNPs侧翼的核酸部分设计引物,所述SNPs指示II型糖尿病。
载体和宿主细胞
本发明的另一方面涉及包含本文所述核酸分子和其互补序列(或者其一部分)的核酸构建体。该构建体包括载体(例如,表达载体),其中本发明的序列已经按正义或者反义方向插入载体中。本文使用的术语“载体”是指能够转运与其连接的另一种核酸分子的核酸分子。一类载体是“质粒”,指可以连接其他DNA片段的环状双链DNA环。另一类载体是病毒载体,其中其他DNA片段可以连接到病毒基因组中。某些载体能够在它们被导入的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如,非附加型哺乳动物载体)在导入宿主细胞时整合到宿主细胞的基因组中,从而随宿主基因组进行复制。表达载体能够指导与它们可操作连接的基因的表达。重组DNA技术中表达载体的应用通常是采取质粒形式。但是,本发明预期包括这类其他形式的表达载体,例如具有等同功能的病毒载体(例如,复制缺陷型逆转录病毒,腺病毒和腺相关病毒)。
在一些情况下,本发明的重组表达载体包括本发明的核酸分子,所述核酸分子的形式适于宿主细胞中的核酸分子表达。这表明重组表达载体包括一种或者多种调控序列,根据待用于表达的宿主细胞进行选择,所述载体与待表达的核酸序列可操作的连接。在重组表达载体内,“可操作的连接”或者“操作的连接”是指感兴趣的核苷酸序列以某种方式连接到调控序列,该方式允许该核苷酸序列的表达(例如,在体外转录/翻译系统或者当载体导入宿主细胞时在宿主细胞中)。术语“调控序列”包括启动子,增强子和其他表达控制元件,(例如,多腺苷酸化信号)。这类调控序列描述于,例如,Goeddel,″GeneExpression Technology″,Methods in Enzymology 185,Academic Press,San Diego,CA(1990)。调控序列包括那些在许多类型的宿主细胞中指导核苷酸序列组成性表达和只在某些宿主细胞中指导核苷酸序列表达(例如,组织-特异调控序列)的序列。本领域技术人员应了解表达载体的设计取决于这类因素,如待转化宿主细胞的选择和所需的多肽表达水平。本发明的表达载体可以导入宿主细胞从而产生本文所述核酸分子编码的多肽,包括融合多肽。
本发明的重组表达载体可以设计成在原核或者真核细胞中表达本发明的多肽,例如,细菌细胞例如E.coli,昆虫细胞(利用杆状病毒表达载体),酵母细胞或者哺乳动物细胞。合适的宿主细胞还描述于Goeddel,supra。此外,重组表达载体可以在体外转录和翻译,例如利用T7启动子调控序列和T7聚合酶。
本发明的另一方面涉及被导入本发明重组表达载体的宿主细胞。术语“宿主细胞”和“重组宿主细胞”是在本文中是可以互换使用的。应了解这类术语不仅指特定个体细胞而且还指这类细胞的后代或者潜在后代。由于突变或者环境影响后继世代可能存在某些修饰,这类后代实际上可能不同于母细胞,但仍然包括在本文使用的该术语范围内。
宿主细胞可以是任意的原核或者真核细胞。例如,本发明的核酸分子可在细菌细胞(例如,E.coli),昆虫细胞,酵母或者哺乳动物细胞(例如中国仓鼠卵巢细胞(CHO)或者COS细胞)中表达。其他合适的宿主细胞是本领域技术人员公知的。
载体DNA可以通过常规转化或者转染技术导入原核或者真核细胞。本文使用的的术语“转化”和“转染”是指将外源核酸分子(例如,DNA)导入宿主细胞的本领域已知的各种技术,包括磷酸钙或者氯化钙共沉淀,DEAE-葡聚糖介导的转染,脂质体转染或者电穿孔。转化或者转染宿主细胞的合适方法可参见Sambrook等人(supra)和其他实验手册。
对于哺乳动物细胞的稳定转染,众所周知,依赖于使用的表达载体和转染技术,只有小部分细胞可以将外源DNA整合到它们的基因组中。为了鉴定和选择这些整合体,编码选择性标记物(例如,抗生素抗性)的基因通常和感兴趣的基因一起导入宿主细胞。优选的选择标记物包括那些产生抗药性的标记物,例如G418,潮霉素和氨甲蝶呤。编码选择性标记物的核酸分子可以与本发明的核酸分子在相同载体上导入宿主细胞,或者在单独载体上导入。稳定转染有导入的核酸分子的细胞可通过药物选择鉴定(例如,整合选择性标志物基因的细胞存活,而其他细胞死亡)。
本发明的宿主细胞,例如培养的原核或者真核宿主细胞可用于产生(即,表达)本发明的多肽。因此,本发明还提供利用本发明的宿主细胞产生多肽的方法。一方面,该方法包括在合适培养基中培养本发明的宿主细胞(其中已经导入编码本发明多肽的重组表达载体)以产生多肽。另一方面,该方法还包括从培养基或者宿主细胞分离多肽。
本发明的抗体
本发明还提供与一种形式的基因产物特异结合而不与另一种形式的基因产物结合的多克隆抗体和/或单克隆抗体。本发明还提供与变异体或者参照基因产物的一部分结合的抗体,所述变异体或者参照基因产物包含多态性位点。本文使用的术语“抗体”是指免疫球蛋白分子和免疫球蛋白分子的免疫活性部分,即,包含特异结合抗原的抗原结合位点的分子。特异结合本发明多肽的分子是与该多肽或者其片段结合,但基本上不与样品中其他分子结合的分子,所述样品,例如,天然包含多肽的生物样品。免疫球蛋白分子免疫活性部分的实例包括F(ab)和F(ab′)2片段,这可以通过用酶例如胃蛋白酶处理抗体产生。本发明提供结合本发明多肽的多克隆和单克隆抗体。本文使用的术语“单克隆抗体”或者“单克隆抗体组合物”,是指只包含一种抗原结合位点的抗体分子集合,所述抗原结合位点能够与本发明多肽特定抗原表位发生免疫反应。因此单克隆抗体组合物通常对与其发生免疫反应的本发明特定多肽显示单一结合亲和力。
多克隆抗体可以如上所述制备,利用所需免疫原,例如,本发明的多肽或者其片段,免疫合适个体。通过标准技术可以随时间监控免疫个体中的抗体滴度,例如利用固定多肽的酶联免疫吸附(ELISA)。如果需要,可以从哺乳动物(例如,从血液)分离针对多肽的抗体分子,采用公知技术进一步纯化,例如蛋白A层析法以获得IgG级分。在免疫后的合适时间,例如,当抗体滴度最高时,抗体产生细胞可以从个体获得,并用于通过标准技术制备单克隆抗体,例如杂交瘤技术,最初描述于Kohler和Milstein,Nature 256:495-497(1975),人B细胞杂交瘤技术(Kozbor等人,Immunol.Today 4:72(1983)),EBV-杂交瘤技术(Cole等人,Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,1985,Inc.,pp.77-96)或者三源杂交瘤技术。产生杂交瘤的技术是已知的(通常参见Current Protocols in Immunology(1994)Coligan等人.,(eds.)John Wiley & Sons,Inc.,New York,NY)。概括的说,永生化细胞系(通常是骨髓瘤)与淋巴细胞(通常是脾细胞)融合,所述淋巴细胞来自上述免疫原免疫的哺乳动物,筛选所得杂交瘤细胞的培养上清液,鉴定产生与本发明多肽结合的单克隆抗体的杂交瘤。
大量公知的用于融合淋巴细胞和永生化细胞系的实验规程均可用于产生本发明多肽的单克隆抗体的目的(参见,例如,Current Protocolsin Immunology,supra;Galfre等人,Nature 266:55052(1977);R.H.Kenneth,in Monoclonal Antibodies:A New Dimension In BiologicalAnalyses,Plenum Publishing Corp.,New York,New York(1980);和Lerner,YaIe J.Biol.Med.54:387-402(1981))。此外,普通技术人员应了解还存在这类方法的许多变形,它们也是有用的。
制备分泌单克隆抗体的杂交瘤的另外一种方法,利用多肽筛选重组组合免疫球蛋白文库(例如,抗体噬菌体展示文库)从而分离结合多肽的免疫球蛋白库成员,可以鉴定本发明多肽的单克隆抗体。用于产生和筛选噬菌体展示文库的试剂盒是商品化供应的(例如,thePharmacia Recombinant Phage Antibody System,Catalog No 27-9400-01;和the Stratagene SurfZAPTM Phage Display Kit,Catalog No 240612)。此外,特别适用于产生和筛选抗体展示文库的方法和试剂的实例可见于,例如,美国专利号5,223,409;PCT公开号WO 92/18619;PCT公开号WO 91/17271;PCT公开号WO 92/20791;PCT公开号WO 92/15679;PCT公开号WO 93/01288;PCT公开号WO 92/01047;PCT公开号WO92/09690;PCT公开号WO 90/02809;Fuchs等人,Bio/Technology 9:1370-1372(1991);Hay等人,Hum.Antibod.Hybridomas 3:81-85(1992);Huse等人,Science 1Aβ:1275-1281(1989);和Griffiths等人,EMBO J.12:725-734(1993)。
此外,利用标准重组DNA技术产生的重组抗体,例如嵌合和人源化单克隆抗体,包括人和非人部分,也包括在本发明的范围内。这类嵌合和人源化单克隆抗体可以通过本领域已知的重组DNA技术产生。
通常,本发明的抗体(例如,单克隆抗体)可用于通过标准技术分离本发明的多肽,例如亲和层析法或者免疫沉淀法。多肽特定抗体可以帮助从细胞中纯化天然多肽,以及对宿主细胞中表达的重组多肽进行纯化。此外,对本发明多肽特异的抗体可用于检测多肽(例如,在细胞裂解产物,细胞上清液或者组织样品中),以便计算多肽的表达丰度和模式。抗体可以用于诊断用途,作为临床检测方法的一部分来监控组织中的蛋白水平,例如,确定给定治疗方法的效果。抗体可以偶联到可检测的物质以帮助其检测。可检测物质的实例包括各种酶,辅基,荧光材料,发光材料,生物发光材料,和放射性物质。合适酶的实例包括辣根过氧化酶,碱性磷酸酶,beta-半乳糖苷酶,或者乙酰胆碱酯酶;合适辅基复合物的实例包括链亲和素/生物素和亲和素/生物素;合适荧光材料的实例包括伞形酮,荧光素,异硫氰酸荧光素,若丹明,二氯三嗪胺荧光素,丹磺酰氯或者藻红蛋白;发光材料的实例包括鲁米诺;生物发光材料的实例包括荧光素酶,荧光素,和水母发光蛋白,和合适放射性物质的实例包括125I,131I,35S或者3H。
现在通过下列例证解释本发明,其不应当在任一方面被认为是限制性的。
实施例
此处描述的是利用10q基因座内密集的微卫星标记物,通过单点关联分析,鉴定转录因子7-样2(TCF7L2-原先的TCF4)为导致患II型糖尿病风险的基因。
方法
冰岛群组
冰岛数据保护机构(Data Protection Authority of Iceland)和冰岛国家生物伦理委员会(National Bioethics Committee of Iceland)批准了此项研究。所有研究参与者都签署了知情同意书。与血液样品、医学信息和家系相关的所有个人身份资料首先由数据保护机构利用第三方加密系统(18)(Data Protection Authority)加密。
为了这项研究,2400名II型糖尿病患者被鉴别,他们或者在冰岛心脏协会(Icelandic Heart Association)过去30年的长期流行病学研究中被诊断,或者在过去12年中在雷克雅未克(Reykjavik)的两家主要医院中被诊断。这些患者中的三分之二存活,代表现在已知的大约一半的冰岛II型糖尿病患者人群。为了这项研究,我们和这些患者中的大多数进行接触,合作比例超过80%。这项研究的所有参与者都访问了冰岛心脏协会,在那里他们回答了一份问卷,进行了抽血和空腹血糖检测。问卷包括关于药物治疗和诊断时年龄的问题。这项研究中的II型糖尿病患者按照我们先前发表的连锁研究(10)所述的进行诊断。简单地说,II型糖尿病的诊断由医生根据先前的医疗记录,药物治疗历史和/或新的实验室测量方法来确认。对于先前确诊的II型糖尿病患者,使用口服降糖药的报告证实II型糖尿病。当前接受胰岛素治疗的个体,如果他们也使用或者以前使用口服降糖药,则被划分为患有II型糖尿病。在这个群组里,大多数接受药物治疗的患者服用口服降糖药,只有少部分(9%)需要胰岛素。对于至今未能诊断的个体,II型糖尿病和空腹血糖受损(IFG)的诊断基于美国糖尿病协会(AmericanDiabetes Association)制定的标准(Expert Committee on the Diagnosisand Classification of Diabetes Mellitus 1997)。这项研究中II型糖尿病患者的平均年龄是69.7岁。
重复群组
丹麦研究组选自丹麦的PERF(Prospective Epidemiological RiskFactors,预期流行病学危险因素)研究(19)。228位女性已经先前确诊患有II型糖尿病和/或检测出>=7mM血糖。作为对照,539位未患病(相对II型糖尿病)女性从相同研究群组中随机抽出。
美国的PENN CATH研究是1998年7月至2003年3月期间在宾夕法尼亚大学医疗中心(University of Pennsylvania Medical Center)接受心导管插入术的患者连续群组中进行的生化和遗传因素与冠状动脉粥样硬化关联性的抽样研究(cross sectional study)。II型糖尿病定义为具有以下病史,空腹血糖>126mg/dl,餐后2小时血糖>200mg/dl,40岁以上个体中使用口服降血糖药或者胰岛素。宾夕法尼亚大学机构审查委员会(University of Pennsylvania Institutional Review Board)批准了研究计划,所有参与者都签署了知情同意书。通过自述进行种族划分。361个白种人II型糖尿病病例来自这个群组。530位未患病(相对II型糖尿病和心肌梗死)的白种人对照从相同研究群组中随机抽出。
用于基因分型的DNA是利用GenomiPhi Amplification试剂盒(Amersham),从丹麦和美国II型糖尿病患者和对照的外周血分离的DNA的全基因组扩增产物。
基因分型
在94个对照中利用串联重复发现软件(20)鉴定新的序列重复(即二核苷酸、三核苷酸和四核苷酸重复),检测多态性。CEPH样品1347-02(CEPH基因组库)低频等位基因碱基对的大小被从微卫星扩增子的大小中减去,用作参照。利用直接DNA测序(Applied BioSystems)或者Centaurus平台(Nanogen)进行SNP基因分型。
关联分析的统计方法
对于单一标记物与II型糖尿病的关联,我们使用似然比检验计算各等位基因的两侧p-值。对于使用的微卫星,我们提供等位基因频率而不是携带者频率。
我们采用乘法模型(16,17)计算相对危险度(RR)和人群归因危险度(PAR)。对于CEPH白种人HapMap数据,我们利用D′(21)和R2(22)的标准定义计算SNPs配对之间的LD。当对全部SNP组合作图以说明特定区域中的LD结构,我们将D′绘制在左上角,p-值绘制在右下角。在我们展示的LD图中,标记物绘制成等距的,而不是根据它们的物理位置。
结果
基因座范围的关联研究
我们过去报道了在冰岛人群中染色体5q与II型糖尿病基因组范围的显著连锁(10);在相同的研究中,我们还报道与10q和12q连锁的指示性证据。为了对10q基因座进行研究,我们采用关联方法,利用对应这个基因座跨越10.5Mb区域(NCBI Build 34:Chr10:114.2-124.7Mb)的高密度的基因分型的微卫星标记物。我们鉴定和分型了228个微卫星标记物--即一个标记物的平均密度为46kb(表1)。全部标记物都分型到1185位冰岛II型糖尿病患者和931位无关的人群对照。
表1:人类基因组集合NCBI Build 34中染色体10上228个基因分型的微卫星的位置。
Figure 2006800221296A00800041
Figure 2006800221296A00800071
Figure 2006800221296A00800101
鉴定与DG10S478相关的微卫星标记物的单一标记物关联分析(表2和图1)。
表2:在冰岛DG10S478与II型糖尿病的关联
Figure 2006800221296A00800111
6个等位基因中观察到这种四核苷酸重复,等位基因0,8和12占人群对照中染色体的98%。相对于其他组合的等位基因,等位基因0显示保护性关联(相对危险度(RR)=0.67;P=2.1×10-9)。这个P-值是两侧的,考虑了一些患者彼此具有亲缘关系。DG10S478位于10q25.2上转录因子7-样2(TCF7L2-原先的TCF4)基因的内含子3中。这个标记物在明确定义的74.9kb LD块内(基于CEPH白种人HapMap PhaseII),包含内含子3的一部分、外显子4的全部和内含子4的一部分(图1)。
当在CEPH白种人HapMap家族DG10S478被基因分型时,清楚的观察到SNP rs12255372的等位基因G与DG10S478的等位基因0几乎完全相关(r2=0.95,P=5.53×10-38),rs12255372的等位基因T与DG10S478的其他等位基因相关。此外,DG10S478的等位基因8和12造成的风险一致(P=0.3)。因此很自然将DG10S478的所有非0等位基因合并成一个复合等位基因,称为等位基因X。等位基因X在对照和患者中的频率分别是27.6%和36.4%。采用乘法模型(16,17),相对非携带者的风险,带有的每拷贝的等位基因X预测RR为1.50。
与II型糖尿病关联的DG10S478的重复
为了验证DG10S478与II型糖尿病的关联,在228个病例的丹麦II型糖尿病群组和539个对照中对微卫星进行基因分型。丹麦群组选自丹麦的PERF(Prospective Epidemiological Risk Factors,预期流行病学危险因素)研究(19)。这个女性II型糖尿病群组先前已经确诊患有II型糖尿病。冰岛观察到的关联被重复(表3)。
表3:在丹麦DG10S478与II型糖尿病的关联
Figure 2006800221296A00800121
复合风险等位基因X在对照中频率为26.0%,在II型糖尿病中为33.1%,得到的估计RR为1.41(P=0.0048)。
随后,在PENN CATH研究的包括美国白种人361个II型糖尿病群组病例和530个对照的中对微卫星进行基因分型。这项研究是在宾夕法尼亚大学医疗中心(University of Pennsylvania Medical Center)接受心导管插入术的患者连续群组中进行的生化和遗传因素与冠状动脉粥样硬化关联性的横断研究。II型糖尿病定义为具有以下病史,空腹血糖>126mg/dl,餐后2小时血糖>200mg/dl,40岁以上个体中使用口服降血糖药或者胰岛素。在冰岛人中观察到的关联在这个种群中也被重复(表4)。
表4:在美国DG10S478与II型糖尿病的关联
复合风险等位基因X在对照中频率为25.3%,在II型糖尿病中为38.5%,得到的估计RR为1.85(P=3.3×10-9)。利用Mantel-Haneszel模型(NOTE 3),从全部3个群组得到的组合得到总的两侧P是4.7×10-18
3个种群中复合风险等位基因与II型糖尿病的关联构成强有力证据,表明TCF7L2基因变异体增加患II型糖尿病风险。
在毫无疑问的建立等位基因X与II型糖尿病的关联之后,我们更细致的研究了遗传方式。显性模型和隐性模型可以被拒绝,因为杂合体携带者相对非携带者风险显著升高(P<1×10-6),相对纯合子携带者风险显著降低(P<0.0001)。乘法模型提供更好拟合,但有证据说明纯合子携带者相对杂合体携带者的风险大于杂合体携带者相对于非携带者的风险。表5提供杂合体携带者和纯合子携带者相对非携带者的相对危险度的无模型估算。
表5:相对危险度的无模型估算
Figure 2006800221296A00800141
3个群组对风险等位基因具有相似的种群频率,但RR估值不同;美国群组中效应最强,丹麦群组中效应最弱。尽管在群组中RR相同是没有理由的,应当注意估算相对危险度的差异不需要没达到统计显著性(P>0.05)。对采用常用相对危险度从群组得到的结果进行组合,,杂合体携带者和纯合子携带者相对非携带者的相对危险度据估算分别为1.45和2.41(表5)。假设风险等位基因的种群频率是26%,则杂合体和纯合子的携带者分别占种群的38%和7%。因此,这种变异体对于临床使用具有良好的预测价值。对应种群归属风险是21%,这从公共卫生观点来看是实质性的。
还应注意到等位基因X在空腹血糖受损(IFG)个体(空腹血糖在6.1和6.9mM之间)中过量。复合风险等位基因X在1393个对照中频率为27.7%,在278个IFG病例中为37.1%,得到估算的RR为1.54(P=1.36×10-5)。
TCF7L2外显子4LD块内SNP标记物与II型糖尿病的关联
我们在表6中列出位于TCF7L2外显子4LD块内的微卫星和SNP标记物。该表包括公布的SNPs,以及通过对整个LD块区域测序发现的SNPs。该表还提供位于所述块内的多态性微卫星标记物。
表6.位于TCF7L2外显子4LD块内的多态性标记物(在标记物rs4074720和rs7087006之间,定位在Build 34坐标:rs4074720(B34:114413084)-rs7087006(B34:114488013)=74929bp。对序列识别索引进行合适的标记,涉及各种情况下包括多态性的扩增引物和正反向引物的SEQ ID号,如序列表所示。
A.公共SNPs(包括全部HapMap种族)
Figure 2006800221296A00800151
Figure 2006800221296A00800161
B.发现的新SNPs,随后在TCF7L2外显子4LD块内验证(扩增引物如下):
C.TCF7L2外显子4LD块内的多态性微卫星(扩增引物如下):
Figure 2006800221296A00800182
表7.TCF7L2外显子4LD块内选择性标记物的扩增引物和引物
>DG10S478
TTCAGGCCATTGGTGTTGTATATATTTCAAGATTTGCTCACAGGTCCAAAGCT
TAACTTAAGCTCCCTGAGACATATCATAAAATATGATTTGGGGAAAAACCCT
AATGGGCCATGATCAGAACATTATTATTCAACAAAGGATGAAATGCTTAAGC
CAAGATGGCCTTCTTTCTTTCTTTCTTTCTTTCTTTTTTTTTAATGAAAGTTGA
GCAGACTCCCGTCCAACAGTTTTCAATGTAGGAATTCCCACAGCCCCATTTG
ATTGCAGTTTGTTGAAAAGTTTAATGTTTTTGTAGGCAATTCATAATTTCCAC
ATTGAACAGCCTGAGAGGAAGAGAGCTGGAGCCCACTGTTGTTTTTGTAGTG
GGATGGTGGGAACTTT(SEQ ID NO:2)
引物:
F:TTCAGGCCATTGGTGTTGTA(SEQ ID NO:3)
R:AAAGTTCCCACCATCCCACT(SEQ ID NO:4)
>rs12255372
TTGTCCCTTGAGGTGTACTGGAAACTAAGGCGTGAGGGACTCATAGGGGT
CTGGCTTGGAAAGTGTATTGCTATGTCCAGTTTACACATAAGGATGTGCA
AATCCAGCAGGTTAGCTGAGCTGCCCAGGAATATCCAGGCAAGAAT
K
ACCATATTCTGATAATTACTCAGGCCTCTGCCTCATCTCCGCTGCCCCCC
CGCCCCCTGACTCTCTTCTGAGTGCCAGATTCAGCCTCCATTTGAATGCCAA
ATAGACAGGAAATTAGCATGCCCAGAATCCACGTCTTTAGTGCACTCT
TCCCCAGCTCCAAACCTGTTACTGCTTGTGTTCAACATCTCAGTAAAGCTCA
ACAACATCGACCCATT(SEQ ID NO:5)
引物:
F:TTGTCCCTTGAGGTGTACTGG(SEQ ID NO:6)
R:AATGGGTCGATGTTGTTGAG(SEQ ID NO:7)
>rs12243326
GCTGTGAAATCCCCTGTGTAGTGGGAAGAAGAAATAGCAAATCTTAGCTGC
CTTGGACCTGATATAATTATTTGTCTTCATTTACATGGTT
Y
ATCCTTCAAGGTTGAATAAATGATGTGGGAGCTAGTCAAGGGGCTTTAGGTA
TGTGATTTCATGCCTACTTTTTTTTAGGTAGAGAAACTGAGGTCACAGGGTA
CTAGAGAATGGACTCTAAGATTCAGGTTTCTGAATTGCCTGTGGTTTTGTTG
ACTCAACTGCTCTTCTGTTGTTTTTTAGCCACATGCCTTGAAACAGTCCTCTT
TCCCATGTTTCTTCATCAGCACCATTAACCCAAGGTATACTGTCCTCTCTTAT
CTTTCACAAGGTCTTGGAGTTCCCATGCCTTTGTAAGCATCCCTCCCCGAGAT
TCAGCACCAACCAAAATCACATTTGGAAAAATTGCTTGTTTCCCAAGAAGCT
TTGGAGGATATGATTTTGTATAGAACGGGTTCACAGGTTTTCTGTTCATTCTT
CTATGGTGGAGTGTGTGTGTATGTGACTCTGTCTTCTCTCCATTCC(SEQ IDNO:8)
引物:
F:GCTGTGAAATCCCCTGTGTAG(SEQ ID NO:9)
R:GGAATGGAGAGAAGACAGAGTCA(SEQ ID NO:10)
>rs7903146
AAGGGAGAAAGCAGGATTGAGCAGGGGGAGCCGTCAGATGGTAATGCAGA
TGTGATGAGATCTCTGCCGGACCAAAGAGAAGATTCCTTTTTAAATGGTGAC
AAATTCATGGGCTTTCTCTGCCTCAAAACCTAGCACAGCTGTTATTTACTGA
ACAATTAGAGAGCTAAGCACTTTTTAGATA
Y
TATATAATTTAATTGCCGTATGAGGCACCCTTAGTTTTCAGACGAGAAACCA
CAGTTACAGGGAAGGCAAGTAACTTAGTCAATGTCAGATAACTAGGAAAAG
GTTAGAGGGGCCCTGGACACAGGCCTGTGTGACTGAGAAGCTTGGGCACTTC
ACTGCTACATTTCATCTCTTCGCT(SEQ ID NO:11)
引物:
F:AAGGGAGAAAGCAGGATTGA(SEQ ID NO:12)
R:AGCGAAGAGATGAAATGTAGCA(SEQ ID NO:13)
>rs4506565
CTGATGAGGGTAGGGAGCATCTGTCTGCAGCTTCATCTTCATTGTCTAGGGG
CTCCAGAAATATCTGTGAGTAAATAAGTTATTTAATCTTTGCCTCAAATTTCC
AGTGACTGTAGGGATATAGCTGTGAGCCTCTAGGAGCTGAGATTTTTTAAAT
TTCCCACTTAAACATTTATTTAAAAATTTTGTGCTCAGCATGG
ACTAAGGACTTTACATTCATTAACTCATTTACAGCTTGATCCTATGCGGT
GGGCATTCATTTACAGAGGATCCCATTTTACAGGTGAGGAAGAGGCCAGC
TAGGGGTGCAGCCTAGGTTAGTATTCTAGAGCTCATCAGGCTGTGTTGTC
XCAGTGAAAGAATAAGCAAAGAAGTGAATGTTGTGCATTGAGAAAAATG
ACTCTCGGAGGAGGATGAGCCTCTCGGATATGGCGACCGAAGTGAT
W
TGGGGCCCTTGTCAAGGGTCTCTATTATGGCATCAAGAAAAGATGCTGCT
TTCGGTGATGCCCGAGGAGAGCCTCAATATTTTACATGGGAAACCTAAAA
AAGGGGCCATGTTGTGGTCTCTGCACCTAAGA(SEQ ID NO:14)
引物:
F:CTGATGAGGGTAGGGAGCA(SEQ ID NO:15)
R:TCTTAGGTGCAGAGACCACAAC(SEQ ID NO:16)
>rs7901695
TATTTAGAAACCATAAAATCCACCTATTTGAGGTGTACAATTGAGTGATTTT
CTGTATAGTCACAGATCTGTGCAGTCATCCACACCCTCTAACTCCAGGACAT
TTTCCTCACCCCCGAGGAGAAACCTCCCTTACCCATTAGCAGTCACTCCTCAT
TTCCTCTCCCCCCAGCCCCTGGCAATCACTGTGGATTTGCCTGTTCTTGACAT
TTCATATAAATGGTATCATAAAATCTA
Y
GGGCTTTTGTGTCTGTCTGCTTTCACTTAGCATACGGTTCTCAAGGTTCATCC
AGTATTGTAGCATCTATCAGTATGTCATTCCTTTTTATGGCCAAATAATATTT
TATTGTATGGATAGACATTTTGTTTATTCATTTATCTGTTTTTGGTTATTATGA
GTAACACTACTATGAACATTTTGCACAAATTTTTGTATTGACATGTTTTCATT
TCTCCTGGGTATAGTCCTATGAGTGGAATTGCTGG(SEQ ID NO:17)
引物:
F:TATTTAGAAACCATAAAATCCACCTAT(SEQ ID NO:18)
R:CCAGCAATTCCACTCATAGGAC(SEQ ID NO:19)
>rs11196205
TTGTCTCCTTTTGTTTCTGCTACTGTGAATGATCCTGTGATGATCATCTTTGTG
TGTAAATCTTTGTCCCCTCGCCCCCTCCCCTTTTATTATTTTCTTGGGATAGA
CCCCAGGACAAAAGGTAGAAAAGAACAAAGTGTTAAAAAATTTCTTGATAC
ATAGCCACAGATTATTTTCCTGAAAGTTCTCAACATTTATAACTAC
S
AGCAGTATGTAAGAGAGTTATGGTTGGAATGATTTTAATGTCTCTGGGGAAT
TTAACAACAAAAAAACTTTAGGCTTCTTTGGAGAGAGACATGCCCTTA
ACTCCACCCCGCCCTAGAACAGAGACCCAGCCCATCCAAGTCAGCCTCCC
CAGGTCCTCCACCTTCAAAACAGGCAAACGAAATCATTTCTTGAATAATT
GGTAGGCTTCAAGGTCAGATGTT(SEQ ID NO:20)
引物:
F:TTGTCTCCTTTTGTTTCTGCTAC(SEQ ID NO:21)
R:AACATCTGACCTTGAAGCCTAC(SEQ ID NO:22)
>rs7895340
TCAGGGACAGTGCATAGGTGTAAAGAAGTTGCTGGTTGGGGGTTCTAATGC
AGGTTTCTCCAAAAGTGAATGCCCTGTTAAAAAAAAATTCTTAACAAATATA
CAGAGATTTTTTTTTTAAAAAAGTGTGACAGTTCTAGACACCTAGAGAGTAA
A
R
TGAAGAAGCCTGTTTTCAGGTTTCCCGCCTCCCTGAATTTCCCAGCATGGTCC
AGGCTTTGAAATTTATTTATCTGCTTTTGGCAATGGTTGATGGGAATTTCCCA
CATTTATTTTTTAGCTACAGAGAAAGGACATTATCTTTAAAATCTCTTCGTTG
TTCTCTCTCTTTGA(SEQ ID NO:23)
引物:
F:TCAGGGACAGTGCATAGGTG(SEQ ID NO:24)
R:TCAAAGAGAGAGAACAACGAAGA(SEQ ID NO:25)
>SG10S405
TATTTAGAAACCATAAAATCCACCTATTTGAGGTGTACAATTGAGTGATTTT
CTGTATAGTCACAGATCTGTGCAGTCATCCACACCCTCTAACTCCAGGACAT
TTTCCTCACCCCCGAGGAGAAACCTCCCTTACCCATTAGCAGTCACTCCTCAT
TTCCTCTCCCCCCAGCCCCTGGCAATCACTGTGGATTTGCCTGTTCTTGACAT
TTCATATAAA
Y
GGTATCATAAAATCTATGGGCTTTTGTGTCTGTCTGCTTTCACTTAGCATACG
GTTCTCAAGGTTCATCCAGTATTGTAGCATCTATCAGTATGTCATTCCTTTTT
ATGGCCAAATAATATTTTATTGTATGGATAGACATTTTGTTTATTCATTTATC
TGTTTTTGGTTATTATGAGTAACACTACTATGAACATTTTGCACAAATTTTTG
TATTGACATGTTTTCATTTCTCCTGGGTATAGTCCTATGAGTGGAATTGCTGG
GTCATATAATAAATAACTGTTTAACATTTTGGGGAGCTGCCAAACTTTTAAA
ACCTTGGGTTCTGTGATGTACCAGTTGTGTTAGGCA(SEQ ID NO:26)
引物:
F:TATTTAGAAACCATAAAATCCACCTAT(SEQ ID NO:27)
R:TGCCTAACACAACTGGTACATC(SEQ ID NO:28)
>SG10S428
TGCCAGGGGTTTTATGGTTAATTTTCCTCCATTATGAGGGTTGACTCAGCCTT
GGGTATTAGATGTCTTTGAGAATCCAGGGTTCAAATACCACAGCTGGTAGAA
TGTTTCTCAACTTGGAGCCAATCTCCATCTACTGAAGGTACGCTGGTTTAGA
CAGACAACAGGGACATCAGCATTTTAAAAAGCGGTGGAAAAAGTTTGCTTG
TCTTGATTGGAGCCATGACATTTTATTTTGAAATTTCAAATAACATGAAGGG
AGGTTTGGAGCGGTTTTTGGTTTATCCAAAGGGCAGTGGATTGAAGGCTGAG
AAACACCAGGCTGAATGGGAGAGGGGTTGGGGTCCCCCTGTGAGATAGTGA
AACAATGGTAGTGCCATCCAATGATAGGCACTTTTCTGTCATTCAGAAGCAG
AAAGGGGGCCAGAGGCCCATTGGCCTTACTGGG
M
AGTAAGCTGTAGAGCTGCTGCCTTTTCGTGAAAGGGTTGACACCAACCTTCT
CCCCCAGGAAGAGTGACCAGGGACCTGAGGGGCATGGTCGAGCAGATGACA
GCCTTTGTAAAACATCTCC(SEQ ID NO:29)
引物:
F:TGCCAGGGGTTTTATGGTTA(SEQ ID NO:30)
R:GGAGATGTTTTACAAAGGCTGTC(SEQ ID NO:31)
>SG10S422
TTGGTAGAGATGGGGTCTCCTAGGCTGGTCTTGAACTCCTGG
R
CTCAAGCAATCTTCCTGCCTCAGCCTTCCAAAGTACTGGGATTACTGGCGTG
GGCCACCATGCCTGGCTTGAAATTTTTCTATGGCTTTATTCTTTCTCCAAGTA
CAGAGTCTACCCAACCTTCTGAGATCTTTGGTTTTCTTTTCCTAGGTAACTAT
AGTACATACTTATTTATGTTAAACAACAGCAATCACACATTTCTTTTTCTATA
CAGTCATGCTTTATAGGCAAATAAAGCCTCCGTCTTAGGCTTTCTGGATTTTT
TCAAAAGATGCAATTCCTGGAGTATGTTTTTACTTAGAGCAAAGCAGCCTAG
TCTCCTATACCTTCTGCATCTGCAGAAAAGTTGGTTAAACAGACTTTGTAAT
GATGCCCCTTACAATTCTGAAGGGACTTGTGAAATAGTTTCACAGAGTTTCA
GTGTTAGGTATATTTGATCAATGCTAACTTTTGGAAAACTTTGGTGCCTGTAT
GATTCAGAGGGTAGGGCAGAATATTAA
ATTAATCACAACTTCTTGTATTTTAACCATTCTGGGTAAATTGGGATTCC
GTGACGCCCAGGCAAAATTAT(SEQ ID NO:32)
引物:
F:TTGGTAGAGATGGGGTCTCC(SEQ ID NO:33)
R:ATAATTTTGCCTGGGCGTCA(SEQ ID NO:34)
>SG10S427
TATCTTATATCCCCTCCAAGCATTCATTAACTGATGGATTAGTGAGTTGG
XTTGAGAAGCATAAAGGCTCGTCTCCATGTGCTTCTAAGCATTGTGTCT
AAGTTCTGTTTGGTTTCCTGAGTGAAACTGTCTTAATGTTACCAACAGAAGTT
AAATGCCTAAGAG
W
TTCTTATACATGGGCTGAGTACCTCTGTGACTGGGCAAGCCACCTCACCTCA
TTTTACCTTGTCTGCAAAATGAGGAACTGGGTCAACTCATCGTTCAAATCTC
ACTGAAAGCTAATTGATCGCTTTTGACAGAAGTAGCTCCCTTGGGCCGTATA
TTTATTTCCTAGCTTGGAGGAAGGTGGGGACAGACAGAATTGATGTACACCT
TTATTTTTATCTCTATGGTAAACCTGTGCATACTAAAGCATTCCTCTGGTCTT
TTGAGATGAGTGTATACATTGTGTCTGGCCCTGTGCATTTTTTACCAAGAAGT
AAGTTTTGTTGAGTAAACTTGGGTTGTATGAAGAACTGCATGCTCACCGTAC
TCAAGTAGCTTTTGCTACCTAAAGGACAGCTGCTCATATGTACTTGACTTCCT
TTAAAGTGAAGGATGATGACATTTGAAAAACGGAGGTTGAAAAGGAG(SEQID NO:35)
引物:
F:TATCTTATATCCCCTCCAAGCATTC(SEQ ID NO:36)
R:CTCCTTTTCAACCTCCGTTTT(SEQ ID NO:37)
>SG10S408
TTGAGCATGTGTTATTTAATGAGTTATACCTCTGTCATATGTGTGTGTTTATA
TCACAAAATAACTTATTTTTATAAAACCATATTTTGAGTCATCATTTGTGACA
ATGTCTTCTTTTCTCTGGTATAAATGAGGCATGTAGAAAGAAGATTGACATT
TGCTAGAAGCTTCCCCTTTCCTCTAACTCCACAATAAAATGGATGCTCATAA
TTACATCTGCTCCTATAAGGTCAAGATTTCAGGGCTGGAAGTGACCTTAGAT
CATTTAGGCCCAACTTGCCCTCAGGAAAGGAAACTGAGGCCCAGAGATGCC
TTAAGTGAATTGCCCAATGTCACACGCTGAGTCAGTGGCCAGAGCAAGGCTT
GGATCCAGTTCTCTGCTCCCTTTCCAGAGCCTTGTGATGTCTTCTCTCCTACA
GGAGGTGAAAATAACTGCTGTGGCTGGTTCTGTTTTGCTGACTGTAAATTGG
GTCATGGTCAGGGACAGTGCATAGGTGTAAAGAAGTTGCTGGTTGGGGGTTC
TAATGCAGGTTTCTCCAAAAGTGAATGCCCTGTTAAAAAAAAATTCTTAACA
AATATACAGAGATTTTTTTTT
W
AAAAAAGTGTGACAGTTCTAGACACCTAGAGAGTAAAGTGAAGAAGCCTGT
TTTCAGGTTTCCCGCCTCCCTGAATTTCCCAGCATGGTCCAGGCTTTGAAATT
TATTTATCTGCTTTTGGCAATGGTTGATGGGAATTTCCCACATTTATTTTTTA
GCTACAGAGAAAGGACATTATCTTTAAAATCTCTTCGTTGTTCTCTCTCTTTG
AGTGAGGAGAGAAGATGTGAATCCTGGCAGTGGTTCAGAGTGGACACAGCC
CCTGTGTTTGTGGCATAGGCTCTGTGGGCCCCATGCCAGGGAGCAGTACCCC
CGTGTAAAGGAGTGGGGGTTTGTCCATTTGGATAGAGCAAAGATCCTCCACC
TCAAATCCCACAAGAACAGTTGCCACAACCTGGGCCCTAAGCATCTCATTTT
CCTATGTAGAAATTAATGATCTGGAGGAGATGGCAAAACATTCCTTCCAGAG
CCTGTGTGGATTTTGG(SEQ ID NO:38)
引物:
F:TTGAGCATGTGTTATTTAATGAGTTA(SEQ ID NO:39)
R:CCAAAATCCACACAGGCTCT(SEQ ID NO:40)
>SG10S409
TAGTGCTCAGTATTTCCAACGTTCTGTTTATTTAAGATGAAAATTGCTGT
AGTTAATAAGCACTTCCCCATGTCATTAAAATGCTTAAGGATTTTTAATG
ACCACATAACAGTCCATAATATGATTAAACCCCAATTTACTGAATCAATG
ICATATTGTTGGGTCTTTAGATTGTCTCCTTTTGTTTCTGCTACTGTGAA
TGATCCTGTGATGATCATCTTTGTGTGTAAATCTTTGTCCCCTCGCCCCC
TCCCCTTTTATTATTTTCTTGGGATAGACCCCAGGACAAAAGGTAGAAAAGA
ACAAAGTGTTAAA
M
AATTTCTTGATACATAGCCACAGATTATTTTCCTGAAAGTTCTCAACATTTAT
AACTACGAGCAGTATGTAAGAGAGTTATGGTTGGAATGATTTTAATGTCTCT
GGGGAATTTAACAACAAAAAAACTTTAGGCTTCTTTGGAGAGAGA
CATGCCCTTAACTCCACCCCGCCCTAGAACAGAGACCCAGCCCATCCAAG
TCAGCCTCCCCAGGTCCTCCACCTTCAAAACAGGCAAACGAAATCATTTC
TTGAATAATTGGTAGGCTTCAAGGTCAGATGTT(SEQ ID NO:41)
引物:
F:TAGTGCTCAGTATTTCCAACGTTCT(SEQ ID NO:42)
R:AACATCTGACCTTGAAGCCTACC(SEQ ID NO:43)
>SG10S406
TAGTGCTCAGTATTTCCAACGTTCTGTTTATTTAAGATGAAAATTGCTGT
AGTTAATAAGCACTTCCCCATGTCATTAAAATGCTTAAGGATTTTTAATG
ACCACATAACAGTCCATAATATGATTAAACCCCAATTTACTGAATCAATGCC
ATATTGTTGGGTCTTTAGATTGTCTCCTTTTGTTTCTGCTACTGTGAATGATCC
TGTGATGATCATCTTTGTGTGTAAATCTTTGTCCCCTCGCCCCCTCCCCTTTT
ATTATTTTCTTGGGATAGACCCCAGGACAAAAGGTAGAAAAGAACAAAGTG
TTAAAAAATTTCTTGATACATAGCCACAGATTATTTTCCTGAAAGTTCT
S
AACATTTATAACTACGAGCAGTATGTAAGAGAGTTATGGTTGGAATGATTTT
AATGTCTCTGGGGAATTTAACAACAAAAAAACTTTAGGCTTCTTTGGAGAGA
GACATGCCCTTAACTCCACCCCGCCCTAGAACAGAGACCCAGCCCATCCAAG
TCAGCCTCCCCAGGTCCTCCACCTTCAAAACAGGCAAACGAAATCATTTCTT
GAATAATTGGTAGGCTTCAAGGTCAGATGTT(SEQ ID NO:44)
引物:
F:TAGTGCTCAGTATTTCCAACGTTCT(SEQID NO:42)
R:AACATCTGACCTTGAAGCCTACC(SEQ ID NO:43)
>SG10S407
TGCTATGTCCAGTTTACACATAAGGATGTGCAAATCCAGCAGGTTAGCTGAG
CTGCCCAGGAATATCCAGGCAAGAATGACCATATTCTGATAATTACTCAGGC
CTCTGCCTCATCTCCGCTG
S
CCCCCCGCCCCCTGACTCTCTTCTGAGTGCCAGATTCAGCCTCCATTTGAATG
CCAAATAGACAGGAAATTAGCATGCCCAGAATCCACGTCTTTAGTGCACTCT
CTCCCCAGCTCCAAACCTGTTACTGCTTGTGTTCAACATCTCAGTAAAGCTCA
ACAACATCGACCCATTACTTAGGCCTCAAACCTTGGGTGGCATCGTCGATTG
CTCTTTTCTTTCATACCCCACATTCAACCCATCAGCCCATCCCACAGGCCCAA
GTGTGTCCTCTCTACCTTCAAAGCGTGTGTGGCATCCACCGCTTATCACCACC
TCTGCCATTACCACTGGAGTCCAGTGCCATCATC
TCTCACTTGGATGTGGCCAGAGTGTCTTTGCTGGTCTCCTTCTTGCTTCC
TACCTTTGTAACAGCCTATCATCTATCTCTGGTCTCCATAGCTCACTCCC
ATACTTTGAGAGGGCCTTTGAAAGCCTTAGACAGATCATATCACAGACCT
CTATACTGAAAGTCGGG(SEQ ID NO:45)
引物:
F:TGCTATGTCCAGTTTACACATAAGG(SEQ ID NO:46)
R:CCCGACTTTCAGTATAGAGGTCTG(SEQ ID NO:47)
>DG10S2164
CCATCTGTGGAGCAGAGTCACTGAAAGGAAATACTGGAAATACTGGAAGC
CACTTGGTGTTTTATCAAGGATGTGAGGTTTCCTGGCAACTTTGTCGCCA
TATCATCATCATCATCACCATCATCATCATCATCATCATCATCATCATCA
TCATCATCATCATCATCTGCCCTTTAAGTTTTCTGCTTGTTTAGAAAAGA
AATTTATACAGAGCCCCCAGTAGCAGCTGTAAGGGGGCAGGTTCTTGGAG
CAGCCCATCCTCAACATTCTTGCTGCTGATGGAA(SEQ ID NO:48)
引物:
F:CCATCTGTGGAGCAGAGTCA(SEQ ID NO:49)
R:TTCCATCAGCAGCAAGAATG(SEQ ID NO:50)
>DG10S479
TCCACGCAGAGAGGATCTAAATCTGGCTCTTTGCAATTGCCTTCATACAT
GTGCATACACACCACACACACACACACACACACACACACACACACACACA
CAGACACATACATATGCACACACCCCGACTCAATGGAGGACCCTC(SEQ ID NO:51)
引物:
F:TCCACGCAGAGAGGATCTAAA(SEQ ID NO:52)
R:GAGGGTCCTCCATTGAGTCG(SEQ ID NO:53)
为了进一步研究TCF7L2外显子4LD块内其他标记等位基因比等位基因X显示更高的与II型糖尿病相关性的可能性,我们使用HapMapCEU样品中产生的DG10S478基因型数据。HapMap Phase I中与DG10S478具有最强相关性的5个SNPs,按照递减顺序,是rs12255372(r2=0.95),rs7903146(r2=0.78),rs7901695(r2=0.61),rs11196205(r2=0.43),和rs7895340(r2=0.42)。我们将这5个SNPs在3个群组中进行基因分型,5个SNPs和DG10S478的相关性与在CEU样品中观察到的非常类似,DG10S478用作双等位基因标记物。全部5个SNPs显示与II型糖尿病的关联。尽管一些SNPs在一个或者两个群组中显示稍微更高的估算相对危险度和较低的p-值,当来自3个群组的结果利用Mantel-Haenszel模型组合时,没有SNP比DG10S478显示更强的与II型糖尿病的关联。但是,尽管相对等位基因X(RR=1.56,P=4.7×10-18),rs11196205和rs7895340与II型糖尿病的关联明显较弱,但rs12255372的等位基因T(RR=1.52,p=2.5×10-16)和rs7903146的等位基因T(RR=1.54,p=2.1×10-17)与II型糖尿病关联的强度是相似的。
在2005年10月公开了HapMap Phase II之后,鉴定了两个其他的SNPs,显示与微卫星DG10S478的强相关-rs12243326(r2=0.961)和rs4506565(r2=0.716)。与II型糖尿病易感性相关的等位基因对rs12243326来说是C(C/T SNP),和对rs4506565来说是T(A/T SNP)。
应当注意在那些载有rs7903146C等位基因的单倍型中间,那些载有rs10885406A等位基因的单倍型相对那些载有rs10885406G等位基因的单倍型的估算相对危险度是1.06,但该差异在统计上没有显著意义(P=0.22)。
为了重复和改进II型糖尿病的这种关联,我们在一个大的追加丹麦群组和一个遗传多样性更高的西非群组中对DG10S478,rs12255372和rs7903146进行基因分型,所述丹麦群组由1111个病例和2315个对照组成,所述西非群组由来自非裔美国人糖尿病研究的618个病例和434个对照组成(23)。在丹麦人中,全部3个变异体都是与疾病风险强相关的,和先前在冰岛观察到的一致。但是,rs7903146等位基因T的关联(相对危险度=1.53,P=4.06×10-14,PAR=24.4%)显著的高于其他两种变异体提供的关联。在西非研究组中,在对亲缘关系和种族起源进行校正后,我们重复了rs7903146的等位基因T与II型糖尿病的关联(相对危险度=1.45,95%C.I.=1.20-1.76,P=0.000146,PAR=22.2%),但另两种变异体不适用该情况。这表明rs7903146的等位基因T或者其自身是风险变异体或者,或者是未知风险变异体的最接近的已知相关物。西非组中标记物DG10S478和rs12255372被排除为风险标记物是可能的,因为与欧洲祖先的种群不同,欧洲人中rs7903146的T等位基因几乎只存在于同时载有DG10S478的等位基因X和rs12255372的等位基因T的染色体上,在西非人中rs7903146的T等位基因与DG10S478和rs12255372的两个等位基因同时存在。这与观察到的一致,即T是rs7903146的祖先等位基因,而DG10S478的等位基因X和rs12255372的等位基因T都不同于黑猩猩参照序列。一般来说,这种发现也与预期相对多样性的种群,例如西非的种群,提供了与在同质性更高的种群中强连锁不平衡区域发现的关联信号的改进(refine)的关联性一致。
讨论
在这项研究中我们描述了一个新的II型糖尿病候选基因的鉴定,所述基因位于先前报道的10q连锁区域内(10),编码10q25.2上的转录因子7-样2(TCF7L2-原先的TCF4)。我们表明它在冰岛,丹麦和美国以相似的频率和相对危险度造成II型糖尿病风险。当变异体不能解释II型糖尿病家庭聚集性的实质部分时,从公共卫生观点来看,至少为20%的种群归因风险是显著的。相对于非携带者,风险复合等位基因的杂合体携带者(大约占种群的38%)和纯合子携带者(大约占种群的7%)的相对危险度分别是1.45和2.41。因此,这种变异体对于临床使用具有良好的预测价值。
我们报告了作为II型糖尿病相关微卫星的变异体,DG10S478,位于TCF7L2基因的第三个内含子内。TCF7L2基因产物是一种包含高迁移率族(HMG)盒的转录因子,在Wnt信号途径中起作用。这个途径被认为是一个关键的细胞发育和生长的调节机制;它被称为Wnts的分泌糖蛋白调节,在结合关连受体复合物时Wnts启动靶细胞内许多信号级联反应,Wnts由Frizzled家族的成员和LDL受体家族的成员Lrp5/6组成(24)。Wnt信号从降解复合物中分离在这个途径中主要成员β-连环蛋白,将其转移到细胞核,在细胞核中它短暂的将TCF因子从阻遏剂转化成翻译激活剂(25)。通过结合钙粘蛋白,β-连环蛋白对调节细胞粘着也是非常重要的。
TCF7L2的NCBI RefSeq包括14个外显子。但是,Duval等人(26)显示TCF7L2具有17个外显子,其中5个是选择性的;此外,还有报导称3个选择性剪接受体位点被使用。这项研究还证明了位于TCF7L2基因3′端的3个连续外显子的选择性使用,这改变了最后一个外显子中使用的读码框,导致大量短的、中等长度的或者长的COOH-末端的合成。
与TCF7L2类似,罕见的Mendelian型II型糖尿病即青年发病的成人型糖尿病(MODY)的6个定位克隆基因中的5个,是转录因子(27)。其他的转录因子也与II型糖尿病的发病有关,包括过氧物酶体增殖物激活受体gamma(PPARγ)(7)和叉头基因家族(28,29)。Noble等人描述了I型糖尿病相关TCF7基因中的一个错义突变(C883A)(30)。但是,还不清楚TCF7和TCF7L2是否采用相同途径对糖尿病的发病起作用。
已经有TCF7L2基因突变的报道,包括在(A)9编码重复(外显子17)的A缺失(26,31-33)和结肠直肠细胞系中的大量突变(26)。DG10S478位于明确定义的74.9kb LD块(CEPH Caucasian HapMapPhase II),包含外显子4和该外显子5′和3′端的侧翼内含子序列。有可能DG10S478自身就是成因变异体;还有可能DG10S478是基础变异体的替代物,所述基础变异体影响转录、剪接或者信息的稳定性。这类变异体可能与DG10S478存在强连锁不平衡(LD),即变异体位于TCF7L2外显子4LD块内。
多个证据表明这种基因在II型糖尿病发病中的肠内分泌功能。首先,已知TCF7L2和结肠直肠癌的进展有关(54),致癌TCF/β-连环蛋白复合物的小分子拮抗剂也已经被报道(35)。此外,出生后24小时内死亡的TCF7L2-/-小鼠,缺乏肠上皮干细胞小室(36)。TCF7L2基因的变异体可以通过改变促胰岛素激素类胰高血糖素肽1(GLP-1)的水平影响II型糖尿病易感性,所述类胰高血糖素肽1是胰高血糖素原基因编码的肽,所述高血糖素原基因在肠内分泌细胞的表达受TCF7L2的转录调控。与胰岛素一样,GLP-1对血糖稳态产生重要影响(12)。GLP-1类似物和二肽基肽酶IV的抑制剂当前用于临床开发。
尽管本发明进行了详细展示并参照其优选的实施方式进行了描述,本领域技术人员应当了解其形式和细节可以做出不脱离附加权利要求包括的本发明范围的各种改变。
                        参考文献
1.A.F.Amos,D.J.McCarty,P.Zimmet,Diabet Med 14 Suppl 5,S1(1997).
2.P.Zimmet等人,Am J Epidemiol 118,673(Nov,1983).
3.W.C.Knowler,D.J.Pettitt,M.F.Saad,P.H.Bennett,DiabetesMetab Rev 6,1(Feb,1990).
4.B.Newman等人,Diabetologia 30,763(Oct,1987).
5.A.H.Barnett,C.Eff,R.D.Leslie,D.A.Pyke,Diabetologia 20,87(Feb,1981).
6.A.L.Gloyn,Ageing Res Rev 2,111(Apr,2003).
7.D.Altshuler等人,Nat Genet 26,76(Sep,2000).
8.A.L.Gloyn等人,Diabetes 52,568(Feb,2003).
9.Y.Horikawa等人,Nat Genet 26,163(Oct,2000).
10.I.Reynisdottir等人,Am J Hum Genet 73,323(Aug,2003).
11.R.Duggirala等人,Am J Ham Genet 64,1127(Apr,1999).
12.F.Yi,P.L.Brubaker,T.Jin,J Biol Chem 280,1457(Jan 14,2005).
13.S.E.Ross等人,Science 289,950(Aug 11,2000).
14.E.A.Jansson等人,Proc Natl Acad Sd USA 102,1460(Feb 1,2005).
15.W.J.Nelson,R.Nusse,Science 303,1483(Mar 5,2004).
16.C T.Falk,P.Rubinstein,Ann Hum Genet 51(Pt 3),227(JuI,1987).
17.J.D.Terwilliger,J.Ott,Hum Hered 42,337(1992).
18.J.R.Gulcher,K.Kristjansson,H.Gudbjartsson,K.Stefansson,Eur J Hum Genet 8,739(Oct,2000).
19.Y.Z.R.Bagger,B.J.;Alexandersen,P.;Tanko,L.B.;Christiansen,C,J Bone Miner Res Suppl 1,1(2001).
20.G.Benson,Nucleic Acids Res 27,573(Jan 15,1999).
21.R.C.Lewontin,Genetics 50,757(Oct,1964).
22.W.G.Hill,A.Robertson,Genetics 60,615(Nov,1968).
23.C.N.Rotimi等人,Ann Epidemiol 11,51(Jan,2001).
24.C.Prunier,B.A.Hocevar,P.H.Howe,Growth Factors 22,141(Sep,2004).
25.J.Huelsken,W.Birchmeier,Curr Opin Genet Dev 11,547(Oct,2001).
26.A.Duval等人,Cancer Res 60,3872(Jul 15,2000).
27.S.S.Fajans,G.I.Bell,K.S.Polonsky,N Engl J Med 345,971(Sep 27,2001).
28.C.Wolfrum,E.Asilmaz,E.Luca,J.M.Friedman,M.Stoffel,Nature 432,1027(Dec 23,2004).
29.J.Nakae等人,Nat Genet 32,245(Oct,2002).
30.J.A.Noble等人,Diabetes 52,1579(Jun,2003).
31.A.Duval等人,Cancer Res 59,4213(Sep 1,1999).
32.A.Duval等人,Oncogene 18,6806(Nov 18,1999).
33.H.R.Chang等人,Cancer Lett(May 16,2005).
34.N.A.Wong,M.Pignatelli,Am J Pathol 160,389(Feb,2002).
35.M.Lepourcelet等人,Cancer Cell 5,91(Jan,2004).
36.V.Korinek等人,Nat Genet 19,379(Aug,1998).
序列表
<110>解码遗传学私营有限责任公司(DECODE GENETICS EHF.)
<120>作为2型糖尿病风险诊断标记物的TCF7L2基因的遗传变异体(GENETIC VARIANTS IN THE TCF7L2GENE
AS DIAGNOSTIC MARKERS FOR
       RISK OF TYPE 2 DIABETES MELLITUS)
<130>SCT075777-47
<150>US 60/692,174
<151>2005-06-20
<150>US 60/757,155
<151>2006-01-06
<160>53
<170>PatentIn version 3.3
<210>1
<211>74930
<212>DNA
<213>Homo sapiens
<400>1
cttgtgtagg aactcacgct ttgtttattc agcaatcatt cctccagaaa taaccttaat    60
agcaacaaga aaaaagaata ggtgtttttt gagctctatc tgccagtttc tctatatatg   120
gacattatat attgcaacat aacactcaca atgcctttaa acatcatccc cgttatacag   180
ataagaaaac agaatttcaa agaaggtagg ggacttgccc agggatacat agctagcaag   240
tggcagcgct ggattgagtc tgggccttgt ctgaggctcg ggtcctgtca tgctctgcgg   300
ttgctatgtt gacatgcaaa gggagaggca gctgctggga gtctaggtgg gtttctcttt   360
gagaatgcta acgtgaaccc tcaaggtgaa tcagaatcct tttgcaagtg aataatcaga   420
tgtaggttcc tgtgtctccc tgtaaaatga aagcctcttt tttccaaggt ccagtataga   480
cctgaagctg ggttactctg gaatttccct ctctggctgg agtgactgag gccttgcacg   540
tgacattggt gaggactcgc agcctcaggt ctggcttccc ttagcaaccc ccctttcctg   600
tctctgcctc tggagttcac cattaaaaaa aaaaaaagaa aaaaagccaa aacactttat   660
aaagttacat gctgggtttc ttctatgtcc tagaaactgt cttaattcat cttccccttt   720
actcttatat gagcaggaag aaaaaaaaat tgctagtcaa tgctaataat tatggcatgt   780
aatgtaattg gaagtgtttc actgacatgc tcatgagagt ttgcggcttc atcttcaggc   840
tgggatgtag cactagactt gccttgagtg tctgcacaag cctttgatgc aggtagacca   900
tattataaat aggcgcgttg ctatggtgag gatggcagtc cttgcttgct gtgggtaacc   960
ttttctacct tctcggacac tgttttaaaa cacagcagcg tgatagcatt tcatttaatt  1020
tggaccaagg tggggtagat gaaatgttga gatttagatc taaaatgttg ttgtggtgtt  1080
tcagggggtt ctggctcacc tagtactatg gaagattttg cagattgggc ttcctcatga  1140
tttatttaga aatagatttt ctaatagatg gggtgagggg agggtggtgg gcagaaggct  1200
gggctttctt ctcttccccc tcctcctttc attgagcgct tctgcgaatg tgttggcttt  1260
gatgccccag gagctcatac agtgaaatgg aagttcaggt tggcacgttg cagaaatgat    1320
tattcctggt agtacgtttc ccattactgt taataatata aagacaattg cctgcctctc    1380
aggactcctg cacgtggcta cagtcatttc ttcatggaat tagacacata gcagtgggga    1440
ccaggagtgt tttattagtg attgtcctcc tgcaagtttc cagggtatct cagcttagac    1500
acatgaatta ttttttcctg ttgcttggag ggtatacttt taattatatt cattcaataa    1560
cagagcagtt caggtttgta aaatattttt tctcccccaa ccttttcccc agcatacatc    1620
cccgtcccgt aagtttctgg gcagagacaa tctcaggaac ctaaaggttg ctaaaaaatt    1680
agctagttgg ccaggcgcat gactcatgcc agtaatccca gcactttggg aggctgaggt    1740
gggtggatcg cttgagccca gaaattcgag accagcctag acaacatggc aaaaccctgt    1800
ctctacaaac aaaacaaaat ctagctgggc atggtggtgc atgcctgtag tcccagctac    1860
tggggaggct gaggtgggcg ggcgattgag ctcaggaggt ccaggctgca gtgagccgtg    1920
attgtgccac tgcactgcag cctggatgac tgagtgggac cctgtctcaa taataaataa    1980
ataaataaat aaaaaataaa aaaaattagc tagccaagct gcttataggt cttttacatg    2040
gccaagccac tttctcacct ttaaaatggt aataacgttt ccgtactcat ctcaatgggt    2100
tttgagtgcc aagacagacc gtttgatgga agccctctgg ggagaaaaat gctacccaag    2160
acaggctttt caattggaga ctgatccatt ggtgttttgg tcagttggtg ttgaaatccc    2220
tatttttcca gctcaggact gcctctctcc ctggaactct tcccgaggtg agttctgcag    2280
ccttccttgg gaactctcag cctctggatc ccttcttgcc aggtggagtg gacatgccaa    2340
agttgtgggc cagactcgga ctgcctggct tgtctcagca cctttgggga cccacttccc    2400
ctctctggga actggggaag ctaacagaga tcttgctagg ggggtggaat cctgtatcca    2460
tgtgaggttg tacccccagg ctcctgagtg gtttgaaagt ggggaaccct ggccgggcgc    2520
ggtggctcat gcctataatc ccagcacttt gggaggctga ggcgggcgga tcacaaggtc    2580
aggagatcga aaccatcctg gctaacacga tgaaaccccg tctctatgtg cgtggtggct    2640
ggcacctgta gtcccagctg ctcgggagtc tgaggcagga gaatggcgtg aacccgggag    2700
gcggagcttg cagtgagccg agatcgcccc actgcactcc agcctgggcg acagagcgag    2760
actccatctc aaaaaaaaaa agaaagaaaa aaaaagaaag tggggaaccc ctcccccagg    2820
atgagaagag ccatggggtg agtctctgcc accgccaagg ggagtcaggc tcagaggctg    2880
ctacagggac agccagctct ctttagatgg tccccaccat ctagtcaggg cttgttacat    2940
atggagcaga gacagcgcag gctgctgctg ttttcctgga gaaggcccct gtcggtctgt    3000
tcagctgtag ctgacctttc ctccttgtgc tttttgggga gggagccttg gaaggagtag    3060
ggcacgtggg gcactctgct tcccggcccc acactggcga acctatggat tctgcctctg    3120
attcctgagg aaacatcact gtgaaggtgg aatgagccac atacagaggt ggctgttggg    3180
gccggggagg ggtgaaacgc ccccagggtg tacattgcac caaaagccag gctgcatata    3240
gacctcagga tgggctggct tttctattta tttagaagta tttccagagg gtaacctcat    3300
tggctacaaa gcatgtctga acaagagctc cgttgttcat tcccagccct gttaccctgg    3360
caggatgcag actccaggcg gcctgttggt caggccttgg actcagagag cagtgaagcc    3420
tgaggagggg tggggggcag aggcgtgagt ggtctagggc ctcagtccct ccaggacacc    3480
ccttgccaag cgcagagaaa gctctgccca tccgtcccct caggcagtgg gattgggcaa    3540
cctgggaagc agtgaatgtg cgtcggtagc atagattcca ttccgcacgc caccctcgcc    3600
tccgcccccc agccctggga gggatgcatg ccctccggga gacacccaga cccgacagag    3660
aggcctttgt tggagctgga ggtgagaatc tgtgggcgtt gggattcctg ggttcgagtt    3720
ccagctcact gccaattgcc cgagtgctgg gcgaacattt ctggaatcaa aaggagtgca    3780
gcctgcccag cagggcctac gggagccgga ggctgcaggg tgctaagatt gcgttatctt    3840
taccaagtgc ccggagctcc tgggagggaa gagagagtcc taggactcag gataggaggt    3900
ggttggagtt tctcgaggaa gactccatgc tttggttctg gcccctggaa acccctcctg    3960
aggactggac ctccaagcag accccctctg tgactccgga atgcagtgtt actctcttat    4020
atttttcttt cttttttttt ttttgagacg gagtctcact ctgtcaccca ggctggagtg    4080
cagtggcacg atctcggctc actgcaacct ccgccctccg agttcaagcg attctcctgc    4140
ctcagcctcc caagtagctg ggattacagg tgcctgacac cgcgcctggc taattttttg    4200
tatttttagt agagatgggg ttttaccatc ttggccaggc tggtcttgaa ctcctgacct    4260
cataatccac ccgcctcggc ctccgaaagt gctgggatca caggcgtgag ccaccgcacc    4320
cggccactgt cttgtatttc taacgtcccc ctgacttttc tgatcatgta attcttaact    4380
ttctcaaaac tgagatttgt cacgtgtcct ctccccactc cattttgtga atcagagtct    4440
tccaggggca ggacctggag aatgggtctt tattaacaca catgtgaaaa tgcttttgcc    4500
agcaaggcgc ggtggctcat gcatgtaatc ccggcacttt gggaggccga ggcaggcgga    4560
tcacttgagg tcagcctggc caacatggta aaaccctgtc tctactaaaa atacaaaaat    4620
tagctgggtg tggtcgtggg cacctgtagt cccacctact cgagaggctg aggcatgaga    4680
atcactggaa cccaggaggt agaagttgca gtgagccgag atcacaccac tggactccag    4740
cttgggtgat agagtgagac tctgtctcaa aaaaagaaaa aaaaaagaaa atgcttttgc    4800
catgggctgt ctcctgcttc tgctttgcat tgggcctctg tacctaggtt gcaagattcc    4860
tcagggtgca cctgggctta tcgttatctg taagttatcc cagcaagcac ttaaaacaca    4920
gtgttggacg atgaatcccc tctacaagag agggacaggg caaaaacgac acctcttgcc    4980
tcgcaagctg tcttgggcca aacctcaggt ctattctttc ttttttttga aagtagtggc    5040
tgggcacggt ggcttacgcc tgtaatccta gcactttggg aggccaaggc gggcggatct    5100
tgaggtcagg agttcgagac cagcttggcc aacatggtaa aactccatct ctactaaaaa    5160
tacaaaaatt agctgggcgt ggtggcgcat gcctgtagac ccagctactc aggaggctga    5220
ggcaggagaa tcacttgaac ctgagaggca gaggttgcag ttagctgaga ccatgccatt    5280
gcactccagc ctgggcggca gagcgagact ctgtctcaaa aaaaaaaaaa aagaaagtag    5340
cagctctact gagatattta gaaaccataa aatccaccta tttgaggtgt acaattgagt    5400
gattttctgt atagtcacag atctgtgcag tcatccacac cctctaactc caggacattt    5460
tcctcacccc cgaggagaaa cctcccttac ccattagcag tcactcctca tttcctctcc    5520
ccccagcccc tggcaatcac tgtggatttg cctgttcttg acatttcata taaatggtat    5580
cataaaatct atgggctttt gtgtctgtct gctttcactt agcatacggt tctcaaggtt    5640
catccagtat tgtagcatct atcagtatgt cattcctttt tatggccaaa taatatttta    5700
ttgtatggat agacattttg tttattcatt tatctgtttt tggttattat gagtaacact    5760
actatgaaca ttttgcacaa atttttgtat tgacatgttt tcatttctcc tgggtatagt    5820
cctatgagtg gaattgctgg gtcatataat aaataactgt ttaacatttt ggggagctgc    5880
caaactttta aaaccttggg ttctgtgatg taccagttgt gttaggcagc acagcaaaat    5940
gtgacttttg attgccagaa acaatattta aaaagtggtt ataaaaagtg gtttgggagg    6000
ctgaggcagg aggatcactt gagcccagga gtttgagacc agcctgggca acatagtgag    6060
accctgttaa aaaaaaagaa ggccaggcac agtggctcat gcctgtaatc ccagcacttt    6120
gggagactga ggcgagcaga tcacctaagg tcaggagttc cagaccagcc tggccaacat    6180
ggcgaaaccc catctctact aaaaatacaa aaattagcca ggcctggtgg tgggcgcctg    6240
taatcccagc tactcaggag gcttgaggca ggagaatcgc ttgaacctgg gagactgagg    6300
ttgcagtgag cggagatcat gccattgcac tccagcctgg gcaacaagag cgaaactgtg    6360
tctcaaaaca aatgaaaaga aaaggctgtc atgttagatc caccctcctc ctcaggggaa    6420
cccctgggct gctctctggg tagagatggg aacccaggcc tcgggccagt gagtggaagg    6480
aaactttggg atgattgact tgggactggg ctagaggtga agaatctccc agtaggcaaa    6540
gttcggcctt acgttttttt gtttcaagca aaccacatca ttacccacag aggccattgg    6600
tgagatattt gtaagtctcc tgacagtggc tggagttcgt tgcttggttg ttgtttctct    6660
gtctcagccc tggagatggg agtgaccacc tgctctctct ggacagaggc tgtccacgtt    6720
catgcaattc cttggacacc ggtggtgcag cgggaggcgt aactgggagt gggagaccct    6780
gaactgtgcc ggttcttgca gagtatcact gtgacttcag gcgagtcacc ccacatcagg    6840
cagctcagaa caagggattg atctagaagg acctttcacc tgggctattc tgtgactcaa    6900
attatcttct cctaagccca ctactgcctg gtgtgttggt taaattagcc taaaggtcat    6960
tccctcggag aggccctctg ggaaacctcc ctttcctgag agtcactgct tgctggcgcc    7020
tgcccctggg gttccttcag agtcgtgatc atgccctggc ctcttccttt atttggcagt    7080
cccttccctt ccccatccct gatgagggta gggagcatct gtctgcagct tcatcttcat    7140
tgtctagggg ctccagaaat atctgtgagt aaataagtta tttaatcttt gcctcaaatt    7200
tccagtgact gtagggatat agctgtgagc ctctaggagc tgagattttt taaatttccc    7260
acttaaacat ttatttaaaa attttgtgct cagcatggac taaggacttt acattcatta    7320
actcatttac agcttgatcc tatgcggtgg gcattcattt acagaggatc ccattttaca    7380
ggtgaggaag aggccagcta ggggtgcagc ctaggttagt attctagagc tcatcaggct    7440
gtgttgtccc cagtgaaaga ataagcaaag aagtgaatgt tgtgcattga gaaaaatgac    7500
tctcggagga ggatgagcct ctcggatatg gcgaccgaag tgatatgggg cccttgtcaa    7560
gggtctctat tatggcatca agaaaagatg ctgctttcgg tgatgcccga ggagagcctc    7620
aatattttac atgggaaacc taaaaaaggg gccatgttgt ggtctctgca cctaagatac    7680
taaaggaaat attttatgga gagatgcaac atgtcaggcc ttggagggaa accccaggat    7740
ccagatggtt gcactctcaa accagggccc ccctcacctt ggccttcagc atttagtgtt    7800
ggaaccaata gcataagctt tggtcaggac ctttgatgga agccacagtg ctcattagtg    7860
accacggttg actaccttct ctctcctaag ctgacttctg gagggcacct gggatttccg    7920
gccagtgatc agtgctggtg aagcctgaag gccaatgtgt aggtttagct gttcagtcag    7980
aacccaaaag gggccaaaga gatggtttcc ttcaacctcc actgagggaa gtgaaagtca    8040
tggttcgtta aaaggctgag ctgggaccag agtctagggt tctagaggtg ggaatttcta    8100
cagctttggg ggaccttgca agggcatttg ctcttctggg actgcaggga gactgtgctt    8160
ctcagagatg ttagcatttg gcttggggag agagaggaaa ggagaggttc atgctccgcc    8220
atgatggtgg aaagtgatgt tggtgtggtg aggagctgag ctgaattcta agtggttcca    8280
gggaattaac aatgttcctg cccaagtgtc ctgttccccc acaaactaat gaggcagcag    8340
gtgtctgaag agaaacattg cagaatgtct gccaggggtt ttatggttaa ttttcctcca    8400
ttatgagggt tgactcagcc ttgggtatta gatgtctttg agaatccagg gttcaaatac    8460
cacagctggt agaatgtttc tcaacttgga gccaatctcc atctactgaa ggtacgctgg    8520
tttagacaga caacagggac atcagcattt taaaaagcgg tggaaaaagt ttgcttgtct    8580
tgattggagc catgacattt tattttgaaa tttcaaataa catgaaggga ggtttggagc    8640
ggtttttggt ttatccaaag ggcagtggat tgaaggctga gaaacaccag gctgaatggg    8700
agaggggttg gggtccccct gtgagatagt gaaacaatgg tagtgccatc caatgatagg    8760
cacttttctg tcattcagaa gcagaaaggg ggccagaggc ccattggcct tactgggcag    8820
taagctgtag agctgctgcc ttttcgtgaa agggttgaca ccaaccttct cccccaggaa    8880
gagtgaccag ggacctgagg ggcatggtcg agcagatgac agcctttgta aaacatctcc    8940
ctggtctcat cagcgatatt cgtcctgcct tccttctgag taatttccat cttaggactg    9000
gagtcaggtg gagcaagatt ccatgttggt ttctgttggg cctagagtgt cacactgaga    9060
cctaatttca tactttatga attctagtac tgctctcgaa ggtaagagcc gtcctctttg    9120
gctgaaggtt tttgcctgca accttgcatt gtaatccagt gacacctgac gtatctgtaa    9180
atttcttcaa atttctaagt gtattacaac cccgtgtgca aaagatgatt aattaattgc    9240
cttgacagta aaacaaaaaa caaaaaaaag gtgtgggggt atatggtatc cctgatttac    9300
tatagaagat gcagagagtg aagggagatg aggtggggag gaggggccca ggttctggtc    9360
ctactttttt tttttttttt ctaaagagat ggagtcttac catgttggcc agtctaggct    9420
tgaactcctg gcctcaagag gtgctctcac ctcagcctcc caaagtgctg ggattatagg    9480
cgtgagccac cgagtttagc ccaggttctg tttcttgctt agtcactttc tgtttgaaca    9540
aaattggaat ttcctttttg gatctgtttc tttaattgta aattgaatcg gactaaaacc    9600
tttccaattt tttcacatgt gaagacatac acaaaagttt tattggaggg ttgcacatgt    9660
gaaagaaaaa gggagaaagc aggattgagc agggggagcc gtcagatggt aatgcagatg    9720
tgatgagatc tctgccggac caaagagaag attccttttt aaatggtgac aaattcatgg    9780
gctttctctg cctcaaaacc tagcacagct gttatttact gaacaattag agagctaagc    9840
actttttaga tactatataa tttaattgcc gtatgaggca cccttagttt tcagacgaga    9900
aaccacagtt acagggaagg caagtaactt agtcaatgtc agataactag gaaaaggtta    9960
gaggggccct ggacacaggc ctgtgtgact gagaagcttg ggcacttcac tgctacattt   10020
catctcttcg ctataaacat tttagctttt tgtgtttgct gactggcaac aatacatagt   10080
gaaagttcta ataatttgta atgcttttgc atgtctttgt atttttcttg gttatcacat   10140
cacatcaaat taagatactg atcagcagtg tgagaggtta tttttccatg tcctcttcat   10200
tagtgttagc ttgtggatgg atttgaggct ctctgtgctt tccccccagc aaagtgaata   10260
ccagactttc ctattaaaaa aagtatttta tttttcagag acagggtctc attctgtctc   10320
ccaggctgga gtgcagtggc acaatcatag cccactgcag cctccaactc ttgggttcaa   10380
atgatcctcc tgcctcagcc tctcttaagc agtgcctttc cccattctca tgggactttc   10440
caatccatga gatactttgc tgcagggaag ccctgtctgt ccaggcctgt gtaatagacg   10500
acttcacatg gtcctgtgtt gttgtttgcc ttctgtgtgg ctaagtttcc atgacctggt   10560
ggcttggaag ccccatccct gatttgtggg agaggcaggg aggcaccttg tagcgcacta   10620
ggcgttgggc ctgaacaagt ctgtgtgctt ccaatgtctt tgtggggagg tttacgagtc   10680
cttcttatta tataatagta tcttgtctta gcttggtgcc tttcttctca gaagcttgag   10740
gcactctgca gataccatct caatttgctt tctgggagga ggagaggaag ctacccaaaa   10800
gatgaagttc tctgtgaggg gcttgaacac aggttgatag cgttgctggt tagttattct   10860
catggtgtgg atgaaaaatg gaatacgctg aaatttcagt tactcgtcac aaaaataagg   10920
cgtatgtaga aaacatcctg ggctaagggt ttgcatgctt ctagaacttc ctgttactta   10980
atggctgttg agtataaacc tcgggaacag tggggatcct tggagacccc aaataacttg   11040
tatttgtggt tactcctgtc ttgtctatca atacccctgt ctatatcgtg ttagaactag   11100
gacacacaga ctggattcag aagctggcct ggggtttagg agaacatggg acctaatcct   11160
ggccatctcg atttacctcc tggatcttgt tttctcatct gtaaaatgaa ttggggtgtg   11220
gactgtttat ggcctgtagg atgctagccc tgagaatttt ctccagatat tctacggtta   11280
agtaatttta ggggacactg tctaagcagt tgcctcttgg agaatgaaga tgttcattag   11340
gatattgaag gctctgagaa gtcctaaagt taaagaaaat ctgcaatgtt ctttgtggga   11400
ccgaataatg caacctggga aatgagggat tagatgacac ttgagtagcc ttccagatct   11460
gagacgagtc tcactctgtt tgtttactcc atctgtgatg ggtgtaggca ccatcttggg   11520
gagcaagctg tgatagagag ggaacaatac cttgttaatg tttgtctaat tcactaccca   11580
ggtgcatggt agtgaattag acactacttt gtaggttctg gagggaagaa gaaaagacga   11640
gacctgcctg gactggggct tgagaccact gtcaaataca agtacagttg tacaactggt    11700
agggagtggg tcatagtatg gccggtcttt ttaaaggtga ggaattctta ggcccagaaa    11760
ggcaaagtga cagatcctgg atttaaccag cagcccagat ttgaggccta gcacatagca    11820
aagcaccata gctattcaat agctgccaag tgggagtttg gatgatggct ttcctggaca    11880
gcgaaagcag tgatgtttgc ttaggatggc ctttggcagt gctgctgtta tccttaccac    11940
tggcaagcca tctcacgggc ccggagggga gggcaaggaa tcctaattct gtgagaaggc    12000
tctgggtaca tgagtgtgag atatggatac cctaggctct gcccctgaag acagtggcat    12060
cggatttact gcactattcc agtcggacag gcaccttaat ttttctcttt ctgggtgttt    12120
gatatggttg ggtcctattt cttctcctcc aaaccccgct agggccattc ccccaccctt    12180
cacttcccgg ccttccactg cagtctctaa ggattctgct tcatctttat gtgtgaacag    12240
ggttttgaca aacatgatta actgggtatt tttggaaggc tcaggaggaa cgcagagtgc    12300
tccggagggc aggcctggag tcaggaatgc ttcctgcaac ctgttcgtgc agtgagcgtg    12360
tcttcctcgc cctgcccttg gctggggaat gtgctggctt ggagggcagg agagtgacag    12420
gcggtttgag aactccgggc tctcccgtct tcggatggct cctgtgaaag cagggcctga    12480
aacttttatc gtcactgctg caggtgaaag actttcattt ggctgtagtg gtccaacaaa    12540
gagtatttta tttatgtgtt tccaagccct taaaaattct tttagggcac atcagtgggg    12600
agttaataga aactttgaaa taagaaaaat gcctgcaggg taagtagaac cccagccagc    12660
cagctccgag ttctgtgctg ttagctggta ggttggttct cagagaagtg gctggctggc    12720
tgggttacgg agcccacatc tctaatgcct tagtgttcaa tcattaagtg gatttttttt    12780
tttcccttct cttcttttgg tttggaggga ggactactct aaactttact cagggcaggg    12840
tagctcctga aagggctccc taacctttct ggtttatgac acaaagaaag tttggaggta    12900
ctgggataag agatggcttg ggtgaccccc ctatcatgcc ccctaacaca tacacagcaa    12960
accaaaccaa ctcacccttg atcatactcg ttgtttacac gaagggaatt tttattgtct    13020
tgtgagtgtt gagtgatgat taaacagaag agatgtgact ccaagcctgg cttcactaag    13080
atagtcttgt ttgtttcttt tcctccaaag taatttccta aagaattaaa agcccctttg    13140
aaacccagca ctaccttgtc tctgattatc agcataggca ggaagggctt ttaaggtctg    13200
agcccagctg tttagaggct acgagacgtg aggcaaatcc tggtatctct ctttgggcct    13260
cagtttcttc atctgtgaaa tggcacagta ctaccctcca ccaaggatga tgatgagaat    13320
taaatgggat gacaggtttc atccccagct cctgttctta ggaaggaaaa actgtgactt    13380
atgaagcctg taggttgtgt tcaggtttgt atgaggcctc ggacttcata caaaggtatc    13440
aaagtggcaa accctgatcc agatgttttc agttcagtca gctggtcctt gagcctgttg    13500
tgtgccagat atcctgacca aagaagctag atgggagctg ctgtgttgtt ccttggggct    13560
gctggatgca agttgtttag gtcggcggtt ttcaaatgct ggtgattttg ctcaccagag    13620
gacatttggc aatgtctaga gacatttagc atggccagtc attgggaggt actcctggca    13680
tctcgtgggc agaggctaag gatgctattg aacatcctgc aatgcccagg acagccccct    13740
gtgacaggag tcatccagcc caacatgtca ctagtgctgc agtggagaag ccctggctgt    13800
gtgtgggggt gtgtgtgtgt cctcttctac atttgataag gtaactcaca cttgctgccc    13860
ccatgatcgc tgtgggggat gcttatctat gccccagtcc tggtgttggt tgatgggaac    13920
atcaagattc aggcaagatg gaaaatagcc cttagaacta gcaggaaaag aatctccttt    13980
catttgtcta gaggttctgt taaagtgcct ttgcttctat tttgagactt gttcttaaaa    14040
aaaatgcgga tatgaaagaa aataaaaacc acattatccc tccacttttt cttggaggag    14100
gatgtgttga agaagtcaaa gttcaccatc cctttagata gaatcatttt gaacaatttc    14160
atatgtcaat acattttgct catctctaaa tttcatttta gagcctgtgg tgttctgtgc    14220
atggatatgt gtgcgtgtat gcacacaaaa ataaaaggaa atatttattc ttatgaataa    14280
gtatagaaat aaattaattt ttggaatctc aaactatcag agacttatgt aataaccaga    14340
ggcaggcctg attatgtatg ggcaaagcat ttgtgaacaa tgtctccatt gtataacata    14400
caaaacaagc ttttcttcca cattggatat gcaagtcggc cttctccaat aagggcctgt    14460
ctctttccaa ctccccccac ctcccacctt tgagcaaaca ttatttattg tggctgatgt    14520
gtgatcaggt cttgatttgg ggcctctttt tgatgccttc tctttgtggg atctcaccca    14580
cgtgcccctg gagacccttt ggctgccagg gcctttgttt cccagccacc catgtggtgc    14640
cagtagtgtc tgctttgtag cgagctgtcc ccagagcctc agcatggctt ggggatggtc    14700
tctgaggttg ggcttggatc cctcccactt ttgggctcag aaagaatgac tgccctctat    14760
ttccctgtcc ctgccctctc ttatcctgtt tcccagcccg catcatgtta tctttgcttc    14820
ttgtaactta ccaaacgatt tatgggcaag taggggaggt gaagagggaa ctcatctatc    14880
aagataacct actttgtgcc aaccactgag catagcaatt gtcccttctc cagccctctg    14940
aggaccgtgg atgggattct catgaaatga aacaggtgag gaacttttct tttagggaac    15000
ttgcttgagg tcccacaggc agcgagtatc aatcaacgtc aggatctgag ccctgttctg    15060
ttcggctgaa aatatactcc ctgagatggt gtaggccacc atggctttca gcaggctctg    15120
tgcttggtgg aaggaagctg gaagctgtgt acacacccac ggggaacagg gaccatagag    15180
gagcaccttt tgagtgcaga acctggcgaa acatacacct ttagagggat tttaggtacc    15240
cttgaggctg ggagaatcaa gcagagctaa gtttcccatt ggggtgtcac agactgaaga    15300
aacagagccc taggtagcac agggaagttg attgcccagt atcagttagt ttggctttaa    15360
tgactgagaa gagattccac cagttcattg aagagagggc ggacttttta ttggaggaaa    15420
gaagagtgcc tgtaagtaga gaagtctccg gggtgtagtg ctgtttgggg caggaagaac    15480
agtgtgagcc actgtggaga gaaagcccaa agagtcttgg cagggcaggg agtaggatgg    15540
atttgaagcc agaggaagta tggggtctct gtagactcca ggcaagccat gttaatattt    15600
taggaagccg tgatggagct gcagatgggt gtggaagtta aagtttaact gttcattcac    15660
cagtccttcc cctggagaat gtgcagcacg tggacagtgg aactttaagg tccttggctt    15720
gtatttcaca cccaagagat gaataggtcc aggtatgtca tagaccagac taatgaaata    15780
acaaatttct tttcaaaaat tttacttttt gtaggaaagc ttctctgtct ggcatttttc    15840
ttctcccagt tgtgactcaa tcttaaacgt cttcagacaa ttagcataaa atttcccaca    15900
gtgaattgac gtatactttt gagggttcca tttctttttt attttttttt tcttttgaga    15960
tggagtttct cgtcacccag gttggagtgc aatggtgcca tcttggctcg ctgcaacctc    16020
cgcctcccgg gttcaagcga ttctcctgcc tcagcctcct gagtagctgg gatgtcaggc    16080
acccgccacc atgcccggct aattttcgtg tgttttagta gagatggggt tccaccgtgt    16140
tggccaggct ggtcacaaac tcccgacctc aggcaatccg cccgcctcgg cctcccaaag    16200
gctgtgatta caggtgtgag ccactgtgcc cagcctaggg ttccatttct taacccctcc    16260
ttctgatgcc tcagaaagtc ttgctctgta agcctcttgt agctgcctcg gttcagggga    16320
agggggaggc ttttgtttta ggaccgtcca gaccatagac acatttcctg gcacctagca    16380
cgtgttgggt caaacaggaa tgatgaatgc atgcatgaat gaggttctta gcgctgaaga    16440
cggtgtcata ggtggtctac cacgccgcct gatcattcca atggcccatt atgaatgtgt    16500
gtgctgcagg gccctcccac gatcccgtca gcactgtgca tgttgtgggg aggtgctggg    16560
agaaagactg ggtctcagaa gatgggttag aggtgggtcc ttctctgctg ctggctagca    16620
gggtagctgt ggaggggtgc cccatcttgc tggtcttaaa ttttctcact gtaggcaggg    16680
agcatgacct ggctgaattc taagtccttt tctactctga ggttcattgt gggtgtgacc    16740
tgctgggctc agctctggct ttgggagaca ccctctcccc ttgatctcga caacccctta    16800
gcagagccca gtggctccta cagtgccctg agctgcttgc ccgaaggatg cggttgtggt    16860
tatctcaccc cctgccaccc tgtttgcgca agggtttgag attgtgtggc ccctccttgt    16920
acttcggggt gaggcttgct ccagaaaggt ggtctgcaaa ggggttggct gggggggagg    16980
aggaagtcat tctccaagtg tttgtcctca tcgttatccc aaattgcttg cctggaataa    17040
ggaaggaaag aaaaaaaaat actcttgagt ggtttgggcc aggattttag ctgatggatc    17100
tggtagttcc ctctgtcaga tttgttttct ttgaactgtc tgggccggtc acagtgtcat    17160
tgtttaaatg tggaatgtag gtgttctgtg ttctgggaaa taaaaaccaa aactggtcca    17220
ggggatccac agaggtaaga aaagaacatt ccaataggaa tgtttcagaa ccaggagggg    17280
aggagagaaa aacggctctg ttggtctcct agaggaagaa cttgttagat ttggggagag    17340
tcaggataaa tttgacccta agagtctctg attcctttta gagacttttc ttataagaaa    17400
taaaatggaa cttgggagag gcggcaactt gggaaacagc acattctgcc gtaatgaaag    17460
tcgtcccata agaatttctc tatcccttta gccaaatttc tgtttctaaa aggggaaaag    17520
gggctagaga taggcttgtt tgttttctta gttgaatctt actttttgta tttccagccc    17580
attctgcagg gtaagaacaa gcacagcccg agggctcact cagtgtgatg ttctagagcc    17640
tggctctgcc tcaatccctc acgctggagg atcaggcagc aggggccagt gatggatttt    17700
tttttcttcc tttcctcccc tattaatatt tactgaggta taaattacag caaagtgcgc    17760
agacctaggt atctaggact gtgaggtttt cctgtgttac ctgtgtaacc acgacccaga    17820
tcaagataag gaacttttct ggcatctcag aggctcttcc tgctcccttt cagactccgt    17880
ctcccagaag gaactacttc tgattcctat agccatagac tgaattttct tttccaactt    17940
catatgcata ggatcatcat gggtgtttta attttaattt catgtctgct tgccactccc    18000
aaatggaaat gtgttggcat ctctggatgt ttcttcataa gaaacatgcc ctgtggggca    18060
aagcccagga cagggctgtg ctgctgctgg aagtcctgtg cagctggcca gcctctgctc    18120
acccctccgg ccacgctggc actttcagct tctccagcct cctgcccttc ccacttccag    18180
tcctgcacct gctgtcctca ctgatgcacc tgcccttttc cttccgtcct ttatgtggca    18240
cacccttaag ggagacatct tcctgtctgt gttttgcacc ctcttaaaac tacattcctt    18300
tcccttcagc attggcatct ctgtccttgt gtattacctg ggatgactat tcagttaaca    18360
aatgctttct tcctaggctg tgagcccaag tttgttggat gattggatgg gggcacgttg    18420
tgtgagagaa ggatcatggg gtagcatctg gctctcttag aggtgtgtgg gggcgtgtga    18480
tgcctgccaa ggcgctttcg ttctgggggg ttctgtgtgt ttgaagcact tgggttgtgt    18540
gtccctgagg cctccgtcac gggcaacctc attccttctc tagcctccat cccctgcccc    18600
ctgcccaccc caggcctctg gagctggctc cctttcctgc tcactctctt ttggccagga    18660
ttttaacata tatcacaggc tggtaggcta agagcttggg acttcccctc accacactca    18720
aagcctttga tcttttgctt tggaggtaac atcaaaagga aggctgagga agacagccag    18780
gctgtgaagt tcaacgttca agttaatagc ttgactgaag gttgtgctgc gttgtggcag    18840
catcaccgag gctggagtaa acagagtgat tctgccacat tttcctggaa atgcacccca    18900
atattggaag agggcttctt ttacattcgg aatgaattca ggctgtagtc agagctgctt    18960
ttccctttcc ccattttcct tggaagtgtg aaaacttggg ggagaagatg tttgtaggag    19020
ggcatgatga ggggtagagg aagcccaaag agaggatctg gggaggggaa gccccatggg    19080
atgagactct gaagttatcc ttgccccgat tccgggactt gctatctgcc tgccttttgg    19140
cgtggtgtct ctgtgcccct gactgttcct gatttagcga ggtgtttctg aattctgatg    19200
gaattcaaag aagcctgggc aggcaggcag cttgacttgg ggcttgggga agcgtgcagc    19260
ccagacatag cagcgatgag agggcctcag ggctgagggc tgagatgaga atttcatcac    19320
atgcaaaagt gaaagcgacc catcgtcttc tccacttgat ctcttgctga gctttgcaga    19380
cactttggtt gttgtttaat ttaacatttt ctgcaatgct ccttttttca gattttcatc    19440
caaagctctg tatgagaggt tttcaaaccc attttggccc tgattctatt tggcatacga    19500
ttcaactctg gggatggtca tcttccccac acctgcgttg ggtacctttt tggtgtatgc    19560
tcagagcatc cttggacatc ttcctggtca gtgtccagca tcgtgaagct gccctttagc    19620
ctctcagtgc ccccagatac acctgtctct ctgcgtagcg gcactcagcg tcacctttct    19680
gtggggtctt gagaccctga tgatatcagc actatgctgc cagaattccc cttggattct    19740
ttagtgtggc ttctcaagca tcccttatcg ctataacgcc ttcatggttt ttggcataac    19800
tgtatactac ctgtgctatt atttatttga tgcattcaaa catttgattc atttatttaa    19860
actcagtctc actgtaatcc ttaattaaca cctgtgaaat tataggtttg atgtgctact    19920
tatttattta ttttttaata cacattagta taatcccgta acggctaaag taacactttg    19980
tactgcctaa aaccatgctt gggagcgcca cagtttgaga aagtgcttag ccttcctttc    20040
cctcctttag tgacttgtgg tttggggcat ctgttgactc ctagggctcc cttgttcatc    20100
tttctgttcc taagctcagg gattagttgc tcaacccagg tgtggcctca aaattctgct    20160
catggaatag cctcaggctt ctataaatct catctttttt gttttgtttt gtttttgttt    20220
ttgagactga gtcttgctct gttgcccagg ctggagcaca gtggcgcaat ccactgtaac    20280
cattgcgttc tgggttcaag cgatcctccc atctcagact cccaagtagc tgggactgta    20340
ggctggtacc accaggcccg actaattttt aaattttttg aagagatggg gtctcactat    20400
attgcccatg ccggaagtct agttttatag tgatgagaat tcatctgggg tccaaggggc    20460
cctcctgtgt tgcttcctgt gctcccctct aaataaagat actccttcca agttgtcctg    20520
attttcaggt catcaccatt ttttgagctg gatggggaag ttggcctgga gcagccttcc    20580
ctgtctccga gttgcattac ctcctgagag gtctcagcaa atcactgcca tctcttgatc    20640
agagttgctg gcaagagtcc tctgtggttc taggttttca gccctggaga ctctcgcctg    20700
cattcattat acatgtcctt ttggtgcctt gttgaaaggc atctcctgcc accgaagggt    20760
gtgggcttct ggaaattctc agaaaacaca atatgccagc ctccagggat gggtctccaa    20820
agcttcagga acatatcctg gggtgttgag gaaacaccca ccttaaaatg ttcctcaagg    20880
gggaatgtta ctgcttgccc taaccctctt gagctgatgc tcacatgacg tccctgagat    20940
gggcttcttt tttgcccgta cttaaagctg taaagggcca ttgtcaaatt tgtttagctt    21000
ctcaattcat gttccttaga ggatggtaaa ttaaagttag cattcctgga cagagccttt    21060
catacattga agacaacccg gtgagtctca aggggagagg taagggagag atgaaaggtt    21120
ttctccaggc ctgttcggca gcatggactg ttcttttagg taattaaggg agaccataaa    21180
agacaattgt gtgagtccat ttacctttca cttgggggtc ttaagtcttt ggttgggctt    21240
ctttaaccct gtgtgtcacc cacgggctcc tatgggtgct gttttcattg ttccgttatc    21300
tagttggctg gaacacacct ttggggattg gagaatggag ttctgggggc tttgggaact    21360
ttgagttttc ctgcaatgtc ctatagaagc ttgagtctgt gattcctggg cagggccttc    21420
tcctagttga gtgagattgg tggggcaggg cagccagtta gggggtcatg ggagcaggtg    21480
tggaaaaggt tatatgtctt agtaattctt tgtgacaatc accctcattc attgatatct    21540
tcttcctatc atgtattagg gcagtggttc ccccaatgtg ctgcacatta ggttcacctg    21600
gagagctttt ataaaaatgc caatgcccgg ggcccacttt gggaggagcc aggcatcagt    21660
aatttcaaag gtctctaaat gatttacagt ttgggaatca ccgtatgagg atagtaagct    21720
ctgagtccta tgcgttctgt gccgaacacc catgaagcag tcttccaagc attttacctg    21780
catcatctca attctcacac tgttaaggag atagacagta tcatctccat tttgtagaca    21840
agacaactga atctcagaga ggtttaagtc tcaggacacc aaggtcatta ttaatcaggg    21900
ggactgtgat tgctcccttt ataaaatgta ggagatattg tggagtacgg ttgagaaacc    21960
attgcaatag ttttcttact ttgttaagaa attaggctgg gcgtggtggc tcaggcctat    22020
aatcccagca cattgggaat ccgaggtgga cagatctctt gagctcggga gttccagacc    22080
agcttgggca acagggtgaa accccatctc gactaaaaat acaaaaatat tagccgggcc    22140
tggtggtgtg cacctgtagt ctcagctact tgagaggctg aggtgggagg atcacctgag    22200
tccggctgca gtgagctggc attgtgccac tgtactccag cctgggcaat gagagtgaga    22260
tcctgtctca aaaaaaagaa aaaaaaggaa attagtggtg gaaggtgact ttgcatctgg    22320
gcgtatctgc ctgcagagtt ggtgtcctta ccttgaagaa accctgcttt agttggagta    22380
tccttaatgg ttagtggcag gaggggagga gtggttcctg ggagactgga acaaaatatg    22440
gtacctgaat gcttaaggct tggcagatga gcagtcattt tcttacacag agcttaggaa    22500
agggcatcca ggtagaggaa tcagcatgaa caaaagcaca gggccataga gttctcagaa    22560
ggaaagatgg ggttaaccgg agccaagcca gagatctggt ggtagtgggg ggtttccaag    22620
ctagaatggt tgtgtggtat tctgtcctca ggggctttga actctgtgtg ctaatgaggc    22680
ctcaaattct ctggggctct ggttaaaatg tagattctga tatcagttgg cttgggtggg    22740
gccttgcatt tctgtaagcc cttagcagtt gcactgctgc tactaccgtg agtattgctg    22800
ttgagcatta ctaccttgag tattgctgtc aagtgttact accttgagta ttgctgttga    22860
gtattactgt cgaattttac taccttgagt gttgctgttg agtattacta ccttgagtgt    22920
tgctgttgaa tattactact ttgagtatta ctgttgagca taaccacttt gagtattgct    22980
cttgagtatt accaccttga gtattgcttt tgagtgctac tgccttgagt atcgctgttg    23040
agtattgcta ccttgaatat tactgttgag tattaccacc ttgagtattg ctcttgagta    23100
ttaccacctt gagttttgtt cttgagtatt gctaccttga gtattgctgt tgagcattac    23160
taccttgagt attgctgttg agcattacta ccttgagtat tgctgttgag cattactacc    23220
tcaaggattg ctcttgagct ttaccgcctc aagtattgct cttgagcgtt actgcctcga    23280
gtattgccgt tgagtattac tcccttgagt attgccattg agtttagtcc tgtgagtatt    23340
gctgctactg cgccttggca atggttttca aactttgcaa cacatcagaa tcacttggga    23400
aacctttaaa attctaacgc ccaggtcaca tcccattcca actagatcag aacatctggg    23460
gaatgcgagc catgcaccag tagttataaa acctgcccag gtgattccaa agtgtgggaa    23520
cctttgagaa gcactgcttt aggggttgga atagtcctgg ctgaatttta atcagggaag    23580
actgactgct ccgtttatga aacgtaggag agtggagcag ggttgagaaa ccatcgggat    23640
agtgttctta ctttgttacg tgagcaatat ttgttgagtc tctgtggtgg gttctagggg    23700
ttcagaggac agcagtgtgc tgctaggatg gtggtctgaa ctagtggaaa ggcactcaaa    23760
ggaagaaaga cagaattcta agaggagagg aattttagga aggagatacc caggactttt    23820
gaattacagg taatttgatc agaacccaaa actgaaatgt ctctgctctg tgatgaaagg    23880
gtttgctggc attgagtaag gagctgcagg aaggccttta acttgtctcc aggtctctta    23940
acagctttgt catttacata caagcacctg cctggctaaa ccattcattt ctgtagcttc    24000
cttctggatc tgtctaggga atatttgctt tgcatatttt ggggttatct taagtgtttg    24060
aaggaaccaa aatatttttc ttaaaaataa cactcaaatg tagttcacat gattaatttt    24120
gactgatttg tgagaatcag taagtgctga ctgactgagg cgccccacac atccggcttc    24180
cttctgttac tctacgcgtg ttgctgaaac ttaacgaacc catgtggggt cttctcgcct    24240
ggtgcagtcc ggcccagtat tcatactgag gtttgcagtg ggagaaagga aggtatttat    24300
ttgtaggtca ccaagcaggg caaatccagc agctcacgct taagacctga cctctcccat    24360
ggtttataag caagtggttt tttttttttt tttttttttc agactgagtc ttgctctgtc    24420
acccaggctg gagtgcagtg gcgtgatctc agctcactgc aacctccgcc tcccaggttc    24480
aagcgattct cctgcctcag cctcctgaat agctgggact acaggcgtgc gcccccacac    24540
ctggctaagt tttgtctttt tagtagagat ggggtttcac catgttgccc aggctagttt    24600
ccagctcctg acctcaagtg atcctcctgc cttgacctcc cagagtgctg ggattacggg    24660
catgagccac agtgcctggc ctgtaagcaa gtgtttttaa agaaaggggt aaattttagg    24720
gaaacagaag ttctaggcaa aatggtaaat taatacaggg aggtaagaca ttggtttggc    24780
ctaaaaagat gggatatttt gaagtggggg ctcataggtc ataagtggat ttaaagattt    24840
ttttggtttg taattggtta aggaagataa gctttgatta aagatttggg gtcagcagaa    24900
agaaatgtta ggtctggctc gtgggcatgt ctttttctag gcccctcctt ggaaagaact    24960
ttagagcaaa gaaaggcagt tggagcttag tccccacttt ctcctgatct gaggtctacg    25020
gaccactgga tccatttggt ggggtccatc tttctgaaaa acaagtcagg gacatgtatt    25080
gagatgatat tattggtatt tatagggaac caaacaacgc cccatgactc ttttttggct    25140
attgttttaa gccactgttt ttttttgttt attgagttgt taacttattt tttaaagcta    25200
gctagctgcc tggaatttct ttagaaggaa ctgaagtttt taaaaatttt tatgttgggg    25260
ggtattgccc tgcaggcccc taaaaggggt ccctgcgctg tctcaaaact tggatgcaaa    25320
aagaagttga gttaacacag gaggacaggg gtagacgcac caagggcatg tgcctcgagt    25380
gcgtggtcct tattaagaag ggtggttaga cagggaatgg gttagttccc aggtcggcat    25440
tcagctgaaa cagtgatggt taaaattctg aaaaatgtcc acgctctgca ttctcttcct    25500
aacacccagg acccagtaac tataaagccc cctaccctgg ggcatagcag ggggcttcag    25560
ggacccatga gaaggtcatc tgctgctagt tacactcctt ctgggacctg atttagacag    25620
tttggtggta gttttgcgag ggttaatttc agggccaagg atgcttctag aatggaaata    25680
ccttcttgac attgggagct ttattggttg attatgtcaa tgtgagaatt caggaagccc    25740
agtgctaatc ctccatccta aaaggagtag attggctggg cgtggtggcg catgcctgta    25800
atcccagcac tttgggaggc cgagggggcg cggatcacct gaggtcagga gttcaagacc    25860
aacatggcga aaccccgtct ctactaaaaa tacataaatt agccaggtgt ggtggtgggc    25920
gcctgtaatg ccacctactc gggaggctga ggcagggaga attgcttgat cccaggaggc    25980
ggaggctgca gtgagccaag attgtgccac tgccctccag cctgggcgac agagcgagac    26040
ttcatctcac aaaaacaaac aaacaaacaa acaaaaacta aaaggagatt tcctccttct    26100
gtcctttatg ggagacttca accttgggaa agtctggaat ccttggacat tagaaattct    26160
gaagttttgg ctggctgtag tggctcatgc ctataatccc agcacgctgg gaggccgagg    26220
caggtggtca cttaggccag gagtttgaga ccagcctggc caacatggtg aaaccccatc    26280
tctactaaaa atacaaaaat tagctgggcg tggtagcgga cgcctgtaag cccagctact    26340
tgggaggctg aggcaggaga atctccagaa cctatgaggt ggaggttgca gtgagctgag    26400
atcacaccat tgcactccag cctgggcaac agaacaagat tccgtttcaa gaaagcagaa    26460
actctgaaat ttttgcctgt ccaggccaca tcaatcccat tcctctgctg tctctgcagg    26520
attctgtgag gaataattag ttaatgtttg cagagcactt tgaaatcctc agatgaaagg    26580
caccggagaa gcacaaagta ttattattta ttattagctt gccccagaat ggaggcgcat    26640
gaggccctgg cagctccctg cctcgtgcca ggtgtgatcc tcctgctggg cttttcctgc    26700
ctgatgagct tttttttttt tttttttttt gagatcaggt tcagctctgt cgcccaggct    26760
ggagtgcagt ggcatgaaaa cagttcactg cacacagctc actgcactgc agcctcaaac    26820
acctgggctc aagcaatccc cctgcctcag cctcccaggt aactgggact atatactaca    26880
ggcatgcgcc accactcctg gctaattaaa aaaaattttt ttttgtagag atgggggtct    26940
cactatgttg cccaggctgg tctcaaactc ctgggcctca aagatgccaa aggttcacac    27000
cttggcctct caaagtgctg agatgacagg cgtgagccac tgtgcctgtg ctcaattgat    27060
tttctttatt aaagaaacat ggaagaaagt gaaggatgag aatcagtaac gtaacgtgtg    27120
cttcagattg tggacaagtg atgtgaagga aacacattgg tcccactgtg gtgacagagc    27180
aggggtttcc ttacctggca aggttgcggc tgccattcct tggggtctgg ggttaagacc    27240
atctgcctga gggtaacgca gtaataaatc agtactaaag ggcgtactaa agtactgtat    27300
tgctaggcta ggccatgctt ggtgtatttt tttttttttt taattgagac ggagtcttgc    27360
tttgttgccc aggctggagt gcagtggtgt gatctcggct cactacaacc tctgctgccc    27420
agtttcaagt gattctcctg ccttagcctc ctgagtagct gggattacag gcacgtgcta    27480
ccatgcttgg ctagttttaa aatattttta gtagagattg ggttttgccg tgttgtccaa    27540
gctggtctca aactcctgac ctcaagggat cagcccacct cggcctcccg aagtgctggg    27600
attacaggca tgagcctggc tggtgtattt gttttaaatt taaagtttac taaatttaat    27660
gatatctggg gaatcagctt gcttcctggg gatctggatg tacttgaggt gagagggtgg    27720
ggattcagaa ttatcctttc tatcgcagca tgttctggat tgattcatgt aggtctcaag    27780
tgtgtgtaat atttcatttc tttgtgcaat tttggcatgc cgaggcgggc accctgaagc    27840
tccggcagag cctggagaca gagtggggag ctctccgctc tttcccttcc ttcatcccag    27900
ctgacttcga ctggaattga attcatcagc tgctggagag ttgttttatt tgccctgctg    27960
gtggagaggg aggaaaggaa catcatgggg ccaggctttt tttttttaaa ggaaagattt    28020
gatttacttt cccccttagt agcatgatgg gcacctgcac ccgccagcta atcagaagcc    28080
actgtcccct gaatgcctcc gctgcccacc agatcctgac agcatcccac gcgggagcac    28140
tctcgtgtgc ccctggcagc ttctgctgcc tggcagttct ctaaacttgc tggtgtctct    28200
ctgcccggag gctcagaaac ccagaggact gaccacttct tgaggctcat gtccagtttg    28260
caaagagccc ccagcaagca gagaagggga tttttgtacc agcgatatct cttctccact    28320
cctcaacaca ctcctttcca ctctgtctcc tataaacatg gaacagccag gaatactcaa    28380
atcctagcct gtcatgaagc caaaaattga tagagatcta ctgtccagaa tgatttctta    28440
tagtgaccct gtgtttagtt ggtaagactt tcttaaacca tgagggattc tggtcccaca    28500
gggcagtaat atctggggca gagcctgaga cttttctcat tgatttcctc tgtgagccag    28560
gagtgactgc tctgatgcag ggtgctgtgt ggttggtaga agctggcgtt atcccatttt    28620
acccacgagg aaacaaatga ccagtggtgg agcgggagct cagcatccca tgtgcccact    28680
tcctcctcgg gtggactttt cacctgccca tgccgtcttc tttgcaaact ttactgcagt    28740
gacggagaca tctttaaata caaattcttg ggggaaccct gtgttccttg gctggagcct    28800
ggctgggaag gaggagggag cagagggctc tcttgggtgt ggcctattgc agttgagcca    28860
gggaaaggct ggtccactgg agacaccctc tctggtcacc gcagacttcc tgccctccat    28920
ccagtgtcct tctacttgca ggatgtgtgc ccagcagaga gaatctctga agccatgtca    28980
ttattgggat aacattcctg tcccagtcac cttatttctc agaaaaagga caatgggaaa    29040
caagttttta ttgaatccta tgctgggcct attaatgggg tctcttactt ttcatagcag    29100
cactgcaaac agagttacgt ttctattcat tttatggatt agaaagctga gatccagagc    29160
gggcagatgt aaacctgggg tctttaaaat gcatcctttt tgcaaacaaa taaacttagt    29220
gtattaaaag ggctggagag agcagagtaa ggtaacattt gggtggtcag catgtagttc    29280
tgggtcccca cagtggagat ggcacagtgc tgggtgctgg gggaactatg gtcactaaga    29340
gacactgaat aatttaatgc atgcccctga ttccatcact gactgttgag gtaacacata    29400
catttatatt gtcagtggtg gtgatgatta catgagctgc gtaaagcgtt tgaccagtgc    29460
ctgcacataa catagtaggt gctcaataaa gatcacccac tcttaagagg tgggaggagg    29520
tgaagtcatc tttctgggga gtgttgccct gttgttctct gctgcattct ttctgtcctt    29580
tgggctccga gaatgctggg ttgggcagtg tgagtggtct tctcaggcct ctgtgacatg    29640
ttgctttcat gaaaggttcc cctctagcca aagactgagt ggtccttgca ggctttctcc    29700
tgagtccttt tttttttttt tttttttttt ttaaagacag agactctgtt gccagattgg    29760
agtgcagtga cgcggtctcg gctcactgca accgctgcct cccaggttca agcaatctac    29820
aaaatgcatc tataaaatga tgcatcagcc tcctgagtat ttgggatcac aggtgcccac    29880
taccatgcct gggtattttt ttgtattttt agtagagaca gggtttcacc ctgttgacca    29940
gtttggtctc aaactcctga cctcgagtga tccgcctgtc ttgacctccc aaagtgctgg    30000
gattacaggc gtgagccact gcacctggcc tctctcctga gtccttttgt ttgtgcctgc    30060
tttggggatt ccctctggct ggggtggact gccgggatct gtttgtccag tgtacatttc    30120
ctggtcacct agcaccggcc agctgcggtg ctgggaggaa cagggcctgg ctctgggagg    30180
cagctgggag agtcaggaag tgaagaaagt tcttgtgggt gtgatggtgg aaacccaagc    30240
agcgtccaga gggagcacaa gagggaggga caaatcttgg gagggtcccg ggccaatggg    30300
acccagtgta agaaattgca cctgtcctgg cagatagaga aggtggaagc agtgaatggt    30360
agagcatcct cactcttctc tctgccagca agcacctttg gggaagtcct cacggacagg    30420
aatgtcgtgt gtcttggctt gagatgtcaa agaaacatgt tggacacacc atggtgacag    30480
agcaggagtc tcttaacccc ggcgtggttg aggctgccgt tctggtggga tctggggtca    30540
gtcaggggtt aacagtcgct cctgcttgcc tgattgacac agtaataaag gcagtgacac    30600
caaactaggt ctcaggaatg tgtcctcgtt agaaagactc actaatggtt gtgggggggt    30660
ggcccatgag tccttctggg tggtggcgag aagtagggga ccctttgggc tttgcccttt    30720
ttggtcatag gacttcactc cacagacata attgaaccgt tgggtttctg cagccaaatt    30780
caaatgtcac caatcttggt cacccctttc atctcttggg tcctctgtaa gttatagcta    30840
tctgatagtt tactgaaaaa taaactgaaa atatgtttta aattgtactt tcgatttaaa    30900
ataatgttta gagacaaaaa aaaagggtcc aatccacttg gagaaaagca ttgtcaaagg    30960
tggttgattt ttttcttttg ctgttttaaa gtggtaagtg gatgagtgtt ttggatatat    31020
tgatttttca ggtgtgcagg cggtcacatg aacagctgac attttttttt ttttcatgtg    31080
gacttcagcc agtcttgaca cctgcccctt aacgaaaagt aaaccatcgc cttgtttgac    31140
agtttaagtg cagtgatacg gatggaggca ggtttacgtt atgttaaagg cttgacaacc    31200
cagaaccccc ctgttggttt ctttgttgta acctttgagc cggtggcctg ctgaaatgtc    31260
acctttgccc ttctttaaaa gcaggaataa taggtggtga gtgggtggat gcctcttaaa    31320
atactggaaa gtgctgtggc ccgagggtaa gctttttaga agtgagtgtg tgtgttgtgt    31380
tgttttaatt aatgaatctt ctgggcctga agataatgag gtcagtgagg gcagccatgc    31440
tgcctcacag ctcaccttag ggtccttgtt gtccagaacg tgcctgacct actggagggg    31500
cctgggaatg cttctttgat tgacgtgggt aggaagacag atgtggcggc ctccatgctg    31560
atgggaggca gctgggaaga aggtcatggg caccatctca ggagtggcag agccacctcc    31620
ccctctcctc accccgtgtg tctggattct tccagctgtg tggtccttct tcctgcctgg    31680
aaatgagcat cctgcagagc tcggctcctg ttcacaccct cctcctaacc ccctactctc    31740
cctctccctt tcatccaggg ctggaggacc agatgggctt tacctgatgg agtgtgcttt    31800
gctgacatgg tgcaaagagc caattcctgg ttgcaaagag gcagctgggt gcagaggcgg    31860
ggtgcattcc tgtaataata ataacttgtg tttttataat actttacagt ctaagtactt    31920
ttcaaatact tgacctcatt tagttctcac cacagccctc tgaagggata ttactattac    31980
cttcatttta tagatgcgtt aaccagggct tgttttggga ggtagagggg gtgtgagggg    32040
gacagagggg agggaaccag tgttgaatga attctgaggc cctgccaaag cagccagcta    32100
gctaggtgtt gtttaatgga ctctttgcat ctacagaatg agggaggtgg gatgagggga    32160
aattatttca caataactga aggtcggaga gactaactct ctgctcattg tcacacagca    32220
gttgagtgcc agctgggatt tgtcacccag gtcacctgac tcctaagccc tgtgatcgtt    32280
ctcttctgtc tctagtatac ccagcataat gcccggcaaa gtgctggcat caataaatat    32340
ttgtcgaatg ttaaatgagg cttaaagaga accattcatg cttggcacag gggcacagtg    32400
agacaaacat gtttcctgcc ctcgtaacct tcgcttccaa attctgtgac cttgggcggg    32460
ttgcctgagc tcttttccag ctcagtttcc tgaaaactca tccggaaaat gggtaaaata    32520
tcagagtgca ttctgtatgg taagactgca aatgttagat gattctgcta cttattattg    32580
ttttcttttt ctcaccacac accttccctt tttatgtaca cctcctagga agtaagtttc    32640
tgataacata ctgcattgtt ggataacagc aacaaaaagc acttcctgac attattgccc    32700
aaatcaccaa atgaggcaat taccaacttt ggaataagaa tagcaacggt ggtaagagct    32760
gacatttctt gagcgcttgc catatgctgg gtgtactact ataagctgct gcctgcaatt    32820
atgatttggg aacaactctg aaagtagtta cctcccattt tatagaagag taaactgagg    32880
ttcagagagg ttaagtaacc cccccagggt ctctcaggaa gtagttggtg gcctgggatt    32940
caaacaccag aattggtctg acttcccact ctttaaacca cactcaaaac tgaactctcc    33000
acgtgtgtgt gttctgggca ttttcgcatc tcccttggct tgttgacagc gtggactttt    33060
gctttcccat tctcatagaa catggccagt gcaggaggag gaaatccaca ctggtctttg    33120
gactgaacca gaggctggcg atggtcccga aacagggtgc caagtggctg acccttgttt    33180
ttatgccttg cgctggtaag cttggggcac caggagttct ttgaatttct ctttcttgac    33240
tgtccacgcc ttctttaggc aatcttttaa caggctatgt tttaaatctt attgacatct    33300
ctgaagaaag aggaggaaaa aaaaatcaag acatggcctt agagaagtga caggttttct    33360
ttgagatttt gttttctgtt ttccttttta ttttgtgcac attgcaaaac ctctttggga    33420
tgatgatttc gtgtggtttc ttggtagccc ttgggcagct gctgccaggt ttcacccaaa    33480
tgcattgtga ccccctgttt cgtgggacgg ctttgcctcc acatggctga ttgtgctctg    33540
tgtgtccgct gtgggcagag tgtgattgta agaatcagaa ttctgctggg cttgcaagca    33600
tttaaaaaat ctctataagt ttgagaactg gttggaaggg agagatgcag cgacttagaa    33660
cacccggcct gcagctgagc ttccgtgtgc ctgggaggag cccatatgga gaaacaggaa    33720
aattccactt caccagaaag ctggggaaat gagtgggagt aggggccagg ctggttaact    33780
aggaagactt ttggtcactc tgctttactt agcctaaagt gttcatttcc cccttaagcg    33840
gtggttaata cgcgtatctg cagatttact ttttggatga tttaaaatct tgcaacatct    33900
caagggattg tatcctgatg atactgatta tattaataac aagataatag cttataatat    33960
aatagctagc aattaccaag cacttacctt acaccaggta caatgccagg catttgatcc    34020
ttacacgaac tctgagagat ggctgtttgt attcccattt tacagatgag ggaagctgtg    34080
ctgagagagg tgagttcatt tgcccaagct cacccacttt gagatggtct gcttttatat    34140
cctcttagcc caattctttt ggatgtcagc acttggcatg tattaggcac tggataagtg    34200
ttttgttgaa tgaacaaaat gatggaactt ggatttgaac ccaggtctga gctggctttg    34260
agtcttcaga atagtaggtc caattagtgg agtgggggct cagtagtcca aagggaaagg    34320
agcaaggaga cattgtgggg gccgagaaga gggcttctgg ggtgtttcct gggcacattg    34380
gcattaaagg catagtgtga agtgccattc aagaccatgt gctggattag tgtttttcct    34440
ctccacttga ggtgcttgcg attggctttg tgccccggtg tctgcaaagt gagttgggct    34500
gaactcagga agaccttttg gttgggatga ctgtgtattc acctgcacct gagtagggac    34560
tgagtttcac ttgccagttt taccgcagca agacctcgtt aagttggctt cctctcattt    34620
aggcatttgg gaaactttag gcggctggag tttaattctc aaggcaaagc cccttttcaa    34680
gggacatgaa gaaaggcaga gggatatatt taaaatacct gaatgaactg tttctttttc    34740
tttttatttt ttgagatgga gtctccctct gtcacccaag ctggagtgca gtggcacgat    34800
ctcagctcac tgcaaccttc acctcccagg ttcaagcgat tctcctgcct cagcctcccc    34860
agtagctggg actgcaggtg tgcaccacca cacccagcta atttttctat tgttttattt    34920
tattttattt attttttaat tttttttttg agacggagtc tcgctctgtt gcccaggctg    34980
gagtgcaatg gcgtgatctc ggctcactgc aagctccacc tcccgggttc atgccattct    35040
cctgaatcag cctcccaagt agctgggact acaggcacct gccaccacac ccggctcatt    35100
ttttgtattt ttagtagaga tggggtttca ccatgttggc caggtctctt gaccttgtga    35160
tccgcccgcc tcggcctccc aaagtgctgg gattacaggc gtgagccact gcgacttgca    35220
tgtagacagt aatggcaggt cactatcagt gggtctgtta atcaggtgtc caacctggtg    35280
ctgggcttgg tggctcatgc ctgtaatcct agcactctgg gaggccaagg cgagtggatc    35340
atctgaggtc aggagtacaa gaccagcctg gccaacatag taaaacccca tctctactaa    35400
aaatacaaaa attagctagg catggtggga tgcatctgta gtcccagcta ctcaagaaga    35460
tgaggcagga gaatggcttg aacctgggag gcggagattg cagtgagcca agatcatgcc    35520
actgcactcc atccagcctg gacaacaaag cgagactctc acaacaaaac aaaacaaaca    35580
aacaaacaaa caaaaagtca cttgcttctt tttttgcttg cttatggaca taaaccctgt    35640
aaactatctc atacatcatg ggagtgagtt tgcagtgggt agactgctat tcacaaactc    35700
atatacatcc tatgaaggag tacaggttaa ataaccatta tccaaaatgc ttggggctga    35760
aagtgttttg gatttttaat ttttttcaga ttttggaata ttcgcatata cataatgaga    35820
tatcctgggg atgggaccca aatctgaaca ggaaattcat ttatgtttta tataaaccct    35880
tttttttttt tttttttttg agacagagtt tcacgcttgt tccccaggct ggaatgcagt    35940
ggtgtgatct cggctcactg caacctctac ctcccaggtc gaaacgattc tcctgcctca    36000
gcctcctgag tagctgagat tacaggggct tcccaccacg cacagctaat ttttgtattt    36060
ttagtagaga tgaggtttca ccctgttagc caggctggtc tcgaactcct gacctcaagt    36120
gatccacccg ctttggcctc ccaaagtgct gggattacaa tgtgagccac tgtgcatggc    36180
cttatataaa ccttaggtaa ttttatacaa tattttaaat aatttttgtg catgaaacag    36240
agttttgact gcattttgac tgtgactcct cacttgaggt caggtgtaga cttttccact    36300
tgtggtgtca aatttcagat tttgaagctt tatataatga gatagggtct tgctctgttg    36360
cccaggctga agtacggtgg cacaatcaca gctcactgca accatgacct cctgggctca    36420
agtgatcctc ccatctcagc cacctgagta gctgggacta caggcatgca ctgtgactgg    36480
attttttttt tttttttttt ttttgagacg gagtctggaa tctcaagtct cgctctggtg  36540
cccaggctgg agtgcaagtg gcgcgttctt ggctcactgc aatctccgcc tcctgggttc  36600
aagtgattct cctgtctcag cctcctgagt agctgggatt ataggcgtgt gccaccactt  36660
ctggctaatt tttgtagttt tagtagggtc ggagtttcac tgtgttggcc aggttggtct  36720
tgaactcctg aactgaagtg atctgcccac cttggcctcc cagagtgatg ggattatagg  36780
catgagccac cgtgcccagc cttggctaat tttttatatt ttttgtagag acagggtttc  36840
gctatgttgc ccaggttggt cttgaattcc tggactcaag caatctgccc accttggcct  36900
cgcaaagtgc tgggattaca ggtgtgagtc accgctcctg gcctgaagca ttttggattt  36960
ttgggttaga gttgcacagc ctttactgtt attatcctga tgttattatc cacattttac  37020
aggcaaggat ctggaggcgt agagaggtaa aatcattttt tcaaagcccc agaagtacta  37080
agccgcagat tctgaatttg aactcaggca ttctgggtca gaattagtga ggttttaagt  37140
taattttttt ttttttttta gatagagtct tgctctgtta cccagggtgg agtgacagtg  37200
gtgctatctc ggctcactgc aacctctgcc tcccgggttc aagtgattct cctgcctcag  37260
cttctagagt agctgggact acagacatgt gccaccacgc ctggctaatt tttgtatttt  37320
tattagagat ggtgtttcgc cacgttggcc aggctggtct tgaactcctg acctcaggtg  37380
atctaaccac ctcggcctcc agaagtgctg ggattacagg cgtgagccac tgcgcctggc  37440
ctaccccctg tcgcccaggc tggagtgcaa gtggcacagt ctcggctcac tgcaacctct  37500
gcctcccagg ttcaagcgat tctcctgcct cagcctcctg agtagctggg attacagata  37560
cccaccacca tgcctggcta attttttttt tttaagtatt tttagtagag acagagtttc  37620
aacaagttgg tcaggctcct cttgaacttc tgacctcatg atctgcctgc ctcggcctcc  37680
caaagtgctg ggattacagg catgagccac catgcctggc ctaagtttgg tttttaacca  37740
tgctgctttt tctagaccct tctgtcagcc agctccacaa tggtgaatca gggagttagg  37800
tccgtctgta agagagggcc caggagctgg gtcagatagg taaagagaca ttccttagtt  37860
cttatcctct gctaccaagc catttcttgg gatcaagccc tctttggcct gtgtcattcc  37920
acctccatta agttcagcct tctttccttc tttccacatc tttccactgc tgttgaaaac  37980
ttgagacctg aaatcccatc tcctgaattc ctgggagctc tagaagtgga gatggccagg  38040
ttctgtggtc agagctggtt gggattacaa ataaaccaaa gcctgggaaa ctttcttgct  38100
attaatagcg cagacctttt ggggagggaa tacccaaact cgatgctgtt ggaattgatt  38160
ttgcctgtct agatgacata ctaatgagct aagtggttag cttcggatca ttattgctct  38220
ttcccaagcc aagttctttt aaagactaaa accacaaaag cagagaacga gttgggttag  38280
agaggcatag tggctgggtc cagagaaggg agagtggtca gccctggcct taaacatgag  38340
aaaataaagg tggtccttgc tttggaatga gttagtggtg ctgactaatt caactggttt  38400
ttctttttct ttttggaagt ggaatttgat ttggtgtctg gattttgata gggccattta  38460
tatttcttca gcactttttg gttcttgcag aaagttacat tcctagttcc tcaactgctt  38520
atttcttttt ggtttttgaa gcaggaattt gatttggtgt ctgggttttg ataggggtgt  38580
ttatgtttca tcaatgtctt ttggttcttt cagcgtttct ctccttgtct gtcatgtgtc  38640
agagagggtg cctgtcaacg attctctctc tccagggaga aagtctttct taaaacagcc  38700
ctaagatcct tatctcctca aatcacccac tttgatgata atatccattg ttctcttctc  38760
tgcttcttgg catattctag tcagtctatg tatacaatta aaaaaacaaa acagccctct  38820
gtgtccaaag tgcttggaat atcccagtgt ttcacaggag actttggaag tggacaaaac  38880
tgtatttcct tccccaaatg aggttattgt gctcgaaata tctcctggta gtttattaaa  38940
ggaaaccgca ggcaggggta agagaggcag tttctacagc ctgcaaccct attatcttgc  39000
ctcttctttt cgaccctcct tcctccctct cctcttctct ccccccctca ccctattcaa  39060
cccagcccca catgtcatgc cgtccccagg aggtagccct gcagccctgc ttctctggga  39120
tggtctgttc ttgccacccg tcccatggaa cgtgaagaag gaatttgggg tgtggacttc  39180
cttgagtgac taggattaga cccgtcgggt ctgcagtcag acgagaagcg tgtgggcaaa  39240
gggaactatt gtgtgaggct tctctggaca gaaagcctgc cttcatcttt tactgtgcct  39300
aatggacaat tgagacattc agcttatgtc tgaaaggaaa gtgggccggg atggtctagc  39360
agacctccca gatgaaggct tgtaggagga gcaaatagag acaaggatta ccaacagggg  39420
gaacaactgg ggcagagtcc tgggagagaa tgtttatttc cttgctctct aggagggatt  39480
tggaaagagc cataatcctg ggttaggagt aatttgttac agcaagatga tacttgagtg  39540
acaggctgct tctggctgag gcagcaagac ttgcatgcag gggggtcgtg gggcctccag  39600
aaggtcagcc tcccgtaaat cttcaccctg gctttggggt ttgttcctcc ccaagcaaaa  39660
ttaaccagag gcactgctga cctttgggct tcctgggtgt agcgttacga agcatctcca  39720
catgtttgtc acagctagaa tttgacaata aaaatttgga cagggagacc ctgccagagc  39780
cactgacctc tttccaatgt gacaagggga aaaaaaacaa aaggaaaacg cagcacgggg  39840
tgcggtttca gttgaagttg gaggacacgg agcccagcct gtctcgcatt tgctgtctat  39900
gtagactcac taaagcaagt taattcattg ctctttgacc gccaagtctt tcgttgtctt  39960
ttgttgttgt ggaatggggg aaagaaatac agaatgggga ggagaaccta attagaaaaa  40020
tcaagccttg agagctccca gccatggaga aagaaaggga ttttttagaa gttgtgattt  40080
taatatctgc tgcaatctga tgattcatgg atttaaaata acccttccag gtcaccagga  40140
ccctgttact tgctggcttt gtacctctca aaggtcattt gttggcttcg tctcttaaca  40200
atttccatgg tagacctaaa atttctggct gtgaaatccc ctgtgtagtg ggaagaagaa  40260
atagcaaatc ttagctgcct tggacctgat ataattattt gtcttcattt acatggttta  40320
tccttcaagg ttgaataaat gatgtgggag ctagtcaagg ggctttaggt atgtgatttc  40380
atgcctactt ttttttaggt agagaaactg aggtcacagg gtactagaga atggactcta  40440
agattcaggt ttctgaattg cctgtggttt tgttgactca actgctcttc tgttgttttt  40500
tagccacatg ccttgaaaca gtcctctttc ccatgtttct tcatcagcac cattaaccca  40560
aggtatactg tcctctctta tctttcacaa ggtcttggag ttcccatgcc tttgtaagca  40620
tccctccccg agattcagca ccaaccaaaa tcacatttgg aaaaattgct tgtttcccaa  40680
gaagctttgg aggatatgat tttgtataga acgggttcac aggttttctg ttcattcttc  40740
tatggtggag tgtgtgtgta tgtgactctg tcttctctcc attcctcttt tttttttttt  40800
ttttttgaga tggaatttcg cttttgtggc ccaggcttga gtgcaatggc gtgatctcgg  40860
ctcactgcaa cctccacctc ctgggttcaa gcgattctcc tgtctcagcc tcgcaagtag  40920
ctaggattac aggcatgcgc caccacgtcc agctaatttt tgtattttta gtagagatgg  40980
agtttcatca ctttggtcag tctggtcaca caaactcctg acctcaggtg atccaaccgc  41040
ctcggcctcc caaagtgctg ggattacagg tgtgagccac cgcgccaagc ctccccatcc  41100
ccttttatct cttaaatgaa tgtggtcacc atcaaagatg gtgcctgact cttttttgtt  41160
ttcagttcat cttaaattca catataattc acacgtcata aaatgtaccc atttaaggtg  41220
tacagttcag tggtttttta gtctatttag tatatttaca agattgtaca aacataccag  41280
tatcttaata tttttatcat ccccaaaaga aacactgtaa ccctagcagc cagtctctac  41340
ccgccttccc catagctcct ggcaatcact aatttacttc ctgtctctat gaatttgcct  41400
attttggtta tttcatataa aaagaatcat acaccatgaa actttcttca tctgccttga  41460
agttagcata ttttcaaggg ctaccatgtt gtggcatgtg tcagtactcc atttgttttt  41520
attactgaat agtattccat tttatggctg taccgcattt tagttatcca gctatcggtt  41580
gagacttggt gcattcttat cccagaacat accatattca gctcccagtg acacccacat  41640
tcattcctgg gctgctcctt gtcttccagc tattttcctg gtctcctgtt gcctctgcct  41700
acttcagcat gctgtagaga catgggtagt aactaaaaca ttccaattaa ctgcattgta  41760
cttggccttt ttataagaag cagtaattag aaaatatggt ggccacaaga ttgatattaa  41820
agtgaaagat tgtaaatact tttctgcctg aaggtagatg gcctctggcc tgcctcttag  41880
tgggaggttc ttccaggagc ttgcaagcat ccattatttg ttagtcatca gcttagcggc  41940
caaggagcat tagcctgtct tgctctgtct gctgaagact ctgagagaca tgggagggca  42000
agggctgctc cttttgaatt cttccaatgt cttcatgtcc tttaacctcc tggcttaggg  42060
acttgtgtgc tggtggtgga gctgacattt gtttggaatc cacagccctt tgggtgggac  42120
tcaatcttgg ggttgcctga agactttgag atggctaggt ctgggcctct tttggtcact  42180
atggaacaag actgtctcag aggccagagt ctgtctcacc agctccctgt cttgggactg  42240
caccattgca gggtctttgc cctcccctgg agatttctct tcctgcctgg gcacccattg  42300
gccattctgc ccgtaagctc agtagggtgt aggcaaaaga gttctggcct ggaagtacca  42360
aagtcctgcg ttctggtttc agtccctcat aactgtgtat aactaagtca cttagttttc  42420
tgtgcctcac tttcttctgt tttaagatgg atttggagat tattggcttt gaccacctaa  42480
aaaggatgta gtgacaatca atttagaggt ctaaaagagc ctttgaggaa gtaaaatgga  42540
atcttcaaat ggactacatg ctgattattg acactgccct agcactgata gttgatgttg  42600
actgatggtc agaattgctt ggcaagttgg aaaaaagtac gtacagatcc tgggccacta  42660
ccaagtttca tttaacagat ctggagtgca tcaggaaaaa agtccctcta aacaagccag  42720
caaggtttgg atactgtgca accttttttt tttttttttt ttccttttga gatggagtct  42780
ggctctgttg cccaagctgg agtgcagttg cacaatcttg gctcactata acctctgcct  42840
cccaggttca agcaattctc ctgctttagc ctcccgagta gctggcataa caggcgcctg  42900
ccaccacacc cagctaattt ttatattttt tggagagatg gggtctcacc atgttggcca  42960
ggctggtctc gaactactga cctcaaagtg atccgcccac ctctgcctct taaagtgctg  43020
ggattacagg catgagccac tgtgtctggc cctacttacc ttctttgtgt taattcctgc  43080
accattgatt agcttattgt cccattgact gtgtctttag atgacttctc tgggcctcag  43140
aatatctagt ccatagctga cacagagcat ctgtttaatg gtaaatgctg caggaatcca  43200
tgcattggag tagaaagagt tttagatcat gttcctcatt tcttgctaca gacttaggca  43260
aagcgtggag aagaggttgt ccaatgaaga aatgaagtga catgccaggt cagtggcaga  43320
gctaggcctg gaaaataggt ttccagactc ttccctttct accatacttt tcctgggagt  43380
acgcactcgt aatttgaaga gcgacttttg ggagagggtg gaaggaaggc ctgggcctca  43440
gcctaagggg cccattggtt gtgagaggag ggtctggtga aattccatac cgattgtccg  43500
tgtgtgagct gctgtaccat agcctccctg cagaaccact aacctgtcaa atgcagaaat  43560
agttcaggga cagagctgtt aaaggattgg cgggttaaag aaaacagtga atcccaagtt  43620
ttgttaattg gatttttttg tttgttagtt atttgttttg cttcattgtc ttcatcacac  43680
caggggcctc cttaaatctg gtggaaaaat ttccttggaa aacaattcag tgtttgtcca  43740
tagacttggg agggagagat gctagatgct ggaaagtctt gcttattact ttggggacac  43800
tgagatgttc ccttcaccat gtactttgag acacacatcc tggttgagtt caggcaagga  43860
tgcctaacag ttgataagaa aactgggaaa gatagaaggg atttgtaagg taagtcaggg  43920
tgagtgaaaa cacatccggt atgctggaga cctagatgct tgactgccac tcgctcctgt  43980
cacctcagtc aatctgggtc ttgctctgtt ggccttagtt tcctccttgc taacaggtta  44040
gttccacctt tctgcccatt tattttgtag ggttattgtg gatgtcattc tgaactctaa  44100
aataccctct aaatatgaag tgatattagt gctctttaca ttgttatgat taaaaatatt  44160
tatgagaaaa aggttaactg taaggatttc attgaaaatc ttataacaac caactgatag  44220
agatagaaga taaggctatt aaattgttca cacagatgcc ttgatatcct acctttttcc  44280
ccctatattc cttttatgtg agaaatgaga tagtgattta agggaaaaac ttaaaagagt  44340
tccgactatg ttggtttttt ttcccccaag tcaaccttaa tatcttactt aaatcttttt  44400
cttttttatc ttttcttttc tttttttctt ttccctccct ccctcctttc ctcctcctcc  44460
ttcccttcct cctcctcctt ctgctgcttc tctctctctc tctcgtttcc ttttcttttc  44520
tattcttcct ttttcttttg agaccaggtc ttgctctgtt gctcaggctg gagtgcagtg  44580
gcaccttctt ggcttattgc aacctctgcc tcctgggctc aagtgatcct cccacctcag  44640
cctcccaagt agctgggacc acaggcacgc gccaccacac tcagctaatt tttttttttt  44700
ggtagagatg gggtctccta ggctggtctt gaactcctgg actcaagcaa tcttcctgcc  44760
tcagccttcc aaagtactgg gattactggc gtgggccacc atgcctggct tgaaattttt  44820
ctatggcttt attctttctc caagtacaga gtctacccaa ccttctgaga tctttggttt  44880
tcttttccta ggtaactata gtacatactt atttatgtta aacaacagca atcacacatt  44940
tctttttcta tacagtcatg ctttataggc aaataaagcc tccgtcttag gctttctgga  45000
ttttttcaaa agatgcaatt cctggagtat gtttttactt agagcaaagc agcctagtct  45060
cctatacctt ctgcatctgc agaaaagttg gttaaacaga ctttgtaatg atgcccctta  45120
caattctgaa gggacttgtg aaatagtttc acagagtttc agtgttaggt atatttgatc  45180
aatgctaact tttggaaaac tttggtgcct gtatgattca gagggtaggg cagaatatta  45240
aattaatcac aacttcttgt attttaacca ttctgggtaa attgggattc cgtgacgccc  45300
aggcaaaatt atttgtttat agaagatggg ctgaattttc catcgtccat ttctgagaaa  45360
tgaggtaggt ttagaaagag acaatcaggc ctcttcttta acagaaatgt ttgtgtctac  45420
taggtgtgtg tcacaatatg agttcctgaa gaaataagtg tccgctattg ggttgtatac  45480
ttgtacttcc tattttctta ttttgcacat ttttctggta tttccctttc tatggtgagt  45540
ggcttctgat cgtctttcct tttgtaaagt gtaatgatat gagaatcata atcgtggtgc  45600
ggtcttttgt gttgcatatt tgtagggggt cagtatgaat ggcccgtggt gaggctgcac  45660
tgaaagatta ggagcagcca ccttgatgcg gaggaggctt agtgactttg gacatgatgg  45720
gctatggctg gctatactct cagctttggg cgcataagca gagtattgat tttgtatttg  45780
gttaaaacca gaagtacaac tttctggcac cagaggatta ggaaaattta acagcggaaa  45840
gccatcatga ggatagtaac caattaattc gatttttttg gtcagacatg gctcccacct  45900
gtaatcccag cactttggga ggctgaggtg ggagggtcat ctgaggtcag gagtttgaga  45960
ccagcctgac caacatggta aaacccgatc tctactaaaa atacaaaaat tagcctggcg  46020
tggtgatacg cgcctgtaat cccagctact cgggaggctg aggcaggaga atcacttgaa  46080
gctggaaggt agaggttgca gtgagtcgag cttgcgtcac tgcactccag cctaggcaac  46140
agagtaagac tgtatctcaa aaataccata attcgttttg tcttttcttt acttttttct  46200
ttccttttcc ttcccctctc ccctcccctc cttccctttc ctcccctttc cttccctttc  46260
catctctttc cttcctttct tttctctctt tctctctttc tttcaacagg gtctcgctct  46320
gaaccttttc cagtcagaat tgctcaggga tttttagact tccattctgg aaaagagggg  46380
gtagttattt tggtgagatt gtggtcttgt ggttagacct tgtgatgggg gcctcagcca  46440
aagggttcag gatttttttc caagcttttc cctcacaact tgagttaatc cgaaacgttg  46500
ctattaggcc accggacatg cttttctgca tgcctgtgtt gggctgtttg gattgaaggc  46560
ccagcaaggg aaggcaccct cgcccatctg acacaggcag gcctctacaa ttttattccc  46620
taaccagggc atgacaaact atggcccata gaccaaaatt ggcttgccac gtgctttttt  46680
ctggccagtg agttaagaat gactttttat tatcattatt attaatattt tttgagccag  46740
gttctcattt tgtcacccag gctggagtgc agtggtgcaa tcacggctcc tgcagcgtga  46800
aactcctggg ctctagcaat cctcctgcta acttttttta tttttgtaca gtcttgctgt  46860
tgttgcccag gctggtctgg aactcctggc cttaagcaat cttccggcct tggccttcca  46920
aaatgttggg actacaggcc tgagccgctg catccagcac ttttattatt tttaaatggt  46980
tgaaacacat caagagagga ataatatttt ctgacacagg aaaatgatat gaaattcaca  47040
tttcagtatc tgtaaataag cttttattgg agcacagcca tgatacaaga catatactga  47100
ctgcctgtgg ctgctttcga gttacaatgg ctgagtcgag tagttatgac agagattgtg  47160
tgggccgcaa agcctaagat atttgctgtc tggcactttg cagaaaaagt ttgccaaccc  47220
tgccctgaac aaataaaggg acaaattcca cttgccccgt ccatctgtgg agcagagtca  47280
ctgaaaggaa atactggaaa tactggaagc cacttggtgt tttatcaagg atgtgaggtt  47340
tcctggcaac tttgtcgcca tatcatcatc atcatcacca tcatcatcat catcatcatc  47400
atcatcatca tcatcatcat catcatctgc cctttaagtt ttctgcttgt ttagaaaaga  47460
aatttataca gagcccccag tagcagctgt aagggggcag gttcttggag cagcccatcc  47520
tcaacattct tgctgctgat ggaagattct caaggatgaa ggcccctcta tgggagcagg  47580
atcagtctgg ctttagtaga tgccaatttc tgctaagact atttcctaaa ggagcctctc  47640
ctcatttgcc ttttctccct gttttcattg ggggaggtgg aagaggagaa aaataattag  47700
agatgctcac ctttttcttt ttgctggcaa tttaacagtc ttttcagctg ctttgattcc  47760
tttcaggcca ttggtgttgt atatatttca agatttgctc acaggtccaa agcttaactt  47820
aagctccctg agacatatca taaaatatga tttggggaaa aaccctaatg ggccatgatc  47880
agaacattat tattcaacaa aggatgaaat gcttaagcca agatggcctt ctttctttct  47940
ttctttcttt cttttttttt aatgaaagtt gagcagactc ccgtccaaca gttttcaatg  48000
taggaattcc cacagcccca tttgattgca gtttgttgaa aagtttaatg tttttgtagg  48060
caattcataa tttccacatt gaacagcctg agaggaagag agctggagcc cactgttgtt  48120
tttgtagtgg gatggtggga actttttttt tccctccccc aaaaggatat aaaactaagt  48180
cagatggttg ggaaaacgtg gcacagggtt ccagcccttt tgtaaatctg agatgccccc  48240
tcctttaggt cttcctttag gacccaacag aatagaaatt cctgctgctt aatgtctcca  48300
ggaaggaaaa aaattttcct ctaggctgta atagtaccta atttcctttt tcttctcttt  48360
atttatttat tttccctatt aataagcacc aattgtagaa gatgaaggaa gctgggaaac  48420
ccatcacttt tggagaaggt taatagcttc ctttagaaaa tcctgacata atacttattt  48480
ccccaaaagg cacttcatca gcctgaatgc cagttaagat tcaaggaatg ggcttggatt  48540
tgtgtgtacc cagcggttct gtggcatcaa gttgcactgg gaaggagagt ttggggctgt  48600
cactgtggag tccctgcaag tcagcaggac cagggctgtc ttcctgcacc atctggattt  48660
ggttagctct ctctgggcag tggggccgag tctcatttcc tccaacaata atgttatata  48720
ggcaatgatc ctgggctgcc ctaacataat tgaaaattat gtgtattgta ggcttggagt  48780
gctgaaatgt gggctcataa aaatatgtgg tgcaggtagc ctatggagat tggatgtggc  48840
acacaatgaa gcttttatgt aaagtaagaa ttataagtct ccatgttaat attgtattat  48900
gagtatgaca gttcttgggt gggtcctcag ggcaggtctg tcaccttcaa caaagcccga  48960
gtttcctaat tctacagagc tggtatttgg atgtaatcaa atcggttttg caggtggcca  49020
aagatgaaaa cttgtccacc aatccagctc tccccactga gggatagcat gggatgtaga  49080
tgggtttgac tccatttggc atttttgttc acgggttttt atgagatgga gaggtgagtg  49140
ttggtgggtg tccattttgg ttggcctcaa ggaaatgact ctattgagtg gttttgacca  49200
atgcagctca tatagttatg tggtaagtga gaatgggaag aagttgggat gagatggggc  49260
agtttagatt cccagagccc tctggcctgg gttacagatg gagactggaa atatttactt  49320
tagtggttct caacttgaga tgatactgct cccagagaag gtatttggaa gtgatgagat  49380
ggtaaggata accaaggggg ttcctgttgg tatttactgt ctgggggctt ggagtcctac  49440
aagtccttca gtgtttgggg cagactcccc acctaatacc ctgtcgcaga taggacaact  49500
cattcagtac acagatgaaa aaaacagaga tcactgaagc aaggggagtc gatgcagggt  49560
cttgtggcaa gatgcagaca caaccggact aataactagg ttgctcacca cgggaggcct  49620
ctaggtgaaa gctctgaatt tgtagcagac acacccacct cgtatagatc ctagacgtca  49680
tgggaaaatc gactgtgtac tttggcaagt agttcttggg caatgatctt ccagctttag  49740
gtataaccaa atttggtttg aatttgccaa gcagtcgtat cttcgaggaa ctccgtcggc  49800
tggcttgtgg atggctttgg cacttctgtc tctcgtggga tttgtgcaaa cccttctttc  49860
tgtattatcc tttcctgtct tttttctttc tattgaaatt gttctgacca tcaagaccta  49920
actctgtgca gccttcccca gtctattgtc ccagaaattc tgtcatcttt cttggcattt  49980
cctgagtccc tgagtctctg tcacagtgtc accatgttct gtcttgattt acctgtgtct  50040
gtaaggctcc tcatgctggc aaaactcccc gagagcggac atctttgtct ctcctagtgc  50100
ttgtcacagc ctgtacacaa agcaagtagt actcagtgtt cattgagtaa agttttctat  50160
agaattaata ttaaaaccag ccatttattt tgcttgagga ggtctccgaa atgaccaagg  50220
tgtctcctta tatcttatat cccctccaag cattcattaa ctgatggatt agtgagttgg  50280
ccttgagaag cataaaggct cgtctccatg tgcttctaag cattgtgtct aagttctgtt  50340
tggtttcctg agtgaaactg tcttaatgtt accaacagaa gttaaatgcc taagagtttc  50400
ttatacatgg gctgagtacc tctgtgactg ggcaagccac ctcacctcat tttaccttgt  50460
ctgcaaaatg aggaactggg tcaactcatc gttcaaatct cactgaaagc taattgatcg  50520
cttttgacag aagtagctcc cttgggccgt atatttattt cctagcttgg aggaaggtgg  50580
ggacagacag aattgatgta cacctttatt tttatctcta tggtaaacct gtgcatacta  50640
aagcattcct ctggtctttt gagatgagtg tatacattgt gtctggccct gtgcattttt  50700
taccaagaag taagttttgt tgagtaaact tgggttgtat gaagaactgc atgctcaccg  50760
tactcaagta gcttttgcta cctaaaggac agctgctcat atgtacttga cttcctttaa  50820
agtgaaggat gatgacattt gaaaaacgga ggttgaaaag gagcagattt ggaattgatg  50880
gtttcctagg acacttctgg cttgagattt gtgttttact ttcttccttt ggaatagctc  50940
tatattcttt cctctccctc cccacctctc ccactcccct ccagccccca ccaagttaag  51000
gtagtagtaa tgaaatcatt ttttctgaag ctaccctgta ctttgaatgc aaagacaaaa  51060
aatacagttg ctagtaacat taatcttcta tatgtgtact tactgaactt gagctctgag  51120
gaagacccta ttggaattgc atgctttttt atttttttaa tgattatttg catgcttgta  51180
tgtttttcag tttctgaccc atgtcacagt tatttcttgg gctagttgtt ctgcatttac  51240
tttctgaatt cattgttttt catttcactt ttgtttcctc tcgccagtat ctccagatga  51300
aatggccact gcttgatgtc caggcaggga gcctccagag tagacaagcc ctcaaggatg  51360
cccggtcccc atcaccggca cacattgtcg taagtaacct cccagagatg atggcttcct  51420
ttattgaggg ggtgaaaaag aaaatgcttt tttgatgata acaggcctta tttgtcattt  51480
ttttctttct ttaaacacat tttctttgga aatattgttg ggtatagttt atatctataa  51540
ggtattcatt ttctgctatt ggaccttaat gattgtaacc tacctggaaa ttttacaaac  51600
ctttcctcca ctcttttcca tgtatttggt taaaatctag ccttgtgggc tctagtttat  51660
aggacacaat caccatggta tggaggagac tagaggtggt atcaaagcag ttataaaaat  51720
acattcaggg caggtgaagt gaagaagagg gaattagaaa actcaaaagg gggtcctgga  51780
tttgaaactt gcctattatc ctctccccca atttatctta atatttgttg gcaacattct  51840
acactaacat tagaaaaatt tcatctgggc tggctgactt gtaaacctag agtagaaatg  51900
aactttgaaa ggctaaaatg gaatttaatc tatacatcca tggctttgaa agtatgtagg  51960
tttgatagag aaagcatttg tttttagtac taagagacta caagtgtgtg tctacatata  52020
tttttaatgt attttcttag ggttttgtag gctctaagag tggaatttat aaattaacct  52080
cttgagaaga tagctcagcc ttatttgaag attcccttct atgtatttat atcatgagct  52140
ggacttcata cttttgaaat aattaatgga aggcatattt ttataatgaa tccatccatg  52200
acaggtagaa ttatgcaaag catgaatcaa tcatgggttt ttcatttgag tatcacaaaa  52260
tgttaatcat aaatacattt tgcctctata ttgtaatttc taaaaattgc aaaataagtt  52320
tcttaagtag aaaaatctta agatgcattc tgccattttg ggctaactgc ctccttattt  52380
tggagcttgc tgtaattgag catgtgttat ttaatgagtt atacctctgt catatgtgtg  52440
tgtttatatc acaaaataac ttatttttat aaaaccatat tttgagtcat catttgtgac  52500
aatgtcttct tttctctggt ataaatgagg catgtagaaa gaagattgac atttgctaga  52560
agcttcccct ttcctctaac tccacaataa aatggatgct cataattaca tctgctccta  52620
taaggtcaag atttcagggc tggaagtgac cttagatcat ttaggcccaa cttgccctca  52680
ggaaaggaaa ctgaggccca gagatgcctt aagtgaattg cccaatgtca cacgctgagt  52740
cagtggccag agcaaggctt ggatccagtt ctctgctccc tttccagagc cttgtgatgt  52800
cttctctcct acaggaggtg aaaataactg ctgtggctgg ttctgttttg ctgactgtaa  52860
attgggtcat ggtcagggac agtgcatagg tgtaaagaag ttgctggttg ggggttctaa  52920
tgcaggtttc tccaaaagtg aatgccctgt taaaaaaaaa ttcttaacaa atatacagag  52980
attttttttt taaaaaagtg tgacagttct agacacctag agagtaaagt gaagaagcct  53040
gttttcaggt ttcccgcctc cctgaatttc ccagcatggt ccaggctttg aaatttattt  53100
atctgctttt ggcaatggtt gatgggaatt tcccacattt attttttagc tacagagaaa  53160
ggacattatc tttaaaatct cttcgttgtt ctctctcttt gagtgaggag agaagatgtg  53220
aatcctggca gtggttcaga gtggacacag cccctgtgtt tgtggcatag gctctgtggg  53280
ccccatgcca gggagcagta cccccgtgta aaggagtggg ggtttgtcca tttggataga  53340
gcaaagatcc tccacctcaa atcccacaag aacagttgcc acaacctggg ccctaagcat  53400
ctcattttcc tatgtagaaa ttaatgatct ggaggagatg gcaaaacatt ccttccagag  53460
cctgtgtgga ttttggccag gggtgcagca agggggctta ggcacctttt tcctctgctg  53520
tgtcttagca ggcgtgttga ccatagcaac tcccctgggg catacacacc ctcttgtaga  53580
tggagacctt tgtccaaagc agccacagct ggcaactgtc tacaatcttt tgggctttct  53640
gctgtgctca aggggatctg ggaatggcca ttgcctagag gggatgggct ggtggaggaa  53700
ggtgggctct gggagccggg gagaagggaa aagccatgaa tttggacaaa aggacaaatg  53760
tggtttacat ttgtgaaata cttgaatgct tgtcatgaat ggtgactttg gttctatgag  53820
tcagccctgt gatggggtat ttctgcagtc ttcacctgac accaggggtg agaaggagga  53880
tttctgggga ggaggaaaga gttgagggag ataggaaagt agagtggaag aaaggccttg  53940
cgttgttgac ctctatccac ctggtcacct atagtttttg ggattgagga tgcatacacc  54000
ttgagactac aaatttatga ttatattttt gctgaacata aggcaatgtg ccaaccaaaa  54060
ccagctgttc tttggctggt acagtgtgtc tttgtttgta aagggtgcat tctgaatggt  54120
ggctgataca tcatttgggt ctttgtacag ttaaacattg gccagagggt ctggttcgtg  54180
tttagagtcg ccgatgaagg gctaactttt ctccagacac ttggggctct tgttcacact  54240
ttgcttttca ctcttttaag taagacatag tcacatcaca gtgtttcatc agacatgttt  54300
caaaataatt gtctaaggat tgcttcttaa tttccccgaa atttggaatt gttgtaactt  54360
ttgggccaag ctatttcata attatttcta atgtctcgct tgaagaatag ggatgtattc  54420
agtgttgatt attaatcatt cgaaactaca actttacaga ttgctaagaa gaataacttc  54480
ttccagtacc catatggggc agaatcttca cgtgggaatt cagagcattt tgttggacta  54540
ttttaatctg attggattat tttcatgtgg tatgtgggtt accacattag aaacgattga  54600
tgtgtagaat aaatgttctt aacaagtgga ggtcaactta tcaaatgata tttacattaa  54660
gaatagactc cacaaatttt agttcctgta gctgatatag catctcattt gttatataat  54720
ccagtgattc ctaatctgtg ttcagaggag agaggaaatc gattgcaaca gggacgatgc  54780
cttcattggc tggcccaaaa ctgggagttt atacaaggcg tcagtctttg ccttcctcct  54840
ccctgccttc cctcttcctt cttccttccc catactcccc aacaaattca tggacttctt  54900
aacaactcag agacattagc cacaagttcc aagacacccc caccccccag cctccccagt  54960
cctattttcg cattcatata actaaactct ttttctttct tggtggagtt ttgaaattta  55020
tatttttaat tctttgctcc cttttttcct cttacaaaat gagtgccaag cagctaagtt  55080
gtgctgagtg gtagagtttg agtcagtctt ggctggtaag ctgtggggtt aggagccgct  55140
ccctggatac cacctctggt gtctttgcta tacaaagact ttcatttagc ctcctttgta  55200
tccagcaaaa aaagattcag tacccaaaat ggtggtattt tggtatagta tgtatcttac  55260
aaaacggcaa aagacttcaa aagttcctac aattttatct tgggggtttc cttttgaagt  55320
cgatgtagaa ttttaccttg gggtggattt tttgtacttc ttggtctggt gtgttttgtt  55380
gtgtaatgag catggaggtg tgggataaga aagcagactg aatcccgagg aacaaagcct  55440
gccagactgt ggtggtgtac ttttcttgtt gttattgctt aaatgctgca agagagtgga  55500
aaactcttac gaaataatgc acgatgggta gaacttcaga gaaaatctct gccgtctacc  55560
ctgtgcattt tcgaggaagc tcagagggca tgctgaacct ttgctttttg tttctgaaga  55620
gttcagggga acctacccat aattaatttt ttaaaacact acctagagag caccctcttg  55680
gttattaaac acatgcgctg tttcgatggg atgtttgacc tggattgtgg atgcttgctg  55740
ggacgtggca tgtgttggga ggctctgtgc tgcctgctga gcaccagcaa agccacagtg  55800
gcccctacct ctgtgggagg ccctgtgcca ggtgccctca aagagtaggg ggcccatgag  55860
ggtatgacca gggggacctg atttcggctg agaagttggc ggggattaca ggcctgggcg  55920
gctccctgag gaaattgcat taaaaatgag atctgaaggc ttgattgggg ttggcccaat  55980
gaagggatag gagaagggat ggggagtggg cagaaggaaa cacatgtgtg aaggtcctca  56040
agggaaaagt gcttggcttg gacagaggca ggaaatcagg taggaggcta gaggtcgggc  56100
agggctccgg gagagtgact tggggtgcag catatggtga ggatctgaca ctggggagtc  56160
atttgagcag gttggctgtt tctgtaggag cgtgtgttaa gctgctggca gtggggatgg  56220
tgaaaataga gatgtggagg aaacagcagc ggaacttgct gacaggttag atattggcat  56280
tgagggagaa aggagagtca aaggtaggta gatggagatg cttcactgag tggggagtat  56340
tggaggagga gcaggtttgg ggtggaagcg ttgtcctttt agagagattg tatttgccat  56400
tgattgattc attcattgtt tctgcaaata tttagtgtgg gaaaaagcat gctagacacc  56460
aagagagagt ggagtcaatg aagaacgata acagcaacaa agactgtagc gcttcctatg  56520
cgaggcttgt tccagttgct tcagaggctg tgttacccct gttctagaga ggaggaacta  56580
ggcccaggga ggtggggatt tgcccagtcg tgggagtcag gatgtgaaac aaggcaccct  56640
ggctccagag cacaccgtcc tctcaaccac tgcagagaag ctgggaaaga gacaaataag  56700
tgggtgctta gagcacaatg tgtgtggtgt gccaagagca gctgggagcc ctgggacccc  56760
cagggaaccc cagccccacc tgggcatggt gggcatggct ggaggaggcc tgctggcttt  56820
gctggagagt gggacatgca tcaaggtggc cagagactgg gcttctgggt gtcgtgctgt  56880
gactgctgca aagggctcat tgacatatgg tggggagggc cagcgtattt tctgcgggca  56940
ggacatttgg gggatatggg gtgtgaccct gtactatcta aaatctttta cttctggatt  57000
atctccactt tctctactgc atatatactt tgtttttatt tattttattc atttatctat  57060
gactcagcca gactctctaa aagagttgac ttgtgtttcc tagcagccac tgagtcagaa  57120
ctttcccatt tcgcagtcag ggctgtggtc agggtgtctg tgttgtctaa ggatataaag  57180
caagccttcg ggcactacca aaacattatt ttataaggag aactatgagt acctaatagg  57240
aagaaccagg caatcaggtt atcttttggt gaggaagaag tggtagatgg gatcattggt  57300
gctttgaagg gagtgggtgg tgtagactcc aaagtgtaca tggggccatg atagagtcta  57360
tgtcagatgt ccaaagcttc cttctctcct cccagaaact ctgtcctctg gtgaagagtt  57420
ttgaagtttc ctgaggtttg ggttcatggt gtggcaggtg ataccatggc aatagaaaat  57480
atcccatcaa gaaggattgt gtgacctcag ttgtagcccc tgcatgttgg aatcacaaca  57540
atttgcaggg ccttaaaatc aaatgccatt tcaccaactg ccctcccccg tttttttcag  57600
cactgtttgg tagctatctg tttcccctga tattcttgga cacttccaga gatgggggct  57660
ctatctcctg gtggtagact gtttcttttt ggtacaatat gaactcttaa gagagttcta  57720
cctttaggga gctgcagtct ctctcctgga aatgctcaac tccttaattc atgttttgct  57780
gttaaattct gctaatgcct caccttacat gtcttgacaa tttgaaggta gctattgtat  57840
tccccgcaac cccaagtctt ctcttcaaaa tgattattaa ttgtaattca aatcatcagt  57900
gactggtatc ttagactact taaggatggg aattgctaat tttgtattta aaagttgtac  57960
ctctaaagta agtgaaattt atttttaaac gtagctttct tcattcataa agtttatgtt  58020
cattgtaggc agtttggaaa acagcccata atctcaccac tcggagatta cattgtgaat  58080
aatttggtat atttcctttt agaaatatac caaattatcc ttttttcctc tgagtgtatg  58140
aatatttata tttgttttta acatacttga gctcatagtg ctcagtattt ccaacgttct  58200
gtttatttaa gatgaaaatt gctgtagtta ataagcactt ccccatgtca ttaaaatgct  58260
taaggatttt taatgaccac ataacagtcc ataatatgat taaaccccaa tttactgaat  58320
caatgccata ttgttgggtc tttagattgt ctccttttgt ttctgctact gtgaatgatc  58380
ctgtgatgat catctttgtg tgtaaatctt tgtcccctcg ccccctcccc ttttattatt  58440
ttcttgggat agaccccagg acaaaaggta gaaaagaaca aagtgttaaa aaatttcttg  58500
atacatagcc acagattatt ttcctgaaag ttctcaacat ttataactac gagcagtatg  58560
taagagagtt atggttggaa tgattttaat gtctctgggg aatttaacaa caaaaaaact  58620
ttaggcttct ttggagagag acatgccctt aactccaccc cgccctagaa cagagaccca  58680
gcccatccaa gtcagcctcc ccaggtcctc caccttcaaa acaggcaaac gaaatcattt  58740
cttgaataat tggtaggctt caaggtcaga tgtttatttt agataattca cagcataaat  58800
ttatatgttt taggtacctt agcccctgaa tatactcagt tcatttagga ctattttaga  58860
ggtcttgagt ttactcttat aacctcacat ttttttgtga atttttagtt ctattatctt  58920
tgttttcatg gcatattatt gggcaaagat actatttatt cgatgctatg tgtgagctgg  58980
gtcaggatta tgaccctgag ttatgtttct gggaaaatgt acccacttgt caaagatgcc  59040
gttggctcct gtgattaagg tcagcccaca atgaatgtgg ggagggctgg cagcctctca  59100
aatcagctct tgaccatttc tcaagctggg gcctgttgtg cttgggggaa gagtctttgg  59160
cagctcagct cggggctagc gtttcctgac atttgtttcg ctgaatgtta acaaggttac  59220
tggaaaaaag ggttctctcc taaaataggt ttagggaagc actgggatat gcgaagtgaa  59280
tgagtttctt tagggcagga tcttgactct gcagggggct tggaggcctt ccctagagtg  59340
gggcttccta acactgcaga gctcttccca ggacgagggg caagattggg acctactttg  59400
gaaggttgtt tttgtttcgg cacctgctct gtttacgaag cgtgggagcc tgttttaaat  59460
taatgtgcgc ctacttagag ctacactcat ggttttgact atgtttatct ttccagtaaa  59520
taaaacaaaa ttgttcattt ggcacccagc ctgtcctgct tgtcatttct tgtcttgctg  59580
attaactcta tggatggggc atgtttctcc aaccagattg taagtttctt gaagccaagg  59640
agccctgtgg ttgatttctt cacatgtggc tctctctcct cccacaatgg tgcttcgtta  59700
attaagcaga aaacccatct ctggttaggg actggagttg atttcgtttg gaatgagtgt  59760
gacttcatca tgacctgaaa gtgttcagaa ccatcttggt tagcacaagg gcgtggacgt  59820
gtgtctactt tctacctgat gggatagcat gtttaatttg gggttatgac actgaatggt  59880
ttgccagtaa cttgctaatc caaccttata cattccagct cacagtggag cgtgtctaat  59940
tgccacagca gcatttatgt ggaacgtggt tgcacaaaag ctccagaaag tcaggctgag  60000
ggctcctatc tctcctcaat cttggtttac gatgtctgtt tctgaggaat cctgggatgg  60060
ggccactggc tctttaagag agagcccgat ttggaaatct aggacttgat tgttgattat  60120
gggcaataga tacattttaa gaatgatgtt gtaggctgta tgaagtcatt tgatgattgt  60180
tttgttaatg gcttgcaggt cagattttca tctttttaaa ttaattatca tagaaggaga  60240
aaacaactgg atttcagaat tgtcccttga ggtgtactgg aaactaaggc gtgagggact  60300
cataggggtc tggcttggaa agtgtattgc tatgtccagt ttacacataa ggatgtgcaa  60360
atccagcagg ttagctgagc tgcccaggaa tatccaggca agaatgacca tattctgata  60420
attactcagg cctctgcctc atctccgctg cccccccgcc ccctgactct cttctgagtg  60480
ccagattcag cctccatttg aatgccaaat agacaggaaa ttagcatgcc cagaatccac  60540
gtctttagtg cactctctcc ccagctccaa acctgttact gcttgtgttc aacatctcag  60600
taaagctcaa caacatcgac ccattactta ggcctcaaac cttgggtggc atcgtcgatt  60660
gctcttttct ttcatacccc acattcaacc catcagccca tcccacaggc ccaagtgtgt  60720
cctctctacc ttcaaagcgt gtgtggcatc caccgcttat caccacctct gccattacca  60780
ctggagtcca gtgccatcat ctctcacttg gatgtggcca gagtgtcttt gctggtctcc  60840
ttcttgcttc ctacctttgt aacagcctat catctatctc tggtctccat agctcactcc  60900
catactttga gagggccttt gaaagcctta gacagatcat atcacagacc tctatactga  60960
aagtcgggat aaattttatc tctggaaaga gtcccaaagc agcgatgaac agatattttg  61020
tcctgtcact tgatgaagag gtggggcttt gagacccaag agcttagaat ggagagccta  61080
gatgccacta agcccaggca ctggccatgc ttcgagtgga gcttttgtgc tggtggagga  61140
gagatggctg ggggacacct gtaggctgag caagtccccg ttcatcagac cctggctcat  61200
ccagcagggc gtggctgatg ttttcaatgt tgtatcctga gtgggaccca gatgcttccc  61260
aactgtgcca catctgagcc ctgcatgcca tctgtccagt tgcagcctga ctgcaatgtg  61320
aggctgctga agagctctgg atggtgtgaa gcaatctgtt ttctagcccg agcctgcata  61380
gctggtggat cctggaccgt gattaagtgc atcacctagg cttcaatgag atggagtcac  61440
tgtgtgtcca aacagtggga taaaggcttt actctttgtc ttcctgctct gagggcacaa  61500
gctgcttgtt tctctcacaa ggacaccgtc tgtgttgctc aggtgctggg gtgaaaaaaa  61560
cagcaagcat ttgaaaaggc tgaagaagga aagaaagctg agagcggtac agccttgggg  61620
actgagccat cccattgtcc cagaggtggg ggtgttatca agacctgttt ttgagccata  61680
cctctgactc ttcctggaaa gttagaccca actcaagaac acactaagag aagtgtttcc  61740
ccctagccct ttcagattga aaggagacgc caaccttgat gggtggaggt agaaaataaa  61800
gtcccaaaac agtgtcttgt aagcgaaggg gaacatggct gggcagaggg cttctggtga  61860
aacttttggg agtattcagt tggaactcag gaaaaaaaaa ttgttttttt ggaaagaggt  61920
agcagccccc ttcagccaaa gctcataaat gaaggaatgt ctgagactca gaattacagt  61980
gaccaaggca agacattgtc aaaggctgaa taagtgagtt tgactgacag aggccatctc  62040
catttttagt atatggccaa gcatctttcc cacagtcttc cttgagcccc ttcccatccc  62100
acttctgaaa agcactgagt tggccattat tatgcttttt tcttaaatta tgaagttgtt  62160
ttcaggtatt gagaataaca cccaggtgct gaactcccag cataagaaat caaacattca  62220
aaatggagta aggttctgaa gctgacatct gtctctacac attttttttt ttctgataat  62280
ggcatttcct atctccaccc tcactctttt tgttgtggtg aactacactt cccttgttcc  62340
actcggttct gttgcacatg tgattaggca aggggcagat atgtgatatt tattatgagt  62400
cttttccacg cagagaggat ctaaatctgg ctctttgcaa ttgccttcat acatgtgcat  62460
acacaccaca cacacacaca cacacacaca cacacacaca cacacagaca catacatatg  62520
cacacacccc gactcaatgg aggaccctca tttgtagaag ggtaaaatgg gtgaggcgga  62580
aatgcctgta tggcaccatg gagttctgtg tagccagttc taatcctggg ctatttggta  62640
aggaatgaag ttggagatag tcttctgtcc cttacaacca aaggaattct aactaatagt  62700
ttgccaagtt ttatgtttat aataaaaaat gacatgcttt ttcttttgga tttttaatgc  62760
ttttgaatta aaaatgctag aacatgaact gattcttcta tcgctattta gatagagcct  62820
tgcaagagca gagcacgcat gctttcttta agaacaggtt ggtttgtggt cgtctgagga  62880
ctgttttaag gagacttatt atacacaatc atcccccaca aatgatttct aaagagaggc  62940
tggtatgaaa gaaggagttt ccatgattct gtcctgtggt tctggggaat tctgaaaatg  63000
aactttagat atttttgtga aattcttatt ttcatatttt tggtatctca gagttttctt  63060
ttctggcttc tgtttaacat actcttcttt gccctaaatc tctcttattt ttgctccttg  63120
ggacaactga agaatcctta gataattaat agtatgaaat actgcccttt tagttgaaaa  63180
atgtcacaat aatgtaataa gataaataag gaggtgtcgc tttaacctgt atcgtgtagt  63240
ctcctctact tactaacact tacttgtatt actagaagca ttatttttta aatcatggaa  63300
aattggtggc aagctgagca tacagttgtt tatttctgtt tgactgatta ttacaacttc  63360
attatttgat gaaggttctg tacgttttcc tttaagacac atagaaattg tgagaagatc  63420
ctgcagcccc gaaaggctac agtgttgatc caaggactct gagccgagtg cagggtttgt  63480
acttggacct gcaggctggg tggcgtctgt gggagcagtg tgttgagaga gattctgagg  63540
ctgtatgtgt cagggcctcc aggggaagga tgcattgatg gattaatttc tgccaaggct  63600
gaaagaggag agagtaagag gctgtagagg tgtcacagct gtcattgctg ttttaggcag  63660
tcaagctttt gggaaagtgt cagaaattga gccccctact ggatctatcg gagccctgtc  63720
aaatgtccat ttagatgtcc tggtgaacaa aagttctctg actcaccatt taaaaacttg  63780
ttccaaatga aattatggga gaaaggaaca tttttcatcc gaacccagaa tgaggatgta  63840
cccaaggaaa aggacgtagg ctcaggagct ggactgtggc tcagctggcc tgatgtatcc  63900
cactttgttc ctcccatggc tgggatgtct ctttgctctc catgacccat gtatcttgag  63960
gacatgacac atggaccaag cttgaactgc ggattcattt ttatgcattc tacctgtgaa  64020
tgattgcagc ggatctagtc gtatttctga gagttactca aactggactt cagcagtgaa  64080
ctctacagtt ctcttttcct cccacctttc tattagacat tgcatgatac aaaaatcaag  64140
atatttctaa gagggtgata acttcaatgt tatctaaact tttaatttgg aagaagaggg  64200
gttctttgtt ctttttaaaa agatacaaac gaacttcttt atctgattct ttttttggtg  64260
caaacccatg atgccttctt cctgattcat ctgctacact gtgagttcaa gcctggcgtg  64320
ggacacaggc acagctctca tgccaacgat ctcatggtta agttttggaa cataatttga  64380
aaaatgtaac ccattgagag gcagtaagga catacggtga gctagtgcgt gtttggacgt  64440
ctgtgtggaa taagtgagtg ggtagagagg acatttgtca aggagcggga gggcgggcca  64500
ttggcttggg ggaaatgggc tgagactcta ggggtggcca gcaccgcata cggaggccag  64560
cagggttggg cttggctaag tgctgtggtg tctggatgcc tatgtgagtt tcctccagaa  64620
gttttcagtt ggcaaagtag aacctgctgg atatgtagca agggtgtgga ttgtcgggat  64680
cctgctgggc gcaggcgtgt gataccagag gtcagaacag aagctgaggg atgaggcttt  64740
gggagctttt tgtcatgcac tgtcctggag cctcagttac tacaaagtct gcaaatgata  64800
gaccggagct ttggttctgc ctgatgctag ctcccctgtt cctgattttt cttttcaata  64860
ttagacttaa tcccagaatt cacatgttga aagaaaactt agaggtctag tgacataaaa  64920
gcctcatttt gatcgttaca gaactgatgc cttgagaaat ggagagagaa gtacacgatc  64980
atggtaatac tggatgttca ctgagcactc actagctcca ggccttttct aagtaattta  65040
tgaagttgtc aggtttaatc ctcacaacgc ccttatgaat gagctattgt tattatcccg  65100
atttggcaga tgaggaaact gaggcttgag gggaggatga cgtactcaag gtcacacagc  65160
tgggaggcgg caagctggaa gttgaaccca aggagtctca catcggagcc aggactctca  65220
cccttcagtg ttatgctgcc ttaatcaggc acacatacag gcggggagag gcaggtttcc  65280
ggacaccaga ctaggctggt gccggtcagg ctacaccagg gaacctggag gcctgtcatt  65340
cttttgtgat gctgttagtt cctgttgagg aagtgaggct ttgtgggttc ccaggaggaa  65400
aaggtatgaa ctcatggcaa aagaaaggaa ccaaaaaagg gagatttgca tcacaatgag  65460
ccttctattc atcctaaatt atacctcctt ttataccatg tgtgtctgca aacttgtggg  65520
taaatcacaa atctttctgg taagttacaa tggatggaag gtttttgcat ttctctcaaa  65580
tcaccaacca tttaatgcta tgtgtagtca ctccctaatc tatcttttgt ataaatttgg  65640
atctttgagt attggggttt tccatgatgt ttggcagttc cccttagggt gtctatctca  65700
aagtttgtca cactgacaag ctttggggag agaagttaga ggtgggcttc cctgttttta  65760
gtggctgtgt ctgattgttc tgtctgttct ccaggacagg agagattgat tgctttctag  65820
ctttttttaa aattaaaaca acaacaacaa aaaaatacag aaaggtacaa aggataacaa  65880
acacattcat gtacctgcca cctaaaataa caattactaa tcttttcacc ctcctagccc  65940
atgatcttcc ctcccaggct gttattaata tgaaaaccga gttcaggttt ttatactttt  66000
cgacatctat ttatattaac gtatgtatta taaataatct tagtagtttt taactttgac  66060
ataagtggct tcacattcca cataacattc tgcagcatgt tttcttttat ttttattttt  66120
ttctttattt ttaaattttt attttgcagc atgcttttct tattcaacat tacatttgaa  66180
ttttttcaac attgtacatt gaaatttagc tcattctttt taactgctct gtagtattta  66240
ttgtatgcat atactacagc tttctatttc tgtattgatg gttaattagg ttgcttacag  66300
ttttttaaga ttacagattc tgctgtaata accatccttt gggcaagtgt atgtaggtac  66360
ctatatatga gtttctctag gattcatacc aaagtagagg aattggtagg gcattggttt  66420
gctggtttta attttaattc acatgctatt gtcaagctct ccagaacaac tggatgagtt  66480
gattggatca atgagtattt ccatcaccag catataaact ctttcctcat aatcacacca  66540
atgcttgatc ctgttggact taaaattttt gccaatttgc tgggtatgca acggcatctt  66600
acctaatttg cctttatttg atgactcctg aggttgaaca tctggtcata tgtttatttt  66660
ctcctctgtg gcttgcctgg tttaatgcct tcttcatttt aaagaatcag atagttttct  66720
gttattgatt tataggaact ctttatataa gttgaaaact tgattatatg tgttggaaat  66780
actttttcta ggctgtgatg ttttaaaata ttgctttaga tgggttttca tttttacctt  66840
ttattttaga gatggagtct cactgcattg cccaggctgg attgcagtgg ctattcacag  66900
gaaagagcat agtatgttac agcctccacc tcctggtacc aagaggtcct cctgccccag  66960
cctcctgaat aggtgggacc acaggtgcac atcactgtgc ctagctttgg atgggttttg  67020
aaagaaagaa gttttaaatt ttaatgccct caaattcatc tgtattttcc tctgtgcttt  67080
tattttgtac ccactctaag tagctccgaa ttctgcagat agttggtgca ggaattctga  67140
ttttgagtgg acatctgctc tctaacagtc acattgaagg aaattaggtt tttttggtag  67200
gaatctaagc aaggggttga tttgtaaact aggctttaaa tatgatttta agcaactcac  67260
ttagaacaag atacaaaaat tgtggactgg acctatatct ggaaaacttg aaagtgctag  67320
ggcaataaat aattcttggt cacatacagc cgagatcctg ggctcctgac tctgggacag  67380
aagctttcta tattttatct catcagtctt tgcaacaggc tccttgaagc aattttatcc  67440
ccattttaga gataagaaaa ccagagctta aagcagttag ataatttatg aagtaagtgg  67500
cagagccaag attcaaatcc agacctttct gaccacaaag ctcgttgctg aataccgcgc  67560
ctcattgcct tcttgcgaat tacttgggat ttgtttgaat cccaaaatct ttatatgtta  67620
ttttaaattt gaatctaatt ggaagtgggg cagtgagggt agaggacaga aagaagggga  67680
agagcttgag actcaataat agaaacaaaa aacccgtctc caggagggcg gttcaaaagg  67740
aagaattcca tatttcatgt aactgaaacg ttaaaagccc aaataattgc atcatgcaag  67800
tctgatgctg agtaatcacc ctcccccata ttattgggga gagggggcaa gaagtctggg  67860
aagctgtttt tgcctaagga attacattcc aggggactct gaggatttag gtaaccacaa  67920
aagccattta tttcgagtac actgagattt ctaccacttt gatccctaat ccatagcata  67980
attaataaat gaaatgtgct gtagcatggg ttttttacaa agtgtacttt taaaatggct  68040
tttggtctga catgattcat ttgccacttg gaaaagcgtc atcgcctcag atgggcaggc  68100
tgggagaggc tgcctggtgg gtagctgagg gcggtttcct ggggcacagt tcctgccttg  68160
ggcctctaca gagcggtctc atccaaacat ctcccagact ctgcgttttc caggaagcgt  68220
gcagaaatag gaggccagta ctgaaatgct atctgctctg tgtatgtcag aagaccacaa  68280
accacttata acaaatgaag atctttttat ttgttcttat ccctttatgt cacttgagga  68340
aagttgctgt gagtaggtga tgatcattac agtgatcact ggttgcccaa actgagaagc  68400
cagacatttg gcttggtttc tctcccttcc tcttgtctct cctaccctgt aaacacatac  68460
ttggtgatta cccatgggga gacaagacag gctgggaata tatacttctg caacttcagc  68520
ctcctgggtt ccagcgattc tcctgcctca gtctccagaa gagctcggat tacaggtgtg  68580
caccaccagg cccagctaac tttttgtatt tttagtaaag atggggtttc atcatgttgg  68640
ccaggctggt ctcgaactcc tgacctcagg tgatctgccc ttctcggcct cccgaagtgg  68700
tgggattata ggcgtgagtc accgagcctg gccccaggca ataatatacc agtgggcaag  68760
aaaatattct tgctctcatg ggacttctgt tgggggtcag ggtataggga ggaaggcata  68820
gagatgaaaa ccagtaaata agtaacaggg gaaaacattt taaatacatt aataactaat  68880
aaaatagaaa taaatctgtt ggctacttaa caggatgtgc cacattccag atacattacg  68940
ttaatcctta tgatctttgg gggctaagta ttagtattcc attttacgga tgaagagact  69000
gaggctcaga gggaagggag gtggcttttc tcaggtggaa agccagacct tttcagtggt  69060
cattcagttc atagctaagg tcttattttc tgtgctctct gtcggctgaa aatgggcaag  69120
gtaatttcac atagtgacag gagccatgtc agagaaagag caggacagtg ggacagagag  69180
ggaccaggct gggggctgtt tgagatggag ggtcaggaag aaccaaacta agatgtgaac  69240
agtgggaggt gttggagctg tggtgcttgc ctagaaggac cctcatcgag caaatagaag  69300
cttctggcag gaagaagtta atgtcttgcg tgtgccctat gtaggttcat tagggccttt  69360
aaagggggaa gaaggtggtg gctataaatg ttacaatctt acctttggcc cctagggatt  69420
ctgtctttca accttggttc agtaacaact tgtgactgcc caacagggct tcctttcggg  69480
agagaatggc ttgttacatt caaatatgcc atgaaagtat caccatttat ttcagtgtct  69540
gatgccccag cttgggcagc ctgagcaggc tctgaatggg tctgaagagg ccctttagag  69600
tagagatgaa gagggggtgg ggaatcctca attctaaaca aagagtctgc aatgggaaga  69660
tggccaaatg ctgtttttgg agtgggtgag agggaaaaga aaggtataga tggttcgttg  69720
gaaaatgtgg ttttataccg ggttttggtg tcaggtcccc gagggcaaca tggactccac  69780
actgtgatcc tccgggcagc tcatagcccc agccccttcc ttttgcttcc tggtcagttt  69840
gtgagaagga ggggttgtgt ctccaatctg agcaataagg ggtctgaggg gggttggatc  69900
catgtggctt tcctgtgtct tgttccttgt aaaagttcca ggttttgggt cgtgagctgt  69960
gtgtgtgtgt gtgcgtgtgt gtgcgctgta cgttaatatg gagagatggg cttgggccag  70020
tgggaaatag agagacccgc aagcacagag tgacagggtt tgatagtaag cagcaggcca  70080
gcgttgctgc ttttattcct cggtaaatcc ttgcacaatg ccatatgctc ttgcattccg  70140
tagctgctgc atagggtgtg atttagttaa tgcccgctct gcaaacagga aacggtgctc  70200
actgctgtgt atgcttttca tggagataaa gtgtcaggag caagacccca aacctgcgaa  70260
atcactaatg caaccgcccc ccatgcccca aaaggtggga gtgggggata aaaagagtag  70320
gaaagtggtg tggggagggg aagctttagg gccataactc agacaatttg tcaggcagtg  70380
gcatcggttg ggaggaaaat attgatgtac actttttgtt tttgaacctg aagtttgggt  70440
tttttcggat gcattggagg acttttaaat gttttcggag tgccagagtt tggactgtta  70500
ggtcaccgta ggtaccggct tgcatatcat ttcagaggaa tattttcaaa actccataaa  70560
aacatgcggc tttcaaggct ggaccacttg ttcaggtcct cctcccaccc cccacccttt  70620
ttggcaaaac catgcaaaca ttggtattca aaaatatttt gttacttttc ttggcaaagt  70680
gttccaagaa ggaattgcaa cacagtctca gagttaggag gcaactttct ggggaaaagg  70740
cgggggttgg ggaggtttgg agtttgaatc aaaaacagac accgaagctt taataaaata  70800
aatgaagcgg agccctttca gctcacggtg gactgtgttg gtgcgcgggt caggctttaa  70860
cgtgcctagt ggaaattgac agtctgagaa ctgggacata aacaaaaatg tcagtccctg  70920
ggagtcttgt tcactggaca atgtctcaat tgttcctttg gttttcaagg cagcagggag  70980
agtggaatat taactgttta ctgcccaaag ctggctcgga aattgcttgg agaaggggag  71040
aaaaaagaca gaaaatcaca ttttttattt agaaactatt aaacatgtca gtaagagata  71100
ggaaaagagc agattgtttt ctccttaatt atctgccatt cacttccata tttctgcata  71160
ccatttttgg ggtgtgtgtg tgtgaaggaa cagcagggtg tttcttttta aatttgaatg  71220
ttagccttgc atattgtcag tttttaaagc ttgctggcat gtagattatc cgcccccggt  71280
ggatatgaca gtgggcttta ggaaaggaag tgtgatttct gataacattt acatcttagc  71340
tgttcagcgg ataccctgtt agtgtttgtt cttcagaatg ctcagataga acaaaaatca  71400
agtggttgga attttaaaaa acaaaatgta tttggctctc cataaaaatg catttagtga  71460
taaagggggg cagcaagtaa ctatgtctga gagaaggaat tgcaggcaca gaggagatcc  71520
agaattctgt tcacacttga atttacttga ttcgagaaac aaacagcaaa gcctggtgta  71580
ttggccttta tctgggcaaa gttcaaaact caactggtaa ttatgtcctt agaagcctta  71640
aaaggactgt gttgttacaa aagcagtgac tgagcttact tcttcaggac cgaatgcact  71700
cgagttgttt gttagataaa cttgttttaa taaatggggg ggtcagggga gaggtttctg  71760
ttcttggaag attccctgat aagtagcttt cttctcttgg agaacttcag gctttctctc  71820
caagcgaggg gtttgcaggc agctaaagtc agcttcggct tctgcttcct gtcagtcagg  71880
aagtcacttc cttaacccaa attacaagct agagcacaac tccccagcca taccgaaaag  71940
agcaggtttt tcccagaaga ctgtgtttct agatgcggaa gtgtaaattg gtacgctgtg  72000
tgatcatgga atgcccaaaa tacataggga acagtgttgt tggaaagagg cgctgtgtcc  72060
ccaaggagaa gacgccgccc agaatggctg gatcgcctgt tgtggctgag tgcgaggcag  72120
ctgtggctgg ctgctgtgtg acgatgacct agtagccacc catgtggagt cctggctgcc  72180
tcagaaccct atcacatcta ggcaaaatct tgcatttttt atctgggagg cctgaggact  72240
tcagggctgg tggatagtaa gctccttggt tatctcacag atacaagagg tcttgggaat  72300
ccacgatcaa acttgatgtg tgcgtttacc ctcctccctt tgaatctgtt attcaaatat  72360
ttaagcctcc aaccttgtgg cccctacctg caccacccct cacccccccg acaaaaatca  72420
agctcttgac ctcatggctt ctttcagtga cccttggggg acagggtttc ccaaggctgg  72480
ttgccagctg gcatggtccc ccgttggtga agtggagacc tgtgtttttt tggtcatttt  72540
gcaaagagct tatggatgac agcagttctc tgtgcctcgc tgggacagag tgtattctga  72600
ggtccagcgt ctgcatggag atctgcctat ccttcacttg gggtgctcag tagataacgc  72660
ggccactttc ctatacattt ccttaattta agggaacagc gtaaactcag cccaggtgga  72720
ttaatctctc cagtgacttt tgaaacttca atttccaatt tccctcttat gtctaggtgt  72780
gagtgaggat acgtgtagta attgtcgcag gtattagtga gaaagggtgc agatcacaca  72840
aatatttcac acgttattag ttggaccaga ctttggaggc aagggagggc cgtgtcacct  72900
aggaaatttg ctcttccgtg gagatgaaag ggcagtgaat taagtgcctg ctttttctcc  72960
ctttttccct ctgacggtta ttgatcctcc cctggaactg tacagttcac gttctgatct  73020
ttttcttgac aaagggaatt cccagtttgt tcgctggcga acgcactagc aggtgaggag  73080
ttaaaagttg gcaacgcctg ccctctcgag agtgtcagga tttttagtct cttccttgag  73140
agctagaaga tgtttctaaa agaatctctt tggtgactta gaagtggaga gagctttaga  73200
agcatggcac aaataaaagg aaagaggcaa acaccgtcat tctacatctg tttattttgt  73260
tattaacaaa aggcaaggcg attttcatta aagttttgct ggggttgggg ttgagggtgt  73320
agagagcaaa agtgtgagtt gtacaccatg actggaatcg cttggacata ctcttcagca  73380
gacatcgtgt gactgtggaa gaaatgagtt tcatgaagat gactgataga aggaagccac  73440
tgaaccagtc ctctatcacc tcttccaagg ctaaagtttg gagccacttg cagaaggctc  73500
tcctcaaacc cctgtgttct ttgcctaccc ctgctgttgc cacatcatct tggagagctg  73560
gctgcttccc tcctcaacta gaagttccta gtgcctgctt agttcttgtc tcttgcttcc  73620
caagtgctca caaaatacat ccatgttcgc tacgaggaaa tggaccacat aaggtttccg  73680
tgaaaacctt agcccttagg tctaacacag taggaacaga agttaatgtt ttcctgacgt  73740
agaagtttct cttgctgctt ctggtcacat ttctttcttg tgtggttctt ctatggctac  73800
tgcacttttt tttttttctt actgtctccc ccttccccca cacaccacct tttggggata  73860
gggtggcagg tgagaatata aacagataat ggttaagaga tagtttagtc tttctaggcc  73920
agattattta gtttttgcca tctaggtaaa attcggtcca attaagcgtc cattaagtgt  73980
tttaatataa gctggagaag gagttgaacc tggaggtcag ggctctgtgg tctattacag  74040
tccccctggg gtctctagcc caagggagac tccagggtct taataaatga ctgggggttt  74100
cattttgagg cctttactac caaagactga ataatacatt gggcatgatg gttttgtcct  74160
aaacattaac agccacaaaa ggtagagagt gtgtctgttt atagatacac atgtatcatg  74220
aataattagt tggggactgt gcatcaggtc tctcatttta cattcgagga agcaatgcac  74280
ggaatgaatt ctggacctgc gaactctgaa tttcaattct ctgtctccta cttttactgg  74340
agtgcttgca aacagtacag tgtttttgtt gtgaagttat accgtgcctg taatctctct  74400
gcgggtggcc ctcctaagcc ctacttcaag aaatagctct aagctcatga cacccgcccc  74460
acccgatgcc tacatatgtc ttatatcctt ggagtagtgt ttggggttgc aaatttgact  74520
ttagggagac atactctctg atgataggct aatgcttata tttactgata aacttccttt  74580
ttgacggtca tgggcttcgg gggccaccca accaaactgt gtggctgctt ttatgttggg  74640
ccaaaagaca ggctccttgt gtcctcccag tttcttaaac aatgaagtca tggcatttta  74700
cagtgctggt gaatggattg agattgtggt ggccctggaa tgtggcactg ctctggctgg  74760
agggaagatg agagtgaggg atggagagga gaggagagcg ggagatggga acctggtgga  74820
cacaggaggg agtgtgagtt ctgagggcca aaggaaactt gacaccggat gggacattaa  74880
tctgattctg ttatctgagg ctgtcaccag tcctccctgt cctcctggca             74930
<210>2
<211>384
<212>DNA
<213>Homo sapiens
<400>2
ttcaggccat tggtgttgta tatatttcaa gatttgctca caggtccaaa gcttaactta     60
agctccctga gacatatcat aaaatatgat ttggggaaaa accctaatgg gccatgatca    120
gaacattatt attcaacaaa ggatgaaatg cttaagccaa gatggccttc tttctttctt    180
tctttctttc ttttttttta atgaaagttg agcagactcc cgtccaacag ttttcaatgt    240
aggaattccc acagccccat ttgattgcag tttgttgaaa agtttaatgt ttttgtaggc    300
aattcataat ttccacattg aacagcctga gaggaagaga gctggagccc actgttgttt    360
ttgtagtggg atggtgggaa cttt                                           384
<210>3
<211>20
<212>DNA
<213>Homo sapiens
<400>3
ttcaggccat tggtgttgta                                                20
<210>4
<211>20
<212>DNA
<213>Homo sapiens
<400>4
aaagttccca ccatcccact                                                20
<210>5
<211>366
<212>DNA
<213>Homo sapiens
<400>5
ttgtcccttg aggtgtactg gaaactaagg cgtgagggac tcataggggt ctggcttgga     60
aagtgtattg ctatgtccag tttacacata aggatgtgca aatccagcag gttagctgag    120
ctgcccagga atatccaggc aagaatkacc atattctgat aattactcag gcctctgcct    180
catctccgct gcccccccgc cccctgactc tcttctgagt gccagattca gcctccattt    240
gaatgccaaa tagacaggaa attagcatgc ccagaatcca cgtctttagt gcactctctc    300
cccagctcca aacctgttac tgcttgtgtt caacatctca gtaaagctca acaacatcga    360
cccatt                                                               366
<210>6
<211>21
<212>DNA
<213>Homo sapiens
<400>6
ttgtcccttg aggtgtactg g                                               21
<210>7
<211>20
<212>DNA
<213>Homo sapiens
<400>7
aatgggtcga tgttgttgag                                                 20
<210>8
<211>558
<212>DNA
<213>Homo sapiens
<400>8
gctgtgaaat cccctgtgta gtgggaagaa gaaatagcaa atcttagctg ccttggacct     60
gatataatta tttgtcttca tttacatggt tyatccttca aggttgaata aatgatgtgg    120
gagctagtca aggggcttta ggtatgtgat ttcatgccta ctttttttta ggtagagaaa    180
ctgaggtcac agggtactag agaatggact ctaagattca ggtttctgaa ttgcctgtgg    240
ttttgttgac tcaactgctc ttctgttgtt ttttagccac atgccttgaa acagtcctct    300
ttcccatgtt tcttcatcag caccattaac ccaaggtata ctgtcctctc ttatctttca    360
caaggtcttg gagttcccat gcctttgtaa gcatccctcc ccgagattca gcaccaacca    420
aaatcacatt tggaaaaatt gcttgtttcc caagaagctt tggaggatat gattttgtat    480
agaacgggtt cacaggtttt ctgttcattc ttctatggtg gagtgtgtgt gtatgtgact    540
ctgtcttctc tccattcc                                                  558
<210>9
<211>21
<212>DNA
<213>Homo sapiens
<400>9
gctgtgaaat cccctgtgta g                  21
<210>10
<211>23
<212>DNA
<213>Homo sapiens
<400>10
ggaatggaga gaagacagag tca               23
<210>11
<211>364
<212>DNA
<213>Homo sapiens
<400>11
aagggagaaa gcaggattga gcagggggag ccgtcagatg gtaatgcaga tgtgatgaga     60
tctctgccgg accaaagaga agattccttt ttaaatggtg acaaattcat gggctttctc    120
tgcctcaaaa cctagcacag ctgttattta ctgaacaatt agagagctaa gcacttttta    180
gataytatat aatttaattg ccgtatgagg cacccttagt tttcagacga gaaaccacag    240
ttacagggaa ggcaagtaac ttagtcaatg tcagataact aggaaaaggt tagaggggcc    300
ctggacacag gcctgtgtga ctgagaagct tgggcacttc actgctacat ttcatctctt    360
cgct                                                                 364
<210>12
<211>20
<212>DNA
<213>Homo sapiens
<400>12
aagggagaaa gcaggattga                   20
<210>13
<211>22
<212>DNA
<213>Homo sapiens
<400>13
agcgaagaga tgaaatgtag ca                22
<210>14
<211>579
<212>DNA
<213>Homo sapiens
<400>14
ctgatgaggg tagggagcat ctgtctgcag cttcatcttc attgtctagg ggctccagaa     60
atatctgtga gtaaataagt tatttaatct ttgcctcaaa tttccagtga ctgtagggat    120
atagctgtga gcctctagga gctgagattt tttaaatttc ccacttaaac atttatttaa    180
aaattttgtg ctcagcatgg actaaggact ttacattcat taactcattt acagcttgat    240
cctatgcggt gggcattcat ttacagagga tcccatttta caggtgagga agaggccagc    300
taggggtgca gcctaggtta gtattctaga gctcatcagg ctgtgttgtc cccagtgaaa    360
gaataagcaa agaagtgaat gttgtgcatt gagaaaaatg actctcggag gaggatgagc    420
ctctcggata tggcgaccga agtgatwtgg ggcccttgtc aagggtctct attatggcat    480
caagaaaaga tgctgctttc ggtgatgccc gaggagagcc tcaatatttt acatgggaaa    540
cctaaaaaag gggccatgtt gtggtctctg cacctaaga                           579
<210>15
<211>19
<212>DNA
<213>Homo sapiens
<400>15
ctgatgaggg tagggagca                   19
<210>16
<211>22
<212>DNA
<213>Homo sapiens
<400>16
tcttaggtgc agagaccaca ac               22
<210>17
<211>486
<212>DNA
<213>Homo sapiens
<400>17
tatttagaaa ccataaaatc cacctatttg aggtgtacaa ttgagtgatt ttctgtatag     60
tcacagatct gtgcagtcat ccacaccctc taactccagg acattttcct cacccccgag    120
gagaaacctc ccttacccat tagcagtcac tcctcatttc ctctcccccc agcccctggc    180
aatcactgtg gatttgcctg ttcttgacat ttcatataaa tggtatcata aaatctaygg    240
gcttttgtgt ctgtctgctt tcacttagca tacggttctc aaggttcatc cagtattgta    300
gcatctatca gtatgtcatt cctttttatg gccaaataat attttattgt atggatagac    360
attttgttta ttcatttatc tgtttttggt tattatgagt aacactacta tgaacatttt    420
gcacaaattt ttgtattgac atgttttcat ttctcctggg tatagtccta tgagtggaat    480
tgctgg                                                               486
<210>18
<211>27
<212>DNA
<213>Homo sapiens
<400>18
tatttagaaa ccataaaatc cacctat       27
<210>19
<211>22
<212>DNA
<213>Homo sapiens
<400>19
ccagcaattc cactcatagg ac            22
<210>20
<211>428
<212>DNA
<213>Homo sapiens
<400>20
ttgtctcctt ttgtttctgc tactgtgaat gatcctgtga tgatcatctt tgtgtgtaaa     60
tctttgtccc ctcgccccct ccccttttat tattttcttg ggatagaccc caggacaaaa    120
ggtagaaaag aacaaagtgt taaaaaattt cttgatacat agccacagat tattttcctg    180
aaagttctca acatttataa ctacsagcag tatgtaagag agttatggtt ggaatgattt    240
taatgtctct ggggaattta acaacaaaaa aactttaggc ttctttggag agagacatgc    300
ccttaactcc accccgccct agaacagaga cccagcccat ccaagtcagc ctccccaggt    360
cctccacctt caaaacaggc aaacgaaatc atttcttgaa taattggtag gcttcaaggt    420
cagatgtt                                                             428
<210>21
<211>23
<212>DNA
<213>Homo sapiens
<400>21
ttgtctcctt ttgtttctgc tac             23
<210>22
<211>22
<212>DNA
<213>Homo sapiens
<400>22
aacatctgac cttgaagcct ac              22
<210>23
<211>330
<212>DNA
<213>Homo sapiens
<400>23
tcagggacag tgcataggtg taaagaagtt gctggttggg ggttctaatg caggtttctc     60
caaaagtgaa tgccctgtta aaaaaaaatt cttaacaaat atacagagat ttttttttta    120
aaaaagtgtg acagttctag acacctagag agtaaartga agaagcctgt tttcaggttt    180
cccgcctccc tgaatttccc agcatggtcc aggctttgaa atttatttat ctgcttttgg    240
caatggttga tgggaatttc ccacatttat tttttagcta cagagaaagg acattatctt    300
taaaatctct tcgttgttct ctctctttga                                     330
<210>24
<211>20
<212>DNA
<213>Homo sapiens
<400>24
tcagggacag tgcataggtg             20
<210>25
<211>23
<212>DNA
<213>Homo sapiens
<400>25
tcaaagagag agaacaacga aga         23
<210>26
<211>574
<212>DNA
<213>Homo sapiens
<400>26
tatttagaaa ccataaaatc cacctatttg aggtgtacaa ttgagtgatt ttctgtatag     60
tcacagatct gtgcagtcat ccacaccctc taactccagg acattttcct cacccccgag    120
gagaaacctc ccttacccat tagcagtcac tcctcatttc ctctcccccc agcccctggc    180
aatcactgtg gatttgcctg ttcttgacat ttcatataaa yggtatcata aaatctatgg    240
gcttttgtgt ctgtctgctt tcacttagca tacggttctc aaggttcatc cagtattgta    300
gcatctatca gtatgtcatt cctttttatg gccaaataat attttattgt atggatagac    360
attttgttta ttcatttatc tgtttttggt tattatgagt aacactacta tgaacatttt    420
gcacaaattt ttgtattgac atgttttcat ttctcctggg tatagtccta tgagtggaat    480
tgctgggtca tataataaat aactgtttaa cattttgggg agctgccaaa cttttaaaac    540
cttgggttct gtgatgtacc agttgtgtta ggca                                574
<210>27
<211>27
<212>DNA
<213>Homo sapiens
<400>27
tatttagaaa ccataaaatc cacctat          27
<210>28
<211>22
<212>DNA
<213>Homo sapiens
<400>28
tgcctaacac aactggtaca tc               22
<210>29
<211>571
<212>DNA
<213>Homo sapiens
<400>29
tgccaggggt tttatggtta attttcctcc attatgaggg ttgactcagc cttgggtatt     60
agatgtcttt gagaatccag ggttcaaata ccacagctgg tagaatgttt ctcaacttgg    120
agccaatctc catctactga aggtacgctg gtttagacag acaacaggga catcagcatt    180
ttaaaaagcg gtggaaaaag tttgcttgtc ttgattggag ccatgacatt ttattttgaa    240
atttcaaata acatgaaggg aggtttggag cggtttttgg tttatccaaa gggcagtgga    300
ttgaaggctg agaaacacca ggctgaatgg gagaggggtt ggggtccccc tgtgagatag    360
tgaaacaatg gtagtgccat ccaatgatag gcacttttct gtcattcaga agcagaaagg    420
gggccagagg cccattggcc ttactgggma gtaagctgta gagctgctgc cttttcgtga    480
aagggttgac accaaccttc tcccccagga agagtgacca gggacctgag gggcatggtc    540
gagcagatga cagcctttgt aaaacatctc c                                   571
<210>30
<211>20
<212>DNA
<213>Homo sapiens
<400>30
tgccaggggt tttatggtta             20
<210>31
<211>23
<212>DNA
<213>Homo sapiens
<400>31
ggagatgttt tacaaaggct gtc         23
<210>32
<211>614
<212>DNA
<213>Homo sapiens
<400>32
ttggtagaga tggggtctcc taggctggtc ttgaactcct ggrctcaagc aatcttcctg     60
cctcagcctt ccaaagtact gggattactg gcgtgggcca ccatgcctgg cttgaaattt    120
ttctatggct ttattctttc tccaagtaca gagtctaccc aaccttctga gatctttggt    180
tttcttttcc taggtaacta tagtacatac ttatttatgt taaacaacag caatcacaca    240
tttctttttc tatacagtca tgctttatag gcaaataaag cctccgtctt aggctttctg    300
gattttttca aaagatgcaa ttcctggagt atgtttttac ttagagcaaa gcagcctagt    360
ctcctatacc ttctgcatct gcagaaaagt tggttaaaca gactttgtaa tgatgcccct    420
tacaattctg aagggacttg tgaaatagtt tcacagagtt tcagtgttag gtatatttga    480
tcaatgctaa cttttggaaa actttggtgc ctgtatgatt cagagggtag ggcagaatat    540
taaattaatc acaacttctt gtattttaac cattctgggt aaattgggat tccgtgacgc    600
ccaggcaaaa ttat                                                      614
<210>33
<211>20
<212>DNA
<213>Homo sapiens
<400>33
ttggtagaga tggggtctcc         20
<210>34
<211>20
<212>DNA
<213>Homo sapiens
<400>34
ataattttgc ctgggcgtca         20
<210>35
<211>633
<212>DNA
<213>Homo sapiens
<400>35
tatcttatat cccctccaag cattcattaa ctgatggatt agtgagttgg ccttgagaag     60
cataaaggct cgtctccatg tgcttctaag cattgtgtct aagttctgtt tggtttcctg    120
agtgaaactg tcttaatgtt accaacagaa gttaaatgcc taagagwttc ttatacatgg    180
gctgagtacc tctgtgactg ggcaagccac ctcacctcat tttaccttgt ctgcaaaatg    240
aggaactggg tcaactcatc gttcaaatct cactgaaagc taattgatcg cttttgacag    300
aagtagctcc cttgggccgt atatttattt cctagcttgg aggaaggtgg ggacagacag    360
aattgatgta cacctttatt tttatctcta tggtaaacct gtgcatacta aagcattcct    420
ctggtctttt gagatgagtg tatacattgt gtctggccct gtgcattttt taccaagaag    480
taagttttgt tgagtaaact tgggttgtat gaagaactgc atgctcaccg tactcaagta    540
gcttttgcta cctaaaggac agctgctcat atgtacttga cttcctttaa agtgaaggat    600
gatgacattt gaaaaacgga ggttgaaaag gag                                 633
<210>36
<211>25
<212>DNA
<213>Homo sapiens
<400>36
tatcttatat cccctccaag cattc        25
<210>37
<211>21
<212>DNA
<213>Homo sapiens
<400>37
ctccttttca acctccgttt t            21
<210>38
<211>1081
<212>DNA
<213>Homo sapiens
<400>38
ttgagcatgt gttatttaat gagttatacc tctgtcatat gtgtgtgttt atatcacaaa     60
ataacttatt tttataaaac catattttga gtcatcattt gtgacaatgt cttcttttct    120
ctggtataaa tgaggcatgt agaaagaaga ttgacatttg ctagaagctt cccctttcct    180
ctaactccac aataaaatgg atgctcataa ttacatctgc tcctataagg tcaagatttc    240
agggctggaa gtgaccttag atcatttagg cccaacttgc cctcaggaaa ggaaactgag    300
gcccagagat gccttaagtg aattgcccaa tgtcacacgc tgagtcagtg gccagagcaa    360
ggcttggatc cagttctctg ctccctttcc agagccttgt gatgtcttct ctcctacagg    420
aggtgaaaat aactgctgtg gctggttctg ttttgctgac tgtaaattgg gtcatggtca    480
gggacagtgc ataggtgtaa agaagttgct ggttgggggt tctaatgcag gtttctccaa    540
aagtgaatgc cctgttaaaa aaaaattctt aacaaatata cagagatttt tttttwaaaa    600
aagtgtgaca gttctagaca cctagagagt aaagtgaaga agcctgtttt caggtttccc    660
gcctccctga atttcccagc atggtccagg ctttgaaatt tatttatctg cttttggcaa    720
tggttgatgg gaatttccca catttatttt ttagctacag agaaaggaca ttatctttaa    780
aatctcttcg ttgttctctc tctttgagtg aggagagaag atgtgaatcc tggcagtggt    840
tcagagtgga cacagcccct gtgtttgtgg cataggctct gtgggcccca tgccagggag    900
cagtaccccc gtgtaaagga gtgggggttt gtccatttgg atagagcaaa gatcctccac    960
ctcaaatccc acaagaacag ttgccacaac ctgggcccta agcatctcat tttcctatgt   1020
agaaattaat gatctggagg agatggcaaa acattccttc cagagcctgt gtggattttg   1080
g                                                                   1081
<210>39
<211>26
<212>DNA
<213>Homo sapiens
<400>39
ttgagcatgt gttatttaat gagtta      26
<210>40
<211>20
<212>DNA
<213>Homo sapiens
<400>40
ccaaaatcca cacaggctct             20
<210>41
<211>599
<212>DNA
<213>Homo sapiens
<400>41
tagtgctcag tatttccaac gttctgttta tttaagatga aaattgctgt agttaataag     60
cacttcccca tgtcattaaa atgcttaagg atttttaatg accacataac agtccataat    120
atgattaaac cccaatttac tgaatcaatg ccatattgtt gggtctttag attgtctcct    180
tttgtttctg ctactgtgaa tgatcctgtg atgatcatct ttgtgtgtaa atctttgtcc    240
cctcgccccc tcccctttta ttattttctt gggatagacc ccaggacaaa aggtagaaaa    300
gaacaaagtg ttaaamaatt tcttgataca tagccacaga ttattttcct gaaagttctc    360
aacatttata actacgagca gtatgtaaga gagttatggt tggaatgatt ttaatgtctc    420
tggggaattt aacaacaaaa aaactttagg cttctttgga gagagacatg cccttaactc    480
caccccgccc tagaacagag acccagccca tccaagtcag cctccccagg tcctccacct    540
tcaaaacagg caaacgaaat catttcttga ataattggta ggcttcaagg tcagatgtt     599
<210>42
<211>25
<212>DNA
<213>Homo sapiens
<400>42
tagtgctcag tatttccaac gttct     25
<210>43
<211>23
<212>DNA
<213>Homo sapiens
<400>43
aacatctgac cttgaagcct acc       23
<210>44
<211>599
<212>DNA
<213>Homo sapiens
<400>44
tagtgctcag tatttccaac gttctgttta tttaagatga aaattgctgt agttaataag     60
cacttcccca tgtcattaaa atgcttaagg atttttaatg accacataac agtccataat    120
atgattaaac cccaatttac tgaatcaatg ccatattgtt gggtctttag attgtctcct    180
tttgtttctg ctactgtgaa tgatcctgtg atgatcatct ttgtgtgtaa atctttgtcc    240
cctcgccccc tcccctttta ttattttctt gggatagacc ccaggacaaa aggtagaaaa    300
gaacaaagtg ttaaaaaatt tcttgataca tagccacaga ttattttcct gaaagttcts    360
aacatttata actacgagca gtatgtaaga gagttatggt tggaatgatt ttaatgtctc    420
tggggaattt aacaacaaaa aaactttagg cttctttgga gagagacatg cccttaactc    480
caccccgccc tagaacagag acccagccca tccaagtcag cctccccagg tcctccacct    540
tcaaaacagg caaacgaaat catttcttga ataattggta ggcttcaagg tcagatgtt     599
<210>45
<211>641
<212>DNA
<213>Homo sapiens
<400>45
tgctatgtcc agtttacaca taaggatgtg caaatccagc aggttagctg agctgcccag     60
gaatatccag gcaagaatga ccatattctg ataattactc aggcctctgc ctcatctccg    120
ctgscccccc gccccctgac tctcttctga gtgccagatt cagcctccat ttgaatgcca    180
aatagacagg aaattagcat gcccagaatc cacgtcttta gtgcactctc tccccagctc    240
caaacctgtt actgcttgtg ttcaacatct cagtaaagct caacaacatc gacccattac    300
ttaggcctca aaccttgggt ggcatcgtcg attgctcttt tctttcatac cccacattca    360
acccatcagc ccatcccaca ggcccaagtg tgtcctctct accttcaaag cgtgtgtggc    420
atccaccgct tatcaccacc tctgccatta ccactggagt ccagtgccat catctctcac    480
ttggatgtgg ccagagtgtc tttgctggtc tccttcttgc ttcctacctt tgtaacagcc    540
tatcatctat ctctggtctc catagctcac tcccatactt tgagagggcc tttgaaagcc    600
ttagacagat catatcacag acctctatac tgaaagtcgg g                        641
<210>46
<211>25
<212>DNA
<213>Homo sapiens
<400>46
tgctatgtcc agtttacaca taagg     25
<210>47
<211>24
<212>DNA
<213>Homo sapiens
<400>47
cccgactttc agtatagagg tctg      24
<210>48
<211>284
<212>DNA
<213>Homo sapiens
<400>48
ccatctgtgg agcagagtca ctgaaaggaa atactggaaa tactggaagc cacttggtgt     60
tttatcaagg atgtgaggtt tcctggcaac tttgtcgcca tatcatcatc atcatcacca    120
tcatcatcat catcatcatc atcatcatca tcatcatcat catcatctgc cctttaagtt    180
ttctgcttgt ttagaaaaga aatttataca gagcccccag tagcagctgt aagggggcag    240
gttcttggag cagcccatcc tcaacattct tgctgctgat ggaa                     284
<210>49
<211>20
<212>DNA
<213>Homo sapiens
<400>49
ccatctgtgg agcagagtca        20
<210>50
<211>20
<212>DNA
<213>Homo sapiens
<400>50
ttccatcagc agcaagaatg        20
<210>51
<211>145
<212>DNA
<213>Homo sapiens
<400>51
tccacgcaga gaggatctaa atctggctct ttgcaattgc cttcatacat gtgcatacac     60
accacacaca cacacacaca cacacacaca cacacacaca cagacacata catatgcaca    120
caccccgact caatggagga ccctc                                          145
<210>52
<211>21
<212>DNA
<213>Homo sapiens
<400>52
tccacgcaga gaggatctaa a          21
<210>53
<211>20
<212>DNA
<213>Homo sapiens
<400>53
gagggtcctc cattgagtcg            20

Claims (3)

1.一种试剂盒,用于分析来自个体的样品以检测II型糖尿病易感性,其特征在于所述试剂盒包括一种或者多种试剂,用于检测TCF7L2外显子4LD块内rs4074720和rs7087006之间选自如下的一种或者多种标记物:DG10S478,rs12255372,rs7895340,rs11196205,rs7901695,rs7903146,rs12243326,和rs4506565,其中所述试剂与所述外显子4LD块内的区域特异性杂交。
2.如权利要求1所述的试剂盒,其特征在于一种或者多种标记物是标记物rs7903146。
3.如权利要求2所述的试剂盒,其特征在于标记物是rs7903146的C等位基因。
CN2006800221296A 2005-06-20 2006-06-16 作为2型糖尿病风险诊断标记物的tcf7l2基因的遗传变异体 Expired - Fee Related CN101238222B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US69217405P 2005-06-20 2005-06-20
US60/692,174 2005-06-20
US75715506P 2006-01-06 2006-01-06
US60/757,155 2006-01-06
PCT/IS2006/000014 WO2006137085A1 (en) 2005-06-20 2006-06-16 Genetic variants in the tcf7l2 gene as diagnostic markers for risk of type 2 diabetes mellitus

Publications (2)

Publication Number Publication Date
CN101238222A CN101238222A (zh) 2008-08-06
CN101238222B true CN101238222B (zh) 2013-04-10

Family

ID=37036993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800221296A Expired - Fee Related CN101238222B (zh) 2005-06-20 2006-06-16 作为2型糖尿病风险诊断标记物的tcf7l2基因的遗传变异体

Country Status (14)

Country Link
US (3) US7585630B2 (zh)
EP (1) EP1907569B1 (zh)
JP (1) JP5301987B2 (zh)
KR (1) KR101374304B1 (zh)
CN (1) CN101238222B (zh)
AU (1) AU2006260477B2 (zh)
BR (1) BRPI0612301A2 (zh)
CA (1) CA2612475C (zh)
EA (1) EA016397B1 (zh)
IL (1) IL188147A (zh)
MX (1) MX2007015848A (zh)
NO (1) NO341910B1 (zh)
NZ (1) NZ564285A (zh)
WO (1) WO2006137085A1 (zh)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7407955B2 (en) 2002-08-21 2008-08-05 Boehringer Ingelheim Pharma Gmbh & Co., Kg 8-[3-amino-piperidin-1-yl]-xanthines, the preparation thereof and their use as pharmaceutical compositions
US7501426B2 (en) 2004-02-18 2009-03-10 Boehringer Ingelheim International Gmbh 8-[3-amino-piperidin-1-yl]-xanthines, their preparation and their use as pharmaceutical compositions
DE102004054054A1 (de) 2004-11-05 2006-05-11 Boehringer Ingelheim Pharma Gmbh & Co. Kg Verfahren zur Herstellung chiraler 8-(3-Amino-piperidin-1-yl)-xanthine
WO2006137085A1 (en) * 2005-06-20 2006-12-28 Decode Genetics Ehf. Genetic variants in the tcf7l2 gene as diagnostic markers for risk of type 2 diabetes mellitus
DE102005035891A1 (de) 2005-07-30 2007-02-08 Boehringer Ingelheim Pharma Gmbh & Co. Kg 8-(3-Amino-piperidin-1-yl)-xanthine, deren Herstellung und deren Verwendung als Arzneimittel
PE20110235A1 (es) 2006-05-04 2011-04-14 Boehringer Ingelheim Int Combinaciones farmaceuticas que comprenden linagliptina y metmorfina
EP1852108A1 (en) 2006-05-04 2007-11-07 Boehringer Ingelheim Pharma GmbH & Co.KG DPP IV inhibitor formulations
CA2810522A1 (en) 2006-05-04 2007-11-15 Boehringer Ingelheim International Gmbh Polymorphs
EP2099937A2 (en) * 2006-11-30 2009-09-16 Decode Genetics EHF Genetic susceptibility variants of type 2 diabetes mellitus
EP2057183A2 (en) * 2007-03-01 2009-05-13 Novetide Ltd. High purity peptides
EP2155903A4 (en) * 2007-04-30 2010-12-01 Compugen Ltd ALLELIC POLYMORPHISM ASSOCIATED WITH DIABETES
PE20091730A1 (es) 2008-04-03 2009-12-10 Boehringer Ingelheim Int Formulaciones que comprenden un inhibidor de dpp4
KR20200118243A (ko) 2008-08-06 2020-10-14 베링거 인겔하임 인터내셔날 게엠베하 메트포르민 요법이 부적합한 환자에서의 당뇨병 치료
UY32030A (es) 2008-08-06 2010-03-26 Boehringer Ingelheim Int "tratamiento para diabetes en pacientes inapropiados para terapia con metformina"
MX2011002558A (es) 2008-09-10 2011-04-26 Boehringer Ingelheim Int Terapia de combinacion para el tratamiento de diabetes y estados relacionados.
US20200155558A1 (en) 2018-11-20 2020-05-21 Boehringer Ingelheim International Gmbh Treatment for diabetes in patients with insufficient glycemic control despite therapy with an oral antidiabetic drug
BRPI0923121A2 (pt) 2008-12-23 2015-08-11 Boehringer Ingelheim Int Formas salinas de compostos orgânico
AR074990A1 (es) 2009-01-07 2011-03-02 Boehringer Ingelheim Int Tratamiento de diabetes en pacientes con un control glucemico inadecuado a pesar de la terapia con metformina
US8796182B2 (en) 2009-07-10 2014-08-05 Decode Genetics Ehf. Genetic markers associated with risk of diabetes mellitus
KR102328772B1 (ko) * 2009-11-27 2021-11-19 베링거 인겔하임 인터내셔날 게엠베하 리나글립틴과 같은 dpp-iv 억제제를 사용한 유전자형 검사된 당뇨병 환자의 치료
CA2797310C (en) 2010-05-05 2020-03-31 Boehringer Ingelheim International Gmbh Glp-1 receptor agonist and dpp-4 inhibitor combination therapy
EA201991014A1 (ru) 2010-06-24 2019-09-30 Бёрингер Ингельхайм Интернациональ Гмбх Лечение диабета
AR083878A1 (es) 2010-11-15 2013-03-27 Boehringer Ingelheim Int Terapia antidiabetica vasoprotectora y cardioprotectora, linagliptina, metodo de tratamiento
KR20190062621A (ko) 2011-07-15 2019-06-05 베링거 인겔하임 인터내셔날 게엠베하 치환된 퀴나졸린, 이의 제조 및 약제학적 조성물에서의 이의 용도
US9555001B2 (en) 2012-03-07 2017-01-31 Boehringer Ingelheim International Gmbh Pharmaceutical composition and uses thereof
US20130303554A1 (en) 2012-05-14 2013-11-14 Boehringer Ingelheim International Gmbh Use of a dpp-4 inhibitor in sirs and/or sepsis
EP3685839A1 (en) 2012-05-14 2020-07-29 Boehringer Ingelheim International GmbH Linagliptin for use in the treatment of albuminuria and kidney related diseases
WO2013174767A1 (en) 2012-05-24 2013-11-28 Boehringer Ingelheim International Gmbh A xanthine derivative as dpp -4 inhibitor for use in modifying food intake and regulating food preference
AU2014236386A1 (en) * 2013-03-14 2015-10-01 The Children's Hospital Of Philadelphia TCF7L2 variant and methods of use thereof in diagnostic and drug screening assays
RU2521202C1 (ru) * 2013-04-12 2014-06-27 Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Белгородский государственный национальный исследовательский университет" Способ прогнозирования риска развития сахарного диабета второго типа у больных гипертонической болезнью
WO2015128453A1 (en) 2014-02-28 2015-09-03 Boehringer Ingelheim International Gmbh Medical use of a dpp-4 inhibitor
CN103882127B (zh) * 2014-03-13 2016-03-16 河北联合大学 用于预测患2型糖尿病肾病发生风险的试剂盒
WO2016201438A1 (en) * 2015-06-11 2016-12-15 The Children's Hospital Of Philadelphia New targets modulated by a casual variant of type 2 diabetes (t2d) embedded within the tcf7l2 gene and methods of use thereof for identifying agents having efficacy for the treatment of type 2 diabetes and other metabolic disorders
EP4233840A3 (en) 2016-06-10 2023-10-18 Boehringer Ingelheim International GmbH Combinations of linagliptin and metformin
CN109182508A (zh) * 2018-10-22 2019-01-11 北京华夏时代生物工程有限公司 Tcf7l2基因单核苷酸多态性的荧光原位杂交测序方法
TWI702292B (zh) * 2018-12-28 2020-08-21 薩摩亞商康多富國際有限公司 個人化新陳代謝疾病保健食品組合的決定方法及非暫態電腦可讀取儲存媒體

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1548553A (zh) * 2003-05-21 2004-11-24 中国医学科学院基础医学研究所 用于预测2型糖尿病易感性的试剂盒及引物

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4376110A (en) * 1980-08-04 1983-03-08 Hybritech, Incorporated Immunometric assays using monoclonal antibodies
DE131052T1 (de) * 1983-01-10 1987-03-19 Gen-Probe Partners, San Diego, Calif. Verfahren zum aufspueren, identifizieren und quantifizieren von organismen und viren.
US5288611A (en) * 1983-01-10 1994-02-22 Gen-Probe Incorporated Method for detecting, identifying, and quantitating organisms and viruses
US4683202A (en) * 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
DE3534934A1 (de) * 1985-10-01 1987-04-02 Draegerwerk Ag Kolorimetrisches gasdosimeter
US5223409A (en) * 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
US5176996A (en) * 1988-12-20 1993-01-05 Baylor College Of Medicine Method for making synthetic oligonucleotides which bind specifically to target sites on duplex DNA molecules, by forming a colinear triplex, the synthetic oligonucleotides and methods of use
US5256775A (en) * 1989-06-05 1993-10-26 Gilead Sciences, Inc. Exonuclease-resistant oligonucleotides
US5424186A (en) * 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
US5143854A (en) * 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5264564A (en) * 1989-10-24 1993-11-23 Gilead Sciences Oligonucleotide analogs with novel linkages
US5384261A (en) * 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
US5837832A (en) * 1993-06-25 1998-11-17 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
US5858659A (en) * 1995-11-29 1999-01-12 Affymetrix, Inc. Polymorphism detection
US6057117A (en) * 1996-04-04 2000-05-02 Chiron Corporation Identification and use of selective inhibitors of glycogen synthase kinase 3
WO1998016528A1 (en) * 1996-10-11 1998-04-23 Chiron Corporation Purine inhibitors of glycogen synthase kinase 3 (gsk3)
US6417185B1 (en) * 1998-06-19 2002-07-09 Chiron Corporation Inhibitors of glycogen synthase kinase 3
US6512102B1 (en) * 1998-12-31 2003-01-28 Chiron Corporation Compositions and methods of diagnosis and treatment using casein kinase I
DE60037905T2 (de) * 1999-12-17 2009-01-29 Novartis Vaccines and Diagnostics, Inc., Emeryville Pyrazin-basierte hemmer der glycogen-synthase-kinase 3
EP1240168B1 (en) * 1999-12-17 2005-08-31 Chiron Corporation Bicyclic inhibitors of glycogen synthase kinase 3
DE60140707D1 (de) * 2000-07-27 2010-01-14 Novartis Vaccines & Diagnostic GSK3-Polypeptide
AU785425B2 (en) * 2001-03-30 2007-05-17 Genetic Technologies Limited Methods of genomic analysis
WO2003004488A1 (en) * 2001-07-03 2003-01-16 Chiron Corporation Indazole benzimidazole compounds as tyrosine and serine/threonine kinase inhibitors
CA2460215A1 (en) * 2001-08-04 2003-02-20 Whitehead Institute For Biomedical Research Haplotype map of the human genome and uses therefor
WO2003024447A1 (en) 2001-09-20 2003-03-27 Smithkline Beecham Corporation Inhibitors of glycogen synthase kinase-3
US20040072831A1 (en) * 2001-10-12 2004-04-15 Choongwae Pharma Corporation Reverse-turn mimetics and method relating thereto
US20040023237A1 (en) * 2001-11-26 2004-02-05 Perelegen Sciences Inc. Methods for genomic analysis
US6762185B1 (en) * 2002-03-01 2004-07-13 Choongwae Pharma Corporation Compounds useful for treatment of cancer, compositions containing the same, and methods of their use
EP1380644A1 (en) * 2002-07-08 2004-01-14 Kylix B.V. The use of specified TCF target genes to identify drugs for the treatment of cancer, in particular colorectal cancer, in which TCF/beta-catenin/WNT signalling plays a central role
US7470709B2 (en) * 2002-08-23 2008-12-30 Novartis Vaccines And Diagnostics, Inc. Benzimidazole quinolinones and uses thereof
US20040247593A1 (en) * 2002-10-04 2004-12-09 Regents Of The University Of California, Methods for treating cancer by inhibiting Wnt signaling
CN1894422A (zh) * 2002-11-01 2007-01-10 解码遗传Ehf公司 位于染色体5q35上的人Ⅱ型糖尿病基因-SLIT-3
US20040146870A1 (en) * 2003-01-27 2004-07-29 Guochun Liao Systems and methods for predicting specific genetic loci that affect phenotypic traits
US6991110B2 (en) * 2003-07-02 2006-01-31 Inficon, Inc. Package for storing sensor crystals and related method of use
CA2537099A1 (en) * 2003-08-28 2005-03-10 Choongwae Pharma Corporation Modulation of .beta.-catenin/tcf activated transcription
WO2006137085A1 (en) * 2005-06-20 2006-12-28 Decode Genetics Ehf. Genetic variants in the tcf7l2 gene as diagnostic markers for risk of type 2 diabetes mellitus

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1548553A (zh) * 2003-05-21 2004-11-24 中国医学科学院基础医学研究所 用于预测2型糖尿病易感性的试剂盒及引物

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Struan F A Grant et al.Variant of transcription factor 7-like 2(TCF7L2)gene confers risk of type 2 diabetes.《Nature Genetics》.2006,第38卷(第3期),320-323. *

Also Published As

Publication number Publication date
AU2006260477B2 (en) 2012-02-23
CN101238222A (zh) 2008-08-06
EP1907569B1 (en) 2013-04-10
EA200800087A1 (ru) 2008-06-30
MX2007015848A (es) 2008-04-22
US20090275043A1 (en) 2009-11-05
JP2008546403A (ja) 2008-12-25
JP5301987B2 (ja) 2013-09-25
NO20080389L (no) 2008-01-21
IL188147A (en) 2013-02-28
CA2612475A1 (en) 2006-12-28
NZ564285A (en) 2010-03-26
KR20080051128A (ko) 2008-06-10
NO341910B1 (no) 2018-02-19
BRPI0612301A2 (pt) 2009-01-27
WO2006137085A1 (en) 2006-12-28
AU2006260477A8 (en) 2006-12-28
EA016397B1 (ru) 2012-04-30
KR101374304B1 (ko) 2014-03-14
HK1117569A1 (zh) 2009-01-16
US20060286588A1 (en) 2006-12-21
US20120149016A1 (en) 2012-06-14
IL188147A0 (en) 2008-03-20
AU2006260477A1 (en) 2006-12-28
EP1907569A1 (en) 2008-04-09
CA2612475C (en) 2015-07-28
US7585630B2 (en) 2009-09-08

Similar Documents

Publication Publication Date Title
CN101238222B (zh) 作为2型糖尿病风险诊断标记物的tcf7l2基因的遗传变异体
CN101874120B (zh) 作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型
DK2471954T3 (en) Susceptibility genetic variants associated with cardiovascular diseases
CA2566256C (en) Genetic polymorphisms associated with liver fibrosis methods of detection and uses thereof
DK2414543T3 (en) Genetic markers for risk management of atrial fibrillation and stroke
CN101784675B (zh) 用于剥脱性综合征和青光眼的诊断、预后和治疗的标记物的chr 15q24上的遗传变异
CN101641451A (zh) chr8q24.21上的癌症易感性变体
KR20110081807A (ko) 갑상선암의 위험도 평가를 위해 유용한 유전적 변이
KR102481305B1 (ko) 유전자에 기반한 염증성 장 질환의 진단
CN101772578A (zh) 作为标记物用在乳腺癌风险评估、诊断、预后和治疗中的在CHR 5p12和10q26上的遗传变异体
KR20110036608A (ko) 유방암 위험도 평가를 위한 유전적 변이
CN101687050A (zh) 用于鉴别原发起源不明的癌的起源的方法和材料
TW201632629A (zh) 用於癌症診斷與預後的方法
CA2651376A1 (en) Method for diagnosis and treatment of a mental disease
KR20130123357A (ko) 저산소증과 관련된 질환의 진단방법 및 키트
WO2015114146A1 (en) Method for predicting the response to an anti-her2 containing therapy and/or chemotherapy in patients with breast cancer
KR20090087486A (ko) 타입 2 당뇨병의 유전적 감수성 변이
US20030099958A1 (en) Diagnosis and treatment of vascular disease
CN101631876A (zh) 2型糖尿病的遗传易感性变体
IL179831A (en) In vitro method for detecting the presence of or predisposition to autism or to an autism spectrum disorder, and an in vitro method of selecting biologically active compounds on autism or autism spectrum disorders
CA2368672A1 (en) Genomic sequence of the purh gene and purh-related biallelic markers
US6780587B2 (en) Methods for diagnosing Pseudoxanthoma elasticum
KR102326582B1 (ko) 청각장애의 진단용 마커 및 그의 용도
US20090258344A1 (en) Methods for identifying risk of breast cancer and treatments thereof
US20040053232A1 (en) Haplotype structures of chromosome 21

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130410

Termination date: 20210616