請求の範囲
1 1又は複数の対照と関連付けることによりゲ
ノムDNAの試験試料を特性決定する方法であつ
て、該試験試料をポリヌクレオチドプローブによ
り探索し、DNAのハイブリダイズした断片を検
出し、そして該ハイブリダイズした断片を前記1
又は複数の対照と比較することを含んで成り、こ
こで、前記ポリヌクレオチドプローブは、ゲノム
のミニサテライト領域と該プローブとのハイブリ
ダイゼーシヨンを可能にする程度にゲノムのミニ
サテライト領域に対して相同性である配列の少な
くとも3個のタンデム反復(正確な反復である必
要はない)を含むポリヌクレオチドを含んで成り
(必要であれば標識された成分又はマーカー成分
を含む)、そして前記試料のDNAは、前記タンデ
ム反復に対応する配列を有意な程度に開裂しない
1又は複数の制限酵素により断片化されており、
そして
(a) 前記反復の各々はコアーを含有し、このコア
ーは異るゲノム遺伝子座からの複数のミニサテ
ライト中に存在する類似の長さのコンセンサス
コアー領域に対して少なくとも70%相同性であ
り;
(b) 前記コアーは6〜16ヌクレオチド長さを有
し;
(c) 前記反復単位中の前記コアーに寄与しないヌ
クレオチドの合計数は15以下であり;そして
(d) 複数の多型性ミニサテライト領域又は超可変
遺伝子座に関連付けることにより前記ハイブリ
ダイズした断片が前記試料のDNAを区別す
る;
ことを特徴とする方法。
2 前記ゲノムがヒト又は動物のゲノムを意味
し、そして前記試料がヒト又は動物のゲノム
DNAの試料である、請求項1に記載の方法。
3 試験試料の提供者と1又は複数の対照試料の
提供者との同異確定するために、該対照試料を同
様に断片化し、そして各試料からのハイブリダイ
ズした断片を比較することを特徴とする、請求項
1に記載の方法。
4 試験試料の提供者と1又は複数の対照試料の
提供者との間の家族関係を確定するために、該対
照試料を同様に断片化し、そして各試料からのハ
イブリダイズした断片を比較することを特徴とす
る、請求項1に記載の方法。
5 前記プローブを少なくとも2種類用いて得ら
れる陽性断片のパターンを比較する、請求項1に
記載の方法。
6 前記プローブの少なくとも反復単位が単鎖形
である、請求項1に記載の方法。
7 前記プローブが全体的に単鎖形である、請求
項1に記載の方法。
8 前記ポリヌクレオチドが、5′→3′の意味に読
まれる次の一般式:
H・(J・コアー・K)o・L (1)
〔式中、「コアー」は、前記と同じ意味で読まれ
る次の配列:
GGAGGTGGGCAGGAXG (2)
AGAGGTGGGCAGGTGG (3)
GGAGGYGGGCAGGAGG (4)
T(C)nGGAGGAXGG(G)pC (5A)
T(C)nGGAGGA(A)qGGGC (5B)
のいずれか内から選択された少なくとも6個の連
続するヌクレオチドを有する配列を示し、ここで
() XはA又はGであり、YはC又はTであ
り、TはT又はUであり、mは0,1又は2で
あり、pは0又は1であり、qは0又は1であ
り、そしてnは少なくとも3であり;
() J及びKは一緒に、前記反復単位内の0
〜15個の追加のヌクレオチドであり;
() H及びLはそれぞれ、前記反復単位を挟
む0又は少なくとも1個の追加のヌクレオチド
を表わし;
() 前記反復単位(J・コアー・K)は、前
記ポリヌクレオチドが認識できる程に反復され
るコンセンサス配列を有する限り、ヌクレオチ
ドの数及び種類のいずれの点でも正確な反復で
ある必要はなく;そして
() 「コアー」はまた、全n反復単位中の実
際のコアー配列が式(2)〜(5)に関して上に定義し
た「真の」コアー配列に対して平均70%以上の
相同性を有する限り、変形コアー配列であるこ
ともできる〕
により表わされ、あるいは上記配列に対して相補
性の配列を有するポリペプチドである、請求項1
に記載の方法。
9 各(J・コアー・K)反復配列中に存在する
ヌクレオチドの合計数が25を超えない、請求項8
に記載の方法。
10 コアーが最高16のヌクレオチドを有する、
請求項8に記載の方法。
11 コアーが7個以上の連続するヌクレオチド
の配列を表わす、請求項8に記載の方法。
12 コアーが12個以上の前記連続するヌクレオ
チドの配列を表わす、請求項8に記載の方法。
13 コアーが、式(2)、(3)又は(4)中に示された配
列から選択される14〜16個の前記連続するヌクレ
オチドの配列を表わす、請求項8に記載の方法。
14 実際のコアー配列が真のコアー配列に対し
て80%以上の相同性を有する、請求項8に記載の
方法。
15 Jが0又は1であり、そしてKが0又は1
である、請求項14に記載の方法。
16 各(J・コアー・K)反復単位中に存在す
るヌクレオチドの合計数が20を超えない、請求項
10に記載の方法。
17 前記ポリヌクレオチドが、次の式:
(5′)GPGGGCWGGWXG(3′) (6)
(式中PはGではなく、WはA又はT又はUで
あり、そしてXはA又はGである)
内から選択される連続する(5′→3′)コアー配列
を含有する6〜31ntの配列の3以上の反復を有す
るポリヌクレオチド、又はその変形体(全反復中
の実際の合計コアー配列が、式(6)について定義さ
れた「真」の合計コアー配列に対して平均70%以
上の相同性を有することを条件とする)、あるい
はこれらに対して相同な配列を有するポリヌクレ
オチドである、請求項1に記載の方法。
18 各反復又は変形体反復が式(6)の配列を含
む、請求項17に記載の方法。
19 連続する(5′→3′)配列:
PGGGCWG (7)
が前記ポリヌクレオチドのすべての反復単位中に
保存されており、P及びWが請求項17において
与えられた意味を有する、請求項1に記載の方
法。
20 連続する(5′→3′)配列:
TGGGCA (8)
が前記ポリヌクレオチドのすべての反復単位中に
保存されており、そしてTがT又はUである、請
求項1に記載の方法。
21 PがT又はUである、請求項17〜20の
いずれか1項に記載の方法。
22 WがAである、請求項17〜20のいずれ
か1項に記載の方法。
23 前記連続するコアー配列又は保存された配
列が反復配列と同一である、請求項17〜22の
いずれか1項に記載の方法。
24 前記ポリヌクレオチドが、次の連続する
5′→3′コアー配列:
GGPGGGCWGGWXG (9)
(式中PはGではなく、WはA又はT又はUで
あり、そしてXはA又はGである)
を含む31ntを超えない配列の3以上の反復を有す
るポリヌクレオチド、又はその変形体(全反復中
の実際の合計コアー配列が式(9)について定義した
「真」のコアー配列に対して70%以上の相同性を
有することを条件とする)、あるいはこれらに対
して相補的な配列を有するポリヌクレオチドであ
る、請求項1に記載の方法。
25 Wが5′末端においてAであり、そして3′末
端においてT又はUである、請求項24に記載の
方法。
26 前記プローブが、次の配列(相補的配列を
含めて):
名 称
(コアー) GGAGGTGGGCAGGAA GG
(33.6) (A)AGGGCTGGAGG
(33.15) AGAGGTGGGCAGGTGG
(33.5) GGGAGGC TGGGCAGGAGG
(M13.コアーB) GTGGGCAGGAAG
名 称
(M13.コアーC) TGGGCAG
(M13.コアーD) GGTGGGCAGGTGG
(式中、TはT又はUである)
から選択された配列の少なくとも3回の反復から
本質上成る、請求項1に記載の方法。
27 前記プローブが、次の配列(相補的配列を
含めて):
(33.6) (A)AGGGCTGGAGG
(33.15) AGAGGTGGGCAGGTGG
から選択された配列の少なくとも3回の反復から
本質上成る、請求項1に記載の方法。
発明の背景
1 発明の分野
この発明は、ヒト又は動物のゲノムを探索
(probing)するのに有用なプローブとして役立
つようにラベルすることができるポリヌクレオチ
ド、及びこのプローブを使用してゲノムDNAを
同定する方法に関する。この同定方法は、例え
ば、父系及び母系試験、法医学、並びに遺伝性疾
患及び癌の診断において有用である。
2 従来技術の記載
ゲノムDNA中の遺伝子の相違を同定するため
の主要な従来方法は、制限断片長の多型性
(restriction fragment length
polymorphisms; RFLP)を検出することによ
るものである。例えば、J.F.Gusella等、Nature
306、234−238(1983)によるハンチングトン舞踏
病を生じさせるDNA欠損の座の同定、およびW.
K.Cavanee等、Nature305、779−784(1984)に
よる網膜芽腫の素因の分析を参照のこと。
ほとんどのRFLPは、DNA中の小規模な変化、
通常、制限エンドヌクレアーゼ開裂部位を形成し
又は破壊する塩基置換から生ずる。ヒトDNAの
平均ヘテロ接合性(mean hetero−zygosity)は
低い(塩基対当り約0.001)であるから、制限エ
ンドヌクレアーゼは所与の遺伝子座における
RFLPを稀にしか検出しないであろう。検出され
る場合でさえ、ほとんどのRFLPは、決して50%
を超えずそして通常は非常に低い、対立遺伝子頻
度によつて決定される、異型(ヘテロ)接合性を
伴う2形性(dimorphic)(制限エンドヌクレア
ーゼ開裂部位の存在及び不存在)に過ぎない。結
果として、このようなすべてのRFLPは個体がホ
モ接合的である場合は常に血統分析において情報
性い欠ける。
遺伝的分析は、多数対立遺伝子変化を示す超可
変領域のプローブの入手可能性により、そして対
応して高いヘテロ接合性(heterozygosity)によ
り相当に単純化され得るであろう。このような第
1の領域は、A.R.Wyman等、Proc.Nat.Acad.
Sci.USA、77、6754−6758(1980)により、偶然
に、ヒトDNAのランダムセグメントのライブラ
リーから単離された。この遺伝子座の多数対立遺
伝子変化(multiallelic variation)の構造的基
礎がまだ不明である。その後、そしてやはり偶然
に幾つかの他の高可変領域がヒトインシユリン遺
伝子〔G.J.Brll等、Nature295 31−35(1982)、
ゼータ・グロビン遺伝子〔N.J.Proudfoot等、
Call 31、553−563(1982)、及びS.E.Y.
Goodbourn等、Prou.Nato AcAd.Sci.USA.80、
5002−5026(1983)〕、及びc−Ha−ras−1発癌
遺伝子〔D.J.Capon等、Nature302、33−37
(1983)〕の近傍で見出された。各場合において、
可変領域は短い配列(“ミニサテライト”)のタン
デム反復から成り、そして多型性
(polymorphism)は、有系分裂性もしくは減数
分裂性非同等交換(unequal exchange)により、
又は複製中のDNAの滑り(slippage)により生
ずる反復数の対立遺伝子的相違に基く。生ずるミ
ニサテライトの長さの相違は、反復単位を開裂し
ない制限エンドヌクレアーゼを用いて検出され得
る。
本発明者及びその共同研究者はすでにヒト−ミ
オグロビン遺伝子のイントロン中の33bp配列の
4個のタンデム反復を含んで成る短いミニサテラ
イトを記載している〔P.Weller等、EMBO J.3、
439−446(1984)〕。この33bp反復はすでに特徴付
けられている上記の他のヒト−ミニサテライトに
対して、配列における弱い類似性を示すことが注
目された。この報文はミニサテライト領域が転位
(transposition)により生ずることを推定した。
ヒト−ミオグロビン遺伝子の33bp反復が転位性
(transposable)であれば、このものは、反復数
の相違に基き多数対立遺伝子多型性としばしば関
連するヒト−ゲノムのタンデム反復領域のための
プローブを提供することができよう。
3 追加の未公表背景情報
ヒト−ゲノムDNAがミオグロビン遺伝子から
の33bp配列のタンデム反復を含んで成るDNAプ
ローブにより探索(probing)された。多型性相
違が3人の個体(父、母、及び娘)のゲノム
DNA中の幾つかの異る領域において観察され、
この相違は一層大きな断片(2〜6kb)のサイズ
において生ずる。データーは1個より多くのミニ
サテライト領域の長さの相違に基く安定に遺伝さ
れる多型性と一致した。
発明の概要
一層の研究が、ミオグロビン遺伝子33bp−反
復プローブを正面図するのよりもはるかに効果的
にミニサテライト又は超可変領域中の変化性を表
示する方法でゲノムSNAを探索することが可能
であることを示した。
この発明は、ヒト又は動物のゲノムDNA中の
多くのミニサテライトが異るミニサテライト間で
高度の相同性を有するDNA領域を含有するとい
う発見に基いている。この共通のコアー領域は短
かく、約16塩基対である。今や、少なくとも3回
タンデムに反復されるヌクレオチドの短コアー配
列をその必須構成成分として有するプローブが、
ゲノムDNA中の多くの異るミニサテライト領域
を、そしてこれらの領域中のそれらのDNAの相
違に言及することにより個体が同定され又は識別
され得る程の精密さをもつて検出するために役立
つであろうことが見出された。これらの従来のプ
ローブはRFLPにより与えられるのよりも良好な
程度の識別に通じるが個体について本質的に特異
的である指紋(fingerprint)には通じない。注
目すべきことには、1個より多くのミニサテライ
ト領域又は超可変遺伝子座への言及によつてこの
発明のコアープローブはDNAを指紋採取するこ
とができることが見出され、そして通常でない程
度の非自明性を発明性に加えているのはこの発見
であり、これが基本的で科学的新規性と重要性を
有する発明にしている。 コアー配列の知見か
ら、ゲノム中の種々の遺伝子座からのミニサテラ
イト領域とハイブリダイズする性質を有する
DNAプローブを製造することができる。しかし
ながら、特定のコアー配列の単なる認識又は同定
は、それ自体では、役立つプローブの製造のため
に不十分である。コアー領域のタンデム反復配列
を含有するポリヌクレオチド又はその誘導体を製
造することも必要である。このようなプローブ
は、ヒト又は動物のDNAからのミニサテライト
として単離することができ、又はこれとは異り合
成技法によつて造成することができる。好結果の
ハイブリダイゼーシヨンを行う追加の制約を達成
することも重要である。これらは、許容され得る
コンセンサス−コアーとの相同性の程度及び全体
として反復単位の内及び外の非−コアーDNAの
許容される長さの知見を包含する。
こうして、この発明は次の認識及び発見を用い
る:
(1) 任意の1つのコアー配列の知識がこの方法に
おいて使用され得ること。これはさらに次の認
識を含む:
(2) ゲノム中の異る超可変遺伝子座を研究するこ
とによつて、必要な程度のコンセンサスを有す
る異るコアー配列が見出され得ること;
(3) 多型性の異るスペクトルを認識するであろう
DNAプローブの一群が蓄積され得ること;
(4) 特定の遺伝子分類があるプローブによつて、
他のプローブによるよりも好結果に達成され得
ること;
(5) 任意の1つの分類における1個より多くのプ
ローブの使用により、同定の確率が増幅される
こと;
(6) 好結果のプローブの第1世代の一層の研究に
より、より簡単で且つより好結果のプローブ
が、例えば合成により製造され得ること。
こうして、この発明の第1の観点に従えば、多
型性ミニサテライト−長さ特異的結合特性を有す
るポリヌクレオチドの製造方法が提供され、この
方法は:
() 他の多型性DNA領域への制限されたハ
イブリダイゼーシヨンを行うことができる、
DNA中の天然タンデム反復配列を同定し、
() そのような結合を担当することが推定さ
れる該反復配列の天然コンセンサス−コアー配
列を同定し、そして
() 天然反復配列よりも低いゲノム−遺伝子
座−特異性及び高い多型性断片受容性を有す
る、ミニサテライト結合性を有する天然コンセ
ンサス−コアー配列由来の完全な又は不完全な
タンデム反復配列を単離するか又は人工的に造
成する、
ことを含んで成る。
プローブのコアー成分は同じ基礎原理に基く
種々の方法により定義され得る。最も基本的な基
礎原理はプローブの反復配列がヒト又は動物のゲ
ノムDNAのミニサテライトに共通の、共通コア
ー領域からのヌクレオチド配列から成るか又はそ
れを含むべきことである。この共通コアー配列
は、1つのミニサテライトと他のものとの間に高
度の、例えば80%以上のコンセンサスを示すとい
う意味において、“共通”である。これらのミニ
サテライトは、例えば、ミオグロビン遺伝子
33bp反復配列によりゲノムDNAを探索して、こ
の明細書において、“λ33−陽性”断片と称する
ハイブリダイズした断片を得ることにより検出さ
れる。これらの断片及びミオグロビン遺伝子の
33bp反復は約16bpの共通コアー配列を含む。こ
のλ33−陽性断片を、やはり共通コアー配列を有
する他の断片を形成するためのゲノムDNAのプ
ローブとしてそれ自体として使用することができ
るが、そのなんらかの小変化を伴うこともでき
る。
他の原理は、コアーヌククレオチド配列が、サ
ンプルDNAのミニサテライト領域に効果的にハ
イブリダイズすることができない程短くなく、多
型性をうまく検出できない程長くないこと、例え
ばミニグロビン遺伝子中の33bpタンデム反復に
非常に類似することである。一般に、コアーはミ
ニサテライトの共通コアー中に見出される6ヌク
レオチドないし最大約16ヌクレオチドを有すべき
である。プローブの反復配列はもつぱらコアーか
ら成る必要はなく、コアー配列のいずれかの端に
少数のフランキングヌクレオチドを含有すること
ができる。反復単位は、ヌクレオチドの数又は種
類のいずれについても、及び反復単位のコアー又
は非コアー成分のいずれについても正確な反復で
ある必要はない。しかしながら、これがおよその
用語であるとしても、この明細書において反復単
位として記載しそして定義するのが便利である。
n反復単位のブロツクはいずれかの末端に任意の
ヌクレオチド配列を有していてもよく、その程度
及び種類は通常重要でない。
この発明のポリヌクレオチドは、次の方法のい
ずれかにおいて定義されるものを特に包含する。
第1の定義
5′→3′の意味に読まれる次の一般式
H.(J.コアー.K)n.L (1)
〔式中、
“コアー”は少なくとも6個の連続するヌクレ
オチドを有する配列を表わし、このヌクレオチド
は同じ意味で読まれる次の配列:
GGAGGTGGGCAGGAXG (2)
AGAGGTGGGCAGGTGG (3)
GGAGGYGGGCAGGAGG (4)
T(C)nGGAGGAXGG(G)pc (5A)
T(C)nGGAGGA(A)qGGGC (5B)
のいずれかの中から選択され、ここで、
XはA又はGであり、YはC又はTであり、m
は0,1又は2であ、pは0又は1であり、qは
0又は1であり、nは3以上であり;
J及びKは一緒になつて反復単位内の0〜15個
の追加のヌクレオチドを表わし;そして、
H及びLはそれぞれ反復配列を挟む0又は1以
上の追加のヌクレオチドであり;そして次のこ
と、すなわち:
() “コアー”並びにJ及びKは各(J.コア
ー.K)反復ユニツトで同じ配列又は長さを必
ずしも有するわけではなく;
() “コアー”はさらに異るコアー配列を表
わすこともでき;
() 全n反復単位中の実際の合計コアー配列
は、同じ数nの反復単位における式2〜5につ
いて上に定義した“真の”合計コアー配列と70
%以上の相同性を有する;
ことを条件とする〕
を有するポリヌクレオチド;並びに
これに対して相補的な配列を有するポリヌクレ
オチド。
第2の定義
次の一般式:
H.(J.コアー.K.)n.L (1)
〔式中、
“コアー”は同じ5′→3′の意味読まれる6〜16
個の連続するヌクレオチドの配列を表わし、(1)反
復単位当り約33ntのミオグロビンタンデム反復配
列を含有すプローブDNAを用いてヒト又は動物
のゲノムDNAを探索することによつて得られる
第1のヒト又は動物のミニサテライトの5′→3′共
通コアー領域、(2)第1のミニサテライトの共通コ
アー領域を含んで成るタンデム反復配列を含有す
るプローブDNAを用いてヒト又は動物のDNAを
探索することによつて得られる第2のヒト又は動
物のミニサテライトの5′→3′共通コアー領域、及
び(3)第2のミニサテライトの共通コアー領域を含
んで成るタンデム反復配列を含有するプローブ
DNAを用いてヒト又は動物のゲノムDNAを探索
することにより得られる第3のヒト又は動物のミ
ニサテライトの5′→3′共通コアー領域から選択さ
れ、上記の各タンデム反復配列は3単位以上の反
復である〕
を有するポリヌクレオチド;並びに、これに次し
て相補的な配列のポリヌクレオチド。
第3の定義
次の一般式:
H.(J.コアー.K)n.L (1)
〔式中、
“コアー”は、75%以上、好ましくは80%のコ
ンセンサスを示すヒト又は動物のゲノムDNAの
ミニサテライトの共通コアー領域内からの6個以
上の連続するヌクレオチドを有する配列のいずれ
かを表わし;
“コアー”は各反復単位中で必ずしも同じ配列
を有するわけではなく、そして他のすべての記号
は上に定義した通りである〕
を有するポリヌクレオチド;並びにこれに対して
相補的な配列のポリヌクレオチド。
第4の定義
次の式:
(5′)GPGGGCWGGWXG(3′) (6)
(式中、PはGではなく、WはA又はTであ
り、そしてXはA又はGである)
で表わされる配列、又はその変形体から選択され
る連続する(5′→3′)コアー配列を含む6〜35nt
の配列の3以上の反復を有するポリペプチド(全
反復中の実際の合計コアー配列は、同じ数の反復
における式(6)について定義した“真の”コアー配
列に対する70%以上の相同性を有することを条件
とする);並びにこれに対して相補的な配列のポ
リヌクレオチド。
上記の式中で、そしてあまねく、配列は通常の
表記法5′→3′で示される。
この発明は、DNAの、RNAの、及びDNAと
ハイブリダイズし得る任意の他の種類のポリヌク
レオチドを包含する。上に定義されたポリヌクレ
オチドはラベルされておらず、そして2本鎖
(ds)形又は単鎖(ss)形であることができる。
この発明は、プローブとして使用するためのss
形のラベルされたポリヌクレオチド、及びこれら
のラベルされた前駆体であつてそれからss−プロ
ーブを製造することができるものを包含する。
これらは好ましくは任意の常法において33P−
放射性ラベルされるが、しかしこの方法に代つ
て、ハイブリダイゼーシヨン技術においてよく知
られている他の手段により放射性ラベルされるこ
とができ、Proceedings of the 1981 ICN−
UCLA Symposium on Developmental
Biology using Purified Genes、キーストン、
コロラド、1981年3月15〜20日、Vol XX
1981、647−658頁、アカデミツク・プレス、
DonaldD.Brown等編、に記載されているD.C.
Ward等の方法によりビオチンもしくは同様の種
でラベルされることができ、又はA.D.B.
Malcolm等、Abstracts of the 604th
Biochemical Society Meeting、ケンブリツジ、
英国(1983年7月1日の会)の方法により酵素ラ
ベルされることさえできる。
そして、この発明の他の観点に従えば、ヒト又
は動物のDNAを含有するサンプルの遺伝子の由
来の決定に有用なポリヌクレオチドプローブが提
供され、このものは、ラベルされた成分又はマー
カー成分を含むと共に、サンプルDNAを制限エ
ンドヌクレアーゼにより断片化することにより得
られ対応するDNA断片へのプローブのハイブリ
ダイゼーシヨンを可能にする程度にヒト又は動物
のゲノムのミニサテライト領域と相同である配列
の3回以上のタンデム反復(変形体を包含する)
を含んで成るポリヌクレオチドを含んで成り、そ
して次のこと、すなわち:
a 各反復が、異るゲノム遺伝子座からの多数の
ミニサテライト中に存在する同様な長さのコン
センサス−コアー領域と70%以上相同であるコ
アーを含有し;
b コアーが6〜16ヌクレオチドの長さを有し;
c コアーに寄与しない、反復単位内のヌクレオ
チドの合計数が15以下である;
ことを特徴とする。
この発明はさらに、ヒト又は動物のゲノム
DNAのサンプルの同定方法を包含し、この方法
は、この発明のプローブにより該DNAを探索し、
そしてDNAのハイブリダイズした断片を検出す
ることを含んで成る。
この発明のこの観点は:
細胞性材料のサンプルからの全DNAを制限エン
ドヌクレアーゼを用いて断片化し、
高可変DNA断片を、ラベル化された成分又は
マーカー成分に加えて反復コアー成分を含有する
上に定義したプローブとハイブリダイズせしめ、
そして
異る長さのDNA断片に、又はさらに一般的に
は異る分子サイズのバンドに結合したラベル又は
マーカーの濃度を決定する、
ことを含む。
通常、断片化されたDNAは、ハイブリダイゼ
ーシヨンの前に、鎖長に従つて、例えば電気泳動
により分別又は分離し、そしてマーカー濃度を検
知してその個々の要素が遺伝的由来に特異的であ
る特徴的パターンを得る。
定 義
この発明及び今までの記載中に使用される下記
の定義が助けとなろう。
超可変的
1つの認められた遺伝子座又は部位におけるヒ
ト又は動物のDNAの領域が長さ又は配列につい
て多くの異る形態で存在する場合、それは超可変
的であると言われる。
制限断片長多型性(RFLP)
これは、電気泳動後に分離さえそしてプローブ
により検出されたヒト又は動物のDNA断片のパ
ターンにおける遺伝子的多様性である。
ミニサテライト
これは、短いDNA配列のタンデム反復から構
成されるヒト又は動物のDNAの領域である。す
べての反復単位が完全な同一を示すことは必ずし
も必要でない。(この発明のプローブは多型性で
あるミニサテライトを含んで成る。)
多型性
個体ごとに相違を示す遺伝子、又はDNAの他
のセグメントは多型性であると言われる。
コアー(配列)
本来、コンセンサス−コアー配列の意味に用い
られるが、しかしそれに由来する任意の反復され
る配列又は変形配列に拡張される。
コンセンサス−コアー(配列)
由来又は遺伝子座を異にする2以上のミニサテ
ライトの反復単位間で実質的な又は完全にマツチ
するものとして同定され得る配列である。
反復(配列)
所与のコアー配列又はコアー配列を含有するセ
グメントの完全な又は不完全なタンデム反復たる
配列である。
定義されたコアー(配列)
それ自体の長さ内で式(2)〜(8)の1つと完全に一
致するコアー配列である。
変形体(コアー配列)
定義されたコアー配列からわずかな程度異る
(相同性50%以上)実際のコアー配列である。
完全反復(配列)
所与のコアー配列の又はコアー配列を含有する
セグメントの正確なタンデム複製たる配列であ
る。
不完全反復(配列)
少なくとも1つの単位が塩基対置換及び/又は
長さにおいて少なくとも1つの他の単位から異る
配列である。(通常、1つのプローブ配列中に少
なくとも3個のタンデム配列が存在し、プローブ
配列内に少なくとも1つの定義されたコアー配列
及び少なくとも1つの変形体が存在するであろ
う。)
相同性%
同じ長さの2つの配列の比較において、塩基対
(bp)の数からbp置換数を差引きしたもののbp数
に対する%である。
ヌクレオチド(nt)及び塩基対(bp)は同義
に使用される。両者はDNA又はRNAに当てるこ
とができる。略号C、A、G、Tは常用通り(デ
オキシ)シチジン、(デオキシ)アデノシン、(セ
オキシ)グアノシン、及びデオキシチミジン又は
ウリジンのいずれかを意味する。
タンデム反復配列(人工的な、又は天然単離
体)は完全反復であることができるが、しかしさ
らに好ましくは不完全反復である。好ましくは少
なくとも2個の反復がコンセンサス−コアー配列
の不完全反復である。好ましくは、3個以上の反
復、そしてさらに好ましくは7個以上の反復がプ
ローブ配列中に存在する。
プローブの製造は、クローニングによる天然ミ
ニサテライトの単離及びDNA配列決定による同
定を含むことができる。これはまた、必要とされ
るコアーの切り出し及びそれに続くそのタンデム
反復への転換、又は由来を異にする断片との非同
一交換の促進を含むことができる。これはまた、
ポリヌクレオチドのクローニングを含むことがで
きる。
他方、造成段階は同定されたコンセンサス−コ
アー配列又はその断片の合成を含むことができ
る。コンセンサス−コアー配列は好ましくは6bp
以上を含有しそして好ましくは16bp以下を含有
する。次に合成コアーのタンデム反復を造成す
る。
言うまでもなく、ポリヌクレオチドは、好結果
の又は部分的に好結果の中間体のクローニングの
後の異る時における操作の連続の結果であること
ができ、そして最終ポリペプチドが親ミニサテラ
イトへのわずかな類似性を有するように天然起原
又は合成起原の断片を含むことができる。
この発明のプローブは次の分野において有用で
ある。
1 ヒトにおける父系及び母系試験。
2 例えば入植紛争及び相続紛争における家族群
の立証。
3 双生児におけるチゴシテイー(Zygasity)試
験。
4 ヒトにおける血族結婚についての試験。
5 ヒトにおける一般的血統分析。
6 ヒトにおける遺伝的疾患の遺伝子座の同定。
これにより遺伝的欠点を検出するための特異的
プローブの造成が可能となる。
7 法医学
(a) 強姦の犠牲者からの精液の特定、
(b) 例えば汚れた衣類からの血液、髪及び精液
の特定、
(c) ヒトの遺体の特定
8 セル・チメラリズム(Cell Chimaerism)の
研究、例えば骨髄移植後の提供細胞対受容体細
胞の追跡。
9 家畜の育種及び血統分析/証明。(これは例
えば動物の純系の日常的調節及び点検、並びに
例えば競争馬及び犬の繁殖に係る訴訟事件にお
ける血統の点検を含むことができよう。)さら
に、経済的に重要な遺伝的形質との関係を示す
であろう遺伝マーカーを提供すること。
10 純粋なセルラインの汚染及び日常的同定作業
を点検する、培養された動物セルラインの日常
的品質管理。
11 腫瘍細胞及び腫瘍の分子以上についての分
析。
12 ポリヌクレオチド又はそれに由来するプロー
ブは植物育種における潜在的用途を有するもの
と期待される。
【図面の簡単な説明】
第1図は、ミオグロビン遺伝子の33bp反復配
列をプラスミドに挿入しそしてそれをクローニン
グする、その製造方法の模式的説明である。第2
図は種々のDNAプローブにハイブリダイズする
ゲノムDNAの断片のオートラジオグラフの写真
のフオトコピーであり、そしてさらにそのDNA
が2つのオートラジオグラムにおいて同定された
親類個体血統を示している。第3図は、この発明
の3種類の異るプローブにより探索された、親類
関係にない3人のヒトの個体からのDNAサンプ
ルのオートラジオグラムを示す。第4図は、この
発明のプローブにより探索された、9人のヒトの
個体からのDNAサンプルのオートラジオグラフ
を示し、その数人は親類関係にあり、そして2人
は一卵性双生児である。第5図は、この発明のプ
ローブにより探索された、2人のヒト及び17のヒ
ト以外の動物からのDNAサンプルのオートラジ
オグラムを示す。第6図は、この発明に従つて探
索された、入植紛争にまき込まれたガーナ人家族
の構成員からのDNAサンプルの1連のオートラ
ジオグラムを示す。第7図は神経線維腫症に罹患
した血縁者からのDNAサンプルのオートラジオ
グラムを示す。第8図は、ミニサテライト断片の
可能性ある共同受け継ぎ及び胎児性ヘモグロビン
の遺伝的存続(HPFH)の試験のために作られ
たGujerati血統からのDNAのオートラジオグラ
ムを示す。第9図A及びBは、大きな親類関係に
おけるHPFH及び種々のミニサテライトの受け
継ぎを示す遺伝的ダイアグラムである。第10図
はクローン化された人工的ミニサテライトの調整
を示すダイアグラムである。第11図は、新規な
合成プローブにより探索された、親類関係にない
2個体の胎盤からのDNAサンプルの1連のオー
トラジオグラムを示す。第12図は大きな親類関
係からの探索されたDNAサンプルの1連のオー
トラジオグラムを示す。第13図は異る2つのプ
ローブを用いて双生児について得られる種々の
DNAバンドパターンを示すオートラジオグラム
である。第14図は単鎖プローブ及び2本鎖プロ
ーブを用いて形成されるバンドパターンを比較す
るオートラジオグラムである。第15図及び第1
5A図は、法医学サンプルから得られるDNA指
紋を示すオートラジオグラムである。第16図は
イヌの一族から得られたDNA指紋を示すオート
ラジオグラムである。第17図は短毛家庭用ネコ
の一族からのDNA指紋を示すオートラジオグラ
ムである。第18図は2つの異るプローブを用い
て種々のヒツジから得られたDNA指紋を示すオ
ートラジオグラムである。第19図は3頭の異る
ブタからのDNA指紋を示すオートラジオグラム
である。第20図はウシの一族及び追加のウシに
ついてのDNA指紋を示すオートラジオグラムで
あり;そして第21図は異るプローブを用いる第
20図い類似するオートラジオグラムである。
好ましい態様の記載
フアージλL47.1中にクローン化されたヒトDNA
の10〜20kb Sau3A部分のヒトゲノムライブラ
リーを、33bpミオグロビン反復プローブ
“pAV33.7とのハイブリダイゼーシヨンによりス
クリーニングした。3×105組換体のライブラリ
ー中に40以上の強くないし弱くハイブリダイズす
るプラークが同定された。これらの陽性プラーク
の8個の無作為選択物を精製し(λ33.1−15)、そ
してフアージDNAのサザンブロツト分析を用い
て、各組換体においてハイブリダイズするDNA
が組換体のユニーツ短(0.2〜2kh)領域内に位置
することが示された。配列分析は、8個の組換体
の各々のこの領域が反復配列の3〜29タンデムコ
ピーを含んで成るミニサテライトを含有し、該反
復配列の長さはλ33.15中の16bp〜λ33.4中の64の
範囲であることを示した。ほとんどのミニサテラ
イトは整数個の反復を含有していた。次に、
λ33.6においては、37bp反復が基本的12bpユニツ
トの分岐したトリマーから成つていた。各λ33組
換体は、各ミニサテライトを挟むクローン特異的
DNA配列により判定した場合ヒトゲノムの異る
領域を代表していた。
8個のクローン化ミニサテライト領域は、ヒト
DNAのHinfI消化物中でpAV33.7により検出さ
れ得る多型性2〜6kbDNA断片より小さい0.5〜
2.2kbHinfIDNA断片内に位置していた。クロー
ン化されたミニサテライト領域のいずれかも多型
性であるか否かを決定するため、32P−ラベル化
単鎖DNAプローブを各ミニサテライトの適当な
M13サブクローンから調製し、そして高厳重さ
で、HinfIで消化された14人の親類関係にない
英国白人のDNAのパネルにハイブリダイズせし
めた。典型的なハイブリダイゼーシヨンパターン
は、これらのハイブリダイゼーシヨン条件下で各
プローブがヒトゲノムのユニーク領域を検出する
こと、及びこれらの領域の3個は高度に多型性で
あることを示す。
上記の手順の、これ以上の詳細は例に記載す
る。
今や、前記のポリヌクレオチドの定義に関し、
定義は次の一般式
H.(J.C.K.)n.L (8)
(式中Cはコアー配列を示し、そして他の記号
は上記の通りである、)
と一致する。すべての定義において、1つの単位
のコアー配列は次のものと同じでも異つていても
よい。例えば、全体として反復単位に当れはまる
コンセンサス配列と比べ1もしくは2個の余分の
ヌクレオチドを含有し、1もしくは2個のヌクレ
オチドを欠き、又は(例えば)1〜4個のヌクレ
オチドが異なつていてもよい。
コアーは種々の方法で定義され得る。一般的定
義はコアー配列を同定することができる手順に言
及することにより得ることができる。ゲノム
DNAのサテライト領域は例えば、
GGAGGTGGGCAGGAXG (2)
のごとき配列と比較される。式(2)に含まれるすべ
ての可能なX−ヌクレオチド長配列から選択され
るX−ヌクレオチドと最大の相同性を示すミニサ
テライトから取られるX−ヌクレオチド長配列
は、コアー配列であるとされる。言うまでもな
く、これはコアーを定義する非常に狭い方法であ
り、そして1又は少数のコアーの6ヌクレオチド
長、1又は少数の7ヌクレオチド長、そして16ま
でのヌクレオチド長をもたらすべきである(最高
の、例えば100%相同性の1より多くが存在する
であろうから“少数”である)。このように定義
されたコアーに対するこれらのコアーの平均70%
以上の相同性を全n反復単位が有する程度に多様
性が存在し得ることが仮定される。反復配列内の
フランキング配列JおよびKは相同性についての
計算には含まれず、コアー間でのみ比較される。
定義されるコアーは種々の長さを有することがで
き、そして“混合”され得る。すなわち、幾つか
の反復単位においては例えば式(2)の
GGGCAGGAXGと相同でありそして他において
は例えば式(3)のGGGCAGGTGGと相同である。
従つて、変形体は、必然的に“コアー”自体との
相同性ではなく(コアー)nとの相同性として考
慮すべきである。
前に定義された“第1の”定義は、上記の考慮
に由来するが、しかし示されている式(2)〜式(5)
中、事情次第で、6〜最高12〜16のいずれかの長
さの配列としてコアーが定義される点において単
純化される。変形体について同様の規定が存在す
る。
第2の定義は、それぞれが追加のミニサテライ
ト断片を生成し得る連続するハイブリダイゼーシ
ヨン段階としてコアーを定義する。ヒトゲノム
DNAの広範なライブラリーに対して十分な数の
ハイブリダイゼーシヨンを行い、十分な数のハイ
ブリダイズした断片を試験し、これらからプロー
ブを作り、ゲノムDNAを再び探索し、そして理
論的にはこれを無限回行うことにより、ミニサテ
ライトDNA中で広く象徴されるコンセンサスコ
アー配列の範囲に到達することが可能であること
が容易に理解されよう。実際には、十分に広いコ
ンセンサスコアー領域に到達するために非常に多
数回そして大規模にこれらの操作が行われなけれ
ばならないとは予想されず、そしてそれ由に(勝
手に)3回のみの探索操作が定義内に含まれる。
“第3の”定義において、Wがコアーを表わ
し、そして25%(例えば16ヌクレオチド中4ヌク
レオチド)より多く異らない多様性を伴う広く共
有されるコンセンサスコアー領域の可能性に頼
る。25%以下の可能性ある可変性を伴う約16ヌク
レオチド以上のコアー領域をこのように定義すれ
ば、コアーWはその領域内からの6以上の連続す
るヌクレオチドの配列として定義される。
“第4”の定義は、合成ポリヌクレオチドに係
る研究から得られた再定義されたコンセンサスコ
アー式(6)を含む。
これらの研究は、一層短いコアー配列の他の定
義を導く。
従つて、好ましくは連続する(5′→3′)配列:
PGGGCWG (7)
がすべての反復単位中に保存され、ここでP及び
Wは上の第4の定義において与えられた意味を有
する。Pは好ましくはTであり、Wは好ましくは
Aである。
好ましくはまた、連続する(5′→3′)配列:
TGGGCA (8)
が全反復単位に保存される。
他の観点に従えば、連続する5′→3′
コアー配列:
GGPGGGCWGGWXG (7)
(式中、PはGではなく、WはA又はTであ
り、そしてXはA又はGである)
を含む3以上の反復を有するポリヌクレオチド、
又はその変形体(全反復中の実際の合計コアー配
列が同じ数の反復中式(7)に関して定義された“真
の”合計コアー配列と70%以上の相同性を有する
ことを条件とする)、及び上記のものと相補的な
配列のポリヌクレオチドが提供される。
上記のすべての定義において、コアーは少なく
とも6ヌクレオチド長であり、さらに好ましくは
7又は8ヌクレオチドであり、そして最も好まし
くは12又はそれより大で例えば14〜16である。式
(2)の配列GGGCAGGAXG(3′末端の末端10ヌクレ
オチド)は高コンセンサスであり、そして特に有
望なようである。
変形体コアーは、好ましくは70%以上、そして
さらに好ましくは80又は85%以上の相同性を有す
る。
各反復単位内のフランキング配列J及びKは好
ましくは各端において省略され、又は短かく、例
えば0.1又は2ヌクレオチドにされ、そして好ま
しくはJ及びKは一緒になつて20を超えるべきで
はなく、さらに好ましくは20を超えるべきではな
い。反復単位内のJ+コアー+Kの合計中の全ヌ
クレオチド数は好ましくは36を、そしてさらに好
ましくは31を、そして最も好ましくは25を超える
べきでない。
反復単位の数nは好ましくは少なくとも10、便
利には10〜40であるが、しかし原理的には任意の
数であることができ、10000までの数でさえ可能
である。
フランキング配列H及びLは無関係である。こ
れらは省略されることができ、又は任意の数の、
例えば20000までのヌクレオチドとして存在する
ことができるが、このような長いプローブを用い
ることはあまり賢明ではない。反復配列がss−
DNAである場合でも、これらはds−DNAを含有
することができる。
同定方法は任意の既知の探索技法を用いること
ができ、その最も通常の方法はサンプルDNAを、
タンデム配列を開裂せしめないか又はそれらの探
索される能力を妨害しない無意味な程度に開裂せ
しめるに過ぎない制限酵素(適当であれば1種類
又は複数種類)により開裂せしめることである。
例1 ヒト−ミオグロビン遺伝子からの、長いタ
ンデム反復配列を含有するプローブの造成
このプローブの造成が(a)〜(e)で表示される5段
階を示す第1図中に摸式中に説明されている。出
発ミオグロビン遺伝子(a)はP.Weller等、EMBO
J.3、439−446(1984)により記載されている。
そこに示されているように、該遺伝子は、ほとん
ど同一の9bp配列(第1図中r)に挟まれた33bp
配列の4個の反復から成る、第1イントロン中に
位置する領域を有する。この領域を169bp Hin
f I断片(b)中に単離し、それを末端修復し
そしてプラスミドpUC13のSma部位にクロー
ニングすることにより増幅した〔J.Vieira等、
Gene19、259−268(1982)を参照のこと〕。制限
エンドヌクレアーゼAva(A)により第3及び
第4反復を開裂せしめることによりモノマーを単
離した(c)。(反復1及び2中の1基置換がこの
部位を除去し、そして代りにDde(D)部位を
形成する。)非同一Ave接着末端を介する33bp
モノマーの連結により反応単位数不明の頭:尾ポ
リマー(d)が生成した。少なくとも10個の反復
を含むポリマーを分取用アガロースゲル電気泳動
により単離し、末端を修復し、pUC13のSma
部位に連結し、そしてE.コリJM83中にクローン
化し(J.Vieiva等、前掲を参照のこと)。
pAV33.7と称する生じたプラスミド(e)中のポ
リマーDNA挿入部の構造を、BamH+EcoR
によりポリリンカーにおいて該挿入部を切り出
し、α−32P−dCTPによりBamH部位におい
てフイル−インラベル化し、そしてAvaにより
部分消化することにより確認した。ラベルされた
部分消化生成物を2%アガロースゲル上での電気
泳動により分離した。pAV33.7は(e)に示すよ
うに767bpBamH−EcoR断片中に含まれる
33bpモノマーの23反復を含有することが見出さ
れた。
(2) ミオグロビン33bp反復プローブによるヒト
−ゲノムのミニサテライト領域の選択物の配列決
定
バクテリオフアージλL47.1中にクローン化さ
れた10〜20kbヒトDNA断片のライブラリー〔P.
Weller等、前掲、及びW.A.M.レネン等、Gene
20、249−259(1980)〕を、P.Weller等、前掲、
の方法により32P−ラベルされた、前記段階(1)中
に記載した767bp pAV33.7挿入部とのハイブリ
ダイゼーシヨンによりスクリーニングした。8個
の陽性プラークの選択物を精製してλ33.1−15と
称する組換体を得た。これらのフアージDNAの
それぞれをHinf又はHaeにより消化し、1.5
%アガロースゲルを通して電気泳動し、そしてそ
の中の33−反復関連配列をpAV33.7DNAとのサ
ザン・ブロツト・ハイブリダイゼーシヨンにより
位置決定した。各組換体は1個の“λ33−陽性”
Hinf及びHae断片を与えたが、λ33.4及び
11は検出可能なHae断片を与えなかつた(これ
らの組換体中の反復領域中にHae開裂部位が存
在するため)。λ33−陽性Hinf及びHae断片
を分取用ゲル電気泳動により単離し、所望により
末端修復し、そして2本鎖DNA M133mp8の
Sma部位に平滑末端連結した(J.Messing等、
Gene19、 269−276(1982)〕。E.コリ(E.coli)
JM101に形質転換した後陽性ss−M13組換体を単
離し、そしてジデオキシヌクレオチド・チエイン
−ターミネーシヨン法により配列決定した。すべ
てのλ33−陽性断片がタンデム反復領域を含有し
ており、これは幾つかの場合には直接配列決定す
ることができた。反復領域が配列決定プライマー
部位から遠すぎる他の場合には、M13挿入部を制
限エンドヌクレアーゼによる開裂によつて短縮
し、そして再度配列決定した。
λ33−陽性断片の構造を、λ33.1,33.3,33.4,
33.5,33.6,33.10,33.11及び33.15と称する8個
の地図の形で後に示す。使用された実際の制限酵
素及びヌクレオチド中の断片の長さはλ33.1:
Hae、2000;33.0:Hinf、465;33.4:Hin
f、2000;33.5:Hinf、1600;33.6:Hae
、720;33.10:Hae、720;33.11:Hinf、
1020;λ33.15:Hinf、1220であつた。各地図
は、長方形箱上に大文字スクリプトで塩基の反復
配列を示す。“反復”は塩基の数について常に完
全というわけではなく、そして塩基の置換によつ
て幾分異る。箱はコンセンサスから異る反復を示
す。箱内の空白は一致が見出されたことを示す。
箱内の塩基記号A,C,G,Tは、コンセンサス
配列中のその上に示されているものがそれにより
置き換えられていることを示す。XはA又はCで
ある。YはC又はTである。−はコンセンサスに
比較して欠けているヌクレオチドである。>>>
<<<(矢はず)記号は、配列決定ままだなされ
ていないが、配列決定ゲルのオートラジオグラス
からその配列がコンセンサスの“反復”である
(言うまでもなく“反復”なる語を上記の同様に
用いる)ことが明らかであることを示す。断片
λ33.3,33.5,33.10,33.11及び33.15は完全に配列
決定されており、他は部分的に配列決定されてい
る。箱の左側の“conの下方の数値は配列の反復
数である。この列の底部の番号は反復の数を示
す。すなわち、λ33.1は箱の上の大文字スクリプ
トで示された62ヌクレオチド(nt)配列の26反復
を含む。各地図の頂部及び底部の小文字スクリプ
トで示された配列は反復配列プロツクのそれぞれ
5′側及び3′側に存在するフランキング配列であ
り、そしてこれらのフランキング配列は反復され
ない。言い換えれば、この構造はフランキング配
列により示されるランダムコポリマーのそれに類
似し、そこではタンデム反復により示されるブロ
ツクコポリマーの単位が現われる。
【表】
【表】
【表】
【表】
(3) 各λ33−陽性断片の反復配列内に位置しそし
てそれに共用される共通短“コアー”配列の発見
および同定
各領域の反復配列をドツトマトリクス分析を用
いて、pAV33.7中のミオグロビン33bp反復配列
と、及びその逆方向相補体と比較した。非常に顕
著に、ミオグロビン33bp反復配列とλ33−陽性断
片のコンセンサス反復配列との間に配列類似性の
1つの小さい明瞭な領域が見出された。同じ領域
が8個のすべてのλ33断片の反復により共有され
ており、そして“共通コアー”と称されよう。下
記のチヤートはその比較を示す。
このチヤートにおいて、前記段階(2)において決
定された各コンセンサス配列の全体が示される。
これらは、ミオグロビン33bpプローブ中及びヒ
ト−ゲノムDNAから単離されたλ33−陽性断片
中のタンデムに反復する部分である。このチヤー
トは共通コアー領域を大文字スクリプトの16ヌク
レオチド長として示す。
【表】
* この配列はトリマーであり、従つてフラン
キング領域はコアーに寄与する。
やはり、XはA又はGであり、YはC又はTで
あり、−は欠けたヌクレオチドである。これら16
ヌクレオチドについて実質的な程度の一致が存在
し、その8個は100%の一致を示し、そして9番
目の“X”はA又はGのいずれかである範囲で一
致する。これらの9ヌクレオチドには底列にアン
ダーラインが付されており、共通コアー領域のヌ
クレオチドを示す。小文字スクリプトで示された
タンデム反復配列の残基が共通コアー領域の縁に
存在する。各反復コンセンサスの始/終端が記号
▼により特定され;λ33.4及び33.15の場合には非
一整数の反復が存在し、そしてそのために別々の
反復開始及び終端が異る記号▽で示されている。
共通コアー領域は複雑な分析によつてのみ同定さ
れ得たことが認識されよう。なぜなら、これはし
ばしばλ33−陽性断片の1個のコンセンサス配列
に全体として属さず、そしてミオグロビン遺伝子
33bp反復の2個の連続する配列にまたがるから
である。
この発明の範囲内にあるものとして定義される
ポリヌクレオチドとの一致の程度を説明するた
め、種々の決定要素を次の第1表に示す。
【表】
【表】
アンダーラインを付した数値は許容されない
長さを示す。
(4) 多型性ヒト−ゲノムDNA断片が個々のλ33
−陽性断片のプローブとのハイブリダイゼーシヨ
ンにより検出され得るという発見
第2図に関し、英国白人(1〜6)の無作為サ
ンプル及び大きな英アジア家系(7〜18)の選ば
れた構成員から採取された白血球からDNAを調
製した。血統は便宜上男性を示す正方形、女性を
示す円形、及びこれらの間の線による結婚により
示される。いとこ間の2件の近身結婚を両親間の
2本線で示す。DNAの10μgのサンプルをHinf
で消化し、20cm長の2%アガロースゲルを通し
て電気泳動し、その場で変性し、そしてブロツテ
イングによりサルトリウス(Sartorius)ニトロ
セルロースフイルターに移した。単鎖の32P−ラ
ベル化ハイブリダイゼーシヨンプローブを、ミニ
サテライト(タンデム反復)領域を含有するM13
組換体から調製した。使用した正確なプローブは
後で記載する。手順は次の通りとした。約0.4μg
の単鎖DNAを4ngのノクーマー配列決定プライ
マー〔M.L.Dockworth等、Nucleic Acids Res.
9,1691−1706(1981)〕と、10μlの10mM
MgCl2,10mM Tris−HCl (pH8.0)中で60℃
にて30分間アニールした。プライマー延長を、
16μlの80μM dATP、80μM dTTP、10mM
Tris−HCl(pH8.0)、0.1mM EDTA及び3μl
(30μCi)α−32P−dCTP(3000 Ci mmole-1)
及び1μlの5ユニツトμl-1Klenow断片(ベーリン
ダー)を添加し、そして37℃にて15分間インキユ
ベートすることにより行つた。延長は2.5μlの
0.5mMdCTPを添加しそして37℃にてさらに15分
間チエージング(chasing)することにより完成
した。(“チエージング”(Chasing)とは
M13ssDNAの鋳型上にdsDMAの輸を完成するた
めにdNTP混合物を添加することを意味する。
DNAを、挿入部中又は挿入部に対して遠位の
M13ポリリンター中の適当な制限エンドヌクレア
ーゼ部位において開裂せしめ、1/10容量の1.5M
NaOH,0.1M DKTAを添加することにより変
性し、そしてプライマーから伸びる32P−ラベル
化単鎖DNA断片を1.5%低融点アガロースゲル
(シー・プラク)による電気泳動によつて回収し
た。切り出されたバンド(比活性>109cpm/
μgDNA)を1mgのアルカリ奪取(sheare)した
キヤリヤーヒト胎盤DNA(0.3MNaOH,20mM
EDTA中で100℃にて5分間奪取し次にHClにて
再中和)の存在下で100℃にて溶融せしめ、そし
てハイブリダイゼーシヨンチヤンバーに直接加え
た。キヤリヤーDNAはまた反復DNA配列へのそ
の後のハイブリダイゼーシヨンを抑制するために
も役立つた。
使用した正確なハイブリダイゼーシヨンプロー
ブは、(A)33.1、ミニサテライト(62nt配列の
26反復=1612nt)+約360ntのフランテングヒト
DNAを含む約2000ntサブクローン化Hae断
片;(B)33.4,2015ntHinf断片中に含まれる
ミニサテライトのプライマー近位側の695nt非−
ミニサテライトEcoR断片;及び(C,D,
E)33.15、λ33.15ミニサテライト配列(上に示
した共通コアー領域から平均2ヌクレオチド異
る、16nt配列の29反復)+128ntフランキングヒト
DNAを含む592ntサブクローン化断片、であつ
た。A.J.Jeffreys等、Cell21、555−564(1980)に
より記載されているようにしてハイブリダイゼー
シヨンを行つた。但し、バツクグラウンドラベル
化を低くするためデキストランサルフエートを6
%(W/V)ポリエチレングルコール6000により
置き換えた。フイルターA及びBを0.5×SSC中
で65°にて一夜ハイブリダイズせしめ、そして65°
にて0.2×SSC中で洗浄した。フイルターC〜E
はハイブリダイズせしめ、そして1×SSC中で65
℃にて洗浄した。フイルターを固定したタングス
テン酸強化スクリーンを用いて−80℃にて1〜3
日間オートラジオグラフ処理した。
第2図に示すように、反復コアープローブ
33.15はHinfで消化されたヒトDNAにおいて
ハイブダイズする断片の極めて複雑なプロフイー
ルを検出した。最大(4〜20knt)Hinf断片
のみが十分に分離され得、そしてこれらはハイブ
リダイゼーシヨンプロフイールが固体特異的
DNA“指紋”を提供する程度に極度の多型性を示
した。
血統分析は、いとこ結婚の単一の血縁関係(第
2図の16〜18)の間でさえ、すべての個体が識別
されえる程の、極度の多型性の多様性を確認し
た。第2図中の家族(D,E)は、大Hinf断
片のほとんどが各親から子孫のいくらかにのみ伝
達されることを示し、これによつて、これらの断
片のほとんどがヘテロ接合状態で存在すること、
及びこれらの大きな超可変断片のヘテロ接合性は
100%に達しなければならないことが示される。
これに対して、子孫中のすべての断片は一方又は
他方親に起因せしめることができ(唯1の例外を
伴つて)、そしてそれ由に1セツトの安定に遺伝
される遺伝マーカーを提供する。特異的に父から
むすこに、又は母からむすめに伝達されるバンド
はなかつた(フイルターD、第2図を参照のこ
と)。これはそれぞれY及びXリンケージを除外
し、そしてこれらのミニサテライト断片が主とし
て常染色体に由来することを意味する。これらの
DNA断片が常染色体のセツト中のどこに由来す
るかはまだ知られていないが、これらは1つの常
染色体の単一の領域に由来するのではない。そう
ではなく、子孫中で独立して分離する親断片の対
が同定され得る(フイルターD、第2図を参照の
こと)。正確には、少なくとも1のAB又は−−
子孫が存在すれば、1方の親における(そして他
方から欠けている)1対のバンドABは対立遺伝
子的ではあり得ず; A−又は−3組換子孫の存
在はさらに、A及びB間の密接なリンケージの欠
如を確率する。第2図D中に示される家族のもと
のオートラジオグラフの注意深い検討は、それら
の基準により、母における少なくとも10個の分離
可能なバンドを示し、その内の8個は相互に非対
立遺伝子的であり、そして密接にリンクしていな
い。他の2個のバンドはそれぞれ8個の非リンク
断片の1つの対立遺伝子であるかもしれず、ここ
でA−及び−B子孫のみが分析される子孫の限定
された数においてのみ観察され、但しこのような
少数のサンプルは、このような断片対が単一遺伝
子座の対立遺伝子であることを証明するには十分
でない。
結論として、コアープローブは、少なくとも幾
つかの非リンク超可変遺伝子座上で同時に有用な
情報を与えることができる。この結論は例8にお
いてさらに詳細に検討される。
他方、他の2つのプローブ(フイルターA及び
B、第2図)は、この発明に従わず、1個又は2
個のバンドを与えるに過ぎず、そして多くの異る
多型性領域を同時に検出することができず、そし
てそれ由に一般的診断に用いることができない。
例 2
ヒトDNA中の新たなセツトの超可変領域を検
出するためのプローブ中の追加の変形体(コア
ー)の使用
クローン化λ33−陽性断片λ33.5及びλ33.6に由
来する他の2つのプローブを例1、段階(4)と同様
にして調製した。33.5プローブはM13mp8中にク
ローン化された308ntDNA断片から成りそして上
記のコンセンサス配列の14反復を含んで成り、こ
れは70ntフランテングヒトDNAと共に共通コア
ー配列の17nt長の変形体である。33.6プローブは
18反復の37nt配列を含み、今度はこの配列は共通
コアー領域由来の約12ntの短縮配列の3反復+そ
の5′−末端における追加のTCを含んで成る。18
×17nt反復ブロツクは97ntヒトDNAに挟まれて
いた。37nt配列の構造は次のように表わすことが
できる。
TGG AGG AGG GGC
TGG AGG A−G GGC(又はTGG
AGG AGG G−C)
TCCGG AGG AGG GGC
このプローブは同様にしてM13mp8にクローン
化された。
後の記載において、11ntコンセンサス配列
AGGGCTGGAGGがこのプローブのために与え
られる。
両プローブを32Pによりラベルし、そして例1.
段階(4)と同様にして14の親類関係にない白人のパ
ネルからのヒトDNAにハイブリダイズせしめた。
両プローブは複雑な1セツトのハイブリダイスす
る断片を検出し、その多くは極度に多型性の変化
を示した。33.5により検出される幾つかの断片は
新規であり、そして33.15コアープローブによつ
ては今まで検出されていないものである。33.6プ
ローブはほとんど完全に新しいセツトのミニサテ
ライトを検出し、そしてこれらの正しいうけ継ぎ
が血統分析により証明された。(例8を参照のこ
と)。
次の例はこの発明をさらに説明しそして例示す
る。
サンプルDNAの消化は好ましくは、ヌクレオ
チドの4塩基対を認識する制限エンドヌクレアー
ゼを用いて行われる。最も長い超可変断片につい
てのDNA指紋パターンが使用される4bp認識制
限エンドヌクレアーゼから大きく独立しているこ
とが見出された。このことは、これらの大断片が
より長いミニサテライトに由来するのではなく、
そしてそれぞれが、制限エンドヌクレアーゼ開裂
部位を欠きそして正常な高密度の四bp開裂部位
を含有するヒトDNAに挟まれた完全長の均一な
ミニサテライトを含有することを強く示唆する。
これは、これらの大ミニサテライト断片のほとん
どがリンクしておらずそして独立して血統中に分
かれることを示す前記の例及び例8において示さ
れる結果と一致する。
好ましい態様においては、DNAのサンプルを、
2つの異る指紋をもたらす別々のハイブリダイゼ
ーシヨンにおいて、2つの異るプローブ、例えば
ラムダ33.15及び33.6断片からのプローブを用い
て、二重指紋採取する。2人の無関係の個体が同
じ指紋を有する。すでに低い確率が、この手段に
よりさらに低下する。例えば、例4は、好ましく
は4kb末端の長さの不完全に分離するハイブリダ
イズDNA断片が無視される場合でさえ10-19とい
う低い確立を示す。
この発明は父系試験の方法を含む。子における
多型性ミニサテライト断片の約半分が父に由来
し、そしてこれらの父系断片は母及び子のDNA
指紋の比較により同定することができる。これら
の父系断片のすべてが通常父のDNA中に存在す
るであろう。プローブ33.15及び4kb以上の長さの
DNA断片を用いて、仮定の父が子において典型
的に同定される6つすべての父系特異的DNA断
片を偶然に有する確率は10-5のオーダーであり、
そして両プローブ33.6及び33.15の使用はそれを
10-8のオーダーに低下せしめることが予想され
る。当然、正確な確率は正確な分離及び得られる
DNAパターンの複雑さに依存し、そして4kb未
満の長さの追加の父系断片が分析され、又は第3
のプローブが用いられれば、改善されるであろ
う。
DNA指紋のため、1滴のヒト血液から十分な
DNA(0.5〜5マイクログラム)を迅速に単離す
ることができる。そして、そのDNAがすでに指
紋採取されている2人+2人の姉妹を含む個体の
無作為パネルからDNA指紋が作成された。2人
のあらかじめ特徴付けられた個体はDNA指紋比
較に基いて容易に且つ明瞭に同定することがで
き、実質的な数のミニサテライト断片を共通に有
する2人の姉妹も同様であつた。
DNAは所与の個体の種々の細胞から採取する
ことができ、すべて同じ指紋を与える。従つて精
子及び血液DNAについてDNA指紋は識別され
ず、一卵性双生児のパターンも同様である。さら
に、血液DNAのDNA指紋と、同じ個体に由来す
るエプスタインーバールウイルスで形質転換され
たリンポブラストイドセルラインから単離された
DNAとの比較により示されるように、パターン
は培養細胞においても維持されるようである。
この発明を適用することができるヒト以外の動
物にはほとんどの哺乳類、鳥、両棲類及び魚が含
まれる。例えば鶏、ハムスター、ラビツト、マウ
ス、スズメ、マグソダカ、カエル、イモリ及び魚
である。鶏の場合、ハイブリダイズするDNA断
片の非常に複雑な不鮮明な部分が生成した。Hae
による消化が、“明瞭”な指紋を残して不鮮明
部分を除去した。従つて、鶏のDNAはまた、そ
の反復単位が1又は複数のHae開裂部位を含有
する長いコアー含有サテライトを含有し、従つて
Haeによる開裂が、DNA電気泳動中にゲルの
底部に泳動除去される非常に小さいDNA断片に
このサテライトを縮小すると考えられる。時お
り、他の動物が不鮮明なバンドを生成し、そして
これらは、一層長い断片を開裂せしめる適当な酵
素によりDNAが消化される場合、分離可能とな
るであろうと考えられる。
次の追加の例において、温度は℃である。
例 3
A.J.Jaffreys、Cell18、1−10(1979)により記
載されているようにして新鮮なヒト胎盤から
DNAを単離した。3つの個々の胎盤を使用し、
1〜3と標識した。DNAの8マイクムグラムの
サンプルを、完全消化を助けるため4mMスペル
ミジントリクロリドの存在下でHinf及び/又
はSau3Aで消化し、フエノール抽出後にエタノ
ール沈澱により回収し、そして20cm長の0.6%ア
ガロースゲルを通して30Vにて約24時間、1.5kb
長未満のすべてのDNA断片がゲルから泳動除去
されるまで電気泳動した。次に、DNAをブロツ
テイングによりサルトリウム−ニトロセルロース
フイルターに移した。高比活性(109cpm32P/
マイクログラムDNAより大)単鎖M13DNA。プ
ローブを例1、段階1に記載されているようにし
て調製した。使用された正確なプローブは:(a)
λ33.5ミニサテライト(17nt×14反復)のほとん
ど+約60ntフランキングヒトDNAを含んで成る、
M13mp8のSma部位にサブクローニングされ
た、220ntHaeDNA断片から成る33.5プロー
ブ;(b)ミニサテライト+約50ntフランテング
ヒトDNAから成る、M18m8のSma部位にサブ
クローン化された、720ntHae断片から成る
33.6プローブ;及び(c)例1、段階(4)と同じ
33.15プローブ(これは、ミニサテライト+128nt
フランキングヒトDNAを含む、Pst+Sma
で消化されたM13mp19DNA中にサブクローン化
された、599ntPst−Aha断片である)であつ
た。サザンブロツトハイブリダイゼーシヨン及び
洗浄は、1×SSC中で65℃にて、例1、段階(4)に
おいてフイルターC−Eについてすでに記載した
ようにして行つた。フイルターを、室温にて強化
スクリーンを用いないで4日間オートラジオグラ
フ処理した。
各プローブは異る断片パターンを生成し、その
複雑さは使用されるテトラヌクレオチド制限エン
ドヌクレアーゼから大いに独立である。第3図は
得られたパターンを示す。4kb長未満の多形性断
片の分離はHinf+Sau3Aによる二重消化にお
いて改良され、これは、1又は複数の反復単位内
に蓄積されたSau3A開裂部位を有する比較的分
かれたそして不変のHinfミニサテライト断片
によりおそらく生ずるバツクグラウンドハイブリ
ダイゼーシヨンの除去に基く。二重消化において
は、プローブ33.15により検出される分離可能な
多型性断片の数は、ほとんどの又はすべての単復
単位中にSau3A開裂部位をおそらく含有する長
い単消化化ミニサテライト断片の約20%を失うと
いう犠牲において、個体当り約15から約23に増加
することができる。
例 4
20人の血縁のない英国の白色人種の無作為抽出
試料から採取したヒト血液DNA8マイクログラム
の試料をHinfで消化し、例3に記載したミニ
サテライトプローブ33.6又は33.15を用いてサザ
ン法によりハイブリツドを形成した。各DNAの
指紋(個体A)を隣接ゲルトラツクにおけるパタ
ーン(個体B)と比較し、Bには明らかに存在し
ない、Aにおけるバンドの数及びBにおけるほぼ
同じオートラジオグラフ強度の同時泳動対応部を
有するバンドの数を記録した。下記の表に示した
結果は、すべて対での比較に関する平均値であ
る。Aにおける少量(約6%)の付加的な弱いハ
イブリツド形成断片は、Bにおける強いハイブリ
ツド形成断片と一致した。このような場合には、
AにおけるバンドがBにも存在するか否かを決定
することができないので、このような断片を無視
した。A及びBにおける同時泳動バンドが、常に
同一のミニサテライト座の同一対立遺伝子である
場合には、Aにおける対立遺伝子がBにも存在す
る平均確率xは、=2q−q2、従つてq=1−(1−
x)1/2によつて平均対立遺伝子頻度(同型接合性)
qに関係する。実際、A及びBにおける同時泳動
バンドの(未知)割合は、異なるミニサテライト
座から偶然に誘導され、従つて平均対立遺伝子頻
度及び同型接合性の概算値は最大であり、ミニサ
テライト断片の電気泳動分離に左右される。
第1表に示した確率は、示したDNAの個々の
サイズ断片に関するものである。指紋の最も読み
やすい部分、すなわち、大きさが4kb以上のすべ
てのDNAに関する全体的確率を得るため、3個
の数値を組合せなければならない。例えば、個体
A中のプローブ33.15によつて検出されるすべて
の断片がBにも存在する平均確率は0.082.9×
0.205.1×0.276.7=3×10-11である。Aにおける2
種のプローブ33.15及び33.6によつて検出される
すべての断片がBにも存在する確率は、5×
10-19である。
【表】
例 5
この例は、DNA指紋の体細胞安定性及び父子
鑑別への用途を説明するものである。
EBウイルスによつて形質転換され、液体窒素
中に貯蔵されたリンパ芽球細胞系統を2年後に液
体培養で再び株化した。これらの培養したリンパ
球を生理食塩液で2回洗浄し、リンパ球ペレツト
及び白血球からのDNAをA.J.Jeffreysによつて
Cell、18巻1〜10(1979)に記載されようにして
製造した。精液から集めた精子を、SDSで溶解す
る前に、室温で5分間1M2−メルカプトエタノー
ルで処理した以外は同様にして精子DNAを製造
した。Hinfで消化し、プローブ33.6(a)又
は33.15(b)でハイブリツド形成したDNAの5
マイクログラムの試料を使用して例3に記載した
ようにしてDNA指紋を調製した。
例 6
この例は、種々の脊椎動物のDNAにおける極
めて多形の領域を検出するための本発明のプロー
ブの使用を説明するものである。
鶏、すずめ及びちようげんぼうから採取した血
液、うさぎ及びマウスの肝臓、ヒトの胎盤並びに
蛙及び魚の消化管を除去した死体からDNA試料
を製造した。8μgのDNA試料をHinfで消化し
たが、鶏のDNAについてはHinfで消化した。
制限消化物を0.6%アガロースゲルを通して電気
泳動し、変性し、サルトリウス(Sartorius)ニ
トロセルロースフイルターに転移させ、ヒトミニ
サテライトプローブ33.15を用いて前記のように
してハイブリツドを形成した。ハイブリツド形成
の厳格さは1×SSC中で65℃であつた。結果を、
下記の試料について第5図に示す。
1,2 :血縁のないヒト胎盤DNA
3 アラスカ及びウイーンホワイト種のF1ハイ
ブリツドからのウサギDNA
4 :アラスカ種からのウサギDNA
5,6 野性で捕獲された2匹のギリシヤマウス
からのマウス(Mus musculus)DNA
7 近交系DBA−2からのマウス(Mus
musculus)DNA
8 近交系C57/BL10からのマウス(Mus
musculus)DMA
9,10 鶏DNA:注、DNAをHaeで消化し
た。
11,12:すずめDNA
13,14,15:ちようげんぼうDNA
16,17:蛙(Xenopus tropicalis)DNA
18,19:小魚DNA
試験したほとんどすべての脊椎動物から有効な
種々のDNA指紋が得られ、明らかにヒトDNA指
紋と同程度に情報を与えることが判る。
また、Hinfで開裂したニワトリDNAは、ハ
イブリツド形成成DNAのあまり強くないが、極
めて複雑な不明瞭部分(図示せず)を生じた。し
かしながら、Haeで消化すると、この汚点は除
去され、きれいな多形指紋パターンを生じた。
2つの近交系のマウスは、野性マウスより簡単
な指紋を有する。これは、野性では、ほとんどの
超可変ミニサテライト座が異型接合性であるが、
近親交配すると、同型接合性であり、近交系では
ハイブリツド形成DNA断片の数を半減するから
であると考えられる。
下記の例は、前記の特定のプローブの適用を更
に説明するものである。
例 7
この例では、従来の遺伝的方法では、解決が不
可能ではないにしても、極めて困難であつた移民
の場合へのDNA指紋分析の使用を記載する。
この事例は、英国で生まれ、父親と再会するた
めガーナへ移民し、この後、母親、兄弟及び2人
の姉妹と再び一緒になるためため一人で英国へ戻
つたガーナ人の少年に関する。しかし、そこに、
血縁のない少年又は全員がガーナで生活している
母親の姉妹のうちの一人の息子とすり換えが起こ
つたことを示唆する証拠があつた。その結果、帰
国する少年は、英国への居住を許可されなかつ
た。その家族の弁護士の請求により、少年の母親
を決定する分析が行われた。事を複雑にするの
で、父親も、母親の姉妹も分析に利用されなかつ
た。更に、母親は、少年が彼女の息子であること
を確信していたが、彼女は息子の父親については
確かでなかつた。従つて、家族の利用しうる人員
(母親M、兄弟B、姉妹S1及びS2並びに問題の少
年X)から採取した血液DNA試料からのDNA指
紋を、それぞれ、ヒトDNAにおいて超可変ミニ
サテライトの異なる組み合わせを検出する。前記
の2種のミニサテライトプローブ33.6及び33.15
に対するサザン法によるハイブリツド形成によつ
て製造した。
母親(M)、問題の少年(X)、彼の兄弟(B)、
姉妹(S1,S2)及び血縁のない個体(U)から
の血液DNAの8μgの試料をHinfで消化し、
0.7%アガロースゲルにより電気泳動し、プロー
ブに対してサザン法でハイブリツドを形成させ
た。オートラジオグラフを第6図に示す。母親
(M)のDNA指紋に存在する断片を短い水平線で
示す。Mには存在しないが、問題となつていない
同胞(B,S1,S2)の少なくとも一人に存在す
る父性断片は、長い線で示されている。Xに伝達
された“母性”断片及び父性断片は、点で示され
ている。XのDNA指紋は、付加的分離断片を含
まない。種々の照射で取つたオリジナルオートラ
ジオグラフからすべての断片を記録した。確実に
は記録できず、特にゲルの底部に向かう、部分的
に分解された、比較的に弱いバンドは無視した。
第一工程は、超可変断片のパターンからXの父
性を確定することであつた。父親を利用できなか
つたが、彼のDNA指紋の大部分は、3人の問題
になつていない同胞(B,S1,S2)の少なくと
も一人に存在するが、Mには存在しない父特異性
DNA断片から再構成することができた。こうし
て同定された39の父性断片のうち約半分が、Xの
DNA指紋に存在した。DNA断片は、血縁のない
個人のDNA指紋(第6図における個人U参照)
の間で共有されるのは希であるので、これは、X
がB,S1及びS2と同一の父親を持つことを極め
て強く示唆する。これらの父特異性DNA断片を
除外した後、Xには40個の断片が残りそのすべて
がMに存在していた。このことは、MがXの母親
であり、従つてX,B、S1及びS2は真実の同胞
であることを強く証明する。
一人の人のDNA指紋における断片が無作為に
選択した第二の個体中に存在する平均確率は、北
ヨーロツパ人では約0.2であることは、既に上記
した。父及びMに関する対応する数値は0.26であ
り、これらのガーナ人におけるDNA指紋変異性
は、北ヨーロツパ人のそれと有意には異ならない
ことを確定する。下記の確率概算において、すべ
てのバンドが0.26の均一な確率で共有されるとい
う極めて控え目な仮定を行う(以下に、数量化す
る)。
第一の問題は、Xがこの家族の血縁であるか否
かである。XのDNA指紋は、61の記録可能な断
片を含み、そのすべてがM及び/又は父親に存在
する。Xが血縁を有しない場合には、彼のバンド
のそれぞれがこれらの両親に存在する確率は、1
−(1−0.26)2=0.45である。従つて、M及び/又
は父親がXのバンドの61全部を偶然に有する確率
は、0.4561=7×10-22である。Xは、明らかにこ
の家族の血縁である。
次の問題は、Mでない、血縁のない婦人がXの
母親でありうるか否かである。XのDNA指紋は
40の“母性”断片を含み、そのうち、われわれは
約25が特に母親から受け継いだものと評価してい
る。残りの断片は、母親と父親との間で共有さ
れ、従つてMの母性についての証拠を挙げるため
使用することはできない。Xにおける25の母特異
性断片はすべて、Mに存在している。MがXと血
縁でないが、25の断片をすべて共有する機会は、
0.2625=2×10-15である。従つて、X及びMは血
縁を有しなければならない。
最後の、最も困難な問題は、分析に利用されな
かつたMの姉妹がXの母でありうるか否かである
(父親はもちろん、Mの夫でなければならない)。
バンドが0.26の平均確率で任意の人に共有される
場合、一人の人の断片が同胞にも存在する対応す
る可能性は0.62である。MがXの真実の母の姉妹
であり、偶然にXの母特異性バンドを25個すべて
含む可能性は、従つて、0.6225=3×10-6である。
従つて、われわれは、なんら合理的な疑いをいれ
る余地もなく、MはXの真実の母でなけれがなら
ないと結論する。この証拠を、移民当局に提供し
たところ、当局はXに対する論争を止め、彼の英
国居住を許可し、彼が彼の家族とともに残ること
を許した。
この困難な事例は、DNA指紋が、重要な家族
の人員が見つからない場合でさえ、親族関係の明
白な積極的証拠を与えることがきることを示す。
この事例は、Xが彼の同胞と同じ父親を有し、こ
の父親がXにだけ伝えたバンドはなかつた(平均
して、1/16の父性バンドが伝達される)という事
実によつて簡素化された。このようなXに独特な
断片は、XとMとの親族関係に関する証明を明ら
かに弱めるが、実際には、必ずしも分析を無効に
するものではない。Xは25の母特異性断片の他
に、このような父性断片を5個より多数有すると
は思われない。XとMに血縁関係がない場合又は
MがXの叔母である場合に、30の特定のバンドの
うち少なくとも25個がXとMとで偶然に一致する
可能性は、それぞれ8×10-11及び9×10-3であ
る。従つて、この分析は、強いものであり、この
ような事例のほとんどにおいて主張された親族関
係を肯定又は否定する明白な証拠を与える。通常
は、もちろん、家族の関係者の全員を、例えば父
親論争に又は移民によつて家族が再び一緒になる
のが困難な場合に、利用できるであろう。DNA
指紋は、ほとんど常にこのような問題を解決する
ことができる。
DNA指紋の数量化
父親から特異的に受け継いだ断片が39個である
のに対し、Mには61のDNA断片が記録されてい
た。父親の異型接合性DNA断片の1/8はB,S1
又はS2に伝達されておらず、従つて父特異性断
片の数に対する補正値は、39×8/7=45である。
M及び父のDNA指紋における断片の総数はほぼ
等しいので、父の共有する、Mにおける断片の数
は、約(61−45)=16である。M及び父親におけ
るバンド共有の平均確率xは、従つて、16/61=
0.26であり、北ヨーロツパ人の無作為試料をスク
リーニングすることから求めた予備概算値と一致
する(x=0.2、対照2)。
45の父性バンドの約半分は、異型接合性バンド
について予測されるように、B,S1及びS2に
(それぞれ18,24及び18個)伝達された。Mのバ
ンドの若干が父親にも存在し、従つて子供のほと
んど又は全員に伝達されていることから予測され
るように、Mの61のバンドのうち、半分より多く
がB,S1及びS2によつて(それぞれ32,38及び
39個)受け継がれた。MのDNA指紋が子供全員
に伝達されたn個の共有バンド、及び半数の子供
に伝えられた(61−n)個の異型接合性バンドを
含む場合には、n+0.5(61−n)=36.3であり、
n=12の場合、M及び父親に共通の16個のバンド
(上記参照)の概算値と一致する。
XのDNA指紋は、21の父特異性断片と40のM
と共有するバンドからなる。母特異性であり、父
と共有でない後者のバンドの割合は、2つの方法
で算出される。第一に、母特異性バンドの数は、
父特異性の数とほぼ等しく45/2=22.5である。第
二に、Xにおける40の母性バンドのうちn個(約
12)は、共有の母性/父性バンド(前記参照)で
あり、Xに28の母特異性バンドを残す。Xが彼の
母親から特異的に獲得した断片の数は従つて、約
25である。
バンド共有の確率
1個人における断片が第二の任意の人における
同様な電気泳動移動度及びオートラチジオグラフ
強度のバンドによつて一致する平均確率は、x
(x=0.2−0.26、前記参照)と定義される。ミニ
サテライト断片が大きい程、恐らく、対立遺伝子
頻度が低くなり、電気泳動分離が良くなるので、
共有される頻度は少なくなり、従つて断片共有確
率xは不均一である。ほとんどすべての断片は、
独立して受け継がれるので、個人におけるn個す
べての断片が第二の任意の個人に存在する最高確
率は、従つて、xnである。xにおける不均一性
は、この確率を低下する。
同胞間のバンド共有
共有されるバンドが、常に、同じ超可変座の同
一の対立遺伝子を表す場合には、xはx=2q−q2
によつて平均対立遺伝子頻度qに関係し、これに
より個人における所定のバンドが同胞にも存在す
る確率は(4+5q−6q2+q3)/4(2−q)であ
ることが示される。
x=0.26であるから、qは0.14であり、記録に
より共有されている、第一の同胞に存在するバン
ドの割合は、0.62である。この確率は、任意の人
によつて共有されるバンドが決して同一の対立遺
伝子でない、即ち、多数のミニサテライトが同一
の大きさの対立遺伝子を有すると仮定すると、僅
かに低下する。
遺伝病の分析へのDNA指紋の適用
ヒトにおける連鎖分析、特に、大きい家系にお
ける病気の座と一緒に分離される超可変DNA断
片の研究のため、DNA指紋を使用する可能性を
測定するため、2つの大家族のDNA指紋を調査
した(一方は神経線維腫症に関して分離し、他方
はβ−グロビン遺伝子集団に連鎖しない常染色体
優性遺伝子によつて明らかに測定される胎盤ヘモ
グロビンの遺伝的残存に関して分離した)。
例 8
神経線維腫症に罹病した同胞群のDNA指紋に
おける超可変ミニサテライト断片の分離
Hinfで消化した血液DNA試料を長さ35cm
の0.7%アガロースゲル上で電気泳動し、ミニサ
テライトプローブ33.6及び33.15に対してサザン
法でハイブリツドを形成させた。罹病していない
父親(F)、5人の息子(S)及び6人の娘(D)
について、DNA指紋を第7図に示す。罹病した
母親は研究に利用しなかつた。多数の神経線維腫
にかかつた子孫は(+)で示し、残りの子孫は、
神経線維腫症の徴候を示さなかつた。分離した父
性(●)及び母性(○)異型接合性DNA断片を
示し、短期間、中期及び長期照射でとつたオリジ
ナルオートグラフから直接、子孫への分離を記録
した。それぞれの子孫における位置及び相対的強
度が両親のものと一致するDNA断片だけを記録
した。AB又は−−を子孫に分離するDNA断片
の連鎖対ABは、連続線によつて結合されてい
る。A−及び−Bを分離する対立遺伝子は点線で
結合されている。神経線維腫症に対する相引状態
での連鎖の証拠を示す一つの母性断片は、星印で
示し、罹病した6人の子孫全員は、この断片を受
け継ぎ、罹病していない子供5人のうち4人はこ
のバンドを持たず、このバンドの遺伝と神経線維
腫症との間に10/11の一致を生じる。
材料及び方法
DNA単離
新鮮な血液を等容量の1xSSC(SSC、クエン酸
ナトリウム食塩水、0.15MNaC1、15mMクエン
酸三ナトリウム、pH7.0)、ヒストペーク
(Histopaque−1077)(Sigma)上に積層し、遠
心分離により有核細胞を集めた。或いは、凍結し
た血液を二倍容量の1×SSC中で解凍し、10000g
で15分間、遠心分離することにより有核細胞及び
核をペレツト化した。Jeffreys、A.J.著、
(1979)、Call、18、1〜10に記載されているよう
にして高分子量DNAを製造した。
サザン法による分析
ヒトDNAの試料5μgを4mMのスペルミジント
リクロリドの存在で20単位のHinfを用いて37
℃で2時間消化し、フエノール抽出及びエタノー
ル沈殿によつて回収した。制限消化物を16μlの
H2O+4μlのゲル負荷混合物(フイコール400
12.5%、ブロモフエノールブルー0.2%、トリス
アセテート0.2M、酢酸ナトリウム0.1M、EDTA
1mM、pH8.3)及び5mg/mlエチジウムブロミ
ド2μl中に溶解し、水平アガロースゲル(トリス
アセテート40mM、酢酸ナトリウム20mM、
EDTA0.2mM,エチジウムブロミド0.5μg/ml
(pH8.3)中の0.7%シグマ(Sigma)型アガロ
ース、厚さ0.7cm×長さ20cm又は35cmのゲル)上
に置いた。10分間平衡化した後、長さ1.5kb未満
のDNA断片すべてがゲルから電気泳動するする
まで、2V/cmで24〜48時間ゲルを電気泳動した。
ニトロセルロースフイルター(Sart−orius、孔
径0.45μm)上にブロツテイングさせることによ
りDNAを転移させた。ヒトミニサテライトM13
組み換え型33.6及び33.15から、32Pでラベルした
一本鎖プローブDNAを製造し、1xSSC中で65℃
でサザン法によるブロツトに対してハイブリツド
形成をし、主たる用途に記載したようにオートラ
ジオグラフイする。
データ分析
BBCモデルBマイクロコンピユーターに分離
データ及び連鎖の分析を記憶させた。
第2表には、神経線維腫症の家族におけるミニ
サテライト標識をまとめる。
【表】
記録された種々の座の数(c)は、n−a−b
によつて得られる。未分離、従つて未記録の断片
を含むDNA指紋全体を、N個の異型接合性座
(2N断片)から誘導する。記録された(n−b)
の明らかな断片がDNA指紋における2Nのバンド
の無作為試料であると仮定すると、所定のプロー
ブによつて検出される超可変座の概算の総数N
は、下記の式により対立遺伝子対の数に関係す
る:
N=1/2[(n−b)(n−b−1)/2a+1]
【表】
超可変断片の伝達頻度(第7図)を研究するた
め、11人の同胞における正確にr人の子供に伝達
され、記録されたn個のうち、プローブ33.6及び
33.15によつて検出される断片の数を、伝達率50
%(第4表)と仮定して、二項分布11Cr・n/211に
よつて得られる予測数と比較した。子供全員に存
在する断片は同型接合性座からのものであつてよ
く、無視された。どの子供にも伝達されなかつた
母性断片は、母性DNAを利用できなかつたので、
記録できなかつた。平均伝達頻度(+S.E.M.)
も得られる。
最初に除外された対立遺伝子及び連鎖したバン
ドを有する父性又は母性断片の可能なすべての対
での比較を使用して、AB(AB又は−−)に関し
て一致する子孫の数を記録することによつて断片
の対ABの間の連鎖を調べた(即ち、c座を各両
親について分析した。第3表参照、c(c−
1)/2の対照比較を得る)。0又は11人の子供
群中に現れる断片の対は、それぞれ対立遺伝子又
は緊密に連鎖した対を表す。定義により、対はど
の群にも属さない。観察された分布をc座のすべ
てが連鎖されていない場合(U)の予測値と比較
する。この場合、正確にr(AB又は−−)の子
孫を与える対による比較の数は、二項分布
11Cr/211・c(c−1)/2によつて得られる。更
に、
c座が密集し、均一に離れており、隣接する座が
組み換え頻度θによつて分離されている(10,20
又は30cM離れている)場合に予測されるものと
分布を比較する。従つて、集団は、(c−1)ψ
座単位〔式中、ψ=−1/21n(1−2θ)〕にわた
つて広がつているであろう。c座(一方又は他方
の対立遺伝子のところで無作為に抽出)に関し
て、11人の同胞群中の正確にr(AB又は−−)
の子孫を生じる対による比較の数は、下記の式に
よつて得られる:
〓i=c−1
(c−i)11Cr
i=1[xi 11-r(1−xi)r+xi r(1−xi)11-r/2]
〔式中xiはi図単位離れた2個の座の間の組み換
えフラクシヨンであり、xiはマツピング関数:
xi=1/2(1−e-2iψ)
によつて得られる〕。
結 果
DNA指紋プローブ
この研究に使用する2種のミニサテライトハイ
ブリツド形成プローブを、主な用途で詳述する。
プローブ33.15は、コア配列の16bp変異体が29反
復して成るクローン化したヒトミニサテライトか
ら成る。プローブ33.6におけるミニサテライトの
反復単位は、コア配列の最も保存された11bp3′末
端の種々の三量体であり、18回反復される。コア
及びプローブ反復単位の配列は、下記のとおりで
ある:
A
コア GGAGGTGGGCAGGAGG
33.15 AGAGGTGGGCAGGTGG
33.16 AGGGCTGGAGG
プローブ33.6及び3.15プローブの配列及び反復
長における差異により、ヒトDNAのHinf消
化物中の長い超可変ミニサテライト断片の異なる
パターンを検出することになる。この4bp制限エ
ンドヌクレアーゼは、小さなフランキングDNA
を有するDNA断片における長い縦列−反復性ミ
ニサテライトを放出することによつて種々のミニ
サテライトの分離を最大にする。
大きい同胞群におけるDNA指紋の分析
個々のミニサテライトDNA断片の分離を調べ
るため、11人の英国人の大きい同胞群を神経線維
腫症〔レツクリングハウゼン(Recklinghausen)
氏病の〕、末梢及び中枢神経系の腫瘍に伴う常染
色体優性障害について分離した。遺伝的標識形質
は、まだ、この病気に連鎖されていなかつた。
11人の子供(6人は罹病、5人は未罹病)の、
プローブ33.6及び33.15で検出される血液DNA指
紋を、第7図において、かれらの未罹病の父親と
比較した。ミニサテライトDNA断片の分離を、
長さ35cmのアガロースゲルでの電気泳動によつて
最大にした。
これらの超可変ミニサテライトの多く、特に極
めて大きいDNA断片は、低い対立遺伝子頻度を
有し、前記のように血縁のない個体には、ほとん
ど受け継がれないので、神経線維腫症の家族にお
けるこれらの断片の多くは、異型接合状態で存在
し、後代の若干の者にのみ伝達される。罹病した
母親のDNAを入手できない場合でさえ、母に由
来するミニサテライト断片を、若干の子孫には存
在するが、父親には存在しない断片として容易に
同定することができた。父性断片も同様にして同
定することができた。プローブ33.6及び33.15を
用いて、この同胞群における41の父性DNA断片
及び32の母性DNA断片の分離(第7図、第3表)
を記録することができた。多数の付加的多形断片
も存在するが、ゲルから電気泳動で除去されるか
又は不完全に分離され、従つて、確実には記録で
きなかつた。
この大きい同胞群におけるすべての父性又は母
性DNA断片の分離パターンを対で比較すること
によつて、断片の対立遺伝子対及び相引状態での
緊密な連鎖を示す対を同定することができる(こ
の同胞群におけるバンドの所定の対の同時分離の
可能性は1/1024である)。父性及び母性断片の対
立遺伝子対の若干の例を、両方のプローブで同定
することができた(第7図)。また、プローブ
33.6は母親及び父親に断片の連鎖対を検出した。
同様な連鎖は、第二の家系(以下に示す)に見ら
れ、これは、プローブ33.6にハイブリツド形成す
る少なくとも1つの超可変領域が、Hinfに関
する内部開裂部位を含み、従つて、開裂して家系
におけるミニサテライト“ハプロタイプ”として
同時に分離する2個以上の断片を生じる長いミニ
サテライト/サテライトであることを示唆する。
プローブ33.15を用いて記録した多形DNA断片
は、33.6によつて検出される断片の組み合わせに
は存在しなかつた。両方のプローブにハイブリツ
ドを形成した、このような断片は、同じ親から同
じ子供へ伝達された(即ち、“連鎖した”)等しい
大きさのバンドとして検出されたであろう。従つ
て、これらの2種のプローブは、ヒトミニサテラ
イトの本質的に完全に異なるサブセツトにハイブ
リツドを形成する。
対立遺伝子及び連鎖した断片を排除することに
よつて、父親及び母親にそれぞれ34及び25の明瞭
な座が記録される(第3表)と結論された。座の
約80%に関して、2個の対立遺伝子の1個だけが
分離され、第二の対立遺伝子は恐らく比較的短い
ミニサテライト断片のあまり分離されていない複
合体に存在する。このことは、恐らく、これらの
縦列反復領域における等しくない交換によつて起
こる、ミニサテライト対立遺伝子長に大きい差異
が存在することを意味する。第7図において確認
された数個の対立遺伝子対は、実際に、実質的な
長さの差異を示す。対立遺伝子中に対合しうるバ
ンドの割合から、プローブ33.6及び33.15によつ
て検出される全DNA指紋に存在する異型接合性
座の総数は、約43〜66であると概算することがで
き、このうち約半数は父親及び母親に記録される
(第3表)。この同胞群における父性断片と母性断
片との間の対立性を測定することはできない。
記録された父性座のすべては、常染色体性であ
り、娘(X連鎖)又は息子(Y連鎖)への特別な
伝達を示さない。更に、父性DNA断片のすべて
の対ABは、明らかに独立して子孫に分離して、
平均して同数の(AB、−−)又は(A−、−B)
後代を生じる。正確な数は、連鎖しない座に関す
る予測される2項分布に従う。母性DNA断片は
同様な挙動を示した。更に詳細に分析すると、こ
れらの座に関する最小の座−座間隔は、≦30cM
(46図単位)でなければならないことが判る。そ
れより間隔が狭いと、同時に分離(カツプリング
状態で連鎖)するか、又は偽対立遺伝子として分
離(相反状態で連鎖)する傾向のある断片の対を
相当数生じる(第4表)。従つて、分離可能なミ
ニサテライト座は、長さ3000cMのヒトゲノムの
少なくとも半分にわたつて広げられていなければ
ならなず、従つて、ヒトの常染色体の多数又は全
部にわたつて散乱していなければならない。
一つの母性ミニサテライト断片(第7図)は、
神経線維腫症とのカツプリング連鎖の弱い証拠を
示し、10/11人の子供はこの断片及び病気に関し
て一致している。(θ=10cM、p=0.006)。しか
しながら、25個の異なる母性遺伝子座が記録され
たので、これらの座の少なくとも1個の対立遺伝
子が、偶然に、カツプリング又は相反状態での観
察される連鎖度を示す確率は、高い(p=0.24)。
例 9
広い家系のDNA指紋:HPFHへの可能な連鎖
β−地中海貧血症及び遺伝性高胎児ヘモグロビ
ン血症(HPFH)について分離するグジヤラー
ト人の広範な4世代家系にDNA指紋の分析を広
げた。
第8A図及び第8B図に示した標識分離パター
ンのオートラジオグラフを下記のようにして調製
した。
血液DNAの10μgの試料をHinfで消化し、
プローブ33.6(A)又は33.15(B)を使用して、
第7図に記載したようにしてDNA指紋を調製し
た。比較的短い(20cm)のアガロースゲルで電気
泳動を行つた。個人の間の関係を第9図に示す。
Aでは、超可変断片a,b及びcは緊密に連鎖
し、家系の各個人にすべて存在するか又はすべて
存在しない。Bでは、バンドg及びHPFH(H)
が同時に分離する。個人7及び8は、一卵性
双生児であり、区別できないDNA指紋を有する。
材料及び方法は、例8と同じであつた。
同時分離分析を第9A図及び第9B図に示す。
第9A図において、4からの30個の超可変断
片及び5からの27個の断片の、子孫1−11
への分離を、両親の断片の対ABの可能な連鎖に
ついてスクリーニングした。少なくとも6/7の
(AB、−−)子孫を示す連鎖の可能な例を更に付
加的血縁関係で調べた。2つの極めて明瞭な連鎖
例を示す(a−f、個人における断片a−fの存
在;・断片不存在)。断片a−c及びe,fはそ
れぞれ完全な同時分離を示し、断片dは、a−c
と同時に分離する傾向を有するが、同胞1−4
は、情報を与えず、一卵性双生児7,8は、遺
伝したa−cを有するが、dを有しない組み換え
型である。第9B図には、β−地中海貧血症形質
(〓、〓)、HPFH(H)及びミニサテライト断片
gの遺伝を示す。個人が>1%HbF(正常)又は
>3%HbF(β−地中海貧血症形質)を示した場
合、その個人は、HPFHを有するものと記録す
る。HPFH及びβ−地中海貧血症形質は、1
−11及び5−8に独立して分離し、連鎖しな
い座によつて測定される。断片gは、試験した個
人においてHPFHと完全に同時に分離する。
結 果
第9図A及びBに示したように、HbFの上昇
は、β−地中海貧血症形質とは独立して伝達さ
れ、明らかにβ−グロビン遺伝子集団に連鎖して
いない常染色体優性座によつて測定される。同様
なサルデーニヤ人の家系はGianniらによつて
EMBOJ.、2、921〜925(1983)に報告されてい
る。
第8A図及び第8B図には、祖父(4)にお
ける30の種々の断片及び祖母(5)における27
の断片を記録した。彼らの7人子孫(1−1
1)の研究により、神経線維腫症家族に関して記
録した基準を使用して、これらの断片は少なくと
も22の明瞭な非連鎖父性常染色体座及び18の母性
常染色体座から由来することが分かつた。残りの
DNA断片は、対立性又は他の断片への連鎖を証
明するが、この小さい同胞群での証明は可能では
ない(両親のDNA断片の所定の対は、7の同胞
群に連鎖して又は対立遺伝子として偶然に伝達さ
れる1/64の可能性を有する)。更に、家系の追加
の人員において、連鎖の証拠を探し、2つの極め
て強い連鎖例を第8図及び第9図に示す。プロー
ブ33.6によつて検出される断片a,b及びcは、
4からその子供(1−11)及びそれから孫
(1−8)に完全な連鎖で伝達される。組み換
え型は、14人の情報を与える後代に見られる(同
時に分離するバンドに関してp=4×10-9)。上
記のように、これは、断片a−cが一つの超可変
座から由来するミニサテライト“ハプロタイプ”
を表すことを意味する。また、プローブ33.15に
よつて検出されるバンドdは、バンドa−cへ連
鎖したことを証明する。しかしながら、一方の同
胞群(1−4)は、両親が断片dを有するの
で、情報を与えない、そして、他方(5−8)
は組み換え型を含む(一卵性双生児7,8)。
バンドdとa−c集団との間の連鎖の証明は、従
つて弱い(θ=10cM,p=0.01)。母性バンドe
(33.6によつて検出される)及びf(33.15によつ
て検出される)は4及び5の子孫及び付加的
血縁同胞群15−20及び17−22において緊密な
連鎖を示す(20人の情報を与える後代、組み換え
型なし、θ=0cM、p=10-6)。プローブ33.6及
び33.15がミニサテライトの種々の組み合わせを
検出し、断片e及びfに交雑−ハイブリツドを形
成しないので、これらの断片は2つの異なる常染
色体ミニサテライト座の間の確実な連鎖の例を表
す。最後に、2個の連鎖群(断片a−c及びe−
f)は、同一の座の対立遺伝子ではない。個人の
1は、父性a−c集団と母性e−f対とを有す
る複合異型接合体である。両方の集団は、彼の4
人の子供のうち2人に伝達され、対立遺伝子とし
て分離せず、その代わりに、2つの連鎖していな
い超可変領域から誘導されなければならないこと
を確認する。
母性(5)ミニサテライト断片は、β−地中
海貧血症形質への著しい連鎖を示さず、従つて、
染色体11上のβ−グロビン遺伝子集団へ緊密に
連鎖していない。これに反して、長さ8.6kbの母
性断片(g)は7人の子孫及び孫の3人の情報を
与える同胞群においてHPFHと同時に分離した
(第9図)。緊密な連鎖を示す(θ=0cM、p=2
×10-4)12人の後代においては、組み換え型は認
められなかつた。5における17個の座を調べた
という事実を考慮しても、この連鎖は、なお有意
である(17の記録された座の少なくとも一つの座
の対立遺伝子が偶然にHPFHと同時分離を示す
確率は、0.004である)。更に、5の断片gがた
だ1個のミニサテライト対立遺伝子であり、上に
載つている2つの分離DNA断片でないことを、
Hinfの代わりにSau3Aで消化した、第9図に
示した全個人のDNA指紋を調査することによつ
て検討した。すべての積極的指紋は、ただ一つの
ミニサテライト断片について予測されたように、
断片gと同様の大きさの対応するSau3A断片
(8.2kb対8.6kb)を含んでいた。
考 察
ヒトの家系分析は、ミニサテライトプローブに
よつて検出されるDNA指紋が、一方又は他方の
両親を研究に利用できない家族においてさえ、多
数の異型接合性DNA断片の分離を研究するため
確実に使用できることを示す。このような2つの
プローブを使用して、1個人において同時に34個
までの超可変座を分析することができ、ヒトの遺
伝学において、RFLPを含めて、従来法で得られ
るよりはるかに高い遺伝的標識形質生成速度を分
析することができる。個々の断片の低い集団頻度
と一緒に種々のミニサテライト断片の安定な遺伝
により、分析された2つの家系に発見された連鎖
例に示されるように、それらの断片は連鎖分析に
理想的に好適になる。これらの超可変ミニサテラ
イトは組み換えホツトスポツトでありうるが、長
いミニサテライトで起こる不等交換の予想率(1
配遇子当たり約0.001)は、ミニサテライト座と
近隣遺伝、例えば病気の座との間の連鎖を著しく
混乱されるには充分ではない。
ミニサテライトプローブ33.6及び33.15によつ
て一緒に検出される超可変座の総数は約60である
と算定される。これらの座の約半分の2個の対立
遺伝子の少なくとも1個は、所定のDNA指紋で
分離することができ、従つて、DNA指紋が異な
れば、試験した座のスペクトルは同一ではなくな
る。これらの座のほとんど又は全部は、遺伝的に
は連鎖していず、従つて、ヒトゲノムの相当な割
合にわたつて散乱していなければならない。それ
らの正確な位置は、分かつていないので、クロー
ニング及び個々の超可変ミニサテライト座の領域
的位置決定を待たねばならない。奇妙にも、研究
したどちらの家系においても、X又はY染色体上
にミニサテライトはまだ認められなかつた。約43
の異なる座を、HPFH家族における個人4と
一緒に、神経線維腫症家族の父親における可能な
伴性について記録した。X及びY染色体は一緒に
雄のゲノムの約5%を構成するので、43の無作為
に分散した座がこれらの染色体上に存在しない確
率は、(0.95)43=0.1である。従つて、伴性ミニサ
テライトの見かけ上の欠損は、有意ではない。
これらの分散した超可変ミニサテライト座は、
神経線維腫症及びHPFHへの連鎖の仮の例によ
つて示したように、病気の座に連鎖した標識の研
究に好適である。従来の単座遺伝分析とは異な
り、異なるミニサテライト対立遺伝子は、各家系
における病気の座と関連していると思われるの
で、血縁のない小さい家系の間では、連鎖データ
を集めることができない。その代わりに、DNA
指紋だけが、広範な家系において及び最も理想的
には、ただ一つの大きい同胞群において、特に優
性障害の連鎖の研究に適当である。
ここまでで、プローブ33.6及び33.15は、個人
において、34までの常染色体超可変座を記録させ
る。これらの座の少なくとも一つが所定の病気の
座に緊密に連鎖する可能性は、長さ3000cMのヒ
ト連鎖図へのミニサテライトの任意分散を仮定し
て、20%である。HPFH家族のような広範な家
系については、ほとんどの座のただ1個の対立遺
伝子が記録されうるので、この確率は約10%にな
り、連鎖を検出するには、この対立遺伝子は病気
の座に相引状態で連鎖しなければならない。これ
らの確率を50%以上に上げるには、一つの大きい
同胞群において104を越える超可変座の記録及び
広範な家系において208を越える座の記録が必要
である。これらの数は、これまで使用した2種の
ミニサテライトプローブによつて検出される座の
総数を越える。しかしながら、プローブ33.6及び
33.15は、超可変遺伝子座の異る組合せを本質的
に全体として検出し、これは、種々のコア配列を
含むヒトミニサテライトの総数が大きいことを示
唆する。
定義された単座標識を使用する従来のヒト家系
分析においては、標識と病気の座との間の連鎖の
証明は、通常直接、病気の遺伝子のおよそのゲノ
ムの位置を与え、付加的家系を分析することによ
つて更に確立することができる。DNA指紋に関
しては、逆も真である。超可変DNA断片と病気
との間の可能な連鎖を更に分析することは、分取
用ゲル電気泳動及びクローニングによつて断片を
単離して可能になる。ミニサテライトを直接挟む
特異的配列セグメントを使用するか、又は高スト
リンジエンシーハイブリド形成における体ミニサ
テライトを使用することによつて、単離されたミ
ニサテライトから遺伝子座特異的ハイブリダイゼ
ーシヨンプローブ設計することができる。このよ
うな座特異性プローブは、連鎖データを付加的家
族に広げるため及びヒトゲノム内にミニサテライ
トを局在化させるため使用することができる。こ
のアプローチは、グジヤラート人の家系におけ
る、明らかにHPFHに連鎖した8.2kbSau3Aミニ
サテライト断片をクローニングすることによつて
現在確認されている。
前記のように、それぞれがコア配列の異なる変
異体を含むヒトミニサテライトから成るプローブ
33.5、33.6及び33.15は、異なるDNA指紋を生じ、
従つて、ヒト及び他の脊椎動物のDNAにおける
超可変ミニサテライト領域の種々の組み合わせを
検出する。特に、プローブ33.6及び33.15は、各
プローブに存在する反復コアの長さ及び正確な配
列に差異がある結果として、ミニサテライトの
種々の組み合わせを大部分又は全部検出する(第
三の用途及びA.J.Jeffreys、V.Wilson、S.L.
Thein、D.J.Weatherall&B.A.J.Ponderによる
“DNA‘指紋’及びヒトの家系における連鎖分
析”参照)
他のコア配列の縦列反復を使用して付加的超可
変領域を検出する可能性を試験するため、一連の
合成ミニサテライトを製造した。
例 10
人工ミニサテライトの合成及びクローニング
多コアプローブを製造するアプローチを第10
図に概説する。第10図はE.コリ(E.coli)のク
ロスオーバーホツトスポツトイニシエーター配列
(Chi,GCTGGTGG)のクローン化した縦列反
復を製造する方法を説明するものである。ポリー
Chiプローブを作る工程は、標準DNA技法を使
用し、下記のとおりである:
1 長さ8ヌクレオチドのChi配列の縦列反復を
含む合成オリゴヌクレオチドを、H.W.D.
Mattesらの(1984)(EMBO J.、3、801〜
805)及びD.G.Brenner&W.V.Shaw(1985)
EMBO J.4、561〜568の方法によつて製造し
た。Chiの相補配列のダイマーから成る第二の
オリゴヌクレオチドを合成した。
2 これらの2種のオリゴヌクレオチドを10mM
MgCl2、10mMトリス−HC1(pH8.0)中で37
℃で一緒にアニールして、DNAの短い二本鎖
セグメントを形成した。第二のオリゴヌクレオ
チドの配列を、頭−尾連結に適当な3−ヌクレ
オチド長の5′突出末端を有するアニールした分
子を生じるように選択した。
3 T4ポリヌクレオチドキナーゼ及びATPを用
いて5′末端を燐酸化した。
4 アニールしたDNA断片をT4 DNAリガーゼ
及びATPを用いて頭−尾法で一緒に連結させ
て反復したChiポリマーを製造した。
5 連結したポリマーを1.5%アガロースゲルで
の電気泳動により大きさで分離し、長さ150塩
基対より大きいポリマーをDE81ロ紙上での電
気泳動により単離した(Dretzen,G.、
Bellard,M.、Sassone−Corri,P.&
Chambon,p.、1981年、Anal.Biochem.、
112、295〜298)。
6 回収した長いポリマーをE.コリDNAポリメ
ラーゼのクレノウ断片を使用してフイルイン
修復によりブラント末端とし、
M13mp19RFDNA(J.Messing&J.Vieira、
1982.Gene 19、269〜276)のSma部位中に
連結した。連結したDNAをE.コリJM101中に
形質転換し、個々の白色プラークから一本鎖フ
アージDNAを単離した。
7 各クローン化単離物のDNA挿入部をジデオ
キシヌクレオチド法(M.D.Biggin、T.J.Gibon
&H.F.Hong、1983.Proc.Nat.Acad.Sci.USA
80、3963〜3965)によつて配列させて、ポリマ
ー挿入部の長さ、方向及び配列を測定した。成
熟一本鎖フアージDNA中に5′→3′に指向する
Chi配列の50の縦列反復を含む組み換え型M13
フアージが見出され、これをM13・コアAと言
う〔即ち、挿入部は、ポリ(Chi)であり、ポ
リ(Chiの相補体)ではない〕。
8 32P−標識一本鎖ハイブリツド形成プローブ
を、フアージ33.6及び33.15からプローブを製
造するのと同じ方法を用いて、プライマー・エ
クステンシヨン法により製造した。
例 11〜15
5個の更に新しい人工ミニサテライトの製造
上記の技法を用いて、更に5種のコア配列を合
成し、M13に多コア組み換え型としてクローン化
して、組み換え型M13・コアA−Fを得た。コア
の長さ及び正確な配列を変えるようにコア変異体
を選択した。第5表には、クローンM13・コアA
−Fにおける反復配列をコア配列及び初期の用途
で記載した、前に使用したプローブ33/5、33.6
及び33.15と比較してまとめる。コア配列におけ
る極めて変化しない塩基に下線を付ける。ベクタ
ーM13mp19中の各挿入部の指向も示す〔→は、
挿入部がポリ(コア)であり。←は、挿入部がポ
リ(コア)の相補配列であることを示す。〕小文
字で書かれた塩基は、コア配列からの離脱を示
す。各配列の簡単な特性を“注釈”にまとめる。
【表】
例 16
Hinfで消化したヒトDNAへのM13・コアA−
Fのハイブリツド形成
初期スクリーニングにおいて、2人の血縁のな
い個人のDNA消化物を33.15及びプローブM13・
コアA−Fのそれぞれで探索した。2個の血縁の
ない胎盤(1,2)からのDNAの8μgの試料を
Hinfで消化し、0.7%アガロースゲルで電気
泳動し、サザン法でプロツトし、主用途に記載し
た操作により32Pでラベルした各プローブに対し
てハイブリツドを形成させた。生じるオートラジ
オグラフを第11図に示す。全プローブは、各個
人における多数のDNA断片を検出した。
結 果
プローブB,C及びDは、それぞれ、2人の個
人の間で実質的に異なるDNA断片の指紋を検出
した。指紋は、プローブによつて変動するが、若
干の断片は1個より多数のプローブによつて選出
され、ある程度、プローブ33.15によつて検出さ
れる超可変断片の組み合わせと重なつた。プロー
ブB−Dは、すべてDNA指紋作製に適当であり、
一緒に、ヒト及び他の脊椎動物において試験する
ことができる超可変ミニサテライトの数を拡張す
ると結論する。ここで、コア配列の中心の最も保
存される7塩基対セグメントだけを含むコアCを
用いて得られる有効な指紋は、重要である。
コアの先端を更に切断してコアEにおける6塩
基対反復を生成させると、DNA指紋パターンは、
完全に変化して、試験した2人の個人によつてほ
とんど共有されている断片の組み合わせを示した
(即ち、これらの断片は極端な多形変化を示さな
い)。従つて、コアEは、DNA指紋分析に対し
て、前に使用したプローブ33.5、33.6及び33.15と
同程度に有用なプローブであるとは思われない。
このことは、また、一般に有効なDNA指紋作製
には、実際に最低7塩基対のコア配列が必要であ
ることを示唆する。また、コア(M13・コアG)
の中心の最も保存的領域の破壊は、DNA指紋パ
ターンの複雑さ及び変動性を低減すると思われ
る。
M13・コアA(ポリChi)は、ハイブリツド形
成DNA断片の新規かつ強いパターンを生じる。
これらの断片の多くは、極めて大きく(>
15kb)、あまり分離されず、場合によつては存在
するHinf開裂部位を含む従来の長いサテライ
ト配列から誘導されるであろう。幾つかのDNA
断片は個々の可変性を示す。
例 17
コアAの詳細な試験
プローブ33.6及び33.15を使用して広範に特性
決定した神経線維腫症に罹病した家族で、M13・
コアAによつて製造されたパターンを更に分析し
た(例8及び第7図参照)。第12図には、父親
(F)、6人の娘(D)及び5人の息子(S)から
のDNAのHinf消化物からのDNA指紋を示
す。常染色体優性遺伝癌である神経線維腫症に罹
病した個人は、+で示す。罹病した母親からの
DNAは入手できなかつた。分離する父性(●)
及び母性(○)バンドを示す。実線で結合したバ
ンドは、連鎖され、点線で結合されたバンドは対
立遺伝子として分離する。(x)を付けたバンド
は、プローブ33.15を用いて予め検出された。
結 果
プローブ33.6及び33.15を用いて得られたDNA
指紋とは異なり、変動性のレベルは比較的低く、
多数の断片がすべての子孫に伝達される(即ち、
これらの断片はその集団において一般的であり、
まれではなく、しばしば同型接合状態で存在す
る)。6個の異型接合性父性バンド及び9個の異
型接合性母性バンドの分離が、11人の子供の同胞
群で記録された。父性バンドの一つ及び母性バン
ドの対立遺伝子対をプローブ33.15で予め検出し
た。バンドの対立遺伝子対及び連鎖した対を排除
した後、2個の新しい父性遺伝子座及び6個の新
しい母性遺伝子座をプローブ33.6及び33.15で予
め記録されないまま残し、予め記録された34個の
父性遺伝子座及び25個の母性遺伝子座と比較す
る。従つて、ポリChiプローブは、ヒトの遺伝分
析に限られた用途を有する。
例16及び17の結果は、第5表の最上列に下線を
付け、主用途の個所に論じた9個の優性ヌクレオ
チドの重要性を確認させる。これらは、また、有
効なプローブコアには、ヌクレオチド6個の最小
配列が必要であるという、主用途において行つた
予言を確認するのに大いに有効である。従つて、
コアEは、最小利用性を表し、ヌクレオチド6個
の他の配列、例えば以下に論じる配列TGGGCA
は、限界的に改良された利用性を示すことができ
る。ヌクレオチド7個への増加は、調査の枠内で
極めて劇的である。
有用なコア配列の本質的要素を明確にする試み
において、代わりのヌクレオチドを示すため上に
使用した変異体X及びYを、下記のように完全な
理論に有用に広げることができる:
X=A又はG P=Gではない
Y=C又はT (Q=Aではない)
W=A又はT (R=Cではない)
V=C又はG (S=Tではない)
(O=任意)
( )=下記の考察には利用していない。
この用語を使用すると、本発明の態様は、下記
の反復コア配列:
GPGGGCWGGWXG (6)
を含むポリヌクレオチドを含むと言うことができ
る。
前記の配列は、もちろん、最も代表的な12個の
ヌクレオチドの配列を示す。しかしながら、7ヌ
クレオチドのコアCも著しい利用性を有すること
が判り、上記の12コア配列からの“許容された”
変異体を有するものを含めるため、一つの態様
は、下記の7コア配列:
PGGGCWG (7)
の反復を含むポリヌクレオチドをも含むと言うこ
とができる。
もちろん、PはコアCにおけるのと同様にTに
等しいのが好ましい。他の最も好適なものは、A
であろう。
明瞭にするため、相同パーセンテージは第3表
に既に示した。この用途の人工プローブに関して
は、反復は正確は反復であつて、全体としてのミ
ニサテライトの相同性はコア配列の相同性によつ
て示すことができる。このことは、相同性を括弧
内に示した前記のプローブ33.6、33.15及び33.5に
は必ずしも真実でない。これは、反復間に生じる
変異体による。コアFは、恐らく、有用性に関し
て最低相同率を示す。しかしながら、この不一致
は、恐らく、コア中に存在する中心基:
TGGGCA (8)
の破壊によつて誇張された。前記の基が最も有効
なプローブB,C及びD中に存在し、あまり有効
でないプローブA,E及びFのすべてにおいては
破壊されていることは注目に値する。従つて、式
(6)を有する最低70%の全相同率を有する更に有効
なプローブが得られることが予想される。
式(8):
TGGGCA (8)
の中心6ポリヌクレオチドがコアE中でも破壊さ
れていることは注目に値する。恐らく、前記の6
ヌクレオチドコア配列は、更に有効であるが、長
さをヌクレオチド6から7に増加すると、更に優
性な特性が証明されることが予想される。
従つて、本発明の態様は、コア配列TGGGCA
の反復を含むポリヌクレオチドを含むと言うこと
ができる。
更に一般的には、本発明は、一態様として、す
べての反復配列中に配列TGGGCAが存在する前
記の“第一の”定義によるポリヌクレオチドを含
むと言うことができる。
別の態様から見れば、本発明は、コアが、式(2)
に示した配列から選択された、同じ5′→3′の意味
で読まれる、少なくとも6個の連続したヌクレオ
チドの配列を表す前記の“第一の”定義のポリヌ
クレオチドの変性を含むと言うことができる。
“コア”は、すべての単位が配列TGGGCAを含
む限り、各反復単位に同じ配列を必ずしも有しな
い。
各単位の残りの基は、全単位長の束縛の範囲内
で式(6)(又は更に好ましくは(2))の配列と少なく
とも70%の相同率を有する。
〓出生時の双生児接合性(zygosity)の測定
双生児における接合生殖性の測定は、疫学的、
遺伝的及び産科学的研究のためばかりでなく、一
卵性と二卵性双生児との予測に差異があるので、
重要である。一卵性双生児は、二卵性双生児より
出生率が低く、体重が低く、医学的合併症が多
く、死亡率が高い。カフカズ人では、新生児の約
30%が異なる性を有し、従つて二卵性である。胎
盤膜を試験すると、別の20%の事例が単絨毛膜性
であり、これらは常に一卵性であることが判る。
残りの50%は、集団のうちで比較的一定な割合で
あり、同じ性を有し、二絨毛膜二羊膜胎盤を有
し、一卵性又は二卵性でありうる。これらの場合
の接合生殖性を測定するため、一般的外観の評
価、指紋、皮膚移植片、味覚試験及び遺伝的標識
形質の測定を含めて種々の方法が使用された。後
者は、95〜98%の精度で、最も信頼性がある、し
かし、ほとんどの蛋白質及び抗原変異体の平均異
型接合性が比較的低いので、通常、このような標
識形質を多数、調べなければならい。
下記の例では、12組の新生双生児からのDNA
を、前記のようなミニサテライトDNAプローブ
を用いて試験した。得られたDNA“指紋”は、個
人ごとに変化し、一卵性双生児だけが同一のパタ
ーンを示すことを証明する。性観察又は胎盤試験
から接合性(zygosity)を決定することのできた
7例いおいては、DNAの結果はこれらの所見と
一致した。他の5組の双生児対及び2組の三つ子
において、DNA分析により接合性(zygosity)
を迅速に測定することができた。従つて、本発明
によるDNAプローブは、多胎妊娠のすべての場
合に、接合性(zygosity)を積極的に測定するこ
とができる一つの遺伝的試験を提供する。
例 18
一本鎖DNAプローブ33.6及び33.15を使用して、
12組の新生双生児の接合性(zygosity)を測定し
た。その詳細を第6表に示す。
【表】
出産時に集めた臍帯血液の試料又は誕生の翌日
に各乳児から得た末梢血液の試料(0.5〜1.0ml)
をDNA抽出のため使用した。胎盤を試験して、
胎盤が単又は二羊膜性及び単又は二絨毛膜性であ
るかを測定した。DNAを標準法(Old,J.M.、
Higgs,D.R.著、遺伝子分析、D.J.Weatherall、
編集、The Thalassaemias.血液学における方
法、チヤーチル・リビングストーン、1983)によ
つて抽出し、10〜15μgをHinfで消化した。試
料を長さ22cmの0.6%アガロースゲルで45Vで約
36時間、長さ1.5kb未満のDNA断片がすべて、電
気泳動によりゲルから除かれるまで、電気泳動し
た。DNAをニトロセルロースフイルターヘブロ
ツテイングによつて転移させ、真空下に80℃で2
時間ベーキングした。一本鎖DNAプローブ、33。
15及び33.6を前記のように32Pでラベルした。
結果を第13図に示す。
第13図において、列1及び2は、33.6一本鎖
ミニサテライトプローブを用いて、症例1の各双
生児に関して得られたDNAバンドパターンを示
す。例3〜19は、一本鎖33.15プローブを用いて
得られた“指紋”を示し、症例1は、列3及び4
に、症例2は、列5及び6に、症例3は、列7及
び8に、症例4は、列9及び10に、症例5は、列
11及び12に、症例6は、列13及び14に、症例7
は、列15及び16に示す。列17〜19は、女性、男性
及び女性の3人の三つ子を示す。列1及び2を列
3及び4と比較すると、2種のプローブ33.6及び
33.15がミニサテライトバンドの種々の組み合わ
せを検出することが判る。大きさの標識は、キロ
塩基で示す。
7つの症例(第6表参照)では、双生児の性及
びその胎盤膜の試験によつて簡単に接合性
(zygosity)を測定することができた。単絨毛膜
性(又は単羊膜性)胎盤を有する双生児(例え
ば、症例1)はすべて一卵性であるが、一卵性双
生児の約50%が単絨毛膜性胎盤(2)を有するに
すぎなかつた。従つて、症例1における双生児
は、一卵性でなければならず、33.15及び33.6プ
ローブにより同一のDNAパターンを示した(第
1図)。5つの症例においては、双生児は異なる
性を有し、33.15及び33.6プローブにより異なる
バンドパターンを示した。症例3,5,7,9及
び11において、双生児は同じ性を有し、二絨毛膜
性胎盤を有し、一卵性又は二卵性でありうる。
DNA分析により、2組の双生児(症例5及び9)
が異なるバンドパターンを有し、従つて、二卵性
であつたが、他の3組(症例3,7及び11)では
同一のバンドパターンを有し、一卵性を示すこと
が判つた。
2組の新生三つ子を同様に研究した。両方の場
合に、母親は妊娠を誘発するため受精剤を服用し
ていた。各三つ子は、特異なバントパターンを示
した(例えば、第13図、列17〜19)。
結果を第14図に示す。第14図において、列
1及び2は、一本鎖33.15を用いた結果を示し、
列3及び4は、二本鎖33.15を用いて結果を示す。
例 19
一本鎖又は二本鎖プローブは、それぞれの診断
をするのに適切であるが、多数の放射性一本鎖プ
ローブを用いて多数のバンドを区別することがで
きた(第14図)。
これらの一本鎖プローブの代替物として、ほと
んどの実験室で一層親しまれている対応する二本
鎖プローブを使用する可能性を調べた。使用した
二本鎖プローブは、)λ33.15からの“コア”ミ
ニサテライトを含む二本鎖600bp Pst I−Aha
断片及び)λ33.6からの“コア”ミニサテラ
イトを含む二本鎖720bp Hae断片であつた。
これらをDNA1μg当たり0.5−1.0×109cpmの比活
性になるまでニツクトランスレーシヨンによつて
ラベルした。予備ハイブリツド形成及びハイブリ
ツド形成条件は、二本鎖プローブ用のハイブリツ
ド形成緩衝液に1×SSC及び10%デキストラン硫
酸を使用した以外は、前記の標準法に記載したと
おりであつた。フイルターを65℃で1×SSC中で
1時間洗浄し、増強スクリーンを用いて−70℃で
1〜3日間、電気泳動した。
例18及び19の考察
接合性(zygosity)を独立に測定することがで
きた7つの症例において、DNAの結果は、性の
観察及び胎盤試験に基づく結論と一致した。他の
5組においては、ミニサテライトプローブを用い
て接合性(zygosity)の明快な測定が可能であつ
た。同様に、研究した2組の三つ子は三卵性であ
ることが判つた。
性の相違(二卵性)又は単絨毛膜性胎盤(一卵
性)によつては双生児の接合性(zygosity)を測
定できない症例の50%において、遺伝子分析を使
用しなければならない。このような試験による情
報量は、試験する遺伝子座における多型性の程度
及び試験する座の数に比例する。多数の赤血球抗
原及び酵素測定より、集団における関係対立遺伝
子頻度が既知である場合にだけ、95〜98%程度の
接合性(zygosity)の精度を達成できる
(Nylander,P.P.S.著、双生児出産現象、
Barron,S.L.、Thomson,A.M.編集、
Obstetrical Epidemiology.ロンドン、Academic
Press、1983:143〜165)。同様に、数種の異なる
DNAプローブを用いる多数の制限酵素部位多型
性を分析すると、一卵性の“誤つた陽性”の診断
がかなりのパーセンテージで生じる(Derom,
C.、Bakker,E.、Vliet−ineck,R.Derom,R.、
Van der Berghe,H.、Thiery,M.、Pearson,
P.著、DNA変異体を用いる新生双生児の接合性
(zygosity)測定、J.Med.Genet.、1985、22:279
〜282)。本発明によるミニサテライトプローブ
は、この問題を克服している。それというのは、
検出する超可変DNA分節が多数で、著しく変化
しうるからである。前記のように、ハイブリツド
形成ミニサテライト断片は、無作為に選択された
個人の間ではほとんど共有されない。血縁のない
二人の個人が、超可変座の種々の組み合わせを検
出するプローブ33.6及び33.15で同一のDNA指紋
を示す可能性は、従つて、天文学的であることは
既に示した(p<<10-18、例4参照)。断片の約
半分を共有する同胞においては、遺伝的同一性を
このように“誤つた陽性”に診断する確率は、<
10-8である。従つて、一本鎖ハイブリツド形成プ
ローブ33.6及び33.15を組み合わせて使用すると、
従来の遺伝的試験より高い精度が得られる。一本
鎖プローブによつて検出される比較的弱いバンド
の若干のものにハイブリツドを形成しない、一層
普通の二本鎖ミニサテライトプローブを使用して
さえ(第14図)、DNA指紋から、“誤つた一卵
性”の割合を<10-4に低下するのに充分な情報を
得ることができる。
この接合性(zygosity)測定法の別の利点は、
分析には極めて僅かな試料しか必要でないことで
ある。通常、半mlの末梢血液又は臍帯血液で、
充分なDNAが得られた。新生並びにそれより年
令の高い双生児及び三つ子における接合性
(zygosity)を測定する、この明瞭な手段を利用
しうることにより、種々の型の多胎妊娠の決定要
素及び影響に関する一層正確な疫学的研究が可能
である。
下記の例では、分子量標識はオートラジオグラ
フでは得られないが、他の結果におけるように、
有効な一般的範囲は、1.5〜20kbであつた。
法医学へのDNA指紋の適用
ミニサテライトプローブ33.6及び33.15によつ
て検出されるDNA指紋の個体特異性により、
DNA指紋は法医学において個人の確認に理想的
に適当になる。ただ一つ不確かなことは、DNA
が例えば乾いた血液又は精液の瘢痕中でDNA指
紋分析を行うのに充分に未分解状態で生存するか
否かである。法医学検体の分析可能性を測定する
ため、Home Office Central Research
Establishment,AldermastonのPeterGill博士に
よつて供給されたDNA試料について予備研究を
実施した。
例 20
布上の乾いた血液及び精液の瘢痕を、Gill博士
によつて実施されたDNA抽出(1MDTTの存在
でSDSで溶解し、次いでフエノールで抽出し、エ
タノールで沈殿させる)の前に、種々の時間室温
で放置した。同様に、新鮮な毛根及び性交の前後
に採取した膣スワブからDNAを抽出した。DNA
試料をHinfで消化し、0.8%アガロースゲル
で電気泳動し、ニトロセルロースフイルター上に
ブロツトした。フイルターを前記の本発明の標準
技法を用いて32P−ラベル一本鎖プローブ33.15
でハイブリツドとした。
電気泳動した試料は、下記のとおりであつた:
1 布上の精液瘢痕40μl、4週間後のもの。
2 新鮮な精液40μl。
3 新鮮な血液60μl。
4 布上の血液瘢痕60μl、4週間後のもの。
5 布上の血液瘢痕60μl、2年後のもの。
6 毛根15個。
注.1−6は、同じ人から採取した。
7 布上の血液瘢痕60μl、男性、新鮮。
8 7と性交後1時間に11から採取した膣スワ
ブ。
9 性交後7時間に採取した以外は8と同じ。
10 11から採取した膣スワブ。
11 布上の血液瘢痕60μl、女性、新鮮。
得られたDNA指紋を第15図に示す。各試料
から分析のため充分なDNA(約0.5〜3μg)を抽出
した。DNAは、乾いた血液瘢痕では2年経過し
たものまで、乾いた精液では2ケ月経過したもの
まで、あまり分解していず、同じ個人の新鮮な血
液及び精液から得られるものと同一のDNA指紋
を生じた。15個の毛根程度の小さいものからも同
様にDNA指紋を得ることができた。
性交後に採取した膣スワブも、分解していない
DNA指紋を生じた。しかしながら、スワブパタ
ーンは、主として、男性の血液ではなく、女性の
血液のものに一致した。このことは、スワブから
集められるDNAはほとんど、綿棒で採取する間
に剥離した膣上皮細胞からのものであり、精液か
らのものではなかつたことを示す。それにもかか
わらず、性交後の試料においては、3個の付加的
な女性のものではないバンドが検出された。これ
らは、男性の血液における主バンドに一致し、精
液から誘導されたものでなければならなかつた。
このようなバンドを、性交後7時間に採取した試
料で検出することができた。
考 察
これらの予備実験の結果は、DNAが種々の法
医学的検体中で損なわれずに維持され、従つて、
同定の目的でDNA指紋を少なくとも若干の法医
学的試料に適用しうることを示す。例えば、被害
者の着衣の精液瘢痕から強姦犯人の積極的確認が
可能になる。強姦被害者からの膣スワブを用いる
場合は、膣DNAが混入する点であまり確実では
ない。しかし、精液DNAの単離に必要な精液の
2−DTT又はメルカプトエタノール−媒介還元
の前にsds溶解によつてこの女性のDNAを除去す
ると、一層明白なDNA指紋が生じる。この場合
に、強姦犯人の同定は、精液瘢痕及び/又は膣ス
ワブのDNA指紋分析によつて可能になる。
その後、Gill博士と協力して行つた最近の研究
で、一般的に上述した予備分離技法を使用して、
性交後の膣スワブから精液DNAの明瞭な“指紋”
が得られることが確認された。
第15A図は、性交後6.5時間に採取した2つ
の膣スワブからのDNA指紋(列3)を示す。列
1には、相手の男性の血液試料からの指紋を示
し、列2には、女性から得た血液からのDNA指
紋を示す。スワブからの女性の細胞核を、SDS/
プロテイナーゼK混合物中での予備培養によつて
優先的に溶解させた。精液核は、この処理に影響
されず、従つて、遠心分離によつて女性の成分か
ら分離することができる。その後、精液核を
SDS/プロテイナーゼK/DTT混合物で処理す
ることにより溶解させた。
この分離操作が完全に有効であつたことは明ら
かである。精液で汚染された膣スワブからの精液
DNA指紋は、相手の男性の血液から得られた指
紋と完全に一致した。
〓ヒトのミニサテライトプローブを用いて得られ
た経済的に重要な動物のDNA指紋
例 21〜25
犬、猫、羊、豚、馬及び牛から採取した血液か
らDNA試料を製造した。8μgの試料を適当な制
限エンドヌクレアーゼ(特に断らない限り、Hin
f)で消化し、制限消化物をフエノール抽出後
にエタノール沈澱によつて回収した。制限消化物
を水中に再溶解し、0.7%アガロースゲルで電気
泳動し、変性し、Schleicher−Schuellニトロセ
ルロースフイルターに転移させ、前記のように32
P−ラベルヒトミニサテライトプローブ33.6及び
33.15を用いてハイブリツドを形成させた。
例21 犬
プローブ33.6を用いて犬の家族から得られた
DMA指紋を第16図に示す。電気泳動した試料
は、下記のとおりであつた:
列1 ビーグル犬の父親
列2 グレーハウンドの母親
例3,4及び5 これらの両親の“グリーグル
(Greagle)”の子犬(それぞれ雌、雄、雄)。
ヒトDNAから得られたものと同様に複雑な、
詳細なDNA指紋が各犬から得られた。父親及び
母親(列1,2)から得られたパターンを比較す
ることによつて判るように、DNA指紋は著しい
変異性を示した。3匹の子犬はすべて、それぞ
れ、すべて父親及び/又は母親に由来をたどるこ
とのできるバンドから成る、異なるDNA指紋を
有する。従つて、これらのDNA指紋は、人の場
合と同様に、犬における父性試験及び家系分析に
有用である。
試料1〜3のDNAは、僅かに分解しており、
それにより、最大(最も緩徐に泳動する)バンド
の強度を優先的に減少した。この分解にもかかわ
らず、両親から子孫へのバンドの伝達は、容易に
測定できた。
例22 猫
第17図は、(左)プローブ33.6及び(右)プ
ローブ33.15を用いて、毛の短い家猫の家族から
のDMA指紋を示す。
列1 母親
列2 父親
列3 子猫
プローブ33.6及び33.15は、情報に富むDNA指
紋を生じる。子猫のほとんどのバンドは、母性又
は父性であると記録することができ、従つて、こ
れらのDNA指紋は、猫における家系試験並びに
個体の同定に適当である。
例23 羊
プローブ33.6(左)及び33.15(右)を用いて
種々の羊から得たDNA指紋を第18図に示す。
試料は下記のものであつた:
列1 雑種の雌
列2 雑種の雌
列3 ドーセツト種の雌
列4 ハンプシヤー×ドーセツト種の雌
列5 ドーセツト種の雄
両方のプローブにより各羊から個体特異性
DNA指紋が得られた。DNA指紋は、ヒトの
DNA指紋より弱く、それほど複雑ではないが、
同定及び遺伝学的目的にはなお有用である。プロ
ーブ33.6は、弱いバンドの範囲の他に、各羊にお
いて1又は2個の極めて強い多形バンドを検出す
る。これらのバンドは、恐らく、極めて高いプロ
ーブ33.6相同性を示す、ただ一つのミニサテライ
ト座から誘導されたものである。
例24 豚及び馬
第19図は、3頭の異なる豚(列1〜3)及び
3頭の異なる馬(列4〜6)〔性別及び育種は、
特定されていない〕からのDNA指紋を示す。プ
ローブ33.6及び33.15は、各種と個体特異性DNA
指紋を生じる。特にプローブ33.15によるDNA指
紋は、弱く、対応するヒトDNA指紋と比べて極
めて少ないバンドを含むが、それでも両方のプロ
ーブの併用は、個体の同定に有用である。
例25 牛
第20図は、牛家族及び付加的な牛についてプ
ローブ33.6を用いて得られたHinfDNA消化物
のDNA指紋を示す。試料は、下記のとおりであ
る:
〔列1 ヒト〕
列2 母牛
列3 父牛
列4 1及び2の子牛
列5 アンガス雄牛
列6 フレシアン雄牛
羊、豚及び馬の場合と同様に、かなり簡単であ
るが、それでも個体特異性のDNA指紋が各動物
から得られた。子牛では、すべてのバンドは、母
牛及び/又は父牛に由来をたどることができ、こ
の動物の家系を確認することができた。
第21図は、同じウシDNAについてプローブ
33.15を用いた結果を示す。個々の列は、下記の
ものを示す。
1 母牛
2 父牛
3 1及び2の子牛
4 アンガス雄牛
5 フレシアン雄牛
〔6. ヒト〕
プローブ33.15は、Hinfで消化したウシ
DNAにおけるハイブリツド形成DNAバンドの強
くて、分離できない程、複雑なパターンを生じ
る。Bgl消化物においては、この強いシグナル
は、主として極めて大きいDNA断片に限られ、
このシグナルが、ふさ状配列又は領域、恐らく従
来のサテライトDNAから誘導されたものである
ことを示唆する。Hinf消化物を短時間、オー
トラジオグラフイに付すと、45−50塩基対の間の
“横木”の間で周期性をもつて(データは示さな
い)、ゲルの底部に向かう“はしご”状バンドを
示す。従つて、強いシグナルは、恐らく長さ45−
50塩基対の反復単位を有するサテライトから誘導
されたものである。強いシグナルは、Pvu、
Dde又はAluで消化されたウシDNAにおいて
著しく破壊されており、サテライトDNA反復単
位がこれらの制限エンドヌクレアーゼのそれぞれ
に対する1個以上の部位を含むが、Hinf又は
Bgl対する部位を含まないことを示唆する。こ
れらは、正確に、46塩基対反復単位の100000縦列
反復から成る1.720ウシサテライト(E.Poschl及
びR.E.Streek著、“ウシ1.720サテライトDNAの
プロトタイプ配列”、J.Mol.Biol.143、147〜
153:1980)の性質である。
1.720反復単位の配列とコアプローブ33.6反復
単位及び33.15反復単位との比較を、以下に示
す:
【表】
前記の式から明らかなとおり、1.720サテライ
ト反復単位は、コア配列の3′領域のほぼ完全な複
写を含む(一致部を*で示した)。1.720反復にお
けるこの領域は、33.15の反復単位と優れた一致
を示すが、33.6とはあまり完全でない一致を示
す。これは、1.720サテライトDNAがプローブ
33.15によつて検出されるが、33.6によつては検
出されない(第20図)理由を説明する。〔1.720
サテライト反復単位(ミオグロビンλ33ミニサテ
ライトの反復単位と似ている)は、コア(式(1)に
おけるH+J>15)の各側にあまり多数のミクレ
オチドを含みすぎて、本発明による多座プローブ
として作用しない〕。
プローブ33.15にハイブリツドを形成するウシ
ミニサテライトを検出するため、DNAをAlu
又はDdeで消化して、1.720サテライトをこの
ゲルの底部から電気泳動により除かれる46塩基対
モノマーに還元した。第21図は、ウシDNAか
らのこれらの制限酵素のそれぞれについて明瞭な
DNA指紋が実際に得られたことを示す(No.3)。
しかしながら、これらのバンドのほとんど全部
は、各反復においてAlu及びDde部位を失つ
た(恐らく、前記の下線を付した塩基の一方又は
他方の突然変異により、重なるAlu及びDde
部位が破壊されることによつて)、正常な
1.720DNA内に埋めこまれた1.720サテライト
DNAの変異体ブロツクから誘導されたものであ
る。このことは、下記の事実を説明するであろ
う:
a Alu及びDdeを用いて、実際に同一のウ
シDNA指紋が得られた。
b 極めて大きい断片は、一貫して、小さいもの
より強力にハイブリツドを形成する(これらは
対応して多くの1.720サテライト反復単位を含
むからである。極めて大きいウシDNA断片は、
これらの単位を440個含む)。ヒトにおいては、
バンド強度は、大きさと共に連続して増加しな
い(第21図)。
c ウシDNA指紋断片のほとんど全部は、1.720
反復単位内で1度で切断するHhaによつて除
去される(前記参照、データを示さない)。
d 父牛(No.2)は、Alu消化物中にハイブリ
ツド形成断片をほとんど有しない。このこと
は、これらの変異体反復ブロツクを含む1.720
サテライトDNAの領域が、この動物では欠失
したことを示唆する。
e 母牛(No.1)及び子牛(No.5)のDNA指紋
は、ほとんど同一である。母牛は、恐らく欠失
に関して異型接合性で、父牛に見られるのと同
等で、非欠失染色体(及び従つて、全部のバン
ド)を偶然、子牛に伝達していた。従つて、こ
れらのバンドはすべて連鎖し、ヒトにおいて起
こるのと同様に子孫に独立して伝達されない。
それにもかかわらず、試験した5頭のウシは、
異なる“サテライト”DNA指紋パターンを示し、
これらの異常な型の指紋は、個体の同定に有用で
あるが、多座標識情報を得るには使用できない。
式(1)において、nが必ずしも3に等しくない場
合にも、あるプローブは有効に機能することがで
きる。このようなプローブにおいては、コアを含
まないDNA配列によつて少なくとも1対の(J.
コア.K)の反復を少なくとも更に2個の反復か
ら分離することができる。従つて、“非コア”
DNA配列によつて隔てされた対中に(J.コア.
K)配列が配列されている充分に長いプローブを
構成することができる。 The scope of the claims
1. Gage by association with one or more controls
A method for characterizing a test sample of DNA.
The test sample is then probed with a polynucleotide probe.
and detect hybridized fragments of DNA.
and the hybridized fragments were subjected to step 1 above.
or to multiple controls;
Here, the polynucleotide probe is
Hybridization between the probe and the minisatellite region of
miniaturization of the genome to the extent that it allows for dissection.
Few sequences are homologous to the satellite region.
At least 3 tandem repeats (must be exact repeats)
comprising a polynucleotide containing (not necessary)
(labeled or marker components if necessary)
), and the DNA of the sample is
does not cleave sequences corresponding to program repeats to a significant extent
fragmented by one or more restriction enzymes,
and
(a) each of said repeats contains a core;
- multiple minisates from different genomic loci
Consensus of similar lengths present in lights
At least 70% homologous to the core region
the law of nature;
(b) said core has a length of 6 to 16 nucleotides;
death;
(c) a null in said repeating unit that does not contribute to said core;
the total number of cleotides is less than or equal to 15; and
(d) Multiple polymorphic minisatellite regions or hypervariability
said hybrid by associating it with a genetic locus.
The soy fragments distinguish the DNA of the sample.
Ru;
A method characterized by:
2. The said genome means a human or animal genome.
and the sample is a human or animal genome.
2. The method according to claim 1, wherein the method is a sample of DNA.
3. The provider of the test sample and one or more control samples.
The same control sample was used to confirm the identity with the donor.
fragment and hybridize from each sample.
The claim is characterized in that the fragments are compared.
The method described in 1.
4. The provider of the test sample and one or more control samples.
to establish the familial relationship between the donor and the donor.
The control sample was similarly fragmented, and the fragments from each sample were
It is characterized by comparing hybridized fragments.
2. The method according to claim 1.
5 Obtained using at least two types of the above probes.
Claim 1, wherein the patterns of positive fragments are compared.
Method described.
6 At least the repeating unit of the probe is single-stranded.
The method according to claim 1.
7. The claim that the probe is entirely single-stranded.
The method described in Section 1.
8. The polynucleotide is read as 5'→3'.
The following general formula is:
H. (J.Core.K)o・L (1)
[In the formula, "core" is read with the same meaning as above.
The following array:
GGAGGTGGGCAGGAXG (2)
AGAGGTGGGCAGGTGG (3)
GGAGGYGGGCAGGAGG (4)
T(C)nGGAGGAXGG(G)pC (5A)
T(C)nGGAGGA(A)qGGGC (5B)
At least 6 sequences selected from
indicates the sequence with the following nucleotides, where
() X is A or G, Y is C or T
, T is T or U, and m is 0, 1 or 2.
, p is 0 or 1, and q is 0 or 1.
and n is at least 3;
() J and K together represent 0 within said repeating unit.
~15 additional nucleotides;
( ) H and L each sandwich the repeating unit.
0 or at least 1 additional nucleotide
represents;
() The repeating unit (J, core, K) is
the polynucleotide is recognizably repeated;
As long as it has a consensus sequence that
exact repetition in both number and type of codes.
There doesn't have to be; and
() "Core" also refers to the actual core in all n repeating units.
The core array in question is defined above in terms of equations (2) to (5).
on average more than 70% compared to the “true” core sequence
As long as there is homology, it can be considered a modified core sequence.
Can also be used]
or complementary to the above sequence
Claim 1, wherein the polypeptide has a sex sequence.
The method described in.
9 Present in each (J, core, K) repeat sequence
Claim 8, wherein the total number of nucleotides does not exceed 25.
The method described in.
10 core has up to 16 nucleotides,
The method according to claim 8.
11 Core is 7 or more consecutive nucleotides
9. The method of claim 8, wherein the method represents an array of .
12 The continuous nucleo having 12 or more cores
9. The method of claim 8, wherein the method represents a sequence of tido.
13 The core has the configuration shown in formula (2), (3) or (4).
14 to 16 said consecutive nuclei selected from the column
9. The method of claim 8, wherein the method represents an octide sequence.
14 The actual core arrangement is different from the true core arrangement.
according to claim 8, which has a homology of 80% or more.
Method.
15 J is 0 or 1, and K is 0 or 1
15. The method according to claim 14.
16 Present in each (J/Core/K) repeating unit
The total number of nucleotides in the claim does not exceed 20.
10.
17 The polynucleotide has the following formula:
(5′)GPGGGCWGGWXG(3′) (6)
(In the formula, P is not G, and W is A, T, or U.
, and X is A or G)
Consecutive (5′→3′) core sequences selected from within
has three or more repeats of a 6-31 nt sequence containing
polynucleotide, or a variant thereof (in all repeats)
The actual total core array of is defined for equation (6).
on average more than 70% of the total “true” core arrays
(provided that it has homology to the above), or
are polynucleotides with sequences homologous to these.
2. The method according to claim 1, wherein the method is otide.
18 Each iteration or variant iteration contains the array of equation (6).
18. The method of claim 17.
19 Consecutive (5′→3′) array:
PGGGCWG (7)
is present in all repeating units of said polynucleotide.
and P and W in claim 17.
The person according to claim 1, which has the given meaning.
Law.
20 Consecutive (5′→3′) array:
TGGGCA (8)
is present in all repeating units of said polynucleotide.
and T is T or U.
The method described in claim 1.
21. Claims 17 to 20, wherein P is T or U.
The method described in any one of the above.
22. Any of claims 17 to 20, wherein W is A.
or the method described in paragraph 1.
23 The continuous core sequence or conserved sequence
23. The sequence of claims 17-22, wherein the sequence is identical to the repeat sequence.
The method described in any one of the above.
24 The polynucleotide is one of the following consecutive
5′→3′ core arrangement:
GGPGGGCWGGWXG (9)
(In the formula, P is not G, and W is A, T, or U.
, and X is A or G)
has 3 or more repeats of a sequence not exceeding 31 nt containing
polynucleotide, or a variant thereof (in all repeats)
The actual total core array of is defined for equation (9)
>70% homology to the “true” core sequence
) or for these
A polynucleotide with a complementary sequence
2. The method according to claim 1.
25 W is A at the 5′ end and
according to claim 24, which is T or U at the end.
Method.
26 The probe has the following sequence (complementary sequence)
Including):
Name
(Core) GGAGGTGGGCAGGAA GG
(33.6) (A) AGGGCTGGAGG
(33.15) AGAGGTGGGCAGGTGG
(33.5) GGGAGGC TGGGCAGGAGG
(M13.Core B) GTGGGCAGGAAG
Name
(M13.Core C) TGGGCAG
(M13. Core D) GGTGGGCAGGTGG
(In the formula, T is T or U)
from at least three repeats of a sequence selected from
A method according to claim 1, consisting essentially of:
27 The probe has the following sequence (complementary sequence)
Including):
(33.6) (A) AGGGCTGGAGG
(33.15) AGAGGTGGGCAGGTGG
from at least three repeats of a sequence selected from
A method according to claim 1, consisting essentially of:
Background of the invention
1 Field of invention
This invention searches the human or animal genome.
(probing)
Polynucleotides that can be labeled as
and use this probe to extract genomic DNA.
Concerning how to identify. This identification method is based on an example
Examples include paternal and maternal testing, forensics, and genetic diseases.
It is useful in the diagnosis of diseases and cancer.
2 Description of prior art
To identify genetic differences in genomic DNA
The main conventional method is restriction fragment length polymorphism.
(restriction fragment length
by detecting polymorphisms (RFLP).
It is something that For example, J.F. Gusella et al., Nature
Huntington Dance by 306, 234-238 (1983)
Identification of the locus of the disease-causing DNA defect, and W.
K. Cavanee et al., Nature305, 779-784 (1984)
See analysis of predisposition to retinoblastoma.
Most RFLPs are caused by small-scale changes in the DNA,
Usually creates a restriction endonuclease cleavage site
or arise from destructive base substitutions. human DNA
The mean heterozygosity is
The limiting error is low (approximately 0.001 per base pair).
nuclease at a given locus
RFLP will be detected only rarely. detected
Most RFLPs never have 50%
Allele frequencies that do not exceed and are usually very low
heterozygosity, determined by the degree of
dimorphic (restriction endonuclea)
cleavage site). Conclusion
As a result, all such RFLPs
Whenever mozygous, information in pedigree analysis
It lacks sex.
Genetic analysis is a highly likely
Due to the availability of variable region probes and
correspondingly high heterozygosity
could be considerably simplified. This kind of
Area 1 is A.R.Wyman et al., Proc.Nat.Acad.
Sci.USA,77, 6754−6758 (1980), by coincidence
A library of random segments of human DNA
isolated from Lee. Multiple alleles at this locus
Structural basis of multiallelic variation
The foundation is still unknown. Then, again by chance
Several other hypervariable regions are found in the human insulin gene.
Denshi [G.J.Brll et al., Nature295 31-35 (1982),
Zeta globin gene [N.J. Proudfoot et al.
Call31, 553−563 (1982), and S.E.Y.
Goodbourn et al., Prou.Nato AcAd.Sci.USA.80,
5002-5026 (1983)], and c-Ha-ras-1 Carcinogenesis
Genes [D.J.Capon et al., Nature302, 33−37
(1983)]. In each case,
Variable regions consist of short sequences (“minisatellites”) of proteins.
Consists of dem repeats and is polymorphic
(polymorphism) is mitotic or meiotic
Due to divisive unequal exchange,
or produced by slippage of DNA during replication.
Based on allelic differences in the number of shear repeats. arising
Differences in the length of the nisatellites cleave the repeat unit
can be detected using no restriction endonucleases
Ru.
The inventor and his co-researchers have already
The 33bp sequence in the intron of the oglobin gene
A short mini-satellite consisting of four tandem repeats
[P. Weller et al., EMBO J.3,
439-446 (1984)]. This 33bp repeat has already been characterized
The other human minisatellites mentioned above
However, it is noted that the sequence shows weak similarity.
I was noticed. This report shows that the minisatellite region is translocated.
It is assumed that this occurs due to (transposition).
Human - 33bp repeats of myoglobin gene are transposable
(transposable), then this one is the number of iterations
often associated with multiple allelic polymorphisms based on differences in
for tandem repeat regions of the human genome that are associated with
Could you please provide the probe?
3 Additional unpublished background information
Human - Genomic DNA from myoglobin gene
A DNA protein comprising tandem repeats of a 33 bp sequence of
probing by lobes. polymorphism
Genomes of three individuals (father, mother, and daughter) with differences
observed in several different regions of DNA,
This difference is due to the size of larger fragments (2-6kb)
occurs in Data is more than 1 mini
Stable inheritance based on differences in the length of satellite regions
The results were consistent with the polymorphism.
Summary of the invention
Further research has shown that the myoglobin gene 33bp -
Much more effective than front view probe
shows the variability in minisatellites or hypervariable regions.
It is possible to explore genomic SNA using the method shown below.
It was shown that
This invention is directed to
Between many minisatellites, different minisatellites
It is said to contain DNA regions with a high degree of homology.
It is based on the discovery of This common core region is short
Thus, it is approximately 16 base pairs. Now at least 3 times
A short core sequence of tandemly repeated nucleotides
A probe having as an essential component the column
Many different minisatellite regions in genomic DNA
, and their DNA phase in these regions.
An individual can be identified or identified by mentioning the difference.
It is useful for detecting
It was found that there is one. These traditional
lobe is better than that given by RFLP.
It leads to the discrimination of degrees, but is essentially unique for individuals.
It doesn't work with fingerprints. note
Of note, more than one mini-satellite
This can be defined by reference to a target region or a hypervariable locus.
The core probe of the invention is capable of fingerprinting DNA.
It has been found that it is possible to
It is this discovery that adds a degree of non-obviousness to inventiveness.
and this is of fundamental scientific novelty and importance.
It is an invention that has. Core sequence knowledge?
et al., minisatellites from various loci in the genome
has the property of hybridizing with the light region
DNA probes can be produced. but
However, mere recognition or identification of a specific core sequence
In itself, it is useful for the manufacture of probes
is insufficient. Tandem repeats in the core region
Producing a polynucleotide or its derivative containing
It is also necessary to build probe like this
is a minisatellite from human or animal DNA
can be isolated as or
It can be created using construction techniques. good results
Achieve additional constraints for hybridization
It is also important to These are acceptable
Consensus - degree and overall homology with the core
of non-core DNA within and outside the repeat unit as
Includes knowledge of acceptable lengths.
Thus, this invention utilizes the following recognition and discovery.
Ru:
(1) Knowledge of any one core sequence can be applied to this method.
that it can be used in This is further confirmed by
Including knowledge:
(2) studying different hypervariable loci in the genome;
have the necessary degree of consensus depending on the
that different core sequences can be found;
(3) would recognize a different spectrum of polymorphisms;
that a collection of DNA probes can accumulate;
(4) By probes with specific gene classification,
Better results can be achieved than with other probes.
thing;
(5) More than one program in any one classification
The use of lobes amplifies the probability of identification
thing;
(6) Further research on the first generation of successful probes
Easier and more successful probes
can be produced, for example, synthetically.
Thus, according to the first aspect of the invention, a large number of
typic minisatellites – with length-specific binding properties
A method for producing a polynucleotide is provided, and
Here's how:
() Restricted activity to other polymorphic DNA regions
can perform hybridization,
Identifying natural tandem repeat sequences in DNA,
() is presumed to be responsible for such binding.
The natural consensus-core sequence of the repeat sequence
identify the column, and
() Lower genome than natural repeat sequences - genes
with locus-specificity and high polymorphic fragment susceptibility
natural constructs with minisatellite binding properties.
complete or incomplete sequence derived from the core sequence.
Isolate or artificially create tandem repeat sequences
to accomplish,
It consists of
The core components of the probe are based on the same basic principles
It can be defined in a variety of ways. the most basic group
The basic principle is that the repeat sequence of the probe is
Common core common to Nomu DNA minisatellites
-consisting of a nucleotide sequence from a region of
This should be included. This common core array
is a high level between one minisatellite and another.
For example, if the consensus is 80% or more,
In this sense, it is “common”. these mini
Satellites are, for example, the myoglobin gene
This was discovered by searching the genomic DNA for 33bp repeat sequences.
referred to as “λ33-positive” fragment in the specification of
Detected by obtaining hybridized fragments
It will be done. These fragments and myoglobin gene
The 33 bp repeat contains approximately 16 bp of common core sequence. child
The λ33-positive fragment of
Plasma of genomic DNA to form other fragments
Can be used as a robe itself
However, it can also be accompanied by some small change.
Ru.
Another principle is that the core nucleotide sequence
effectively hack into the minisatellite region of sample DNA.
It is not so short that it cannot be hybridized, and it is
Not so long that type characteristics cannot be detected successfully, e.g.
A 33bp tandem repeat in the miniglobin gene
It is very similar. In general, the core
6 Nuks Found in the Common Core of Nisatellites
should have up to about 16 nucleotides
It is. Is the repeating sequence of the probe exclusively a core?
at either end of the core array.
Contain a small number of flanking nucleotides
I can do it. The repeating unit can be any number or species of nucleotides.
for any of the classes, and for the core or repeating unit.
is an exact iteration for any of the non-core components.
It doesn't have to be. However, this is approximately
Even if the term
It is convenient to describe and define it as a position.
A block of n repeating units can have any
It may have a nucleotide sequence and its extent
and type is usually unimportant.
The polynucleotide of this invention can be obtained by any of the following methods.
specifically includes those defined in any of the following.
First definition
The following general formula read in the meaning of 5′→3′
H. (J.Core.K)n.L (1)
[During the ceremony,
A “core” consists of at least six consecutive nuclei.
represents a sequence with an otide, this nucleotide
The following array is read equivalently:
GGAGGTGGGCAGGAXG (2)
AGAGGTGGGCAGGTGG (3)
GGAGGYGGGCAGGAGG (4)
T(C)nGGAGGAXGG(G)pc (5A)
T(C)nGGAGGA(A)qGGGC (5B)
is selected from one of the following, where:
X is A or G, Y is C or T, m
is 0, 1 or 2, p is 0 or 1, and q is
is 0 or 1, and n is 3 or more;
J and K together are 0 to 15 in the repeating unit
represents an additional nucleotide of; and
H and L are 0 or 1 or more sandwiching the repeat sequence, respectively.
the additional nucleotides above; and the
and i.e.:
() “Core” and J and K are each (J. Core
-. K) Require same sequence or length in repeat units
It doesn't have sushi either;
() “Core” represents a further different core arrangement.
You can also forget;
() Actual total core sequence in all n repeat units
is for formulas 2 to 5 in the same number n of repeating units.
The “true” total core array defined above and 70
% or more homology;
[provided that]
a polynucleotide having; and
A polynucleotide with a complementary sequence to this
Otide.
Second definition
The following general formula:
H. (J. Core. K.) n.L (1)
[During the ceremony,
“Core” has the same meaning as 5′ → 3′ 6 to 16
represents a sequence of consecutive nucleotides, (1)
Myoglobin tandem repeat arrangement of about 33 nt per repeat unit
human or animal using probe DNA containing sequences
obtained by searching the genomic DNA of
5′→3′ of the first human or animal minisatellite
(2) common core area of the first mini-satellite;
Contains a tandem repeat sequence comprising an arch region.
human or animal DNA using probe DNA
Second person or movement obtained by searching
5′→3′ common core region of minisatellites of objects, and
and (3) including the common core region of the second minisatellite.
A probe containing a tandem repeat sequence consisting of
Search for human or animal genomic DNA using DNA
A third human or animal species obtained by
Selected from the 5′→3′ common core region of Nisatellite.
Each of the above tandem repeat sequences has 3 or more units of repeats.
vengeance]
a polynucleotide having;
A polynucleotide with a complementary sequence.
Third definition
The following general formula:
H. (J.Core.K)n.L (1)
[During the ceremony,
“Core” means 75% or more, preferably 80% core.
of human or animal genomic DNA showing a
6 or more from within the common core area of the minisatellite
Any of the sequences with consecutive nucleotides above
represents;
The “core” is not necessarily the same sequence in each repeat unit.
and all other symbols
is as defined above]
a polynucleotide having; and for this
A polynucleotide of complementary sequence.
Fourth definition
The following formula:
(5′)GPGGGCWGGWXG(3′) (6)
(In the formula, P is not G, and W is A or T.
and X is A or G)
selected from the array represented by or its variants
6 to 35 nt containing a contiguous (5′→3′) core sequence
A polypeptide having three or more repeats of the sequence (all
The actual total core array during the iteration is the same number of iterations
The “true” core configuration defined for equation (6) in
conditional on having 70% or more homology to the column
); and a complementary array point to this.
Renucleotide.
In the above expressions, and throughout, the array is a regular
It is indicated by the notation 5′→3′.
This invention relates to DNA, RNA, and
Any other type of polynuc that can hybridize
Includes leotide. Polynucleus defined above
Otides are unlabeled and double-stranded
(ds) form or single chain (ss) form.
This invention is a ss for use as a probe.
shaped labeled polynucleotides, and these
labeled precursor and then ss-pro
This includes those capable of producing a tube.
These are preferably in any conventional manner33P-
radioactively labeled, but this method is
well-known in hybridization technology.
may be radioactively labeled by other means.
Proceedings of the 1981 ICN−
UCLA Symposium on Developmental
Biology using Purified Genes, Keystone;
Colorado, March 15-20, 1981, Vol XX
1981, pp. 647-658, Academic Press,
D.C. described in Donald D. Brown et al., eds.
biotin or similar species by the method of Ward et al.
or A.D.B.
Malcolm et al., Abstracts of the 604th
Biochemical Society Meeting, Cambridge,
Enzyme treatment using the method of the United Kingdom (Meeting of July 1, 1983)
You can even be belled.
According to another aspect of the invention, human or
is the genetic source of samples containing animal DNA.
Polynucleotide probes useful for determining the future of
This product contains labeled ingredients or markers.
Contains a car component and restricts sample DNA.
obtained by fragmentation with endonuclease.
Hybridization of the probe to the corresponding DNA fragment
human or animal to the extent that it allows for daization.
Sequences homologous to minisatellite regions of the genome of
3 or more tandem repetitions of (including variants)
comprising a polynucleotide comprising
and do the following, i.e.:
a Each repeat consists of multiple repeats from different genomic loci.
Containers of similar length present in minisatellites
Census - core region with 70% or more homology
Contains ar;
b the core has a length of 6 to 16 nucleotides;
c Nucleos within the repeat unit that do not contribute to the core
The total number of chidos is 15 or less;
It is characterized by
This invention further provides human or animal genomes.
This method encompasses DNA sample identification methods.
searches the DNA with the probe of this invention,
and detect hybridized fragments of DNA.
It consists of
This aspect of the invention:
Total DNA from a sample of cellular material is restricted and encoded.
Fragmented using donuclease,
Highly variable DNA fragments can be combined with labeled components or
Contains repeating core components in addition to marker components
hybridize with the probe defined above;
and
into DNA fragments of different lengths, or more generally
are labels attached to bands of different molecular sizes or
determine the concentration of the marker,
Including.
Usually, fragmented DNA is processed by hybridization
Before electrophoresis, e.g.
and then detect the marker concentration.
We know that its individual elements are specific to genetic origin.
Obtain a characteristic pattern.
Definition
The following used in this invention and the description so far:
A definition may help.
hypervariable
human at one recognized locus or site
A region of animal or animal DNA that is different in length or sequence.
If it exists in many different forms, it is hypervariable.
It is said to be a target.
Restriction fragment length polymorphism (RFLP)
This allows even separation and probes after electrophoresis.
The pattern of human or animal DNA fragments detected by
Genetic diversity in turn.
mini satellite
It is composed of tandem repeats of short DNA sequences.
This is the region of human or animal DNA that is produced. vinegar
It is not always the case that all repeating units exhibit exact identity.
is not necessary either. (The probe of this invention is polymorphic
It consists of a mini-satellite. )
polymorphism
Genes or DNA that show differences between individuals
Segments of are said to be polymorphic.
core (array)
Originally used to mean consensus-core sequence.
However, any iterations derived from it
It is extended to arrays or modified arrays.
Consensus-core (sequence)
Two or more minisates with different origins or genetic loci
Substantial or complete match between repeating units of light
A sequence that can be identified as
iteration (array)
a given core sequence or a cell containing a core sequence.
complete or incomplete tandem repetition of a segment
It is an array.
defined core (array)
completely identical to one of equations (2) to (8) within its own length.
This is the core arrangement that matches the
Deformed body (core arrangement)
differs by a small degree from the defined core sequence
(50% or more homology) Actual core sequence.
Complete iteration (array)
of or containing a given core sequence
An array that is an exact tandem copy of the segment.
Ru.
incomplete repeat (array)
at least one unit has a base pair substitution and/or
differs in length from at least one other unit
It is an array. (Normally, there are only a few in one probe sequence.)
At least 3 tandem arrays are present and the probe
at least one core array defined within the array
and there will be at least one variant
cormorant. )
Homology %
In comparing two sequences of the same length, base pairs
The number of bp obtained by subtracting the number of bp substitutions from the number of (bp)
% of
Nucleotides (nt) and base pairs (bp) are synonymous
used for. Both can refer to DNA or RNA.
I can do it. Abbreviations C, A, G, T are as usual (De
(oxy)cytidine, (deoxy)adenosine, (sepoxy)cytidine, (deoxy)adenosine,
oxy)guanosine, and deoxythymidine or
It means either uridine.
tandem repeats (artificial or naturally isolated)
body) can be completely iterative, but
More preferably, it is an incomplete repeat. Preferably less
At least two repeats are consensus-core sequence
is an incomplete repetition of Preferably, three or more
repeats, and more preferably seven or more repeats.
Present in lobe array.
Probe production is based on natural clones by cloning.
Nisatellite isolation and DNA sequencing
can include specifics. This is also required
Cutting out the core and its subsequent tandem
Conversion to repeats or non-identical fragments with different origins
This may include facilitating an exchange. This is also
May include cloning of polynucleotides
Wear.
On the other hand, the construction stage is based on the identified consensus code.
may include the synthesis of a sequence or a fragment thereof.
Ru. Consensus - core sequence preferably 6bp
and preferably contains 16 bp or less
do. Next, create tandem repeats of the synthetic core.
Ru.
Needless to say, polynucleotides have shown good results.
cloning of or partially successful intermediates of
be the result of a succession of operations at different subsequent times
and the final polypeptide is the parent minisatellite
of natural origin as having a slight resemblance to
or fragments of synthetic origin.
The probe of this invention is useful in the following fields:
be.
1. Paternal and maternal studies in humans.
2. For example, family groups in settlement disputes and inheritance disputes.
proof of.
3 Zygasity test in twins
Experiment.
4. Studies on consanguineous marriage in humans.
5 General pedigree analysis in humans.
6. Identification of genetic disease loci in humans.
This allows for specific
It becomes possible to create a probe.
7 Forensic medicine
(a) Identification of semen from rape victims;
(b) blood, hair and semen, for example from soiled clothing;
identification of,
(c) Identification of human remains
8 Cell Chimaerism
studies, e.g. donor cells versus recipient cells after bone marrow transplantation.
follicle tracking.
9 Livestock breeding and pedigree analysis/certification. (This is an example
routine control and inspection of purebred animals;
For example, in litigation cases related to race horse and dog breeding.
This could include a pedigree check. )Sara
shows relationships with economically important genetic traits.
To provide genetic markers that may be useful.
10 Contamination of pure cell lines and routine identification procedures
Routine inspection of cultured animal cell lines
quality control.
11 Information on tumor cells and tumor molecules
Analysis.
12 Polynucleotide or probe derived therefrom
has potential uses in plant breeding
It is expected that
[Brief explanation of drawings]
Figure 1 shows the 33bp repeat sequence of the myoglobin gene.
Insert the column into the plasmid and clone it
This is a schematic explanation of its manufacturing method. Second
Diagram shows hybridization to various DNA probes
Photograph of an autoradiograph of genomic DNA fragments
is a photocopy of, and furthermore, its DNA.
was identified in two autoradiograms.
Shows the pedigree of relatives. Figure 3 shows this invention.
relatives explored with three different probes of
DNA samples from three unrelated human individuals
The autoradiogram of the sample is shown. Figure 4 shows this
9 human cases probed with the inventive probe
Autoradiograph of a DNA sample from an individual
, several of them are related, and two
are identical twins. Figure 5 shows the prototype of this invention.
2 humans and 17 humans explored by Loeb
Autoradiation of DNA samples from animals other than animals
Show ogram. FIG. 6 shows the search according to the invention.
Ghanaian family caught in settlement conflict investigated
A series of autotra of DNA samples from members of
Showing a geogram. Figure 7 shows neurofibromatosis.
Autoradiation of DNA samples from blood relatives who have
Indicates grams. Figure 8 shows the minisatellite fragment.
Possible co-inheritance and fetal hemoglobin
Created for Genetic Persistence (HPFH) Testing
Autoradiogram of DNA from Gujerati Pedigree
Indicates the time. Figure 9 A and B are related to large kinship relationships.
reception of HPFH and various minisatellites in
Genetic diagram showing splicing. Figure 10
is the preparation of cloned artificial minisatellites.
This is a diagram showing. Figure 11 shows the new
Unrelated, explored with synthetic probes
One series of DNA samples from the placentas of two individuals.
A traradiogram is shown. Figure 12 shows large kinship relationships.
A series of audits of the DNA samples searched from
A traradiogram is shown. Figure 13 shows two different programs.
Various results obtained for twins using lobes
Autoradiogram showing DNA banding pattern
It is. Figure 14 shows single-stranded probe and double-stranded probe.
Comparing the band patterns formed using the
This is an autoradiogram. Figure 15 and 1
Figure 5A shows DNA fingerprints obtained from forensic samples.
This is an autoradiogram showing the crest. Figure 16 is
Auto showing DNA fingerprints obtained from a family of dogs
It is a radiogram. Figure 17 shows a short-haired domestic cat.
Autoradiograph showing DNA fingerprints from a family of
It is mu. Figure 18 uses two different probes.
An image showing DNA fingerprints obtained from various sheep.
This is a radiogram. Figure 19 shows three different animals.
Autoradiogram showing DNA fingerprints from a pig
It is. Figure 20 shows a family of cows and additional cows.
In an autoradiogram showing the DNA fingerprints of
Yes; and Figure 21 shows a diagram using a different probe.
Figure 20 is a similar autoradiogram.
Description of preferred embodiments
Human DNA cloned into Phage λL47.1
10-20kb ofSau3A part human genome library
Lee, 33bp myoglobin repeat probe
“Hybridization with pAV33.7
Cleaned. 3×10FiveRecombinant library
– 40 or more strongly or weakly hybridized
A plaque was identified. These positive plaques
(λ33.1−15) and purified 8 random selections of
using Southern blot analysis of phage DNA.
DNA that hybridizes in each recombinant
is located within the unit short (0.2-2kh) region of the recombinant
It was shown that Sequence analysis revealed that eight recombinants
This region of each of the 3 to 29 tandem cos of the repeat
Contains minisatellites comprising P.
The length of the repeat sequence is 16bp in λ33.15 to 64bp in λ33.4.
It was shown that the range is within the range. most mini satella
The site contained an integral number of repeats. next,
In λ33.6, the 37bp repeat is a basic 12bp unit.
It consisted of two forked trimmers. λ33 pairs each
Converting is clone-specific between each minisatellite.
Differences in the human genome as determined by DNA sequence
He represented the area.
Eight cloned minisatellite regions are human
DNAHinfDetected by pAV33.7 in the I digest.
Possible polymorphic 2-6kb DNA fragments smaller than 0.5~
2.2kbHinfIt was located within the IDNA fragment. claw
Polymorphism in any of the minisatellite regions
In order to determine whether the32P-labeling
Place a single-stranded DNA probe at the appropriate location for each minisatellite.
Prepared from M13 subclone, and high stringency
in,HinfNot related to the 14 people killed in I
Hybridized to a panel of British white DNA
I met. Typical hybridization pattern
each under these hybridization conditions.
Probe detects unique region of human genome
and that three of these regions are highly polymorphic.
Show that something is true.
Further details of the above steps are provided in the example.
Ru.
Now, regarding the above definition of polynucleotide,
The definition is the following general formula
H. (J.C.K.) n.L (8)
(In the formula, C indicates the core sequence, and other symbols
is as above)
matches. One unit in all definitions
The core array of can be the same or different from
good. For example, this applies to the repeating unit as a whole.
1 or 2 extra sequences compared to the consensus sequence
Contains nucleotides, one or two nucleotides
Lacking an octide or (for example) 1 to 4 nuclei
The punch line may be different.
The core can be defined in a variety of ways. general definition
The definition refers to a procedure by which the core sequence can be identified.
It can be obtained by applying genome
For example, the satellite region of DNA is
GGAGGTGGGCAGGAXG (2)
It is compared with an array such as . Everything included in equation (2)
selected from all possible X-nucleotide length sequences.
The minisa that shows the greatest homology with the X-nucleotide
X-nucleotide long sequence taken from tellite
is considered to be a core array. Needless to say
This is a very narrow way to define the core.
and one or a few core 6 nucleotides
long, one or a few seven nucleotides long, and up to 16
should yield a nucleotide length of (maximum
, for example, there is more than one of 100% homology
Therefore, it is a “few”). defined like this
An average of 70% of these cores relative to
Diverse to the extent that all n repeat units have the above homology
It is assumed that gender can exist. in a repeating array
Flanking sequences J and K are for homology
Not included in calculations, only compared between cores.
The defined core can have various lengths.
and can be “mixed”. That is, some
For example, in the repeating unit of formula (2)
homologous to GGGCAGGAXG and elsewhere
is homologous to, for example, GGGCAGGTGG in formula (3).
Therefore, the deformed body is necessarily connected to the “core” itself.
Considered as homology with (core) n rather than homology.
should be considered.
The “first” definition defined earlier takes into account the above considerations.
Equations (2) to (5) derived from but shown
Medium, depending on circumstances, any length from 6 to maximum 12 to 16
It is simple in that the core is defined as an array of
Purified. Similar regulations exist for deformed bodies.
Ru.
The second definition is that each additional mini-satellite
Successive hybridizations that can generate fragments
Define the core as a yon stage. human genome
Sufficient numbers for extensive libraries of DNA
Perform hybridization to obtain a sufficient number of hybrids.
Test the hybridized fragments and probe from these.
make a new library, explore the genomic DNA again, and make sense of it.
Logically, by doing this an infinite number of times, you can
Consensus code widely symbolized in light DNA
It is possible to reach the range of the array
will be easily understood. In reality, the space is wide enough.
very large numbers to reach the sensor score area.
These operations must be performed several times and on a large scale.
It is not expected that the
Only three search operations (in hand) are included in the definition.
In the “third” definition, W represents the core.
and 25% (e.g. 4 out of 16 nucleotides)
leotide) is widely shared with more and less different diversity.
Relying on the possibility of a consensus core area
Ru. Approximately 16 nuku with possible variability of less than 25%
Define the core region above leotide in this way.
For example, core W consists of all consecutive 6 or more from within the area.
It is defined as the sequence of nucleotides.
The “fourth” definition relates to synthetic polynucleotides.
The redefined consensus code obtained from the
Contains formula (6).
These studies support other definitions of shorter core sequences.
Lead righteousness.
Therefore, preferably a contiguous (5′→3′) sequence:
PGGGCWG (7)
is conserved in all repeat units, where P and
W has the meaning given in the fourth definition above.
do. P is preferably T and W is preferably
It is A.
Preferably also a contiguous (5′→3′) sequence:
TGGGCA (8)
is conserved in all repeat units.
According to another point of view, consecutive 5′→3′
Core array:
GGPGGGCWGGWXG (7)
(In the formula, P is not G, and W is A or T.
and X is A or G)
a polynucleotide having three or more repeats comprising;
or its variants (actual total core configuration during all iterations)
“True” defined with respect to formula (7) in iterations with the same number of columns
“has more than 70% homology with the total core sequence of
), and complementary to the above.
Polynucleotide sequences are provided.
In all the above definitions, the core is less
Both have a length of 6 nucleotides, and more preferably
7 or 8 nucleotides and most preferably
or greater than 12, e.g. 14-16. formula
(2) sequence GGGCAGGAXG (terminal 10 nucleotides at the 3′ end)
) has a high consensus and is particularly
It seems hopeful.
The deformed body core preferably has 70% or more, and
More preferably have a homology of 80 or 85% or more
Ru.
Flanking sequences J and K within each repeat unit are preferred.
Preferably omitted or shortened at each end, e.g.
for example 0.1 or 2 nucleotides and preferably
Or J and K together should exceed 20.
should not exceed 20, and more preferably should not exceed 20.
stomach. All nulls in the sum of J + core + K in the repeating unit
The cleotide number is preferably 36, and even more preferably
preferably greater than 31 and most preferably greater than 25
Shouldn't.
The number n of repeating units is preferably at least 10, conveniently
The profit range is 10 to 40, but in principle any
can be a number, even a number up to 10000
It is.
Flanking sequences H and L are unrelated. child
These can be omitted or any number of
Exists as up to 20,000 nucleotides, e.g.
However, with such long probes
It is not very wise to do so. Repeated array is ss−
Even if DNA, these contain ds-DNA
can do.
Any known search technique may be used as the identification method.
The most common method is to collect sample DNA,
Do not cleave tandem sequences or search for them.
cleave to a meaningless degree that does not interfere with the ability to be searched.
Restriction enzyme (one type if appropriate)
or multiple types).
Example 1 Long tag from human myoglobin gene
Construction of a probe containing a double repeat sequence
The construction of this probe is shown in 5 stages (a) to (e).
It is explained in the mock-up in Figure 1 which shows the floor. Out
Myoglobin gene (a) is derived from P. Weller et al., EMBO
J.3, 439-446 (1984).
As shown there, the gene is mostly
33bp sandwiched between two identical 9bp sequences (r in Figure 1)
In the first intron, consisting of four repeats of the sequence
It has a region where it is located. This region is 169bpHint
isolated in f I fragment (b) and end-repaired it.
and plasmid pUC13SmaClaw on the part
[J. Vieira et al.,
Gene19, 259-268 (1982)]. limit
endonucleaseAvaBy (A), the third and
The monomer is isolated by cleaving the fourth repeat.
Released (c). (Single substitutions in repeats 1 and 2 are
remove the part and replace it withDde(D) Part
Form. ) non-identicalAve.33bp via sticky ends
Head:tail port with unknown number of reactive units due to monomer linkage
Rimmer (d) was produced. at least 10 iterations
Agarose gel electrophoresis for preparative separation of polymers containing
isolated and end-repaired pUC13Sma
ligated into the E. coli JM83 site and cloned into E. coli JM83
(see J. Vieiva et al., supra).
The port in the resulting plasmid (e), designated pAV33.7.
The structure of the remer DNA insertion site isBamH+EcoR
Cut out the insertion part in the polylinker by
, α−32By P-dCTPBamH site odor
to create a file-in label, andAvaby
Confirmed by partial digestion. labeled
The partial digestion products were electrolyzed on a 2% agarose gel.
Separated by electrophoresis. pAV33.7 is shown in (e).
Sea urchin 767bpBamH-EcoContained in R fragment
Found to contain 23 repeats of 33bp monomer
It was.
(2) Human with myoglobin 33bp repeat probe
- Sequencing a selection of minisatellite regions of the genome
fixed
Cloned into bacteriophage λL47.1
Library of 10-20 kb human DNA fragments [P.
Weller et al., supra, and W.A.M. Lenen et al., Gene
20, 249-259 (1980)], P. Weller et al., supra.
by the method of32P-labeled in step (1) above.
Hybridization with the 767bp pAV33.7 insert described in
Screening was carried out by daization. 8 pieces
A selection of positive plaques was purified and labeled as λ33.1−15.
A recombinant named . These Phage DNA
eachHintf orHaeDigested by 1.5
electrophoresed through a % agarose gel and
The 33-repeat-related sequences in
By way of hybridization
The position has been determined. Each recombinant has one “λ33-positive”
Hinf andHaegave a fragment, but λ33.4 and
11 is detectableHaeDidn't give any fragments (this
in the repeat region in the recombinant of et al.Haecleavage site exists
). λ33-positiveHintf andHaepiece
isolated by preparative gel electrophoresis and optionally
End repair and double-stranded DNA M133mp8
blunt-end ligated to the Sma site (J. Messing et al.
Gene19, 269-276 (1982)]. E. coli
After transformation into JM101, positive ss-M13 recombinants were isolated.
release, and dideoxynucleotide chain
-Sequenced by termination method. All
All λ33-positive fragments contain tandem repeat regions.
, which in some cases requires direct sequencing.
I was able to Repeated regions are sequencing primers
In other cases, if it is too far from the site, restrict the M13 insertion site.
Shortened by restriction endonuclease cleavage
and sequenced again.
The structure of the λ33-positive fragment is λ33.1, 33.3, 33.4,
8 pieces called 33.5, 33.6, 33.10, 33.11 and 33.15
shown later in map form. Actual restriction enzyme used
The length of the elementary and nucleotide fragments is λ33.1:
Hae, 2000; 33.0:Hintf, 465; 33.4:Hint
f, 2000; 33.5:Hintf, 1600; 33.6:Hae
, 720; 33.10:Hae, 720; 33.11:Hinf,
1020;λ33.15:HintIt was f, 1220. Each map
repeats the bases in uppercase script on a rectangular box
Indicates an array. “Repeat” is always complete in number of bases.
Not all, and due to base substitution.
It's somewhat different. Boxes indicate iterations that differ from consensus.
vinegar. Blank space within the box indicates a match was found.
The base symbols A, C, G, and T in the box are consensus
What is shown above it in the array is
Indicates that it has been replaced. X is A or C
be. Y is C or T. − is a consensus
It is the missing nucleotide in comparison. >>>
The <<< (arrowhead) symbol is used as is in the sequence.
Not autoradio glasses for sequencing gels
, the sequence is a consensus “repeat”
(It goes without saying that the word “repetition” can be used in the same way as above.
use). piece
λ33.3, 33.5, 33.10, 33.11 and 33.15 are fully aligned
others have been partially sequenced.
Ru. The number below “con” on the left side of the box is the repetition of the array.
It is a number. The number at the bottom of this column indicates the number of iterations.
vinegar. i.e. λ33.1 is the uppercase script above the box
26 repeats of the 62 nucleotide (nt) sequence shown in
including. Lowercase script at the top and bottom of each map
The sequences shown in
These are flanking sequences present on the 5′ and 3′ sides.
and these flanking sequences are iterated
do not have. In other words, this structure
That of the random copolymers indicated by the columns
similar, where the block represented by tandem repeats
Units of the copolymer appear.
【table】
【table】
【table】
【table】
(3) located within the repeat sequence of each λ33-positive fragment;
Discovery of common short “core” sequences shared by
and identification
Repeated sequences in each region were analyzed using dot matrix analysis.
Myoglobin 33bp repeat sequence in pAV33.7
, and its reverse complement. very obvious
In particular, myoglobin 33bp repeat sequence and λ33-positive
There is no sequence similarity between the consensus repeats of the fragments.
One small clear area was found. same area
is shared by all eight λ33 fragment repeats.
and may be referred to as the "common core." under
The chart below shows the comparison.
In this chart, the decision made in step (2) above
The entirety of each consensus sequence determined is shown.
These are in myoglobin 33bp probe and human
λ33-positive fragment isolated from genomic DNA
This is the part that repeats in tandem. This cheer
The common core area is divided into 16 blocks of uppercase script.
Shown as leotide length.
【table】
* This sequence is a trimer and therefore a furan
The king area contributes to the core.
Again, X is A or G, and Y is C or T.
Yes, - is the missing nucleotide. these 16
Substantial degree of identity exists for nucleotides
8 of them showed 100% agreement, and number 9
The “X” of the eye is either A or G.
I will. These 9 nucleotides have an nucleotide in the bottom row.
A dashed line is attached to indicate the null area of the common core area.
Indicates cleotide. indicated in lowercase script
Residues of tandem repeats are located at the edges of the common core region.
exist. The start/end of each iteration consensus is a symbol
Identified by ▼; non-standard in the case of λ33.4 and 33.15.
There is one integer iteration, and therefore separate
The start and end of the repetition are indicated by different symbols ▽.
Common core regions can only be identified through complex analyses.
Let's recognize what could have been done. Because this is
One consensus sequence of frequently λ33-positive fragments
does not belong to the whole, and the myoglobin gene
Because it spans two consecutive sequences of 33bp repeats
It is.
defined as being within the scope of this invention
To illustrate the degree of match to the polynucleotide,
The various determining factors are shown in Table 1 below.
【table】
【table】
Underlined numbers are not allowed
Indicates length.
(4) Polymorphic human-genomic DNA fragments contain individual λ33
- Hybridization of positive fragments with probes
discovery that it can be detected by
Regarding Figure 2, a random sample of British Whites (1-6)
Selection of small and large Anglo-Asian ancestry (7-18)
DNA was extracted from white blood cells collected from members of the
Manufactured. For convenience, the pedigree is a square that indicates males and a square that indicates females.
By the circles shown and the marriage by the lines between them
shown. Two close marriages between cousins and parents
Indicated by two lines. 10μg sample of DNAHinf
and passed through a 20 cm long 2% agarose gel.
electrophoresed in situ, denatured in situ, and blotted.
Sartorius Nitro by Ing
Transferred to cellulose filter. single chain32P-ra
Convert the hybridization probe into a mini
M13 containing satellite (tandem repeat) regions
Prepared from recombinant. The exact probe used was
I will write about it later. The procedure was as follows. Approximately 0.4μg
4 ng of single-stranded DNA in Nocoumer sequencing primer
[M.L.Dockworth et al., Nucleic Acids Res.
9, 1691-1706 (1981)] and 10 μl of 10 mM
MgCl2, 60℃ in 10mM Tris-HCl (pH 8.0)
Annealed for 30 minutes. Primer extension,
16μl 80μM dATP, 80μM dTTP, 10mM
Tris-HCl (pH 8.0), 0.1mM EDTA and 3μl
(30 μCi) α−32P-dCTP (3000 Ci mmole-1)
and 1 μl of 5 units μl-1Klenow Fragment (Baelin
) and incubate for 15 minutes at 37°C.
This was done by baiting. Extension is 2.5μl
Add 0.5mM dCTP and further 15 min at 37°C
Completed by chasing
did. (What is “Chasing”?
To complete the transfer of dsDMA onto the M13ssDNA template.
means adding the dNTP mixture.
DNA in the insert or distal to the insert.
Appropriate restriction endonucleases in M13 polylinters
1/10 volume of 1.5M
Modified by adding NaOH, 0.1M DKTA.
and extend from the primer.32P-label
Convert single-stranded DNA fragments into a 1.5% low melting point agarose gel
Recovered by electrophoresis using (Sea Plaque)
Ta. Excised band (specific activity >109cpm/
μgDNA) was sheareed with 1mg of alkali.
Carrier human placenta DNA (0.3MNaOH, 20mM
Taken for 5 minutes at 100°C in EDTA and then in HCl.
re-neutralized) at 100°C, and
directly into the hybridization chamber.
Ta. Carrier DNA also serves as a link to repetitive DNA sequences.
to suppress hybridization after
It was also helpful.
The exact hybridization procedure used
(A) 33.1, minisatellite (62nt sequence)
26 repeats = 1612nt) + approx. 360nt frantenghito
Approximately 2000nt subcloning containing DNAHaeCut off
Piece; (B) 33.4, 2015ntHintContained in f fragment
695nt non-− on the proximal side of the minisatellite primer
mini satelliteEcoR fragment; and (C, D,
E) 33.15, λ33.15 minisatellite array (shown above)
An average of 2 nucleotide differences from the common core region
29 repeats of 16nt sequence) + 128nt flanking human
A 592nt subcloned fragment containing DNA,
Ta. A.J. Jeffreys et al., Celltwenty one, 555-564 (1980)
Hybridize as described above.
I went to Shion. However, the background label
Dextran sulfate is added to lower the
% (W/V) by polyethylene glycol 6000
Replaced. Filters A and B in 0.5×SSC
Hybridize overnight at 65°, then 65°
and washed in 0.2×SSC. Filter C~E
was hybridized and 65% in 1×SSC.
Washed at ℃. Tangs with fixed filter
1 to 3 at -80℃ using a thenic acid reinforced screen
Autoradiography was performed for days.
Iterative core probe as shown in Figure 2.
33.15 isHinIn human DNA digested with f
Extremely complex profiles of hived fragments
detected. Maximum (4~20knt)Hintf fragment
only the hives can be well separated, and these
Redization profile is solid-specific
Shows extreme polymorphism to the extent that it provides a DNA “fingerprint”
did.
Pedigree analysis is based on a single blood relationship (first cousin marriage).
Even between 16 and 18 in Figure 2, all individuals were identified.
confirmed the extreme polymorphic diversity that can be
Ta. The family (D, E) in Figure 2 isHintf-cut
Most of the fragments are passed down from each parent to only some of the offspring.
This shows that these discontinuities
Most of the pieces exist in a heterozygous state,
and the heterozygosity of these large hypervariable fragments is
It is shown that it must reach 100%.
In contrast, all fragments in the descendants are either one or
on the other hand (the only exception being
), and hence a set of stable heredity
Provides genetic markers that can be used. specifically from my father
transmitted to son or from mother to daughterband
(Filter D, see Figure 2)
and). This excludes Y and X linkages respectively
and these minisatellite fragments are
meaning that it is derived from autosomes. these
Where in the set of autosomes does the DNA fragment come from?
Although it is not yet known how many
It does not originate from a single region of the chromosome. yes
pairs of parent fragments that segregate independently in their progeny rather than
can be identified (filter D, see Figure 2).
thing). Precisely at least one AB or --
If there are descendants, the
The pair of bands AB (missing from one side) is an allelic gene.
cannot be a descendant; existence of A- or -3 recombinant progeny
Furthermore, the lack of close linkage between A and B
Probability. The origin of the family shown in Figure 2D
Careful examination of the autoradiographs of those
At least 10 separations in the mother by the criteria of
Possible bands, 8 of which are mutually exclusive.
are genetic and not closely linked.
stomach. The other two bands each have 8 unlinked
may be one allele of the fragment, here
Restricting the progeny so that only A- and -B progeny are analyzed in
observed only in the number of
A small number of samples show that such fragment pairs are monogenic.
Enough to prove that it is an allele at the child locus
Not.
In conclusion, the core probe
Simultaneously useful on a few unlinked hypervariable loci
can give information. This conclusion is shown in Example 8.
will be considered in more detail.
On the other hand, the other two probes (filter A and
B, FIG.
and many different bands.
Polymorphic regions cannot be detected simultaneously, and
Therefore, it cannot be used for general diagnosis.
Example 2
Detecting a new set of hypervariable regions in human DNA
Additional deformed body (core
-) use
Cloned λ33 - derived from positive fragments λ33.5 and λ33.6
The other two probes coming in are similar to Example 1, step (4).
It was prepared as follows. 33.5 probe is clicked during M13mp8
Consists of a loaned 308nt DNA fragment and on
It consists of 14 repeats of the consensus sequence shown below.
This is the common core along with the 70nt Franteng human DNA.
-This is a 17nt long variant of the sequence. 33.6 probe is
Contains a 37nt sequence of 18 repeats, this sequence is common
3 repeats of a shortened sequence of approximately 12 nt derived from the core region +
comprising an additional TC at the 5'-end of the TC. 18
×17nt repeat block is sandwiched between 97nt human DNA
there was. The structure of the 37nt sequence can be expressed as follows.
can.
TGG AGG AGG GGC
TGG AGG A-G GGC (or TGG
AGG AGG GC)
TCCGG AGG AGG GGC
This probe was similarly cloned into M13mp8.
was made into
In the later description, the 11nt consensus sequence
AGGGCTGGAGG given for this probe
It will be done.
both probes32Label by P and Example 1.
Similar to step (4), 14 unrelated Caucasian pa
It was hybridized with human DNA from flannel.
Both probes perform a complex set of hybridizations.
detected fragments, many of which have extremely polymorphic changes.
showed that. Some fragments detected by 33.5 are
New and with 33.15 core probe
This has not been detected until now. 33.6p
The robe is almost a completely new set of mini satays.
Detecting lights and correct inheritance of these
was proven by pedigree analysis. (See Example 8)
and).
The following examples further explain and illustrate this invention.
Ru.
Digestion of sample DNA preferably involves
Restriction endonuclea that recognizes the 4 base pairs of
This is done using ze. For the longest hypervariable fragment
4bp recognition system using all DNA fingerprint patterns
It is largely independent of restriction endonucleases.
was found. This means that these large fragments
Rather than being derived from longer minisatellites,
and each is subjected to restriction endonuclease cleavage
site lacking and normal high density of 4 bp cleavage sites
full-length homogeneous DNA flanked by human DNA containing
Strongly suggests that it contains minisatellites.
This is because most of these large minisatellite fragments
which are unlinked and separated into lineages independently.
The examples above and in Example 8 show that
matches the results given.
In a preferred embodiment, the sample of DNA is
Separate hybridizations resulting in two different fingerprints
In the process, two different probes, e.g.
Using probes from lambda 33.15 and 33.6 fragments
and double fingerprints will be taken. Two unrelated individuals are the same
have the same fingerprint. The probability is already low, but this method
This will further decrease. For example, Example 4 preferably
is an incompletely segregated hybrid with a terminal length of 4 kb.
10 even when is DNA fragments are ignored-19Toi
indicates a low probability.
The invention includes a method of paternity testing. in child
Approximately half of the polymorphic minisatellite fragments originate from the father.
and these paternal fragments are the DNA of the mother and child.
It can be identified by comparing fingerprints. these
all of the paternal fragments are normally present in the father's DNA.
There will be. Probe length 33.15 and over 4kb
Using DNA fragments, a hypothetical father can be identified as typical in a child.
All six paternal-specific DNA segments identified
The probability of having a piece by chance is 10-FiveIt is an order of
And the use of both probes 33.6 and 33.15 makes it
Ten-8is expected to decrease to the order of
Ru. Of course, the exact probability is obtained by the exact separation and
Depends on the complexity of the DNA pattern and less than 4kb
Additional paternal fragments of full length are analyzed, or
This could be improved if more probes were used.
cormorant.
Due to DNA fingerprinting, one drop of human blood can produce enough
Rapidly isolate DNA (0.5-5 micrograms)
can be done. And that DNA has already been
Individuals including 2 people + 2 sisters whose crests have been collected
DNA fingerprints were created from a random panel. 2 people
A pre-characterized individual has a DNA fingerprint ratio
can be easily and unambiguously identified based on comparison.
have a substantial number of minisatellite fragments in common.
The same was true for the two sisters.
DNA is taken from different cells of a given individual
can all give the same fingerprint. Therefore, the essence
DNA fingerprints are identified on children and blood DNA.
The pattern is similar for identical twins. Sara
The DNA fingerprint of the blood DNA and the
transformed with Epstein-Barr virus.
isolated from a lymphoblastoid cell line
pattern, as shown by comparison with DNA
appears to be maintained in cultured cells.
Non-human movements to which this invention can be applied
This includes most mammals, birds, amphibians, and fish.
be caught. For example, chickens, hamsters, rabbits, mice.
Sparrow, Sparrow, Magusodaka, Frog, Newt and Fish
It is. In the case of chickens, the hybridizing DNA fragment
A very complex blurred part of the fragment was produced. Hae
Digestion leaves behind “clear” fingerprints and is unclear
part was removed. Therefore, the chicken's DNA also
one or more repeating units ofHaeContains cleavage site
contains long core-containing satellites and thus
It is believed that cleavage by Hae reduces this satellite to very small DNA fragments that migrate to the bottom of the gel during DNA electrophoresis. Occasionally, other animals produce smeared bands, and these are thought to be separable if the DNA is digested with a suitable enzyme that cleaves the longer fragments. In the following additional examples, the temperature is in °C. Example 3 From fresh human placenta as described by AJ Jaffreys, Cell 18 , 1-10 (1979).
DNA was isolated. Using three individual placentas,
Labeled 1-3. An 8 microgram sample of DNA was digested with Hinf and/or Sau 3A in the presence of 4mM spermidine trichloride to aid complete digestion, recovered by ethanol precipitation after phenol extraction, and 20 cm 1.5kb through a long 0.6% agarose gel at 30V for approximately 24 hours.
Electrophoresis was performed until all DNA fragments of less than 100 mL were removed from the gel. The DNA was then transferred to a sartrium-nitrocellulose filter by blotting. High specific activity (10 9 cpm 32 P/
larger than microgram DNA) single-stranded M13DNA. The probe was prepared as described in Example 1, Step 1. The exact probe used was: (a)
Comprising most of the λ33.5 minisatellite (17nt x 14 repeats) + approximately 60nt flanking human DNA,
33.5 probe consisting of a 220nt Hae DNA fragment subcloned into the Sma site of M13mp8; (b) consisting of a 720nt Hae fragment subcloned into the Sma site of M18m8, consisting of a minisatellite + approximately 50nt flanked human DNA;
33.6 probe; and (c) same as Example 1, step (4)
33.15 probe (this is a minisatellite + 128nt
Pst+ Sma containing flanking human DNA
It was a 599 nt Pst - Aha fragment subcloned into M13mp19 DNA digested with Southern blot hybridization and washing were carried out in 1×SSC at 65° C. as previously described for filters C-E in Example 1, step (4). Filters were autoradiographed for 4 days at room temperature without an intensifying screen. Each probe produces a different fragment pattern, the complexity of which is largely independent of the tetranucleotide restriction endonuclease used. Figure 3 shows the pattern obtained. Separation of polymorphic fragments less than 4 kb in length was improved upon double digestion with Hin f+ Sau 3A, which produced relatively separate and unaltered fragments with Sau 3A cleavage sites accumulated within one or more repeat units. It is based on the removal of background hybridization probably caused by Hin f minisatellite fragments. In double digests, the number of separable polymorphic fragments detected by probe 33.15 is approximately equal to that of the long monodigested minisatellite fragment, which likely contains Sau 3A cleavage sites in most or all single repeat units. It can increase from about 15 to about 23 per individual at the cost of losing 20%. Example 4 A sample of 8 micrograms of human blood DNA from a random sample of 20 unrelated British Caucasians was digested with Hin f and analyzed using minisatellite probes 33.6 or 33.15 as described in Example 3. A hybrid was formed by the method. Compare each DNA fingerprint (individual A) with the pattern in an adjacent gel track (individual B), with a co-migrating counterpart of approximately the same number of bands in A and approximately the same autoradiographic intensity in B that is clearly absent in B. The number of bands was recorded. Results shown in the table below are all mean values for pairwise comparisons. A small amount (approximately 6%) of additional weak hybridizing fragments in A matched the strong hybridizing fragments in B. In such a case,
Such fragments were ignored as it is not possible to determine whether the bands in A are also present in B. If the co-migrating bands in A and B are always the same allele of the same minisatellite locus, then the average probability x that the allele in A is also present in B is = 2q - q 2 , so q = 1-(1-
x) Average allele frequency (homozygosity) by 1/2
Related to q. In fact, the (unknown) proportion of co-migrating bands in A and B are derived by chance from different minisatellite loci, and therefore the average allele frequency and homozygosity estimates are maximum, and the electrophoresis of the minisatellite fragments Depends on separation. The probabilities shown in Table 1 are for the individual size fragments of DNA indicated. The three numbers must be combined to obtain an overall probability for the most readable part of the fingerprint, i.e. all DNA larger than 4kb in size. For example, the average probability that all fragments detected by probe 33.15 in individual A are also present in B is 0.08 2.9 ×
0.20 5.1 ×0.27 6.7 = 3 × 10 -11 . 2 in A
The probability that all fragments detected by species probes 33.15 and 33.6 are also present in B is 5×
10 -19 . [Table] Example 5 This example illustrates the somatic stability of DNA fingerprints and their use in paternity testing. Lymphoblastoid cell lines transformed by EB virus and stored in liquid nitrogen were reestablished in liquid culture after 2 years. These cultured lymphocytes were washed twice with physiological saline, and DNA from the lymphocyte pellet and white blood cells was collected by AJ Jeffreys.
Cell, Vol. 18, 1-10 (1979). Sperm DNA was produced in the same manner, except that spermatozoa collected from semen were treated with 1M2-mercaptoethanol for 5 minutes at room temperature before being dissolved with SDS. 5 of DNA digested with Hin f and hybridized with probe 33.6 (a) or 33.15 (b).
DNA fingerprints were prepared as described in Example 3 using microgram samples. Example 6 This example illustrates the use of probes of the invention to detect highly polymorphic regions in the DNA of various vertebrates. DNA samples were prepared from blood taken from chickens, sparrows and baby birds, rabbit and mouse livers, human placentas, and gutted carcasses of frogs and fish. An 8 μg DNA sample was digested with Hin f, whereas chicken DNA was digested with Hin f.
Restriction digests were electrophoresed through a 0.6% agarose gel, denatured, transferred to Sartorius nitrocellulose filters, and hybridized as described above using human minisatellite probe 33.15. The stringency of hybridization was 65° C. in 1×SSC. The results,
The following samples are shown in FIG. 1, 2: Unrelated human placental DNA 3: Rabbit DNA from F 1 hybrids of Alaskan and Vienna White breeds 4: Rabbit DNA from Alaskan breeds 5,6 Mouse from two wild-caught Greek mice ( Mus musculus ) DNA 7 Mouse from the inbred strain DBA-2 ( Mus
musculus) DNA 8 Mouse from inbred strain C57/BL10 ( Mus
musculus) DMA 9,10 Chicken DNA: Note: DNA was digested with Hae . 11, 12: Sparrow DNA 13, 14, 15: Little bird DNA 16, 17: Frog (Xenopus tropicalis) DNA 18, 19: Small fish DNA A variety of valid DNA fingerprints have been obtained from almost all tested vertebrates. It can be seen that it is clearly as informative as a human DNA fingerprint. Chicken DNA cleaved with Hinf also produced a less strong but highly complex obscurity of hybridizing DNA (not shown). However, upon digestion with Hae, this stain was removed, resulting in a clean polymorphic fingerprint pattern. The two inbred strains of mice have simpler fingerprints than wild mice. This is because in the wild, most hypervariable minisatellite loci are heterozygous;
This is thought to be because inbreeding results in homozygosity, which reduces the number of hybridizing DNA fragments by half in inbred lines. The following examples further illustrate the application of the particular probes described above. Example 7 This example describes the use of DNA fingerprint analysis in an immigration case that would have been extremely difficult, if not impossible, to solve using traditional genetic methods. This case concerns a Ghanaian boy who was born in the UK, immigrated to Ghana to be reunited with his father, and then returned alone to the UK to be reunited with his mother, brother and two sisters. But there,
There was evidence to suggest that a swap had taken place with an unrelated boy or with the son of one of the mother's sisters, all of whom were living in Ghana. As a result, the returning boy was not allowed to reside in the UK. At the request of the family's attorney, an analysis was conducted to determine the boy's mother. Neither the father nor the mother's sisters were used in the analysis, as this would complicate matters. Furthermore, although the mother was certain that the boy was her son, she was not sure about the boy's father. Therefore, DNA fingerprints from blood DNA samples taken from available members of the family (mother M, brothers B, sisters S1 and S2, and the boy in question Detect. The above two minisatellite probes 33.6 and 33.15
It was produced by hybrid formation by the Southern method. The mother (M), the boy in question (X), his brother (B),
An 8 μg sample of blood DNA from sisters (S1, S2) and an unrelated individual (U) was digested with Hin f;
Electrophoresis was performed on a 0.7% agarose gel, and a hybrid was formed with the probe using the Southern method. The autoradiograph is shown in Figure 6. Fragments present in the mother's (M) DNA fingerprint are indicated by short horizontal lines. Paternal fragments that are absent in M but present in at least one of the non-disputed siblings (B, S1, S2) are indicated by long lines. The "maternal" and paternal fragments transmitted to X are indicated by dots. The DNA fingerprint of X contains no additional isolated fragments. All fragments were recorded from the original autoradiographs taken at different exposures. Partially resolved, relatively weak bands that could not be reliably recorded, especially towards the bottom of the gel, were ignored. The first step was to establish the paternity of X from the pattern of hypervariable fragments. Although the father was not available, most of his DNA fingerprints are paternal specificities present in at least one of the three non-disputed siblings (B, S1, S2) but not in M.
They were able to reconstruct it from DNA fragments. Approximately half of the 39 paternal fragments thus identified are
It was present in the DNA fingerprint. DNA fragments are DNA fingerprints of unrelated individuals (see individual U in Figure 6).
Since it is rarely shared between
very strongly suggests that B, S1 and S2 have the same father. After excluding these father-specific DNA fragments, 40 fragments remained in X, all of which were present in M. This strongly proves that M is the mother of X and therefore X, B, S1 and S2 are true siblings. It was already mentioned above that the average probability that a fragment in one person's DNA fingerprint will be present in a randomly selected second individual is about 0.2 for Northern Europeans. The corresponding values for Father and M are 0.26, establishing that the DNA fingerprint variability in these Ghanaians is not significantly different from that of Northern Europeans. In the probability estimates below, we make the very conservative assumption that all bands share a uniform probability of 0.26 (quantified below). The first issue is whether or not X is related to this family. X's DNA fingerprint contains 61 recordable fragments, all of which are present in M and/or the father. If X is unrelated, the probability that each of his bands exists in these parents is 1
−(1−0.26) 2 =0.45. Therefore, the probability that M and/or the father have all 61 of X's bands by chance is 0.45 61 =7×10 −22 . X is clearly related to this family. The next question is whether an unrelated woman who is not M can be X's mother. X's DNA fingerprint is
It contains 40 "maternal" fragments, of which we assess that about 25 are specifically inherited from the mother. The remaining fragments are shared between mother and father and therefore cannot be used to give evidence as to M's motherhood. All 25 mother-specific fragments in X are present in M. Although M is not related to X, the opportunity to share all 25 fragments is
0.26 25 = 2×10 -15 . Therefore, X and M must be related. The final and most difficult question is whether M's sister, who was not used in the analysis, can be X's mother (the father, of course, must be M's husband).
If a band is shared by any person with an average probability of 0.26, then the corresponding probability that a fragment of one person is also present in a sibling is 0.62. The probability that M is a sister of X's true mother and happens to contain all 25 of X's mother specificity bands is therefore 0.62 25 =3×10 −6 .
We therefore conclude, beyond any reasonable doubt, that M must be the true mother of X. This evidence was provided to the immigration authorities, who discontinued the dispute against X and granted him residence in the UK, allowing him to remain with his family. This difficult case shows that DNA fingerprints can provide clear positive evidence of kinship even when key family members are missing.
This case is simplified by the fact that X has the same father as his compatriot, and that this father transmitted no bands exclusively to X (on average, 1/16 paternity bands are transmitted). was made into Such X-specific fragments clearly weaken the proof of kinship between X and M, but in fact they do not necessarily invalidate the analysis. X does not appear to have more than 5 such paternal fragments in addition to the 25 maternal specific fragments. If X and M are unrelated or if M is an aunt of and 9×10 -3 . Therefore, this analysis is strong and provides unequivocal evidence for or against the claimed kinship in most such cases. Normally, of course, all family members will be available, for example in paternity disputes or where it is difficult for the family to be reunited due to immigration. DNA
Fingerprints can almost always solve such problems. Quantification of DNA fingerprints M had 61 DNA fragments recorded, compared to 39 fragments specifically inherited from his father. 1/8 of the father's heterozygous DNA fragments are B, S1
or not transmitted to S2, so the correction value for the number of paternal-specific fragments is 39 x 8/7 = 45.
Since the total number of fragments in the DNA fingerprints of M and father are approximately equal, the number of fragments in M shared by father is approximately (61-45)=16. The average probability x of band sharing in M and the father is therefore 16/61=
0.26, consistent with a preliminary estimate obtained from screening a random sample of Northern Europeans (x = 0.2, control 2). Approximately half of the 45 paternal bands were transmitted to B, S1 and S2 (18, 24 and 18, respectively), as expected for heterozygous bands. Of M's 61 bands, more than half are in B, S1, and S2, as expected since some of M's bands are also present in the father and are therefore transmitted to most or all of the children. Yotsute (32, 38 and 38 respectively)
39 pieces) were inherited. If M's DNA fingerprint contains n shared bands transmitted to all children and (61-n) heterozygous bands transmitted to half of the children, then n+0.5(61-n) = 36.3,
For n=12, it matches the estimate of 16 bands common to M and the father (see above). X's DNA fingerprint consists of 21 paternal-specific fragments and 40 M
Consists of bands in common with The proportion of the latter band that is mother-specific and not shared with the father is calculated in two ways. First, the number of mother specificity bands is
It is almost equal to the number of paternal specificities, which is 45/2 = 22.5. Second, n of the 40 maternal bands in X (approximately
12) is a shared maternal/paternal band (see above), leaving X with 28 maternal-specific bands. The number of fragments that X specifically acquired from his mother is therefore approximately
It is 25. Probability of Band Sharing The average probability that a fragment in one individual will be matched by a band of similar electrophoretic mobility and autoradiographic intensity in a second arbitrary person is x
(x=0.2−0.26, see above). Larger minisatellite fragments probably have lower allele frequencies and better electrophoretic separation;
The frequency with which it is shared becomes less, so the fragment sharing probability x is non-uniform. Almost all the fragments are
Since they are inherited independently, the highest probability that all n fragments in an individual are present in any second individual is therefore x n . Non-uniformity in x reduces this probability. Band sharing between siblings If the shared bands always represent the same allele of the same hypervariable locus, then x = 2q − q 2
is related to the average allele frequency q, which states that the probability that a given band in an individual is also present in a sib is (4+5q- 6q2 + q3 )/4(2-q). Since x=0.26, q is 0.14 and the proportion of bands present in the first sibling that are shared by the record is 0.62. This probability decreases slightly if we assume that the bands shared by any person are never the same allele, ie, many minisatellites have alleles of the same size. Application of DNA fingerprints to the analysis of genetic diseases To determine the possibility of using DNA fingerprints for linkage analysis in humans, in particular for the study of hypervariable DNA fragments that segregate together with disease loci in large kindreds. We investigated the DNA fingerprints of two large families, one segregating for neurofibromatosis and the other for genetic persistence of placental hemoglobin, apparently determined by an autosomal dominant gene not linked to the β-globin gene population. separated). Example 8 Isolation of Hypervariable Minisatellite Fragments in the DNA Fingerprints of a Sibling Group Affected by Neurofibromatosis Blood DNA samples digested with Hin f were isolated to a length of 35 cm.
Electrophoresis was performed on a 0.7% agarose gel, and hybrids were formed using the Southern method with minisatellite probes 33.6 and 33.15. Unaffected father (F), 5 sons (S) and 6 daughters (D)
Figure 7 shows the DNA fingerprint of The affected mothers were not used in the study. Offspring with multiple neurofibromas are indicated by (+); the remaining offsprings are
He showed no signs of neurofibromatosis. Separated paternal (●) and maternal (○) heterozygous DNA fragments are shown, and segregation into offspring was recorded directly from the original autographs taken with short, medium, and long-term irradiation. Only DNA fragments whose positions and relative intensities in each offspring matched those of the parents were recorded. The linked pairs of DNA fragments AB that separate AB or -- into progeny are joined by continuous lines. Alleles separating A- and -B are joined by dotted lines. The single maternal fragment showing evidence of consequential linkage to neurofibromatosis is marked with an asterisk; all six affected offspring inherited this fragment, and four of the five unaffected children Humans do not have this band, resulting in a 10/11 match between inheritance of this band and neurofibromatosis. Materials and Methods DNA Isolation Fresh blood was layered onto an equal volume of 1x SSC (SSC, sodium citrate saline, 0.15M NaC1, 15mM trisodium citrate, pH 7.0), Histopaque−1077 (Sigma). , nucleated cells were collected by centrifugation. Alternatively, thaw frozen blood in double volume of 1x SSC and collect 10,000 g
Nucleated cells and nuclei were pelleted by centrifugation for 15 minutes at . Written by Jeffreys, A.J.
(1979), Call, 18 , 1-10, high molecular weight DNA was produced. Analysis by Southern Method A 5 μg sample of human DNA was analyzed using 20 units of Hin f in the presence of 4 mM spermidine trichloride.
Digested for 2 hours at °C and recovered by phenol extraction and ethanol precipitation. 16 μl of restriction digest
H 2 O + 4 μl gel loading mixture (Fuicol 400
12.5%, Bromophenol Blue 0.2%, Tris Acetate 0.2M, Sodium Acetate 0.1M, EDTA
1mM, pH 8.3) and 5mg/ml ethidium bromide, dissolved in 2μl of horizontal agarose gel (Tris acetate 40mM, sodium acetate 20mM,
EDTA 0.2mM, ethidium bromide 0.5μg/ml
(0.7% Sigma type agarose in pH 8.3, 0.7 cm thick x 20 cm or 35 cm long). After equilibrating for 10 minutes, the gels were electrophoresed at 2 V/cm for 24-48 hours until all DNA fragments less than 1.5 kb in length were electrophoresed from the gel.
DNA was transferred by blotting onto a nitrocellulose filter (Sart-orius, pore size 0.45 μm). Human minisatellite M13
32P -labeled single-stranded probe DNA was prepared from recombinant 33.6 and 33.15 and incubated at 65°C in 1xSSC.
Hybridize to Southern blots and autoradiograph as described in the primary application. Data Analysis Separate data and chain analysis were stored on a BBC Model B microcomputer. Table 2 summarizes minisatellite markers in neurofibromatosis families. [Table] The number of different loci recorded (c) is n-a-b
obtained by. The entire DNA fingerprint, including unseparated and therefore unrecorded fragments, is derived from N heterozygous loci (2N fragments). recorded (n-b)
The approximate total number of hypervariable loci detected by a given probe N, assuming that the apparent fragments are a random sample of 2N bands in the DNA fingerprint.
is related to the number of allele pairs by the following formula: N = 1/2 [(n-b) (n-b-1)/2a+1] [Table] Transmission frequency of hypervariable fragments (Figure 7) To study the probes 33.6 and
33.15 the number of fragments detected by the transmissibility 50
% (Table 4) and compared with the predicted number obtained by the binomial distribution 11 Cr·n/2 11 . Fragments present in all children may be from homozygous loci and were ignored. Maternal fragments that were not passed on to any children had no maternal DNA available, so
I couldn't record it. Average transmission frequency (+S.EM)
You can also get By recording the number of offspring matching for AB (AB or --) using all possible pairwise comparisons of paternal or maternal fragments with initially excluded alleles and linked bands. (i.e., the c locus was analyzed for each parent. See Table 3, c(c-
1)/2 to obtain control comparisons). Pairs of fragments appearing in groups of 0 or 11 children represent alleles or closely linked pairs, respectively. By definition, pairs do not belong to any group. Compare the observed distribution with the predicted value if all c loci were unlinked (U). In this case, the number of pairwise comparisons giving exactly r(AB or --) offspring is given by the binomial distribution 11 Cr/2 11 ·c(c-1)/2. Furthermore, the c loci are clustered and evenly spaced, and adjacent loci are separated by a recombination frequency θ (10, 20
or 30 cM apart). Therefore, the population is (c-1)ψ
It will spread over the locus unit [in the formula, ψ=-1/21n (1-2θ)]. For the c locus (randomly sampled at one or the other allele), exactly r (AB or --) among 11 sibships.
The number of pairwise comparisons yielding descendants of is given by the following formula: 〓i=c-1 (c-i) 11 Cr i=1[x i 11-r (1-x i ) r +x i r (1-x i ) 11-r /2] [In the formula, x i is the recombination fraction between two loci separated by i figure units, and x i is the mapping function: x i = 1/2 ( 1−e -2i ψ)]. Results DNA Fingerprint Probes The two minisatellite hybrid-forming probes used in this study are detailed in their primary applications.
Probe 33.15 consists of a cloned human minisatellite consisting of 29 repeats of a 16 bp variant of the core sequence. The minisatellite repeat unit in probe 33.6 is a different trimer of the most conserved 11 bp 3' end of the core sequence, repeated 18 times. The sequences of the core and probe repeat units are as follows: A Core GGAGGTGGGCAGGAGG 33.15 AGAGGTGGGCAGGTGG 33.16 AGGGCTGGAGG Probes 33.6 and 3.15 Differences in the sequence and repeat length of the probes result in a long hypervariable minisatellite in the Hin f digest of human DNA. Different patterns of fragments will be detected. This 4bp restriction endonuclease uses small flanking DNA
The separation of different minisatellites is maximized by releasing long tandem-repetitive minisatellites in DNA fragments with . Analysis of DNA fingerprints in a large sibling group To investigate the segregation of individual minisatellite DNA fragments, a large sibling group of 11 British individuals was diagnosed with neurofibromatosis (Recklinghausen).
disease], an autosomal dominant disorder associated with tumors of the peripheral and central nervous system. Genetic marker traits had not yet been linked to the disease. Of 11 children (6 affected, 5 unaffected),
Blood DNA fingerprints detected with probes 33.6 and 33.15 were compared to their unaffected father in Figure 7. Isolation of minisatellite DNA fragments,
Maximized by electrophoresis on a 35 cm long agarose gel. Many of these hypervariable minisatellites, especially very large DNA fragments, have low allelic frequencies and are rarely inherited by unrelated individuals, as mentioned above, and therefore these in families with neurofibromatosis. Many of the fragments exist in a heterozygous state and are transmitted to only some progeny. Even when DNA from the affected mother was not available, minisatellite fragments derived from the mother could be easily identified as fragments present in some offspring but not in the father. Paternal fragments could also be identified in the same way. Separation of 41 paternal and 32 maternal DNA fragments in this sib group using probes 33.6 and 33.15 (Figure 7, Table 3)
was able to record. A number of additional polymorphic fragments were also present, but either electrophoretically removed from the gel or incompletely resolved and therefore could not be reliably recorded. By comparing the segregation patterns of all paternal or maternal DNA fragments in this large sibship group pairwise, allelic pairs of fragments and pairs exhibiting close linkage in competitive conditions can be identified (this The probability of simultaneous separation of a given pair of bands in a sib group is 1/1024). Several examples of allelic pairs of paternal and maternal fragments could be identified with both probes (Figure 7). Also, the probe
33.6 detected linked pairs of fragments in the mother and father.
A similar linkage is seen in a second kindred (shown below), in which at least one hypervariable region that hybridizes to probe 33.6 contains an internal cleavage site for Hin f and thus can be cleaved. This suggests a long minisatellite/satellite that produces two or more fragments that separate simultaneously as a minisatellite "haplotype" in the family.
The polymorphic DNA fragments recorded using probe 33.15 were not present in the combination of fragments detected by 33.6. Such fragments that hybridized to both probes would be detected as equally sized bands transmitted from the same parent to the same child (ie, "linked"). These two probes therefore hybridize to essentially completely different subsets of human minisatellites. By eliminating alleles and linked fragments, it was concluded that 34 and 25 distinct paternal and maternal loci, respectively, were recorded (Table 3). For approximately 80% of loci, only one of the two alleles is separated, with the second allele probably present in a less-separated complex of relatively short minisatellite fragments. This means that there are large differences in minisatellite allele length, probably due to unequal exchange in these tandem repeat regions. Several allele pairs identified in FIG. 7 do indeed exhibit substantial length differences. From the proportion of matching bands in the alleles, it can be estimated that the total number of heterozygous loci present in the total DNA fingerprint detected by probes 33.6 and 33.15 is approximately 43-66; Approximately half of these are recorded by the father and mother (Table 3). It is not possible to measure the antagonism between the paternal and maternal fragments in this sibship. All of the recorded paternal loci are autosomal and show no specific transmission to daughters (X-linked) or sons (Y-linked). Furthermore, all pairs of paternal DNA fragments AB apparently segregate independently into the offspring;
On average, the same number of (AB, --) or (A-, -B)
give rise to progeny. The exact number follows the expected binomial distribution for unlinked loci. Maternal DNA fragments showed similar behavior. A more detailed analysis shows that the minimum loci-to-locus spacing for these loci is ≦30cM.
It turns out that it must be (in units of 46 figures). Closer spacing results in a significant number of pairs of fragments that tend to segregate simultaneously (linked in a coupled state) or as pseudoalleles (linked in a reciprocal state) (Table 4). Therefore, separable minisatellite loci must be spread over at least half of the 3000 cM long human genome and, therefore, must be scattered across many or all of the human autosomes. It won't happen. One maternal minisatellite fragment (Figure 7) is
Showing weak evidence of coupling linkage with neurofibromatosis, 10/11 children were concordant for this fragment and disease. (θ=10cM, p=0.006). However, since 25 different maternal loci were recorded, the probability that at least one allele at these loci, by chance, exhibits the observed degree of linkage in a coupled or reciprocal state is high (p = 0.24). Example 9 DNA fingerprinting of a wide pedigree: Possible linkage to HPFH DNA fingerprinting analysis was extended to an extensive four-generation pedigree of Gujyarat people segregating for β-thalamic anemia and hereditary hyperfetal hemoglobinaemia (HPFH). Autoradiographs of the label separation patterns shown in Figures 8A and 8B were prepared as follows. A 10 μg sample of blood DNA was digested with Hin f,
Using probe 33.6 (A) or 33.15 (B),
DNA fingerprints were prepared as described in FIG. Electrophoresis was performed on a relatively short (20 cm) agarose gel. The relationships between individuals are shown in Figure 9.
In A, hypervariable fragments a, b, and c are tightly linked and either all present or all absent in each individual in the pedigree. In B, band g and HPFH (H)
are separated at the same time. Individuals 7 and 8 are identical twins and have indistinguishable DNA fingerprints. Materials and methods were the same as in Example 8. Simultaneous separation analysis is shown in Figures 9A and 9B. In Figure 9A, progeny 1-11 of 30 hypervariable fragments from 4 and 27 fragments from 5.
The separation into was screened for possible linkage of the parental fragment pairs AB. Possible instances of linkage showing at least 6/7 (AB, --) progeny were further investigated for additional kinship. Two very clear linkage examples are shown (a-f, presence of fragments a-f in individuals; • absence of fragments). Fragments a-c and e,f each show complete simultaneous separation, and fragment d shows a-c
Although they have a tendency to separate at the same time, sibs 1-4
is uninformative and identical twins 7 and 8 are recombinant with inherited a-c but no d. FIG. 9B shows the inheritance of β-thalassemia trait (〓, 〓), HPFH (H) and minisatellite fragment g. An individual is recorded as having HPFH if the individual exhibits >1% HbF (normal) or >3% HbF (β-thalamic anemia trait). HPFH and β-thalassemia traits are 1
-11 and 5-8 independently separated and unlinked loci. Fragment g separates completely simultaneously with HPFH in the individuals tested. Results As shown in Figures 9A and B, elevated HbF is transmitted independently of the β-thalamic anemia trait and is clearly associated with an autosomal dominant locus not linked to the β-globin gene population. It is measured accordingly. A similar Sardinian ancestry was reported by Gianni et al.
EMBOJ., 2, 921-925 (1983). Figures 8A and 8B show 30 different fragments of grandfather (4) and 27 of grandmother (5).
A fragment was recorded. Their seven descendants (1-1
The study of 1) found that these fragments are derived from at least 22 distinct unlinked paternal autosomal loci and 18 maternal autosomal loci, using criteria recorded for neurofibromatosis families. Remaining
DNA fragments demonstrate allelism or linkage to other fragments, but this demonstration in small sibships is not possible (a given pair of parental DNA fragments can be linked or allelic to a sibship of 7). (has a 1/64 chance of being transmitted by chance as a gene). Additionally, we looked for evidence of linkage in additional members of the family, and two very strong linkage examples are shown in Figures 8 and 9. Fragments a, b and c detected by probe 33.6 are:
4 to its children (1-11) and then to grandchildren (1-8) in a complete chain. The recombinant form is found in 14 informative progeny (p=4×10 −9 for bands that separate simultaneously). As mentioned above, this is a minisatellite "haplotype" in which fragments a-c originate from a single hypervariable locus.
means to represent. It also proves that band d detected by probe 33.15 is linked to bands ac. However, one sib group (1-4) does not give information because both parents have fragment d, and the other (5-8)
includes recombinant types (identical twins 7 and 8).
The evidence for linkage between band d and the a-c population is therefore weak (θ=10 cM, p=0.01). motherhood band e
(detected by 33.6) and f (detected by 33.15) show tight linkage in the descendants of 4 and 5 and additional sib groups 15-20 and 17-22 (information of 20 individuals). (no recombinants, θ = 0 cM, p = 10 -6 ). Since probes 33.6 and 33.15 detect different combinations of minisatellites and do not form hybrids to fragments e and f, these fragments represent examples of reliable linkage between two different autosomal minisatellite loci. . Finally, two linkage groups (fragments a-c and e-
f) are not alleles at the same locus. One of the individuals is a compound heterozygote with a paternal a-c population and a maternal e-f pair. Both groups are his 4
be transmitted to two of a person's children and do not segregate as alleles, but instead must be derived from two unlinked hypervariable regions. Maternal (5) minisatellite fragments do not show significant linkage to β-thalassemia traits and therefore
It is not tightly linked to the β-globin gene cluster on chromosome 11. In contrast, the 8.6 kb long maternal fragment (g) segregated at the same time as HPFH in an informative sibship of 7 offspring and 3 grandchildren (Figure 9). Showing a tight linkage (θ=0cM, p=2
×10 -4 ) No recombinant type was observed in 12 progeny. This linkage is still significant even considering the fact that we examined 17 loci in 5 (probability that an allele of at least one of the 17 recorded loci coincidentally cosegregates with HPFH). is 0.004). Furthermore, we can confirm that fragment g in 5 is only one minisatellite allele and not the two separated DNA fragments listed above.
This was done by examining the DNA fingerprints of all individuals shown in Figure 9, digested with Sau 3A instead of Hinf. All positive fingerprints, as predicted for a single minisatellite fragment,
Fragment g contained a corresponding Sau 3A fragment of similar size (8.2 kb vs. 8.6 kb). Discussion Human pedigree analysis ensures that the DNA fingerprints detected by minisatellite probes allow us to study the segregation of large numbers of heterozygous DNA fragments even in families where one or the other parent is not available for study. Indicates that it can be used. Using two such probes, up to 34 hypervariable loci can be analyzed simultaneously in one individual, which is a much higher genetic potential than can be obtained using traditional methods, including RFLP, in human genetics. The kinetics of labeled trait production can be analyzed. The stable inheritance of the various minisatellite fragments together with the low population frequency of the individual fragments makes them ideally suited for linkage analysis, as shown in the linkage examples found in the two families analyzed. become. These hypervariable minisatellites may be recombination hotspots, but the expected rate of unequal exchange (1
(approximately 0.001 per factor) is not sufficient to significantly disrupt the linkage between minisatellite loci and neighboring genes, such as disease loci. The total number of hypervariable loci detected together by minisatellite probes 33.6 and 33.15 is calculated to be approximately 60. At least one of the two alleles in about half of these loci can be separated in a given DNA fingerprint, so if the DNA fingerprints are different, the spectra of the loci tested will not be identical. Most or all of these loci are not genetically linked and therefore must be scattered over a significant proportion of the human genome. Their exact locations have not yet been determined and must await cloning and regional localization of individual hypervariable minisatellite loci. Curiously, no minisatellites were yet detected on the X or Y chromosomes in either of the families studied. about 43
Different loci were recorded for possible sex in the father of the neurofibromatosis family, along with individual 4 in the HPFH family. Since the X and Y chromosomes together make up about 5% of the male genome, the probability that 43 randomly distributed loci are not present on these chromosomes is (0.95) 43 =0.1. Therefore, the apparent loss of sex-linked minisatellites is not significant. These dispersed hypervariable minisatellite loci are
It is suitable for studying markers linked to disease loci, as demonstrated by the hypothetical example of linkage to neurofibromatosis and HPFH. Unlike traditional single-locus genetic analyses, linkage data cannot be collected among small, unrelated kindreds because different minisatellite alleles are likely associated with disease loci in each kindred. Instead, DNA
Fingerprints alone are especially suitable for the study of linkage of dominant disorders in extended families and, most ideally, in a single large sibling group. To date, probes 33.6 and 33.15 have recorded up to 34 autosomal hypervariable loci in the individual. The probability that at least one of these loci is tightly linked to a given disease locus is 20%, assuming an arbitrary distribution of minisatellites into a 3000 cM long human linkage diagram. For extensive pedigrees such as HPFH families, this probability is approximately 10%, as only one allele at most loci can be recorded, and to detect linkage this allele must be at the disease locus. must be chained in a discounted state. Increasing these probabilities above 50% requires records of more than 104 hypervariable loci in one large sibling group and more than 208 loci in an extended pedigree. These numbers exceed the total number of loci detected by the two minisatellite probes used so far. However, probe 33.6 and
33.15 detected different combinations of hypervariable loci essentially as a whole, suggesting that the total number of human minisatellites containing various core sequences is large. In traditional human pedigree analysis using defined monolocus markers, proof of linkage between the marker and the disease locus usually directly gives the approximate genomic location of the disease gene and analyzes additional pedigrees. This can be further established by The reverse is also true for DNA fingerprints. Further analysis of possible linkages between hypervariable DNA fragments and diseases is made possible by isolating the fragments by preparative gel electrophoresis and cloning. Locus-specific hybridization probe design from isolated minisatellites by using specific sequence segments that directly flank the minisatellites or by using body minisatellites in high stringency hybrid formation can do. Such locus-specific probes can be used to extend linkage data to additional families and to localize minisatellites within the human genome. This approach has now been confirmed by cloning an 8.2 kb Sau 3A minisatellite fragment apparently linked to HPFH in a Gujyarat ancestry. Probes consisting of human minisatellites, each containing a different variant of the core sequence, as described above.
33.5, 33.6 and 33.15 yield different DNA fingerprints,
Thus, various combinations of hypervariable minisatellite regions in human and other vertebrate DNA are detected. In particular, probes 33.6 and 33.15 detect most or all of the different combinations of minisatellites as a result of differences in the length and precise sequence of the repeat cores present in each probe (Third Application and AJ Jeffreys, V. Wilson, S.L.
To test the possibility of detecting additional hypervariable regions using tandem repeats of other core sequences, a series of synthetic A mini-satellite was created. Example 10 Synthesis and cloning of artificial minisatellites
Outlined in Figure. FIG. 10 illustrates a method for producing cloned tandem repeats of the E. coli crossover hot spot initiator sequence (Chi, GCTGGTGG). Polly
The steps for making Chi probes, using standard DNA techniques, are as follows: 1 Synthetic oligonucleotides containing tandem repeats of Chi sequences 8 nucleotides in length are
Mattes et al. (1984) (EMBO J., 3 , 801~
805) and DGBrenner & W.V.Shaw (1985)
Manufactured by the method of EMBO J. 4 , 561-568. A second oligonucleotide consisting of a dimer of complementary sequences of Chi was synthesized. 2 These two oligonucleotides at 10mM
MgCl2 , 37 in 10mM Tris-HC1 (pH 8.0)
were annealed together at °C to form short double-stranded segments of DNA. The sequence of the second oligonucleotide was chosen to yield an annealed molecule with a 3-nucleotide long 5' overhang suitable for head-to-tail ligation. 3 Phosphorylated the 5' end using T4 polynucleotide kinase and ATP. 4 The annealed DNA fragments were ligated together in a head-to-tail manner using T4 DNA ligase and ATP to produce repeated Chi polymers. 5 The linked polymers were separated by size by electrophoresis on a 1.5% agarose gel, and polymers greater than 150 base pairs in length were isolated by electrophoresis on DE81 paper (Dretzen, G.,
Bellard, M., Sassone-Corri, P. &
Chambon, p., 1981, Anal.Biochem.
112, 295-298). 6. The long polymers recovered were blunt-ended by fill-in repair using the Klenow fragment of E. coli DNA polymerase.
M13mp19RFDNA (J.Messing & J.Vieira,
1982. Gene 19 , 269-276) into the Sma site. The ligated DNA was transformed into E. coli JM101 and single-stranded phage DNA was isolated from individual white plaques. 7 The DNA insert of each cloned isolate was isolated using the dideoxynucleotide method (MDBiggin, TJGibon
& H.F.Hong, 1983.Proc.Nat.Acad.Sci.USA
80, 3963-3965) to measure the length, direction, and alignment of the polymer inserts. 5′→3′ orientation in mature single-stranded phage DNA
Recombinant M13 containing 50 tandem repeats of the Chi sequence
A phage was found and is designated M13 Core A (i.e. the insert is poly(Chi) and not poly(complement of Chi)). 8 32 P-labeled single stranded hybridizing probes were prepared by primer extension method using the same method used to prepare probes from phages 33.6 and 33.15. Examples 11-15 Production of 5 newer artificial minisatellites Using the techniques described above, 5 more core sequences were synthesized and cloned into M13 as a multi-core recombinant, resulting in recombinant M13 core A-F. I got it. Core variants were selected to vary the length and exact sequence of the core. Table 5 shows Clone M13/Core A
-Previously used probes 33/5, 33.6 that described repeat sequences in F as core sequences and early applications
Compare and summarize with 33.15. Underline highly unchanged bases in the core sequence. The orientation of each insert in vector M13mp19 is also shown [→ is
The insertion part is poly(core). ← indicates that the insert is a complementary sequence to poly(core). ] Bases written in lowercase letters indicate departures from the core sequence. Summarize the simple characteristics of each sequence in an “annotation”. [Table] Example 16 M13/core A- to human DNA digested with Hinf
Hybridization of F. In an initial screen, DNA digests from two unrelated individuals were mixed with 33.15 and probe M13.
Each of cores A-F was explored. An 8 μg sample of DNA from two unrelated placentas (1, 2) was
The fragments were digested with Hinf, electrophoresed on a 0.7% agarose gel, plotted using the Southern method, and hybrids were formed for each probe labeled with 32 P by the procedure described in the main application. The resulting autoradiograph is shown in FIG. All probes detected multiple DNA fragments in each individual. Results Probes B, C and D each detected DNA fragment fingerprints that were substantially different between the two individuals. Although the fingerprint varied with the probes, some fragments were picked up by more than one probe and overlapped to some extent with the combination of hypervariable fragments detected by probe 33.15. Probes B-D are all suitable for DNA fingerprinting;
We conclude that together they expand the number of hypervariable minisatellites that can be tested in humans and other vertebrates. Here, the effective fingerprint obtained using core C, which contains only the central most conserved 7 base pair segment of the core sequence, is important. When the tip of the core is further truncated to generate a six base pair repeat in core E, the DNA fingerprint pattern is
It shows a combination of fragments that are completely varied and mostly shared by the two individuals tested (ie, these fragments do not exhibit extreme polymorphic variation). Therefore, Core E does not appear to be as useful a probe for DNA fingerprint analysis as the previously used probes 33.5, 33.6 and 33.15.
This also suggests that a core sequence of at least 7 base pairs is indeed required for effective DNA fingerprinting in general. Also, core (M13/Core G)
Disruption of the most conserved regions at the center of the DNA is likely to reduce the complexity and variability of the DNA fingerprint pattern. M13 Core A (polyChi) generates a novel and strong pattern of hybridizing DNA fragments.
Many of these fragments are extremely large (>
15 kb), are not well separated and may be derived from conventional long satellite sequences containing an optionally present Hin f cleavage site. some DNA
Fragments exhibit individual variability. Example 17 Detailed Examination of Core A In a family affected by neurofibromatosis, which was extensively characterized using probes 33.6 and 33.15, M13.
The pattern produced by Core A was further analyzed (see Example 8 and Figure 7). Figure 12 shows DNA fingerprints from Hin f digests of DNA from a father (F), six daughters (D), and five sons (S). Individuals affected by neurofibromatosis, an autosomal dominant cancer, are marked +. from a sick mother
DNA was not available. Separating fatherhood (●)
and maternal (○) band. Bands joined by solid lines are linked, and bands joined by dotted lines segregate as alleles. Bands marked (x) were previously detected using probe 33.15. Results DNA obtained using probes 33.6 and 33.15
Unlike fingerprints, the level of variability is relatively low;
A large number of fragments are transmitted to all descendants (i.e.
These fragments are common in the population;
(not uncommon, often present in a homozygous state). Separation of 6 heterozygous paternal and 9 heterozygous maternal bands was recorded in a sibship group of 11 children. Allele pairs of one of the paternal bands and the maternal band were previously detected with probe 33.15. After eliminating allelic pairs and linked pairs of bands, 2 new paternal loci and 6 new maternal loci remain unrecorded with probes 33.6 and 33.15, leaving 34 prerecorded paternal loci loci and 25 maternal loci. Therefore, polyChi probes have limited use in human genetic analysis. The results of Examples 16 and 17 underline the top row of Table 5 and confirm the importance of the nine dominant nucleotides discussed in the main uses section. They also go a long way in confirming the prediction made in primary applications that an effective probe core requires a minimum sequence of six nucleotides. Therefore,
Core E represents the minimum availability and includes other sequences of 6 nucleotides, such as the sequence TGGGCA discussed below.
can show marginally improved utility. The increase to 7 nucleotides is quite dramatic within the framework of the study. In an attempt to define the essential elements of a useful core sequence, the variants X and Y used above to represent alternative nucleotides can be usefully expanded into a complete theory as follows: X=A or G P=G not Y=C or T (Q=not A) W=A or T (R=C not) V=C or G (S=not T) (O=any) ( ) = Not used in the following discussion. Using this terminology, embodiments of the invention can be said to include polynucleotides that include the following repetitive core sequence: GPGGCWGGWXG (6). The above sequence, of course, represents the most representative 12 nucleotide sequence. However, the 7-nucleotide core C was also found to have significant utility, and the "accepted"
To include those with variants, one embodiment may also be said to include polynucleotides comprising repeats of the following heptad core sequence: PGGGCWG (7). Of course, P is preferably equal to T as in core C. The other most preferred is A
Will. For clarity, the homology percentages have already been shown in Table 3. For artificial probes of this use, the repeats are precisely repeats, and the homology of the minisatellite as a whole can be demonstrated by the homology of the core sequence. This is not necessarily true for probes 33.6, 33.15 and 33.5 above, whose homology is shown in parentheses. This is due to mutations that occur between repeats. Core F probably shows the lowest homology rate in terms of utility. However, this discrepancy was probably exaggerated by the disruption of the central group present in the core: TGGGCA (8). It is noteworthy that said group is present in the most effective probes B, C and D, and is destroyed in all of the less effective probes A, E and F. Therefore, Eq.
It is expected that more effective probes with an overall homology of at least 70% with (6) will be obtained. It is noteworthy that the central 6 polynucleotides of formula (8): TGGGCA (8) are also destroyed in core E. Probably the above 6
The nucleotide core sequence is more effective, but increasing the length from 6 to 7 nucleotides is expected to demonstrate even more dominant properties. Accordingly, embodiments of the invention provide that the core sequence TGGGCA
can be said to include polynucleotides containing repeats of. More generally, the invention can be said to include, as one aspect, polynucleotides according to the above "first" definition in which the sequence TGGGCA is present in all repeat sequences. Viewed from another aspect, the present invention provides that the core has the formula (2)
comprising a modification of a polynucleotide of the "first" definition above representing a sequence of at least six consecutive nucleotides, read in the same 5'→3' sense, selected from the sequences shown in I can do it.
A "core" does not necessarily have the same sequence in each repeating unit, as long as all units contain the sequence TGGGCA. The remaining groups of each unit have at least 70% homology with the sequence of formula (6) (or more preferably (2)) within the constraints of the total unit length. 〓Measurement of twin zygosity at birth The measurement of zygosity in twins is based on epidemiological,
Not only for genetic and obstetric research purposes, but also because of the differences in prediction between identical and fraternal twins.
is important. Identical twins have lower birth rates, lower body weight, more medical complications, and higher mortality than fraternal twins. In the Caucasians, newborns of approx.
30% have different sexes and are therefore dizygotic. When the placental membranes are examined, another 20% of cases are found to be monochorionic, and these are always monozygotic.
The remaining 50% are a relatively constant proportion of the population, are of the same sex, have a dichorionic diamniotic placenta, and can be monozygotic or dizygotic. A variety of methods were used to determine zygosity in these cases, including evaluation of general appearance, fingerprints, skin grafts, taste testing, and measurement of genetic marker traits. The latter is the most reliable, with an accuracy of 95-98%, but because the average heterozygosity of most protein and antigenic variants is relatively low, it is usually necessary to investigate a large number of such marker traits. Follow me. In the example below, DNA from 12 sets of newborn twins
was tested using minisatellite DNA probes as described above. The resulting DNA "fingerprints" vary from person to person, proving that only identical twins exhibit identical patterns. In seven cases where zygosity could be determined from sex observation or placental testing, DNA results were consistent with these findings. Zygosity was determined by DNA analysis in five other twin pairs and two triplets.
could be measured quickly. The DNA probe according to the invention therefore provides one genetic test that can positively measure zygosity in all cases of multiple pregnancies. Example 18 Using single-stranded DNA probes 33.6 and 33.15,
The zygosity of 12 pairs of newborn twins was measured. The details are shown in Table 6. [Table] Umbilical cord blood sample collected at birth or peripheral blood sample (0.5-1.0ml) obtained from each infant the day after birth
was used for DNA extraction. Test the placenta
It was determined whether the placenta was mono- or di-amniotic and mono- or dichorionic. DNA was extracted using standard methods (Old, JM,
Higgs, DR, Genetic Analysis, DJWeatherall,
10-15 μg were digested with Hin f. Place the sample on a 22 cm long 0.6% agarose gel at 45 V at approx.
Electrophoresis was performed for 36 hours until all DNA fragments less than 1.5 kb in length were electrophoretically removed from the gel. DNA was transferred by blotting onto a nitrocellulose filter at 80°C under vacuum.
Baked for an hour. Single-stranded DNA probe, 33.
15 and 33.6 were labeled with 32P as above. The results are shown in FIG. In FIG. 13, columns 1 and 2 show the DNA banding patterns obtained for each twin of case 1 using the 33.6 single-stranded minisatellite probe. Examples 3 to 19 show "fingerprints" obtained using a single-stranded 33.15 probe; Case 1 shows rows 3 and 4.
Case 2 is in columns 5 and 6; Case 3 is in columns 7 and 8; Case 4 is in columns 9 and 10; Case 5 is in columns 9 and 10;
Case 6 is in columns 11 and 12, case 7 is in columns 13 and 14.
are shown in columns 15 and 16. Columns 17-19 show three triplets: female, male and female. Comparing rows 1 and 2 with rows 3 and 4, the two probes 33.6 and
It can be seen that 33.15 detects various combinations of minisatellite bands. Size labels are given in kilobases. In seven cases (see Table 6), the sex of the twins and their zygosity could be easily determined by testing their placental membranes. All twins with a monochorionic (or monoamniotic) placenta (e.g., case 1) are identical, but only about 50% of identical twins have a monochorionic (or monoamniotic) placenta (2). Nakatsuta. Therefore, the twins in case 1 must be monozygotic and showed identical DNA patterns with the 33.15 and 33.6 probes (Figure 1). In five cases, the twins were of different sexes and showed different band patterns with the 33.15 and 33.6 probes. In cases 3, 5, 7, 9 and 11, the twins have the same sex, have a dichorionic placenta, and can be monozygotic or dizygotic.
Two sets of twins (cases 5 and 9) were identified by DNA analysis.
The cases had different band patterns and were therefore dizygotic, while the other three pairs (cases 3, 7, and 11) had the same band pattern and were found to be monozygotic. Two sets of newborn triplets were similarly studied. In both cases, the mothers were taking fertility drugs to induce pregnancy. Each triplet exhibited a unique bunt pattern (eg, Figure 13, rows 17-19). The results are shown in FIG. In Figure 14, columns 1 and 2 show results using single strand 33.15;
Columns 3 and 4 show the results using duplex 33.15. Example 19 Although single-stranded or double-stranded probes are suitable for each diagnosis, multiple bands could be distinguished using multiple radioactive single-stranded probes (Figure 14). As an alternative to these single-stranded probes, we investigated the possibility of using the corresponding double-stranded probes, which are more familiar to most laboratories. The double-stranded probe used was a double-stranded 600bp Pst I-Aha containing the “core” minisatellite from λ33.15.
fragment and) was a double-stranded 720 bp Hae fragment containing the "core" minisatellite from λ33.6.
These were labeled by nick translation until a specific activity of 0.5-1.0×10 9 cpm/μg DNA was achieved. Prehybridization and hybridization conditions were as described in the standard method above, except that 1×SSC and 10% dextran sulfate were used in the hybridization buffer for the double-stranded probe. Filters were washed in 1×SSC at 65° C. for 1 hour and electrophoresed using an intensifying screen at −70° C. for 1 to 3 days. Discussion of Examples 18 and 19 In the seven cases where zygosity could be determined independently, the DNA results were consistent with the conclusions based on sex observations and placental testing. In the other five pairs, unambiguous measurements of zygosity were possible using minisatellite probes. Similarly, the two sets of triplets studied were found to be trizygotic. Genetic analysis must be used in 50% of cases where twin zygosity cannot be determined due to sex differences (dizygotic) or monochorionic placenta (monozygotic). The amount of information from such a test is proportional to the degree of polymorphism at the loci tested and the number of loci tested. By measuring multiple red blood cell antigens and enzymes, zygosity accuracy on the order of 95-98% can only be achieved if the relevant allele frequencies in the population are known (Nylander, PPS, Twin Birth Phenomenon,
Edited by Barron, SL, and Thomson, AM.
Obstetrical Epidemiology. London, Academic
Press, 1983: 143-165). Similarly, several different
Analysis of large numbers of restriction enzyme site polymorphisms using DNA probes yields a significant percentage of monozygotic “false positive” diagnoses (Derom, et al.
C., Bakker, E., Vliet-ineck, R.Derom, R.,
Van der Berghe, H., Thiery, M., Pearson,
P., Determination of zygosity in newborn twins using DNA variants, J.Med.Genet., 1985, 22:279
~282). The minisatellite probe according to the invention overcomes this problem. That is,
This is because the hypervariable DNA segments to be detected are large and can vary significantly. As mentioned above, hybridizing minisatellite fragments are rarely shared among randomly selected individuals. We have already shown that the probability that two unrelated individuals exhibit identical DNA fingerprints with probes 33.6 and 33.15, which detect different combinations of hypervariable loci, is therefore astronomical (p<< 10 -18 , see Example 4). For siblings who share about half of the fragments, the probability of such a “false positive” diagnosis of genetic identity is <
10 -8 . Therefore, when single-stranded hybridizing probes 33.6 and 33.15 are used in combination,
Higher accuracy than traditional genetic testing. Even using the more common double-stranded minisatellite probes (Figure 14), which do not hybridize to some of the relatively weak bands detected by single-stranded probes, it is possible to detect "mistakes" from DNA fingerprints (Figure 14). Sufficient information can be obtained to reduce the ivy monozygotic rate to <10 -4 . Another advantage of this zygosity measurement method is that
Only a very small sample is required for analysis. Usually half a ml of peripheral blood or umbilical cord blood,
Sufficient DNA was obtained. The availability of this unambiguous means of measuring zygosity in newborns and older twins and triplets allows for more accurate epidemiological studies of the determinants and effects of different types of multiple pregnancies. is possible. In the example below, the molecular weight label is not obtained in the autoradiograph, but as in the other results,
A valid general range was 1.5-20kb. Application of DNA fingerprints to forensic medicine Due to the individual specificity of DNA fingerprints detected by minisatellite probes 33.6 and 33.15,
DNA fingerprints become ideally suited for personal identification in forensic medicine. The only uncertainty is that DNA
for example, whether they survive in a sufficiently undegraded state to perform DNA fingerprint analysis in dried blood or semen scars. Home Office Central Research to determine the analyzability of forensic specimens.
Preliminary studies were carried out on DNA samples supplied by Dr Peter Gill of the Establishment, Aldermaston. Example 20 Dried blood and semen scars on cloth were subjected to various tests before DNA extraction (dissolved in SDS in the presence of 1 MDTT, then extracted with phenol and precipitated with ethanol) performed by Dr. Gill. It was left at room temperature for an hour. Similarly, DNA was extracted from fresh hair roots and vaginal swabs taken before and after intercourse. DNA
Samples were digested with Hin f, electrophoresed on a 0.8% agarose gel, and blotted onto nitrocellulose filters. Filter the 32 P-labeled single-stranded probe 33.15 using standard techniques of the invention as described above.
It was made into a hybrid. The samples electrophoresed were as follows: 1. 40 μl of semen scar on cloth, 4 weeks later. 2 40 μl of fresh semen. 3. 60μl of fresh blood. 4 60 μl of blood scar on cloth, after 4 weeks. 5 60 μl of blood scar on cloth, 2 years later. 6. 15 hair roots. note. Samples 1-6 were collected from the same person. 7 Blood scar on cloth 60 μl, male, fresh. 8 Vaginal swab taken from 7 and 11 1 hour after intercourse. 9 Same as 8 except that the sample was collected 7 hours after intercourse. 10 Vaginal swabs taken from 11. 11 Blood scar on cloth 60 μl, female, fresh. The obtained DNA fingerprint is shown in Figure 15. Sufficient DNA (approximately 0.5-3 μg) was extracted from each sample for analysis. DNA remains largely undegraded in dried blood scars up to two years old, and in dried semen up to two months old, producing DNA fingerprints identical to those obtained from fresh blood and semen from the same individual. occured. They were also able to obtain DNA fingerprints from something as small as 15 hair roots. Vaginal swabs taken after sex are not degraded either.
A DNA fingerprint was generated. However, the swab pattern primarily matched that of female rather than male blood. This indicates that most of the DNA collected from the swabs was from vaginal epithelial cells that were detached during swabbing, and not from semen. Nevertheless, three additional non-female bands were detected in the postcoital sample. These corresponded to the major bands in male blood and had to be derived from semen.
Such bands could be detected in samples taken 7 hours after intercourse. Discussion The results of these preliminary experiments indicate that DNA remains intact in various forensic specimens and therefore
It is shown that DNA fingerprints can be applied to at least some forensic samples for identification purposes. For example, it becomes possible to positively identify a rapist based on semen scars on the victim's clothing. Using vaginal swabs from rape victims is less reliable, as vaginal DNA can be contaminated. However, removal of this female DNA by SDS lysis prior to the 2-DTT or mercaptoethanol-mediated reduction of the semen required for semen DNA isolation results in a more pronounced DNA fingerprint. In this case, identification of the rapist is made possible by DNA fingerprint analysis of semen scars and/or vaginal swabs. Then, in a recent study conducted in collaboration with Dr. Gill, using the pre-separation technique generally described above,
Clear “fingerprint” of semen DNA from post-coital vaginal swab
It was confirmed that this was obtained. Figure 15A shows DNA fingerprints (column 3) from two vaginal swabs taken 6.5 hours after intercourse. Column 1 shows the fingerprint from the male partner's blood sample, and column 2 shows the DNA fingerprint from the blood obtained from the female. Female cell nuclei from the swab were collected using SDS/
Preferential lysis was achieved by preincubation in a proteinase K mixture. Sperm nuclei are unaffected by this treatment and can therefore be separated from the female component by centrifugation. Then, the semen nucleus
Lysis was achieved by treatment with an SDS/Proteinase K/DTT mixture. It is clear that this separation operation was completely effective. Semen from semen-contaminated vaginal swabs
The DNA fingerprint was a perfect match to the fingerprint obtained from the other man's blood. Examples of DNA fingerprints of economically important animals obtained using human minisatellite probes 21-25 DNA samples were prepared from blood collected from dogs, cats, sheep, pigs, horses, and cows. 8 μg of the sample was treated with an appropriate restriction endonuclease (unless otherwise specified, Hin
f), and the restriction digest was recovered by ethanol precipitation after phenol extraction. Restriction digests were redissolved in water, electrophoresed on 0.7% agarose gels, denatured, transferred to Schleicher-Schuell nitrocellulose filters, and filtered as described above.
P-label human minisatellite probe 33.6 and
33.15 was used to form hybrids. Example 21 Dog Obtained from a dog family using probe 33.6
The DMA fingerprint is shown in Figure 16. The samples electrophoresed were as follows: Row 1 Beagle father Row 2 Greyhound mother examples 3, 4 and 5 "Greagle" pups of these parents (female, male and male respectively) ). As complex as that obtained from human DNA,
Detailed DNA fingerprints were obtained from each dog. The DNA fingerprints showed significant variability, as seen by comparing the patterns obtained from the father and mother (columns 1, 2). All three puppies each have different DNA fingerprints consisting of bands that can all be traced to their father and/or mother. These DNA fingerprints are therefore useful for paternity testing and pedigree analysis in dogs, as well as in humans. The DNA of samples 1 to 3 was slightly degraded,
Thereby, the intensity of the largest (slowest migrating) band was preferentially reduced. Despite this degradation, transmission of the band from parents to offspring could be easily measured. Example 22 Cat Figure 17 shows DMA fingerprints from a family of short-haired domestic cats using (left) probe 33.6 and (right) probe 33.15. Row 1 Mother Row 2 Father Row 3 Kitten Probes 33.6 and 33.15 produce informative DNA fingerprints. Most bands in kittens can be recorded as maternal or paternal, so these DNA fingerprints are suitable for pedigree testing in cats as well as individual identification. Example 23 Sheep DNA fingerprints obtained from various sheep using probes 33.6 (left) and 33.15 (right) are shown in Figure 18.
The samples were: Row 1 Crossbred female row 2 Crossbred female row 3 Dorset female row 4 Hampshire x Dorset female row 5 Dorset male Individual specificity from each sheep using both probes
DNA fingerprints were obtained. DNA fingerprints are human
Although weaker and less complex than a DNA fingerprint,
Still useful for identification and genetic purposes. Probe 33.6 detects one or two very strong polymorphic bands in each sheep in addition to a range of weak bands. These bands are probably derived from a single minisatellite locus showing extremely high probe 33.6 homology. Example 24 Pigs and horses Figure 19 shows three different pigs (columns 1-3) and three different horses (columns 4-6) [sex and breeding:
DNA fingerprint from [unidentified]. Probes 33.6 and 33.15 contain species- and individual-specific DNA.
Produces fingerprints. Although the DNA fingerprint with probe 33.15 in particular is weak and contains far fewer bands compared to the corresponding human DNA fingerprint, the combination of both probes is nevertheless useful for individual identification. Example 25 Cows Figure 20 shows the DNA fingerprint of Hin fDNA digests obtained using probe 33.6 for the cow family and additional cows. The samples are as follows: [column 1 human] column 2 dam column 3 sire column 4 calves 1 and 2 column 5 Angus bull column 6 Flesian bull Same as for sheep, pigs and horses. , a fairly simple but still individual-specific DNA fingerprint was obtained from each animal. In the calf, all bands could be traced back to the dam and/or sire, confirming the animal's pedigree. Figure 21 shows probes for the same bovine DNA.
The results using 33.15 are shown. The individual columns indicate: 1 Mother cow 2 Father cow 3 Calfs 1 and 2 4 Angus bull 5 Fresian bull [6. Human] Probe 33.15 is a cow digested with Hin f.
Hybridization in DNA produces a strong, inseparable, complex pattern of DNA bands. In Bgl digests, this strong signal is mainly confined to extremely large DNA fragments;
This suggests that this signal is derived from a tufted sequence or region, probably a conventional satellite DNA. Brief autoradiography of the Hin f digest reveals periodicity between the 45-50 base pair "rungs" (data not shown) and a "ladder" toward the bottom of the gel. Shows a band. Therefore, a strong signal is probably of length 45−
It is derived from a satellite with a 50 base pair repeating unit. A strong signal is Pvu ,
Significantly disrupted in bovine DNA digested with Dde or Alu , satellite DNA repeat units contain one or more sites for each of these restriction endonucleases, but not Hin f or Alu.
This suggests that it does not contain a site for Bgl. These are precisely the 1.720 bovine satellites, consisting of 100,000 tandem repeats of 46 base pair repeat units (E. Poschl and REStreek, “Prototype sequence of bovine 1.720 satellite DNA”, J. Mol. Biol. 143 , 147–
153:1980). A comparison of the sequence of the 1.720 repeat unit with the core probe 33.6 repeat unit and 33.15 repeat unit is shown below. (matched parts are marked *). This region in the 1.720 repeat shows an excellent match with the repeat unit of 33.15, but a less perfect match with 33.6. This is the 1.720 satellite DNA probe
The reason why it is detected by 33.15 but not by 33.6 (Fig. 20) will be explained. [1.720
Satellite repeat units (similar to those of myoglobin λ33 minisatellites) contain too many microtides on each side of the core (H+J>15 in equation (1)) to act as multilocate probes according to the present invention. do not〕. To detect bovine minisatellites that hybridize to probe 33.15, DNA was Alu
Alternatively, digestion with Dde reduced the 1.720 satellite to a 46 base pair monomer that was removed by electrophoresis from the bottom of the gel. Figure 21 shows the clear distribution of each of these restriction enzymes from bovine DNA.
This shows that a DNA fingerprint was actually obtained (No. 3).
However, almost all of these bands lost the Alu and Dde sites in each repeat (possibly due to mutations in one or the other of the underlined bases above), resulting in overlapping Alu and Dde sites.
by destroying the normal
1.720 satellite embedded within 1.720DNA
It is derived from a mutant block of DNA. This would explain the following facts: a Indeed identical bovine DNA fingerprints were obtained using Alu and Dde . b Very large fragments consistently hybridize more strongly than smaller ones, as they contain correspondingly more 1.720 satellite repeat units. Very large bovine DNA fragments
(contains 440 of these units). In humans,
Band intensity does not increase continuously with size (Figure 21). c Almost all of the bovine DNA fingerprint fragments are 1.720
It is removed by Hha , which cuts once within the repeat unit (see above, data not shown). d The sire (No. 2) has almost no hybridization fragments in the Alu digest. This means that 1.720 containing these mutant repeat blocks
This suggests that a region of satellite DNA has been deleted in this animal. e The DNA fingerprints of the mother cow (No. 1) and calf (No. 5) are almost identical. The mother cow was likely heterozygous for the deletion and had coincidentally transmitted the non-deleted chromosome (and thus the entire band) to the calf, equivalent to that seen in the father cow. These bands are therefore all linked and not transmitted independently to offspring as occurs in humans. Nevertheless, the five cows tested were
showing different “satellite” DNA fingerprint patterns,
Although these unusual types of fingerprints are useful for individual identification, they cannot be used to obtain multilocus signature information. In equation (1), some probes can function effectively even if n is not necessarily equal to 3. In such probes, at least one pair of (J.
core. The repeat of K) can be separated from at least two further repeats. Therefore, “non-core”
In pairs separated by DNA sequences (J. Core.
K) Sufficiently long probes can be constructed in which sequences are aligned.