JP2007535766A - アミノ酸の複雑なパターンを同定するためのシステム及び方法 - Google Patents
アミノ酸の複雑なパターンを同定するためのシステム及び方法 Download PDFInfo
- Publication number
- JP2007535766A JP2007535766A JP2007510929A JP2007510929A JP2007535766A JP 2007535766 A JP2007535766 A JP 2007535766A JP 2007510929 A JP2007510929 A JP 2007510929A JP 2007510929 A JP2007510929 A JP 2007510929A JP 2007535766 A JP2007535766 A JP 2007535766A
- Authority
- JP
- Japan
- Prior art keywords
- amino acid
- sequence
- replikin
- protein
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 150000001413 amino acids Chemical class 0.000 title claims abstract description 98
- 238000000034 method Methods 0.000 title claims abstract description 70
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 113
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 113
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 62
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 claims abstract description 41
- 125000000539 amino acid group Chemical group 0.000 claims abstract description 36
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 claims abstract description 12
- 230000014509 gene expression Effects 0.000 claims description 12
- 201000010099 disease Diseases 0.000 claims description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 8
- 229960005486 vaccine Drugs 0.000 claims description 8
- 206010022000 influenza Diseases 0.000 claims description 5
- 238000003909 pattern recognition Methods 0.000 claims 2
- 230000002194 synthesizing effect Effects 0.000 claims 2
- 108091026890 Coding region Proteins 0.000 claims 1
- 230000004044 response Effects 0.000 abstract description 3
- 235000018102 proteins Nutrition 0.000 description 95
- 235000001014 amino acid Nutrition 0.000 description 84
- 238000011160 research Methods 0.000 description 11
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 7
- 235000004279 alanine Nutrition 0.000 description 7
- 238000002869 basic local alignment search tool Methods 0.000 description 7
- 206010028980 Neoplasm Diseases 0.000 description 6
- 201000011510 cancer Diseases 0.000 description 5
- 239000004474 valine Substances 0.000 description 5
- 239000004475 Arginine Substances 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 4
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 4
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 235000009697 arginine Nutrition 0.000 description 4
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 235000004400 serine Nutrition 0.000 description 4
- 241000712461 unidentified influenza virus Species 0.000 description 4
- 235000014393 valine Nutrition 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- 235000003704 aspartic acid Nutrition 0.000 description 3
- 206010064097 avian influenza Diseases 0.000 description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 235000008521 threonine Nutrition 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000007429 general method Methods 0.000 description 2
- 208000037797 influenza A Diseases 0.000 description 2
- 235000005772 leucine Nutrition 0.000 description 2
- 235000006109 methionine Nutrition 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 235000013930 proline Nutrition 0.000 description 2
- 229940126577 synthetic vaccine Drugs 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- MTKPWXBFIJYWLJ-UHFFFAOYSA-N 2-amino-3,7-dihydropurin-6-one;6-amino-1h-pyrimidin-2-one;5-methyl-1h-pyrimidine-2,4-dione Chemical compound NC=1C=CNC(=O)N=1.CC1=CNC(=O)NC1=O.O=C1NC(N)=NC2=C1NC=N2 MTKPWXBFIJYWLJ-UHFFFAOYSA-N 0.000 description 1
- LRUSMCBQRMRPNR-UHFFFAOYSA-N 2-amino-3,7-dihydropurin-6-one;6-amino-1h-pyrimidin-2-one;7h-purin-6-amine Chemical compound NC1=CC=NC(=O)N1.NC1=NC=NC2=C1NC=N2.N1C(N)=NC(=O)C2=C1N=CN2 LRUSMCBQRMRPNR-UHFFFAOYSA-N 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 208000005176 Hepatitis C Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 208000000102 Squamous Cell Carcinoma of Head and Neck Diseases 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 241000700647 Variola virus Species 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000002223 anti-pathogen Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 210000003679 cervix uteri Anatomy 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000010460 detection of virus Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 208000024519 eye neoplasm Diseases 0.000 description 1
- 210000000232 gallbladder Anatomy 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 201000000459 head and neck squamous cell carcinoma Diseases 0.000 description 1
- 239000000185 hemagglutinin Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000004792 malaria Diseases 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000001989 nasopharynx Anatomy 0.000 description 1
- 210000004498 neuroglial cell Anatomy 0.000 description 1
- 201000008106 ocular cancer Diseases 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 210000003079 salivary gland Anatomy 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 235000002374 tyrosine Nutrition 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 229960004854 viral vaccine Drugs 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/145—Orthomyxoviridae, e.g. influenza virus
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/08—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses
- C07K16/10—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses from RNA viruses
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- Virology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Hematology (AREA)
- Microbiology (AREA)
- Urology & Nephrology (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- General Physics & Mathematics (AREA)
- Food Science & Technology (AREA)
- Cell Biology (AREA)
- Pathology (AREA)
- Mycology (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pulmonology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
Abstract
Description
本願は2004年4月28日に出願された、「アミノ酸の複雑なパターンを同定するためのシステム及び方法」と題する米国仮特許出願第60/565,847号に基づく、米国特許法第119条(e)項の優先権を主張する。この出願はまた、2005年2月16日に出願された「アミノ酸の複雑なパターンを同定するためのシステム及び方法」と題する米国仮特許出願第60/653,083号に基づく、米国特許法第119条(e)項の優先権も主張する。これらの仮出願はどちらもそれらの全体が、そしてすべての目的のために、参考文献として本願明細書中に援用されている。
先の特許出願において、発明者らは、「レプリキンパターン」又は単に「レプリキン」と名づけられたアミノ酸のパターンを同定し、そして記載した。レプリキンパターンは、約7〜約50の隣接したアミノ酸の配列であって、以下の3つの特徴を含むものを含む。
(1)該配列は、第2のリジン残基から6〜10アミノ酸残基の位置にある少なくとも1つのリジン残基を有し;
(2)該配列は、少なくとも1つのヒスチジン残基を有し;そして
(3)該配列は、少なくとも6%のリジン残基を有する。
本分野で知られているとおり、タンパク質及びアミノ酸のデータベースは、多様なデータベースツール及び検索エンジンを用いて検索されることができる。これらの公的に利用可能なツールを用いて、アミノ酸パターンは記述され、そして多くの異なる生物体に対応する多くの異なるタンパク質において位置決めされることができる。いくつかの方法及び技術が利用可能であり、それによってアミノ酸パターンが記述されることができる。1つの一般的なフォーマットはPROSITEパターンである。PROSITEパターンの記述は以下の規則にしたがって構築されることができる。
(2)シンボル「x」は任意のアミノ酸が受容される位置のために使用される。
(3)あいまいさは、所与の位置についての許容可能なアミノ酸を四角括弧「[]」の間に列挙することによって示される。例えば、[ALT]は、アラニン又はロイシン又はトレオニンをさす。
(4)あいまいさはまた、中括弧の対「{}」の間に所与の位置において許容されないアミノ酸を列挙することによっても示される。例えば、{AM}は、アラニン及びメチオニン以外のいずれかのアミノ酸をさす。
(5)パターン中の各要素は、その隣のものと「−」によって分けられる。
(6)パターンの要素の反復は、その要素に続く括弧の間の数値又は数字の範囲によって示されることができる。例:x(3)は、x−x−xに対応し、x(2,4)は、x−x又はx−x−x又はx−x−x−xに対応する。
(7)パターンが配列のN−又はC−末端のいずれかに限定される場合、そのパターンは、それぞれシンボル「<」で始まるか又はシンボル「>」で終わる。
(8)ピリオドは、パターンを終了する。
PA[AC]−x−V−x(4)−{ED}。このパターンは、[アラニン又はシステイン]−任意−バリン−任意−任意−任意−任意−{任意であるが、グルタミン酸又はアスパラギン酸ではない}と翻訳される。
(1)アミノ酸残基については大文字を用い、そして(必要ではないが)「−」を2つのアミノ酸の間に置く。
(2)特定の位置における複数のアミノ酸の選択肢については「[]」を使用する。[LIVM]は、L、I、V又はMの任意の1つのアミノ酸がその位置にあることができることを意味する。
(3)アミノ酸を除外するためには「{}」を使用する。したがって、{CF}は、CおよびFがその特定の位置にあってはならないことを意味する。いくつかのシステムにおいては、除外機能は、「^」記号で特定されることができる。例えば、^Gは、グリシン以外のすべてのアミノ酸を意味し、そして[^ILMV]は、I、L、MおよびV以外のすべてのアミノ酸を表す。
(4)任意のアミノ酸であることのできる位置については、「x」又は「X」を使用する。
(5)複数の位置については、nが数字である「(n)」を使用する。例えば、x(3)は、「xxx」と同じである。
(6)複数又は可変の位置については、「(n1,n2)」を使用する。したがって、x(1,4)は、「x」又は「xx」又は「xxx」又は「xxxx」を表す。
(7)パターンがN又はC末端にマッチすることを要求するためには、「>」というシンボルを該パターンの最初又は最後に使用する。例えば、「>MDEL」は、MDELで始まる配列のみを見出す。「DEL>」はDELで終わる配列のみを見出す。
その定義からわかるように、レプリキンパターンの記述は、アミノ酸の単一の直線的配列として表されることはできない。したがって、否定、結合および鎖状体形成などの論理的な組を構築することのできるオペレーションにしたがって得られる順序付けられた配列を記述するためによく適合されている、PROSITEパターンおよび正規表現のどちらもが、レプリキンパターンを記述するのに適していない。
本発明の実施態様は、アミノ酸配列の複雑なパターンを同定し及び/又は位置決めするためのシステム及び方法に向けられている。本発明の側面によれば、タンパク質データベースの問い合わせを促進するための技術が提供される。該問い合わせに対する応答として受け取られたタンパク質の記述については、本発明の実施態様は、受け取られたタンパク質の記述をスキャンして、レプリキンパターンを同定しかつ位置決めすることができる。ある実施態様によれば、レプリキンパターンは、それぞれが本発明の実施態様によって認識されることのできる以下の3つの(3)特徴を含む、7〜約50アミノ酸の配列である。(1)該配列は、第二のリジン残基から6〜10アミノ酸残基の位置に位置する少なくとも1つのリジン残基を有し;(2)該配列は、少なくとも1つのヒスチジン残基を有し;そして(3)該配列中の少なくとも6%のアミノ酸はリジン残基である。本発明の他の実施態様は、特定された長さの制約を有する複雑なアミノ酸配列を同定し及び/又は位置決めすることができ、該配列はさらに、以下の特徴の任意の組み合わせを含む:(1)N位置超かつM位置未満、第二のアミノ酸残基から離れて位置する第一のアミノ酸残基;(2)配列の任意の場所に位置する第三のアミノ酸残基;および(3)少なくともRパーセントの第四のアミノ酸残基。さらに他の実施態様によれば、本発明は同定されたアミノ酸配列の発生を計数し、そして計数された発生数を生の絶対値又は該タンパク質中のNアミノ酸あたりの同定されたアミノ酸配列の数の比率のいずれかとして報告することができる。本発明のさらに他の実施態様は、所与のタンパク質の変異体中における同定されたアミノ酸配列パターンの進化を経時的に分析することができ、そしてまた、複数の異なるタンパク質にわたって同定されたアミノ酸配列パターン例の間の類似性及び相違を経時的に分析することもできる。分析の結果として、本発明のさらに他の実施態様が、同定されたアミノ酸配列パターンの構成要素が突然変異及び/又は発生するときに、経時的にかつ異なるタンパク質間で保存されていると見られる潜在的なアミノ酸足場構造を同定することができる。
本発明の実施態様は、タンパク質内のアミノ酸の複雑なパターンを同定するための一般化された方法及び系を含んでもよい。タンパク質及びアミノ酸リサーチシステム630によって同定されるか又は選択されるいかなるタンパク質の定義にいついても、ユーザーは、アミノ酸のさまざまな複雑なパターンについて検索することに本発明の実施態様をむけさせることができる。アミノ酸の1つのパターンの例として、本発明は、レプリキンパターンを含むヌクレオチド又はアミノ酸配列を同定する方法を提供する。図7は、本発明の実施態様にしたがってアミノ酸の配列中のレプリキンパターンを位置決めするための一般的な方法を図示する単純なフローチャートである。方法700は、アミノ酸配列が得られた後に開始することができる。典型的には、アミノ酸配列は、図1に与えられたコードにしたがってアルファベット文字によって表されることができる。しかしながら、他のコード化方法も同様に本発明の範囲内である。
図6に戻って、本発明は、タンパク質の定義を検索するために、ローカルに又はインターネットなどのネットワーク全体にわたってアミノ酸及びタンパク質データベースにアクセスしそして対話する検索エンジンを含むことができる。例えば、タンパク質及びアミノ酸リサーチシステム630は、ユーザーからタンパク質検索基準を受容することができ、そして、供給された検索基準にマッチするタンパク質の定義を検索するための、複数のオンラインのアミノ酸及びタンパク質データベース検索エンジンにアクセスすることができる。タンパク質データベース検索基準は、任意のオンラインタンパク質又はアミノ酸検索エンジンにおける有効な検索タームを形成することのできる任意のテキスト列を含むことができる。典型的には、これらの検索基準は、各特定のタンパク質を記述するプリントアウトにおいて見出されることのできるテキストに関連する。例えば、ユーザーが検索基準「A型インフルエンザ」を与えた場合、本発明の実施態様は、このテキスト列を複数のインターネットタンパク質及びアミノ酸検索エンジンに転送することができ、上記検索エンジンはそれぞれ、ターム「A型インフルエンザ」を含むそのデータベース中に発見された任意のタンパク質記述をリターンすることができる。アミノ酸配列スキャナー640を使用して、リターンされたタンパク質の記述のそれぞれは、レプリキンパターンの存在についてスキャンされることができる。
本発明の実施態様は、アミノ酸配列中のレプリキンパターンを同定し、そして位置決めするためだけに採用されることができるわけではない。実施例は、異なるタンパク質中に発生するレプリキンパターンの構造における類似性を発見して分析するため、又は同じタンパク質中に経時的に発生する異なるレプリキンパターンを分析するためにも使用されることができる。例えば、図10は、「トリインフルエンザ(Bird Flu)」インフルエンザウイルス中に1917年〜2004年の87年間にわたって保存されてきた、レプリキン「固定足場」構造を示す表である。本発明の実施態様は、同じタンパク質の変異体中に発見されたレプリキンパターンを含む、タンパク質中に発見された多数のレプリキンパターンを集めることができる。各レプリキンパターンとともに、本発明の実施態様は各タンパク質が最初に同定された日付も付随させてもよい。研究者によって指導される場合、ある実施態様は、レプリキンパターン中に経時的に保存され、そして異なるタンパク質並びに同じタンパク質の変異体中に存在することのできる実質的に固定されたアミノ酸構造を明らかにするために、複数の選択されたレプリキンパターンを、内容、日付又は他の基準によってソーティングし及びディスプレイすることができる。さらに、研究者によって指導される場合、かかる固定されたアミノ酸構造を自動的に同定するために、ある実施態様は複数の選択されたレプリキンパターンを比較するための既知のパターン分析方法を採用してもよい。例として、図10においては、例解されたレプリキンパターンは−この場合−アミノ末端において一対のリジン残基(kk)で始り、カルボキシル末端において一対のヒスチジン残基(hh)で終わり、そしてリジン残基を8、10又は11位のいずれかに含む、(通常)29アミノ酸の比較的固定された足場構造を示しているようである。何十年にもわたるこの足場構造の保存は、合成ワクチンが迅速かつ安価に調製されることを可能とする。レプリキン足場構造が同定された後、かかるワクチンを合成するために、研究者は経時的に保存され、そしてタンパク質の現在の変異体中にも存在するその足場構造の構成要素を選択することができる。その後、ワクチンは足場構造から選択された構成要素に基づいて調製されることができる。かかるワクチンは保存された足場構造に基づくため、それらは何年もの間有効であり、かつ予想される大流行よりも充分前に開発されることができる。
Claims (16)
- 以下のステップ:
アミノ酸残基のサブ配列中において、第一のリジン残基が第二のリジン残基から6〜10位置以内に存在するか否かを決定し;
もし存在するなら、上記アミノ酸残基のサブ配列中に7〜50の連続的なアミノ酸残基の列を同定し、ここで、該列は上記第一のリジン残基、上記第二のリジン残基及びヒスチジン残基を含み;
該列中のリジン残基のパーセンテージを計算し;そして
上記リジン残基のパーセンテージが少なくとも6パーセントである場合、上記列をレプリキンパターンとして認識する、
を含む、レプリキンパターンの認識方法。 - タンパク質中のレプリキンパターンの濃度を決定するための方法であって、以下のステップ:
請求項1に記載の方法によって認識された異なるレプリキンパターンを含む上記タンパク質を定義するアミノ酸残基の配列中のサブ配列の数を計数する、
を含む前記方法。 - さらに、以下のステップ:
上記計数されたサブ配列の数対前記配列中のアミノ酸残基の総数の比率を報告すること、
を含む、請求項2に記載の方法。 - 上記タンパク質を定義する上記アミノ酸残基の配列がコンピュータファイルから検索される、請求項2に記載の方法。
- 上記タンパク質を定義する上記アミノ酸残基の配列がデータベースから検索される、請求項2に記載の方法。
- 上記データベースがネットワークを通じてアクセスされる、請求項5に記載の方法。
- プロセッサによって実行された場合、請求項1に記載の方法によって該プロセッサにレプリキンパターンを認識させる、実行可能な命令を記憶した、機械読み取り式の媒体。
- 以下の:
ネットワークに連結されたプロセッサ;
該プロセッサに連結されたメモリ、ここで、該メモリは請求項1に記載の方法によってレプリキンパターンを認識する複数の命令を含む、
を含む、コンピュータシステム。 - アミノ酸のパターンを認識する方法であって、以下のステップ:
アミノ酸残基のコード化配列中でお互いの所定の第一の距離内に、少なくとも一対の第一のアミノ酸残基を位置決めし;
第一のアミノ酸残基の上記対の各メンバーの所定の第二の距離内に、第二のアミノ酸残基を位置決めし;
アミノ酸残基の列を同定し、ここで、前記列は、第一のアミノ酸残基の上記対と第二のアミノ酸残基を含み;
上記列中の第一のアミノ酸残基のパーセンテージを決定し;そして
上記列中の第一のアミノ酸残基の上記パーセンテージが少なくとも所定のパーセンテージである場合、上記列をアミノ酸の上記パターンであると認識する、
を含む、前記方法。 - アミノ酸のパターンを認識する方法であって、以下のステップ:
タンパク質を定義するアミノ酸残基の配列のコード化された表現内にアミノ酸の列を位置決めし、ここで、該列は、少なくとも第一のアミノ酸及び第二のアミノ酸を含む、正規表現に適合しており;
上記列中の第二のアミノ酸の対の存在の間の距離が、所定の第一の範囲外である場合、上記アミノ酸の列を、上記パターンに適合しないとして捨て;
上記第一のアミノ酸の存在及び上記第二のアミノ酸の存在の間の距離が、所定の第二の範囲外である場合、上記アミノ酸の列を、上記パターンに適合しないとして捨て;そして
上記列中の第二のアミノ酸のパーセンテージが少なくとも所定のパーセンテージである場合、上記アミノ酸のパターンとして上記列を認識すること、
を含む、前記方法。 - アミノ酸の足場構造を認識する方法であって、以下のステップ:
複数のタンパク質中に発生するレプリキンパターンのリストを構築し;そして、
上記足場構造を、上記リスト中の各レプリキンパターン中に発生する実質的に固定されたアミノ酸残基のパターンとして同定すること、
を含む、前記方法。 - 上記複数のタンパク質が、同じタンパク質の変異体を含む、請求項11に記載の方法。
- 上記複数のタンパク質が、異なるタンパク質を含む、請求項11に記載の方法。
- 病気の発生を予測する方法であって、以下のステップ:
最初の時点でタンパク質中に発生するレプリキンパターンの最初の計測数を決定し;
第二の時点で上記タンパク質中に発生するレプリキンパターンの第二の計測数を決定し;そして
上記第二の計測数が上記第一の計測数よりも大きい場合、上記タンパク質を有する生物体によって引き起こされる将来の病気の増加した確率を報告する、
を含む、前記方法。 - ワクチンを合成する方法であって、以下のステップ:
病気を引き起こす生物体に関連するタンパク質の変異体中に発生するレプリキンパターンのリストを構築し;
アミノ酸の足場構造を、上記リスト中の各レプリキンパターン中に発生する実質的に固定されたアミノ酸残基のパターンとして同定し;
上記足場構造の構成要素を選択し、ここで、前記構成要素は経時的に保存され、かつ、ここで、前記構成要素は上記タンパク質の現在の変異体中に表現され;そして、
上記選択された構成要素に基づいてワクチンを合成する、
を含む、前記方法。 - 上記病気を引き起こす生物体がインフルエンザである、請求項15に記載の方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US56584704P | 2004-04-28 | 2004-04-28 | |
US10/860,050 US7442761B2 (en) | 2003-06-06 | 2004-06-04 | Replikin peptides and uses thereof |
US65308305P | 2005-02-16 | 2005-02-16 | |
PCT/US2005/014443 WO2005104754A2 (en) | 2004-04-28 | 2005-04-28 | System and method for identifying complex patterns of amino acids |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007535766A true JP2007535766A (ja) | 2007-12-06 |
JP2007535766A5 JP2007535766A5 (ja) | 2008-03-13 |
Family
ID=35063033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007510929A Pending JP2007535766A (ja) | 2004-04-28 | 2005-04-28 | アミノ酸の複雑なパターンを同定するためのシステム及び方法 |
Country Status (11)
Country | Link |
---|---|
EP (2) | EP1745401B1 (ja) |
JP (1) | JP2007535766A (ja) |
KR (2) | KR101270934B1 (ja) |
CN (1) | CN1947122B (ja) |
AU (1) | AU2005237587A1 (ja) |
CA (1) | CA2565006A1 (ja) |
HK (1) | HK1100414A1 (ja) |
IL (1) | IL178469A0 (ja) |
NZ (1) | NZ550512A (ja) |
SG (2) | SG196773A1 (ja) |
WO (1) | WO2005104754A2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2009240587A1 (en) * | 2008-04-23 | 2009-10-29 | Bogoch, Elenore S. | Methods and compounds for mitigating pathogenic outbreaks using replikin count cycles |
CN102056737A (zh) | 2008-06-09 | 2011-05-11 | 巴斯夫欧洲公司 | 包含水蒸气可透塑料箔的多层复合材料,其制备方法及用途 |
SG11201405447QA (en) | 2012-03-09 | 2014-10-30 | Samuel Bogoch | Therapies, vaccines, and predictive methods for infectious salmon anemia virus |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08287088A (ja) * | 1995-04-17 | 1996-11-01 | Canon Inc | 情報検索方法及びその装置 |
JP2000222421A (ja) * | 1999-01-29 | 2000-08-11 | Fujitsu Ltd | タンパク質解析支援装置及びその装置での処理をコンピュータに行わせるためのプログラムを格納した記憶媒体 |
US20020151677A1 (en) * | 2001-03-27 | 2002-10-17 | Samuel Bogoch | Replikins and methods of identifying replikin-containing sequences |
WO2002085093A2 (en) * | 2001-03-27 | 2002-10-31 | Samuel Bogoch | Replikin peptides and uses thereof |
WO2003005880A2 (en) * | 2001-07-09 | 2003-01-23 | Samuel Bogoch | Replikin peptides and uses thereof |
JP2003308333A (ja) * | 2002-04-16 | 2003-10-31 | Fujitsu Ltd | 繰り返しを含む順序パターンを用いた検索装置および方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EA199700257A1 (ru) * | 1995-04-25 | 1998-12-24 | Ирори | Матрицы с памятью, программируемые на расстоянии, и их использование |
KR100906102B1 (ko) * | 2001-03-27 | 2009-07-07 | 사무엘 보고치 | 레플리킨 펩타이드 및 그의 이용 |
US7189800B2 (en) * | 2001-03-27 | 2007-03-13 | Samuel Bogoch | Replikin peptides in rapid replication of glioma cells and in influenza epidemics |
KR20040027869A (ko) * | 2001-07-09 | 2004-04-01 | 사무엘 보고치 | 레플리킨 펩타이드 및 그의 이용 |
EP2671129B1 (en) | 2010-12-02 | 2016-03-09 | SeeScan, Inc. | Magnetically sensed user interface apparatus and devices |
-
2005
- 2005-04-28 JP JP2007510929A patent/JP2007535766A/ja active Pending
- 2005-04-28 CN CN2005800129740A patent/CN1947122B/zh not_active Expired - Fee Related
- 2005-04-28 SG SG2013095518A patent/SG196773A1/en unknown
- 2005-04-28 CA CA002565006A patent/CA2565006A1/en not_active Abandoned
- 2005-04-28 KR KR1020067021152A patent/KR101270934B1/ko not_active IP Right Cessation
- 2005-04-28 KR KR1020137002241A patent/KR101398851B1/ko not_active Expired - Fee Related
- 2005-04-28 SG SG201004731-4A patent/SG163553A1/en unknown
- 2005-04-28 EP EP05743059.7A patent/EP1745401B1/en not_active Not-in-force
- 2005-04-28 AU AU2005237587A patent/AU2005237587A1/en not_active Abandoned
- 2005-04-28 WO PCT/US2005/014443 patent/WO2005104754A2/en not_active Application Discontinuation
- 2005-04-28 EP EP11158038A patent/EP2390804A3/en not_active Withdrawn
- 2005-04-28 NZ NZ550512A patent/NZ550512A/en not_active IP Right Cessation
-
2006
- 2006-10-05 IL IL178469A patent/IL178469A0/en unknown
-
2007
- 2007-07-31 HK HK07108340.3A patent/HK1100414A1/xx not_active IP Right Cessation
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08287088A (ja) * | 1995-04-17 | 1996-11-01 | Canon Inc | 情報検索方法及びその装置 |
JP2000222421A (ja) * | 1999-01-29 | 2000-08-11 | Fujitsu Ltd | タンパク質解析支援装置及びその装置での処理をコンピュータに行わせるためのプログラムを格納した記憶媒体 |
US20020151677A1 (en) * | 2001-03-27 | 2002-10-17 | Samuel Bogoch | Replikins and methods of identifying replikin-containing sequences |
WO2002085093A2 (en) * | 2001-03-27 | 2002-10-31 | Samuel Bogoch | Replikin peptides and uses thereof |
WO2003005880A2 (en) * | 2001-07-09 | 2003-01-23 | Samuel Bogoch | Replikin peptides and uses thereof |
JP2003308333A (ja) * | 2002-04-16 | 2003-10-31 | Fujitsu Ltd | 繰り返しを含む順序パターンを用いた検索装置および方法 |
Also Published As
Publication number | Publication date |
---|---|
EP1745401A2 (en) | 2007-01-24 |
CN1947122B (zh) | 2012-09-05 |
CA2565006A1 (en) | 2005-11-10 |
EP2390804A3 (en) | 2012-02-29 |
SG196773A1 (en) | 2014-02-13 |
EP1745401B1 (en) | 2014-12-24 |
KR20130023378A (ko) | 2013-03-07 |
KR101270934B1 (ko) | 2013-06-21 |
WO2005104754A3 (en) | 2006-07-13 |
AU2005237587A1 (en) | 2005-11-10 |
EP2390804A2 (en) | 2011-11-30 |
KR101398851B1 (ko) | 2014-05-27 |
WO2005104754A2 (en) | 2005-11-10 |
HK1100414A1 (en) | 2007-09-21 |
NZ550512A (en) | 2008-08-29 |
KR20060127253A (ko) | 2006-12-11 |
SG163553A1 (en) | 2010-08-30 |
IL178469A0 (en) | 2007-02-11 |
CN1947122A (zh) | 2007-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8417462B2 (en) | System and method for identifying complex patterns of amino acids | |
US12173374B2 (en) | Systems and methods for analyzing viral nucleic acids | |
Kent | BLAT—the BLAST-like alignment tool | |
Lee et al. | MOSAIK: a hash-based algorithm for accurate next-generation sequencing short-read mapping | |
Mount | Using the basic local alignment search tool (BLAST) | |
Morrison | Multiple sequence alignment for phylogenetic purposes | |
Zhao et al. | Genetic grouping of SARS-CoV-2 coronavirus sequences using informative subtype markers for pandemic spread visualization | |
US20120330566A1 (en) | Sequence assembly and consensus sequence determination | |
Anselmetti et al. | Comparative methods for reconstructing ancient genome organization | |
Vlachakis et al. | Advanced protein alignments based on sequence, structure and hydropathy profiles; the paradigm of the viral polymerase enzyme | |
JP2007535766A (ja) | アミノ酸の複雑なパターンを同定するためのシステム及び方法 | |
Kriventseva et al. | AnoEST: toward A. gambiae functional genomics | |
JP7602264B2 (ja) | 生物学的情報の取り扱い | |
EP2390807A2 (en) | System and method for identifying complex replikin patterns of amino acids | |
Vishwakarma et al. | AnnoDUF: A Web-Based Tool for Annotating Functions of Proteins having Domains of Unknown Function (DUFs) | |
JP7352985B2 (ja) | 生物学的配列情報の取り扱い | |
Dorlass et al. | Bioinformatic Approaches for Comparative Analysis of Viruses | |
JP2007535766A5 (ja) | ||
Dutia | A method for analysis of mutations in HIVs and SARS viruses and for homologous proteins structure characterisation | |
Wyman et al. | Annotating animal mitochondrial tRNAs: A new scoring scheme and an empirical evaluation of four methods | |
Han et al. | A gene clustering method with masking cross-matching fragments using modified suffix tree clustering method | |
JP2001290822A (ja) | 候補遺伝子に優先度をつける装置 | |
Haubold et al. | Fast Alignment: Genome Comparison and Database Searching | |
From | Reference-free SNP detection: dealing with the data deluge |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080123 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090409 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20090409 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110228 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110830 |