JP2007034871A - 文字入力装置および文字入力装置プログラム - Google Patents
文字入力装置および文字入力装置プログラム Download PDFInfo
- Publication number
- JP2007034871A JP2007034871A JP2005219916A JP2005219916A JP2007034871A JP 2007034871 A JP2007034871 A JP 2007034871A JP 2005219916 A JP2005219916 A JP 2005219916A JP 2005219916 A JP2005219916 A JP 2005219916A JP 2007034871 A JP2007034871 A JP 2007034871A
- Authority
- JP
- Japan
- Prior art keywords
- context dictionary
- context
- document
- character string
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 13
- 238000000034 method Methods 0.000 claims description 34
- 239000000284 extract Substances 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 18
- 230000014509 gene expression Effects 0.000 abstract description 5
- 239000013598 vector Substances 0.000 description 14
- 230000006870 function Effects 0.000 description 11
- 201000010099 disease Diseases 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 206010012601 diabetes mellitus Diseases 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000000877 morphologic effect Effects 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 208000004998 Abdominal Pain Diseases 0.000 description 3
- 208000007882 Gastritis Diseases 0.000 description 3
- 208000007107 Stomach Ulcer Diseases 0.000 description 3
- 206010047700 Vomiting Diseases 0.000 description 3
- 230000001154 acute effect Effects 0.000 description 3
- 230000035622 drinking Effects 0.000 description 3
- 201000005917 gastric ulcer Diseases 0.000 description 3
- 208000019622 heart disease Diseases 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000008673 vomiting Effects 0.000 description 3
- 206010003011 Appendicitis Diseases 0.000 description 2
- 235000021152 breakfast Nutrition 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 210000004798 organs belonging to the digestive system Anatomy 0.000 description 2
- 206010034674 peritonitis Diseases 0.000 description 2
- 208000023504 respiratory system disease Diseases 0.000 description 2
- 206010000087 Abdominal pain upper Diseases 0.000 description 1
- 208000019838 Blood disease Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 208000005176 Hepatitis C Diseases 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 206010033645 Pancreatitis Diseases 0.000 description 1
- 206010033647 Pancreatitis acute Diseases 0.000 description 1
- 231100000674 Phytotoxicity Toxicity 0.000 description 1
- 201000003176 Severe Acute Respiratory Syndrome Diseases 0.000 description 1
- 231100000354 acute hepatitis Toxicity 0.000 description 1
- 201000003229 acute pancreatitis Diseases 0.000 description 1
- 206010003119 arrhythmia Diseases 0.000 description 1
- 230000006793 arrhythmia Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 208000010643 digestive system disease Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 210000001156 gastric mucosa Anatomy 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 208000014951 hematologic disease Diseases 0.000 description 1
- 208000018706 hematopoietic system disease Diseases 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
【解決手段】文脈辞書生成部202が、文書集合に保存されている文書に基づいて文脈辞書を生成し、文脈辞書集合203へ出力する。入力部204がユーザから文字列が入力されたかどうかを判定する。文脈辞書選択部205が、入力中の文書の内容や文脈に応じて最適な文脈辞書を文脈辞書集合203から選択する。文字列変換処理部206が、ユーザからの入力文字列に基づいて、ユーザの入力希望文字列を予測し、選択された文脈辞書から予測候補を抽出する。出力部207が、ユーザの入力希望文字列の予測候補を表示装置104に表示させる。
【選択図】図2
Description
以下、本発明を病院や診療所等の医療機関で用いられる電子カルテシステムの入力予測処理に実施した形態につき、図面に沿って説明する。
ここで、文書内容を反映した言語的特徴とは、例えば、
(1)各クラスタにおける単語単位の出現頻度または出現確率
(2)各クラスタにおける単語間の共起回数または共起確率
(3)各クラスタにおける文字単位の出現頻度または出現確率
(4)各クラスタにおける文字間の共起回数または共起確率
等である。
各クラスタに属するカルテ文書における単語単位の出現頻度を得るために、まず各カルテ文書の形態素解析結果を参照して、カルテ文書中に出現した単語とその出現回数をカウントする。そしてC個のクラスタそれぞれについて、各クラスタに属するカルテ文書中に出現した単語の出現回数を単語ごとに集計する。これにより、各クラスタごとの単語出現頻度リストが得られる。
文脈辞書集合203に保存する。
(昨夜, 腹痛, 今朝, 朝食, 嘔吐, 既往歴, 胃潰瘍, 職業, 会社員, 飲酒歴)
= (1, 2, 1, 1, 1, 1, 1, 1, 1, 1)
次に、文脈辞書選択部205は、抽出した単語とその回数を各クラスタに対応する文脈辞書の“表記”の列に格納されている単語と“出現頻度”の列に格納されている出現頻度と照合する。具体的には、各文脈辞書の “出現頻度”の列に格納されている各単語の出現頻度を“表記”の列に格納されている対応する各単語の重みとする文書ベクトルをそのクラスタを代表する文書ベクトルとみなして、文字入力中のカルテ文書の文書ベクトルと各クラスタの文書ベクトルとの間のコサイン類似度Sを求める。即ち、次式(数1)に示すように両者に共に出現する単語の出現頻度を掛け合わせて加算し、これを2つのベクトルのノルムの積で除算する。
Di :i番目のクラスタを代表する文書ベクトル
(d∩Di) : dとDiに共通して現れる単語の集合
W(d,w) : ベクトルdにおける単語wの重み(出現頻度)
W(Di,w) : ベクトルDiにおける単語wの重み(出現頻度)
文脈辞書選択部205は、C個の文脈辞書との類似度Sを算出し、類似度Sが最大である文脈辞書を抽出し、かかる文脈辞書を、出現する単語の傾向が最も似通ったクラスタの文脈辞書として選択する。図6のケースでは、主として消化器疾患のカルテ文書から構成されるクラスタ2をもっとも類似するクラスタとして選択する。
(実施例2)
上記実施例1で述べた電子カルテシステムにおいて、文脈辞書集合203に保存されている文脈辞書の更新が行われる場合について以下に説明する。
(1)前回の文脈辞書生成から所定時間(日数)の経過後
(2)ユーザによる所定回数のカルテ文書へのアクセス(作成・編集・閲覧・受信等)後
また、タイミングを2段階設定しておき、第1のタイミングでは分類済みクラスタへの更新されたカルテ文書の追加と文脈辞書の生成のみを行い、第2のタイミングではクラスタリングからすべて行う、としてもよい。これは、クラスタリングには計算コストがかかることを考慮したものである。
ど)文書集合に保存される新たな内容や種類のカルテ文書に基づいて新たに必要な文脈辞書を容易に生成することができる。
(実施例3)
本発明を手書き文字入力装置における文脈処理(文字認識後処理)に用いる場合について説明する。
201 文書集合
202 文脈辞書生成部
203 文脈辞書集合
204 入力部
205 文脈辞書選択部
206 文字列変換処理部
207 出力部
Claims (8)
- 入力情報を文字列に変換することにより文字入力を行う文字入力装置において、
入力情報を文字列に変換するときに使用する1又は2以上の文脈辞書と、
文字入力中の文書の内容に基づいて、前記1又は2以上の文脈辞書から使用すべき文脈辞書を選択する文脈辞書選択手段と、
選択された文脈辞書に基づいて入力情報を文字列に変換する文字列変換手段と、
を備えたことを特徴とする文字入力装置。 - 1又は2以上の文書からなる文書集合に基づいて、前記1又は2以上の文脈辞書を生成する文脈辞書生成手段を、
備えることを特徴とする請求項1記載の文字入力装置。 - 前記文字列変換手段は、前記入力情報に基づいてユーザが入力を希望
する1又は2以上の文字列候補を、前記選択された文脈辞書から抽出して表示させる
文字列候補表示手段を、
備えることを特徴とする請求項1又は2に記載の文字入力装置。 - 前記文脈辞書生成手段は、
前記文書集合に対してクラスタリング処理を行うことにより1又は2以上のクラスタを生成し、前記各文書を該1又は2以上のクラスタの何れかに分類する文書分類手段と、
前記各クラスタに属する1又は2以上の文書から各文書の内容を反映する言語的な特徴を抽出する第1の言語特徴抽出手段と、
抽出された特徴に基づいて前記各クラスタごとに文脈辞書を出力する文脈辞書出力手段と、
を備えることを特徴とする請求項2又は3に記載の文字入力装置。 - 前記文脈辞書選択手段は、
前記文字入力中の文書の内容を反映した言語的な特徴を抽出する第2の言語特徴抽出手段と、
抽出された言語的な特徴と前記各クラスタに対応する前記各文脈辞書の言語的な特徴との類似度を算出する類似度算出手段と、
算出された類似度が所定値以上であるクラスタの文脈辞書を抽出し、使用すべき文脈辞書として出力する文脈辞書抽出手段と、
を備えることを特徴とする請求項4に記載の文字入力装置。 - 前記文字列候補表示手段は、前記選択された文脈辞書から該文脈辞書の言語的な特徴に応じて前記文字列候補を抽出して表示させることを特徴とする請求項4又は5に記載の文字入力装置。
- 前記文脈辞書生成手段は、所定のタイミングで前記1又は2以上の文脈辞書の再生成を行う文脈辞書更新手段、を備えることを特徴とする請求項2乃至6の何れかに記載の文字入力装置。
- 前記請求項1乃至7の何れか一項に記載された各手段の機能をコンピュータに付与する文字入力装置プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005219916A JP2007034871A (ja) | 2005-07-29 | 2005-07-29 | 文字入力装置および文字入力装置プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005219916A JP2007034871A (ja) | 2005-07-29 | 2005-07-29 | 文字入力装置および文字入力装置プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007034871A true JP2007034871A (ja) | 2007-02-08 |
Family
ID=37794029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005219916A Pending JP2007034871A (ja) | 2005-07-29 | 2005-07-29 | 文字入力装置および文字入力装置プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007034871A (ja) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009265758A (ja) * | 2008-04-22 | 2009-11-12 | Hitachi Ltd | 用語入力支援装置及び方法、並びにプログラム |
JP2009288889A (ja) * | 2008-05-27 | 2009-12-10 | Sony Ericsson Mobilecommunications Japan Inc | 文字入力装置、文字入力方法及びプログラム |
JP2011145935A (ja) * | 2010-01-15 | 2011-07-28 | Hitachi Medical Corp | 医用診断レポートシステム、当該システムとして機能させるためのプログラム、および医用診断レポート作成支援方法 |
JP2013541786A (ja) * | 2010-11-01 | 2013-11-14 | コーニンクレッカ フィリップス エヌ ヴェ | テキスト入力の際の関連用語の提案 |
JP2014535110A (ja) * | 2011-10-25 | 2014-12-25 | グーグル・インコーポレーテッド | ジェスチャベースの検索 |
JP2015507252A (ja) * | 2011-12-12 | 2015-03-05 | エンパイア テクノロジー ディベロップメント エルエルシー | コンテンツベースの自動的な入力プロトコルの選択 |
JP2016012196A (ja) * | 2014-06-27 | 2016-01-21 | 富士通株式会社 | 変換装置、変換プログラム、及び変換方法 |
JP2016066174A (ja) * | 2014-09-24 | 2016-04-28 | 富士ゼロックス株式会社 | 辞書選択装置、文書変換システム、プログラム及び文書変換方法 |
JP2016066269A (ja) * | 2014-09-25 | 2016-04-28 | Kddi株式会社 | クラスタリング装置、方法及びプログラム |
JP6092462B2 (ja) * | 2014-03-12 | 2017-03-08 | 株式会社東芝 | 電子機器、方法及びプログラム |
JP2019179445A (ja) * | 2018-03-30 | 2019-10-17 | 正晃テック株式会社 | 病理診断文入力支援プログラム、病理診断文入力支援方法および病理診断文入力支援システム |
CN110673748A (zh) * | 2019-09-27 | 2020-01-10 | 北京百度网讯科技有限公司 | 输入法中候选长句的提供方法及装置 |
CN111665954A (zh) * | 2019-03-06 | 2020-09-15 | 京瓷办公信息系统株式会社 | 字符输入装置和存储字符输入程序的非暂时性记录介质 |
JP2022525089A (ja) * | 2019-04-10 | 2022-05-11 | テンセント・アメリカ・エルエルシー | 医療データ自動収集セグメンテーション及び分析のための方法、装置、及びコンピュータプログラム |
WO2025031608A1 (en) * | 2023-08-08 | 2025-02-13 | Goodnotes Limited | Enhanced spell checking and auto-completion for text that is handwritten on a computer device |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05158969A (ja) * | 1991-12-02 | 1993-06-25 | Nec Corp | 言語処理システム |
JPH0683812A (ja) * | 1992-08-31 | 1994-03-25 | Omron Corp | 文書入力装置のかな漢字変換装置 |
JP2000172701A (ja) * | 1998-12-04 | 2000-06-23 | Fujitsu Ltd | 文書データ提供装置、文書データ提供システム、文書データ提供方法及び文書データを提供するプログラムを記録した記録媒体 |
-
2005
- 2005-07-29 JP JP2005219916A patent/JP2007034871A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05158969A (ja) * | 1991-12-02 | 1993-06-25 | Nec Corp | 言語処理システム |
JPH0683812A (ja) * | 1992-08-31 | 1994-03-25 | Omron Corp | 文書入力装置のかな漢字変換装置 |
JP2000172701A (ja) * | 1998-12-04 | 2000-06-23 | Fujitsu Ltd | 文書データ提供装置、文書データ提供システム、文書データ提供方法及び文書データを提供するプログラムを記録した記録媒体 |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009265758A (ja) * | 2008-04-22 | 2009-11-12 | Hitachi Ltd | 用語入力支援装置及び方法、並びにプログラム |
JP2009288889A (ja) * | 2008-05-27 | 2009-12-10 | Sony Ericsson Mobilecommunications Japan Inc | 文字入力装置、文字入力方法及びプログラム |
JP2011145935A (ja) * | 2010-01-15 | 2011-07-28 | Hitachi Medical Corp | 医用診断レポートシステム、当該システムとして機能させるためのプログラム、および医用診断レポート作成支援方法 |
JP2013541786A (ja) * | 2010-11-01 | 2013-11-14 | コーニンクレッカ フィリップス エヌ ヴェ | テキスト入力の際の関連用語の提案 |
US9886427B2 (en) | 2010-11-01 | 2018-02-06 | Koninklijke Philips N.V. | Suggesting relevant terms during text entry |
JP2014535110A (ja) * | 2011-10-25 | 2014-12-25 | グーグル・インコーポレーテッド | ジェスチャベースの検索 |
US9348808B2 (en) | 2011-12-12 | 2016-05-24 | Empire Technology Development Llc | Content-based automatic input protocol selection |
JP2015507252A (ja) * | 2011-12-12 | 2015-03-05 | エンパイア テクノロジー ディベロップメント エルエルシー | コンテンツベースの自動的な入力プロトコルの選択 |
KR101613155B1 (ko) * | 2011-12-12 | 2016-04-18 | 엠파이어 테크놀로지 디벨롭먼트 엘엘씨 | 콘텐트에 기초한 자동 입력 프로토콜 선택 |
US20160224687A1 (en) * | 2011-12-12 | 2016-08-04 | Empire Technology Development Llc | Content-based automatic input protocol selection |
JP6092462B2 (ja) * | 2014-03-12 | 2017-03-08 | 株式会社東芝 | 電子機器、方法及びプログラム |
JPWO2015136645A1 (ja) * | 2014-03-12 | 2017-04-06 | 株式会社東芝 | 電子機器、方法及びプログラム |
JP2016012196A (ja) * | 2014-06-27 | 2016-01-21 | 富士通株式会社 | 変換装置、変換プログラム、及び変換方法 |
JP2016066174A (ja) * | 2014-09-24 | 2016-04-28 | 富士ゼロックス株式会社 | 辞書選択装置、文書変換システム、プログラム及び文書変換方法 |
JP2016066269A (ja) * | 2014-09-25 | 2016-04-28 | Kddi株式会社 | クラスタリング装置、方法及びプログラム |
JP2019179445A (ja) * | 2018-03-30 | 2019-10-17 | 正晃テック株式会社 | 病理診断文入力支援プログラム、病理診断文入力支援方法および病理診断文入力支援システム |
JP7036378B2 (ja) | 2018-03-30 | 2022-03-15 | 正晃テック株式会社 | 病理診断文入力支援プログラム、病理診断文入力支援方法および病理診断文入力支援システム |
CN111665954A (zh) * | 2019-03-06 | 2020-09-15 | 京瓷办公信息系统株式会社 | 字符输入装置和存储字符输入程序的非暂时性记录介质 |
JP2022525089A (ja) * | 2019-04-10 | 2022-05-11 | テンセント・アメリカ・エルエルシー | 医療データ自動収集セグメンテーション及び分析のための方法、装置、及びコンピュータプログラム |
JP7242889B2 (ja) | 2019-04-10 | 2023-03-20 | テンセント・アメリカ・エルエルシー | 医療データ自動収集セグメンテーション及び分析のための方法、装置、及びコンピュータプログラム |
CN110673748A (zh) * | 2019-09-27 | 2020-01-10 | 北京百度网讯科技有限公司 | 输入法中候选长句的提供方法及装置 |
WO2025031608A1 (en) * | 2023-08-08 | 2025-02-13 | Goodnotes Limited | Enhanced spell checking and auto-completion for text that is handwritten on a computer device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109299239B (zh) | 一种基于es的电子病历检索方法 | |
JP7464800B2 (ja) | 小サンプル弱ラベル付け条件での医療イベント認識方法及びシステム | |
US20090299977A1 (en) | Method for Automatic Labeling of Unstructured Data Fragments From Electronic Medical Records | |
US10847261B1 (en) | Methods and systems for prioritizing comprehensive diagnoses | |
US20090259487A1 (en) | Patient Data Mining | |
CN111984851B (zh) | 医学资料搜索方法、装置、电子装置及存储介质 | |
US20220223245A1 (en) | Drug recommendation method, apparatus and system, electronic device and storage medium | |
JP2005189363A (ja) | 質問応答システムおよびプログラム | |
JP2007034871A (ja) | 文字入力装置および文字入力装置プログラム | |
US10936962B1 (en) | Methods and systems for confirming an advisory interaction with an artificial intelligence platform | |
US11581094B2 (en) | Methods and systems for generating a descriptor trail using artificial intelligence | |
Friedman et al. | Natural language and text processing in biomedicine | |
JP4997892B2 (ja) | 検索システム、検索方法及び検索プログラム | |
US12087442B2 (en) | Methods and systems for confirming an advisory interaction with an artificial intelligence platform | |
US20210134461A1 (en) | Methods and systems for prioritizing comprehensive prognoses and generating an associated treatment instruction set | |
US20240028838A1 (en) | Speech signal processing using artificial intelligence | |
JP7473314B2 (ja) | 医療情報管理装置及び医療レポートのメタデータ付加方法 | |
CN109840275B (zh) | 一种医疗搜索语句的处理方法、装置和设备 | |
CN113065355B (zh) | 专业百科命名实体识别方法、系统及电子设备 | |
Harkema et al. | Information extraction from clinical records | |
CN113761899A (zh) | 一种医疗文本生成方法、装置、设备及存储介质 | |
JP7315165B2 (ja) | 診断支援システム | |
US20240112765A1 (en) | Method and system for clinical trials matching | |
JP2017134693A (ja) | 意味情報登録支援プログラム、情報処理装置および意味情報登録支援方法 | |
JP4169618B2 (ja) | テキスト情報管理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070918 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100401 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101005 |