KR20060045349A - 논리 형식에 대한 통계적 언어 모델 - Google Patents
논리 형식에 대한 통계적 언어 모델 Download PDFInfo
- Publication number
- KR20060045349A KR20060045349A KR1020050026439A KR20050026439A KR20060045349A KR 20060045349 A KR20060045349 A KR 20060045349A KR 1020050026439 A KR1020050026439 A KR 1020050026439A KR 20050026439 A KR20050026439 A KR 20050026439A KR 20060045349 A KR20060045349 A KR 20060045349A
- Authority
- KR
- South Korea
- Prior art keywords
- mapping
- score
- transport
- transmission
- mappings
- Prior art date
Links
- 238000013507 mapping Methods 0.000 claims abstract description 360
- 238000000034 method Methods 0.000 claims abstract description 66
- 238000013179 statistical model Methods 0.000 claims abstract description 13
- 230000005540 biological transmission Effects 0.000 claims description 68
- 238000013519 translation Methods 0.000 claims description 45
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 238000012015 optical character recognition Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 2
- 230000035558 fertility Effects 0.000 claims description 2
- 238000012935 Averaging Methods 0.000 claims 2
- 230000014616 translation Effects 0.000 description 36
- 238000012549 training Methods 0.000 description 13
- 241000022563 Rema Species 0.000 description 9
- 238000004891 communication Methods 0.000 description 9
- 238000012546 transfer Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 239000000470 constituent Substances 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 3
- 238000010845 search algorithm Methods 0.000 description 3
- CDFKCKUONRRKJD-UHFFFAOYSA-N 1-(3-chlorophenoxy)-3-[2-[[3-(3-chlorophenoxy)-2-hydroxypropyl]amino]ethylamino]propan-2-ol;methanesulfonic acid Chemical compound CS(O)(=O)=O.CS(O)(=O)=O.C=1C=CC(Cl)=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC(Cl)=C1 CDFKCKUONRRKJD-UHFFFAOYSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (38)
- 출력 의미 구조(output semantic structure)를 생성하기 위해 입력 의미 구조(input semantic structure)를 디코드하는 방법에 있어서,전송 매핑들의 집합을 제공하는 단계;통계적 모델을 사용하여 상기 전송 매핑들의 집합 내에서 적어도 하나의 전송 매핑에 대한 스코어를 계산하는 단계;상기 스코어(score)에 기초하여 적어도 하나의 전송 매핑을 선택하는 단계; 및상기 출력 의미 구조를 구성하기 위해 상기 선택된 전송 매핑을 사용하는 단계를 포함하는 방법.
- 제1항에 있어서, 전송 매핑들의 집합을 제공하는 단계는, 각각의 전송 매핑이 상기 입력 의미 구조의 노드들을 설명하는 입력 의미 측(input semantic side) 및 상기 출력 의미 구조의 노드들을 설명하는 출력 의미 측(output semantic side)을 갖는, 전송 매핑들의 집합을 제공하는 단계를 포함하는 방법.
- 제1항에 있어서, 적어도 하나의 전송 매핑에 대한 스코어를 계산하는 단계는, 상기 출력 의미 구조에 있는 노드들의 집합의 확률을 제공하는 타겟 언어 모델(target language model)을 사용하여 스코어를 계산하는 단계를 포함하는 방법.
- 제2항에 있어서, 적어도 하나의 전송 매핑에 대한 스코어를 계산하는 단계는, 주어진 전송 매핑의 출력 의미 측에 대하여, 상기 전송 매핑의 입력 의미 측의 확률을 제공하는 채널 모델(channel model)을 사용하여 스코어를 계산하는 단계를 포함하는 방법.
- 제4항에 있어서, 상기 채널 모델을 사용하여 스코어를 계산하는 단계는, 전송 매핑들 사이에 중첩하는(overlapping) 노드들의 수에 기초하여 채널 모델 스코어를 표준화하는(normalizing) 단계를 포함하는 방법.
- 제2항에 있어서, 적어도 하나의 전송 매핑에 대한 스코어를 계산하는 단계는, 전송 매핑에서 노드 삭제(node deletion)의 확률을 제공하는 퍼틸리티 모델(fertility model)을 사용하여 스코어를 계산하는 단계를 포함하는 방법.
- 제2항에 있어서, 적어도 하나의 전송 매핑에 대한 스코어를 계산하는 단계는, 상기 전송 매핑의 상기 입력 의미 측의 노드들 수에 기초하여 사이즈 스코어(size score)를 계산하는 단계를 포함하는 방법.
- 제2항에 있어서, 적어도 하나의 전송 매핑에 대한 스코어를 계산하는 단계는, 상기 전송 매핑의 상기 입력 의미 측과 상기 입력 의미 구조에서 부합하는 바이너리 특성들(matching binary features) 수에 기초하여 랭크 스코어(rank score)를 계산하는 단계를 포함하는 방법.
- 제2항에 있어서, 상기 전송 매핑들의 집합들 내에서 적어도 하나의 전송 매핑에 대한 스코어를 계산하는 단계는,다수의 모델들에 대한 개별의 스코어들(separate scores)을 계산하는 단계;상기 전송 매핑에 대한 상기 스코어를 결정하기 위해 상기 개별 스코어들을 조합하는 단계를 포함하는 방법.
- 제9항에 있어서, 상기 다수의 모델들은 주어진 전송 매핑의 출력 의미 측에 대하여, 상기 전송 매핑의 입력 의미 측의 확률을 제공하는 채널 모델을 포함하는 방법.
- 제9항에 있어서, 상기 다수의 모델들은 전송 매핑에서 노드 삭제의 확률을 제공하는 퍼틸리티 모델을 포함하는 방법.
- 제9항에 있어서, 상기 다수 모델들은 상기 출력 의미 구조에 있는 노드들의 집합의 확률을 제공하는 타겟 언어 모델을 포함하는 방법.
- 제9항에 있어서,상기 전송 매핑에 대한 사이즈 스코어를 계산하는 단계로서, 상기 사이즈 스코어는 상기 전송 매핑의 상기 입력 의미 측의 노드들 수에 기초하는 단계; 및상기 전송 매핑에 대한 상기 스코어를 결정하기 위해 상기 사이즈 스코어를 상기 다수의 모델들에 대한 상기 개별 스코어들과 조합하는 단계를 더 포함하는 방법.
- 제9항에 있어서,상기 전송 매핑에 대한 랭크 스코어를 계산하는 단계로서, 상기 랭크 스코어는 상기 전송 매핑의 상기 입력 의미 측과 상기 입력 의미 구조에서 부합하는 바이너리 특성들 수에 기초하는 단계; 및상기 전송 매핑에 대한 상기 스코어를 결정하기 위해 상기 랭크 스코어를 상기 다수의 모델들에 대한 상기 개별 스코어들과 조합하는 단계를 더 포함하는 방법.
- 제9항에 있어서, 상기 스코어들을 조합하는 단계는,각각의 스코어를 가중치로 곱하여 가중치가 부여된 모델(weighted model score) 스코어들을 형성하는 단계; 및각각의 전송 매핑에 대한 상기 스코어를 결정하기 위해 상기 가중치가 부여된 모델 스코어들을 더하는 단계를 포함하는 방법.
- 제2항에 있어서, 전송 매핑들의 집합을 제공하는 단계는, 루트(root) 전송 매핑 및 서브트리들(subtrees)을 포함하는 트리(tree) 구조로서, 각각의 서브 트리는 루트 전송 매핑을 포함하고, 상기 전송 매핑들의 집합 내의 각각의 전송 매핑은 상기 트리 및 서브 트리들 중의 적어도 하나에서 루트 전송 매핑으로 나타나는 트리구조로 정렬되는 전송 매핑들의 집합을 제공하는 단계를 포함하는 방법.
- 제16항에 있어서, 전송 매핑들의 집합을 트리 구조로 제공하는 단계는, 포개진(nested) 서브 트리들의 다중 레벨을 제공하는 단계를 포함하는 방법.
- 제17항에 있어서, 적어도 하나의 전송 매핑에 대한 스코어를 계산하는 방법은,포개진 서브 트리들의 각각의 레벨에 대한 스코어를 반복적으로 계산하는 단계로서, 하나의 서브 트리에 대한 스코어를 계산하는 단계가,상기 서브 트리의 상기 서브 트리들을 반복적으로 스코어를 계산하는 단계;상기 서브 트리의 상기 루트 전송 매핑에 대한 스코어를 계산하는 단계; 및상기 서브 트리의 상기 서브 트리들에 대한 상기 스코어들을 상기 서브 트리의 상기 루트 전송 매핑에 대한 상기 스코어와 조합하는 단계를 포함하는 단계;상기 루트 전송 매핑에 대한 스코어를 계산하는 단계; 및각각의 서브 트리에 대한 상기 스코어를 상기 루트 전송 매핑에 대한 상기 스코어와 조합하는 단계를 포함하는 단계들을 통해서, 전송 매핑들의 트리에 대한 스코어를 계산하는 단계를 포함하는 방법.
- 제18항에 있어서, 루트 전송 매핑에 대한 스코어를 계산하는 단계는, 상기 루트 전송 매핑의 상기 입력 의미 측에서의 노드들 수에 기초하여 상기 루트 전송 매핑에 대한 사이즈 스코어를 계산하는 단계를 포함하는 방법.
- 제18항에 있어서, 서브 트리들의 상기 스코어를 루트 전송 매핑에 대한 상기 스코어와 조합하는 단계는, 상기 서브 트리들에 대한 사이즈 스코어들을 상기 루트 전송 매핑에 대한 상기 사이즈 스코어와 함께 평균 내어, 상기 서브 트리들에 대한 상기 사이즈 스코어들을 상기 루트 전송 매핑들에 대한 상기 사이즈 스코어와 조합하는 단계를 포함하는 방법.
- 제18항에 있어서, 루트 전송 매핑에 대한 스코어를 계산하는 단계는 상기 루트 전송 매핑의 상기 입력 의미 측과 상기 입력 의미 구조에서 부합하는 바이너리 특성 수에 기초하여 상기 루트 전송 매핑에 대한 랭크 스코어를 계산하는 단계를 포함하는 방법.
- 제21항에 있어서, 서브 트리들의 상기 스코어를 루트 전송 매핑에 대한 상기 스코어와 조합하는 단계는, 상기 서브 트리들에 대한 랭크 스코어들을 상기 루트 전송 매핑의 상기 랭크 스코어와 함께 평균 내어, 상기 서브 트리들에 대한 상기 랭크 스코어들을 상기 루트 전송 매핑들의 상기 랭크 스코어와 조합하는 단계를 포함하는 방법.
- 제1 언어로 된 입력을 제2 언어로 된 출력으로 번역하기 위한 기계 번역 시스템에 있어서,상기 입력을 입력 의미 표현(input semantic representation)으로 구문 분석(parsing)하기 위한 구문 분석부;전송 매핑들의 집합을 찾도록 구성되는(configured) 갖춘 검색 구성 요소로서, 각각의 전송 매핑은 상기 입력 의미 표현의 일부와 대응하는 검색 구성 요소;다수의 전송 매핑들을 스코어 계산하고, 상기 스코어에 기초하여 적어도 하나의 전송 매핑을 선택하도록 구성되는(configured) 디코드 구성 요소; 및상기 선택된 전송 매핑에 기초하여 상기 출력을 생성하도록 구성되는(configured) 생성 구성 요소를 포함하는 기계 번역 시스템.
- 제23항에 있어서, 상기 디코드 구성 요소는 다수의 통계적 모델들을 사용하여 각각의 전송 매핑을 스코어 계산하는 기계 번역 시스템.
- 제24항에 있어서, 상기 출력은 출력 의미 표현(output semantic representation)을 포함하고, 상기 다수의 통계적 모델들은 상기 출력 의미 표현에 있는 일련의 노드들의 확률을 제공하는 타겟 모델을 포함하는 기계 번역 시스템.
- 제24항에 있어서, 상기 다수의 통계적 모델들은, 전송 매핑 내에서 출력 측에서의 주어진 의미 노드들의 집합에 대하여, 상기 전송 매핑들의 입력 측에서의 의미 노드들의 집합의 확률을 제공하는 채널 모델을 포함하는 기계 번역 시스템.
- 제24항에 있어서, 상기 다수의 통계적 모델들은 상기 전송 매핑의 노드 삭제의 확률을 제공하는 퍼틸리티 모델을 포함하는 기계 번역 시스템.
- 제24항에 있어서, 상기 디코드 구성 요소는 상기 전송 매핑의 입력 측에서의 노드들의 수에 기초하는 사이즈 스코어를 사용하여 각각의 전송 매핑을 스코어 계산하는 기계 번역 시스템.
- 제24항에 있어서, 상기 디코드 구성 요소는 상기 입력과 상기 전송 매핑의 입력 측 사이에 부합하는 바이너리 특성들 수에 기초하는 랭크 스코어를 사용하여 각각의 전송 매핑을 스코어 계산하는 기계 번역 시스템.
- 단어 문자열(word string)에 대한 스코어를 결정하는 컴퓨터에 의해 구현되는 방법에 있어서,상기 단어 문자열에 관련된 다수의 노드들을 갖는 의미 구조를 계산하는 단계; 및상기 단어 문자열을 스코어 계산하기 위해, 상기 단어 문자열을 상기 의미 구조의 일련의 노드들의 확률을 제공하는 타겟 언어 모델로 스코어하는 단계를 포함하는 컴퓨터 구현 방법.
- 제30항에 있어서, 다수의 노드들을 갖는 의미 구조를 제공하는 단계는, 다수의 단어 노드(word node)들 및 단어들 사이의 의미 관련(semantic relationship)을 설명하는 적어도 하나의 관련 노드(relationship node)를 갖는 의미 구조를 제공하는 단계를 포함하는 컴퓨터 구현 방법.
- 제30항에 있어서, 단어 노드들을 제공하는 단계는, 렘마들(lemmas)에 대한 단어 노드들을 제공하는 단계를 포함하는 컴퓨터 구현 방법.
- 제30항에 있어서, 상기 단어 문자열을 타겟 언어 모델로 스코어 계산하는 단계는 기계 번역(machine translation)의 상기 타겟 언어 모델로 상기 단어 문자열을 스코어 계산하는 단계를 포함하는 컴퓨터 구현 방법.
- 제30항에 있어서, 상기 단어 문자열을 타겟 언어 모델로 스코어 계산하는 단계는 음성 인식(speech recognition)의 상기 타겟 언어 모델로 상기 단어 문자열을 스코어 계산하는 단계를 포함하는 컴퓨터 구현 방법.
- 제30항에 있어서, 상기 단어 문자열을 타겟 언어 모델로 스코어 계산하는 단계는 광문자인식(optical character recognition)의 상기 타겟 언어 모델로 상기 단어 문자열을 스코어 계산하는 단계를 포함하는 컴퓨터 구현 방법.
- 제30항에 있어서, 상기 단어 문자열을 타겟 언어 모델로 스코어 계산하는 단계는 문법 검사(grammar checking)의 상기 타겟 언어 모델로 상기 단어 문자열을 스코어 계산하는 단계를 포함하는 컴퓨터 구현 방법.
- 제30항에 있어서, 상기 단어 문자열을 타겟 언어 모델로 스코어 계산하는 단계는 필체 인식(handwriting recognition)의 상기 타겟 언어 모델로 상기 단어 문자열을 스코어 계산하는 단계를 포함하는 컴퓨터 구현 방법.
- 제30항에 있어서, 상기 단어 문자열을 타겟 언어 모델로 스코어 계산하는 단계는 정보 추출(information extraction)의 상기 타겟 언어 모델로 상기 단어 문자열을 스코어 계산하는 단계를 포함하는 컴퓨터 구현 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/813,208 | 2004-03-30 | ||
US10/813,208 US7593843B2 (en) | 2004-03-30 | 2004-03-30 | Statistical language model for logical form using transfer mappings |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060045349A true KR20060045349A (ko) | 2006-05-17 |
KR101122850B1 KR101122850B1 (ko) | 2012-04-19 |
Family
ID=34887697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050026439A KR101122850B1 (ko) | 2004-03-30 | 2005-03-30 | 논리 형식에 대한 통계적 언어 모델 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7593843B2 (ko) |
EP (1) | EP1582997B1 (ko) |
JP (1) | JP4945086B2 (ko) |
KR (1) | KR101122850B1 (ko) |
CN (1) | CN1677388B (ko) |
ES (1) | ES2416359T3 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10671353B2 (en) | 2018-01-31 | 2020-06-02 | Microsoft Technology Licensing, Llc | Programming-by-example using disjunctive programs |
Families Citing this family (102)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2002316581A1 (en) | 2001-07-03 | 2003-01-21 | University Of Southern California | A syntax-based statistical translation model |
WO2004001623A2 (en) | 2002-03-26 | 2003-12-31 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
US8548794B2 (en) | 2003-07-02 | 2013-10-01 | University Of Southern California | Statistical noun phrase translation |
US8296127B2 (en) | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
DE202005022113U1 (de) * | 2004-10-12 | 2014-02-05 | University Of Southern California | Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet |
US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US20070010989A1 (en) * | 2005-07-07 | 2007-01-11 | International Business Machines Corporation | Decoding procedure for statistical machine translation |
US10983695B2 (en) * | 2005-10-24 | 2021-04-20 | Kinoma, Inc. | Focus management system |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
CN101030197A (zh) * | 2006-02-28 | 2007-09-05 | 株式会社东芝 | 双语词对齐方法和装置、训练双语词对齐模型的方法和装置 |
US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
US7827028B2 (en) * | 2006-04-07 | 2010-11-02 | Basis Technology Corporation | Method and system of machine translation |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US9471562B2 (en) * | 2006-10-10 | 2016-10-18 | Abbyy Infopoisk Llc | Method and system for analyzing and translating various languages with use of semantic hierarchy |
US8433556B2 (en) * | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
US8468149B1 (en) | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
US8332207B2 (en) * | 2007-03-26 | 2012-12-11 | Google Inc. | Large language models in machine translation |
US8326598B1 (en) | 2007-03-26 | 2012-12-04 | Google Inc. | Consensus translations from multiple machine translation systems |
US8185375B1 (en) * | 2007-03-26 | 2012-05-22 | Google Inc. | Word alignment with bridge languages |
US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
US8639509B2 (en) * | 2007-07-27 | 2014-01-28 | Robert Bosch Gmbh | Method and system for computing or determining confidence scores for parse trees at all levels |
US8180624B2 (en) * | 2007-09-05 | 2012-05-15 | Microsoft Corporation | Fast beam-search decoding for phrasal statistical machine translation |
JP5239307B2 (ja) * | 2007-11-20 | 2013-07-17 | 富士ゼロックス株式会社 | 翻訳装置及び翻訳プログラム |
US8209164B2 (en) * | 2007-11-21 | 2012-06-26 | University Of Washington | Use of lexical translations for facilitating searches |
US8849665B2 (en) * | 2008-01-30 | 2014-09-30 | At&T Intellectual Property I, L.P. | System and method of providing machine translation from a source language to a target language |
US8615388B2 (en) * | 2008-03-28 | 2013-12-24 | Microsoft Corporation | Intra-language statistical machine translation |
US8682660B1 (en) * | 2008-05-21 | 2014-03-25 | Resolvity, Inc. | Method and system for post-processing speech recognition results |
JP5288371B2 (ja) * | 2008-06-03 | 2013-09-11 | 独立行政法人情報通信研究機構 | 統計的機械翻訳装置 |
US8849650B2 (en) * | 2008-10-22 | 2014-09-30 | Sankhya Technologies Private Limited | System and method for automatically generating sentences of a language |
WO2010046782A2 (en) * | 2008-10-24 | 2010-04-29 | App Tek | Hybrid machine translation |
US8185373B1 (en) * | 2009-05-05 | 2012-05-22 | The United States Of America As Represented By The Director, National Security Agency, The | Method of assessing language translation and interpretation |
US20100299132A1 (en) * | 2009-05-22 | 2010-11-25 | Microsoft Corporation | Mining phrase pairs from an unstructured resource |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
US8380486B2 (en) | 2009-10-01 | 2013-02-19 | Language Weaver, Inc. | Providing machine-generated translations and corresponding trust levels |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US9069755B2 (en) * | 2010-03-11 | 2015-06-30 | Microsoft Technology Licensing, Llc | N-gram model smoothing with independently controllable parameters |
US8972930B2 (en) * | 2010-06-04 | 2015-03-03 | Microsoft Corporation | Generating text manipulation programs using input-output examples |
US20110307240A1 (en) * | 2010-06-10 | 2011-12-15 | Microsoft Corporation | Data modeling of multilingual taxonomical hierarchies |
US9613115B2 (en) | 2010-07-12 | 2017-04-04 | Microsoft Technology Licensing, Llc | Generating programs based on input-output examples using converter modules |
KR101762866B1 (ko) * | 2010-11-05 | 2017-08-16 | 에스케이플래닛 주식회사 | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 |
US8407041B2 (en) * | 2010-12-01 | 2013-03-26 | Microsoft Corporation | Integrative and discriminative technique for spoken utterance translation |
US8600730B2 (en) * | 2011-02-08 | 2013-12-03 | Microsoft Corporation | Language segmentation of multilingual texts |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US8260615B1 (en) * | 2011-04-25 | 2012-09-04 | Google Inc. | Cross-lingual initialization of language models |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
KR101870729B1 (ko) * | 2011-09-01 | 2018-07-20 | 삼성전자주식회사 | 휴대용 단말기의 번역 트리구조를 이용한 번역장치 및 방법 |
CN103000052A (zh) * | 2011-09-16 | 2013-03-27 | 上海先先信息科技有限公司 | 人机互动的口语对话系统及其实现方法 |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9552335B2 (en) | 2012-06-04 | 2017-01-24 | Microsoft Technology Licensing, Llc | Expedited techniques for generating string manipulation programs |
CN102968409B (zh) * | 2012-11-23 | 2015-09-09 | 海信集团有限公司 | 智能人机交互语义分析方法及交互系统 |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US9786269B2 (en) * | 2013-03-14 | 2017-10-10 | Google Inc. | Language modeling of complete language sequences |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
CN103810999B (zh) * | 2014-02-27 | 2016-10-19 | 清华大学 | 基于分布式神经网络的语言模型训练方法及其系统 |
US9940658B2 (en) | 2014-02-28 | 2018-04-10 | Paypal, Inc. | Cross border transaction machine translation |
US9881006B2 (en) | 2014-02-28 | 2018-01-30 | Paypal, Inc. | Methods for automatic generation of parallel corpora |
US9530161B2 (en) | 2014-02-28 | 2016-12-27 | Ebay Inc. | Automatic extraction of multilingual dictionary items from non-parallel, multilingual, semi-structured data |
US9569526B2 (en) | 2014-02-28 | 2017-02-14 | Ebay Inc. | Automatic machine translation using user feedback |
GB201405025D0 (en) | 2014-03-20 | 2014-05-07 | Gould Tech Solutions Ltd | Apparatus and method for content handling |
US9740687B2 (en) | 2014-06-11 | 2017-08-22 | Facebook, Inc. | Classifying languages for objects and entities |
CN105279552B (zh) * | 2014-06-18 | 2018-06-22 | 清华大学 | 一种基于字的神经网络的训练方法和装置 |
US9953646B2 (en) | 2014-09-02 | 2018-04-24 | Belleau Technologies | Method and system for dynamic speech recognition and tracking of prewritten script |
US9864744B2 (en) | 2014-12-03 | 2018-01-09 | Facebook, Inc. | Mining multi-lingual data |
US9830404B2 (en) | 2014-12-30 | 2017-11-28 | Facebook, Inc. | Analyzing language dependency structures |
US10067936B2 (en) | 2014-12-30 | 2018-09-04 | Facebook, Inc. | Machine translation output reranking |
US9830386B2 (en) | 2014-12-30 | 2017-11-28 | Facebook, Inc. | Determining trending topics in social media |
US9477652B2 (en) | 2015-02-13 | 2016-10-25 | Facebook, Inc. | Machine learning dialect identification |
CN106372053B (zh) * | 2015-07-22 | 2020-04-28 | 华为技术有限公司 | 句法分析的方法和装置 |
CN106372054B (zh) * | 2015-07-24 | 2020-10-09 | 中兴通讯股份有限公司 | 一种多语言语义解析的方法和装置 |
US9734142B2 (en) | 2015-09-22 | 2017-08-15 | Facebook, Inc. | Universal translation |
US10586168B2 (en) | 2015-10-08 | 2020-03-10 | Facebook, Inc. | Deep translations |
US9990361B2 (en) * | 2015-10-08 | 2018-06-05 | Facebook, Inc. | Language independent representations |
US10133738B2 (en) | 2015-12-14 | 2018-11-20 | Facebook, Inc. | Translation confidence scores |
US9734143B2 (en) | 2015-12-17 | 2017-08-15 | Facebook, Inc. | Multi-media context language processing |
US10002125B2 (en) | 2015-12-28 | 2018-06-19 | Facebook, Inc. | Language model personalization |
US9805029B2 (en) | 2015-12-28 | 2017-10-31 | Facebook, Inc. | Predicting future translations |
US9747283B2 (en) | 2015-12-28 | 2017-08-29 | Facebook, Inc. | Predicting future translations |
US10902221B1 (en) | 2016-06-30 | 2021-01-26 | Facebook, Inc. | Social hash for language models |
US10902215B1 (en) | 2016-06-30 | 2021-01-26 | Facebook, Inc. | Social hash for language models |
US10235336B1 (en) * | 2016-09-14 | 2019-03-19 | Compellon Incorporated | Prescriptive analytics platform and polarity analysis engine |
US11256710B2 (en) | 2016-10-20 | 2022-02-22 | Microsoft Technology Licensing, Llc | String transformation sub-program suggestion |
US11620304B2 (en) | 2016-10-20 | 2023-04-04 | Microsoft Technology Licensing, Llc | Example management for string transformation |
US10846298B2 (en) | 2016-10-28 | 2020-11-24 | Microsoft Technology Licensing, Llc | Record profiling for dataset sampling |
CA3042293A1 (en) | 2016-11-17 | 2018-05-24 | Goldman Sachs & Co. LLC | System and method for coupled detection of syntax and semantics for natural language understanding and generation |
US10282415B2 (en) | 2016-11-29 | 2019-05-07 | Ebay Inc. | Language identification for text strings |
US10180935B2 (en) | 2016-12-30 | 2019-01-15 | Facebook, Inc. | Identifying multiple languages in a content item |
US10318633B2 (en) * | 2017-01-02 | 2019-06-11 | International Business Machines Corporation | Using multilingual lexical resources to improve lexical simplification |
US10318634B2 (en) * | 2017-01-02 | 2019-06-11 | International Business Machines Corporation | Enhancing QA system cognition with improved lexical simplification using multilingual resources |
CN106897268B (zh) * | 2017-02-28 | 2020-06-02 | 科大讯飞股份有限公司 | 文本语义理解方法、装置和系统 |
US20190065462A1 (en) * | 2017-08-31 | 2019-02-28 | EMR.AI Inc. | Automated medical report formatting system |
US10380249B2 (en) | 2017-10-02 | 2019-08-13 | Facebook, Inc. | Predicting future trending topics |
US11068758B1 (en) | 2019-08-14 | 2021-07-20 | Compellon Incorporated | Polarity semantics engine analytics platform |
CN111090460B (zh) * | 2019-10-12 | 2021-05-04 | 浙江大学 | 一种基于最近邻算法的代码变更日志自动生成方法 |
CN114333830A (zh) * | 2020-09-30 | 2022-04-12 | 中兴通讯股份有限公司 | 同声传译模型的训练方法、同声传译方法、设备和存储介质 |
US20240062021A1 (en) * | 2022-08-22 | 2024-02-22 | Oracle International Corporation | Calibrating confidence scores of a machine learning model trained as a natural language interface |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US547745A (en) * | 1895-10-08 | Shend | ||
JPS58201175A (ja) * | 1982-05-20 | 1983-11-22 | Kokusai Denshin Denwa Co Ltd <Kdd> | 機械翻訳方式 |
JP2814634B2 (ja) * | 1989-12-29 | 1998-10-27 | 松下電器産業株式会社 | 機械翻訳装置 |
US5329446A (en) * | 1990-01-19 | 1994-07-12 | Sharp Kabushiki Kaisha | Translation machine |
US5289375A (en) * | 1990-01-22 | 1994-02-22 | Sharp Kabushiki Kaisha | Translation machine |
US5418717A (en) * | 1990-08-27 | 1995-05-23 | Su; Keh-Yih | Multiple score language processing system |
US5477451A (en) * | 1991-07-25 | 1995-12-19 | International Business Machines Corp. | Method and system for natural language translation |
JP2968151B2 (ja) * | 1993-06-17 | 1999-10-25 | シャープ株式会社 | 機械翻訳装置 |
GB2295470A (en) * | 1994-11-28 | 1996-05-29 | Sharp Kk | Machine translation system |
US5643088A (en) * | 1995-05-31 | 1997-07-01 | Interactive Network, Inc. | Game of skill or chance playable by remote participants in conjunction with a common game event including inserted interactive advertising |
US6769128B1 (en) * | 1995-06-07 | 2004-07-27 | United Video Properties, Inc. | Electronic television program guide schedule system and method with data feed access |
US6233545B1 (en) * | 1997-05-01 | 2001-05-15 | William E. Datig | Universal machine translator of arbitrary languages utilizing epistemic moments |
US6804825B1 (en) * | 1998-11-30 | 2004-10-12 | Microsoft Corporation | Video on demand methods and systems |
US6330530B1 (en) * | 1999-10-18 | 2001-12-11 | Sony Corporation | Method and system for transforming a source language linguistic structure into a target language linguistic structure based on example linguistic feature structures |
US6942574B1 (en) * | 2000-09-19 | 2005-09-13 | Igt | Method and apparatus for providing entertainment content on a gaming machine |
US7734459B2 (en) * | 2001-06-01 | 2010-06-08 | Microsoft Corporation | Automatic extraction of transfer mappings from bilingual corpora |
US7050964B2 (en) * | 2001-06-01 | 2006-05-23 | Microsoft Corporation | Scaleable machine translation system |
US7249012B2 (en) * | 2002-11-20 | 2007-07-24 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among phrases |
US7306522B2 (en) * | 2003-06-29 | 2007-12-11 | Nds Limited | Interactive inter-channel game |
US7580080B2 (en) * | 2005-11-22 | 2009-08-25 | Gateway, Inc. | Automatic launch of picture-in-picture during commercials |
-
2004
- 2004-03-30 US US10/813,208 patent/US7593843B2/en not_active Expired - Fee Related
-
2005
- 2005-03-23 ES ES05102340T patent/ES2416359T3/es not_active Expired - Lifetime
- 2005-03-23 EP EP05102340.6A patent/EP1582997B1/en not_active Expired - Lifetime
- 2005-03-30 KR KR1020050026439A patent/KR101122850B1/ko active IP Right Grant
- 2005-03-30 CN CN200510056232XA patent/CN1677388B/zh not_active Expired - Fee Related
- 2005-03-30 JP JP2005098366A patent/JP4945086B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10671353B2 (en) | 2018-01-31 | 2020-06-02 | Microsoft Technology Licensing, Llc | Programming-by-example using disjunctive programs |
Also Published As
Publication number | Publication date |
---|---|
JP2005285129A (ja) | 2005-10-13 |
EP1582997A3 (en) | 2008-08-20 |
CN1677388A (zh) | 2005-10-05 |
US20050228640A1 (en) | 2005-10-13 |
JP4945086B2 (ja) | 2012-06-06 |
KR101122850B1 (ko) | 2012-04-19 |
EP1582997B1 (en) | 2013-05-08 |
US7593843B2 (en) | 2009-09-22 |
EP1582997A2 (en) | 2005-10-05 |
CN1677388B (zh) | 2011-02-02 |
ES2416359T3 (es) | 2013-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101122850B1 (ko) | 논리 형식에 대한 통계적 언어 모델 | |
KR101084786B1 (ko) | 트리 서열화 컴포넌트를 저장하는 컴퓨터 판독가능 기록매체 | |
KR101031970B1 (ko) | 구문들 사이의 번역 관계를 학습하기 위한 통계적 방법 | |
US7493251B2 (en) | Using source-channel models for word segmentation | |
US11030407B2 (en) | Computer system, method and program for performing multilingual named entity recognition model transfer | |
CN106537370B (zh) | 在存在来源和翻译错误的情况下对命名实体鲁棒标记的方法和系统 | |
US9098489B2 (en) | Method and system for semantic searching | |
Liu et al. | Discourse representation structure parsing | |
KR101120798B1 (ko) | 텍스트로부터 세만틱 구조들을 식별하기 위한 방법 및장치 | |
US8185377B2 (en) | Diagnostic evaluation of machine translators | |
US7003445B2 (en) | Statistically driven sentence realizing method and apparatus | |
US20060282255A1 (en) | Collocation translation from monolingual and available bilingual corpora | |
US9588958B2 (en) | Cross-language text classification | |
JP2003050797A (ja) | スケーラブル機械翻訳システム | |
Bikel et al. | Multilingual natural language processing applications: from theory to practice | |
US7865352B2 (en) | Generating grammatical elements in natural language sentences | |
CN113609838A (zh) | 文档信息抽取及图谱化方法和系统 | |
US10223349B2 (en) | Inducing and applying a subject-targeted context free grammar | |
EP3598321A1 (en) | Method for parsing natural language text with constituent construction links | |
KR101130457B1 (ko) | 트리렛 번역쌍 추출 | |
US10810368B2 (en) | Method for parsing natural language text with constituent construction links | |
CN114970516A (zh) | 数据增强方法及装置、存储介质、电子设备 | |
CN117669532A (zh) | 一种基于改进的wmd文本相似度计算方法及装置 | |
US20070016397A1 (en) | Collocation translation using monolingual corpora | |
Baishya et al. | Present state and future scope of Assamese text processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20050330 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20100326 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20050330 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20110620 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20111228 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20120224 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20120224 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20150121 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20150121 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20160127 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20160127 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20170201 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20170201 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20180201 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20180201 Start annual number: 7 End annual number: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190129 Year of fee payment: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20190129 Start annual number: 8 End annual number: 8 |
|
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20201206 |