KR101762866B1 - 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 - Google Patents
구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 Download PDFInfo
- Publication number
- KR101762866B1 KR101762866B1 KR1020100109546A KR20100109546A KR101762866B1 KR 101762866 B1 KR101762866 B1 KR 101762866B1 KR 1020100109546 A KR1020100109546 A KR 1020100109546A KR 20100109546 A KR20100109546 A KR 20100109546A KR 101762866 B1 KR101762866 B1 KR 101762866B1
- Authority
- KR
- South Korea
- Prior art keywords
- translation
- sentence
- target
- knowledge
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/49—Data-driven translation using very large corpora, e.g. the web
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
Description
도 2는 도 1의 기계 번역 장치를 구성하는 구문 구조 변환 지식 추출기의 세부 구성을 나타낸 도면.
도 3은 도 1의 기계 번역 장치를 구성하는 어휘 변환기의 세부 구성을 나타낸 도면.
도 4는 본 발명의 실시 예에 따른 구문 구조 변환 모델과 어휘 변환 모델의 차이를 설명하기 위한 예시 도면.
120: 구문 구조 변환 지식DB 130: 어휘 변환 지식 추출기
140: 어휘 변환 지식DB 150: 언어 모델 생성기
160: 언어 모델 300: 번역 모델 학습기
400: 번역문 생성기 410: 구문 구조 변환기
420: 어휘 변환기 111: 문장 선별기
113: 소스 트리 생성기 115: 트리 노드 정렬기
117: 트리 변환 지식 추출기 119: 확률 계산기
421: 자질 추출기 422: 번역 옵션 생성
423: 번역 옵션 제약기 424: 가설 탐색
425: 번역 디스톨션 제약기
Claims (19)
- 복수의 병렬 말뭉치에서 소스 문장의 단어 정렬 정보와 구문 분석 정보 및 타겟 문장의 단어 정렬 정보를 이용하여 타겟 문장의 구문 구조 변환 지식 및 어휘 변환 지식을 추출하고 추출된 각각의 지식에 대하여 변환 확률을 계산한 다음 상기 변환 확률에 대하여 가중치를 학습시키는 번역 모델 구축기;
실시간으로 입력되는 소스 문장에 대하여 상기 번역 모델 구축기를 통해 학습시킨 구문 구조 변환 과정과 어휘 변환 과정을 적용하여 상기 소스 문장을 타겟 문장으로 디코딩하는 번역문 생성기를 포함하며;
상기 번역 모델 구축기는,
상기 소스 문장의 단어 정렬 정보와 타겟 문장의 단어 정렬 정보 및 타겟 문장의 구문 분석 정보에 특정 제약 조건을 정의해 둔 자질 함수를 적용하여 상기 어휘 변환 지식에 대한 변환 확률을 계산하는 것을 특징으로 하는 통계적 기계 번역 장치. - 제 1 항에 있어서,
상기 번역 모델 구축기는,
상기 타겟 문장의 단일 말뭉치로부터 타겟 어휘열의 생성 확률을 추출하여 언어 모델을 생성하는 언어 모델 생성기
를 더 포함하는 것을 특징으로 하는 통계적 기계 번역 장치. - 제 1 항에 있어서,
상기 번역문 생성기는
상기 구문 구조 변환 과정과 어휘 변환 과정에 의해 출력된 복수의 구문 구조 변환 확률과 어휘 변환 확률을 결합하여 확률이 높은 타겟 어휘열을 최종 번역문으로 생성하는 것을 특징으로 하는 통계적 기계 번역 장치. - 복수의 병렬 말뭉치에서 소스 문장의 단어 정렬 정보와 구문 분석 정보 및 타겟 문장의 단어 정렬 정보를 이용하여 타겟 문장에 대한 구문 구조 변환 지식을 추출하고 추출된 지식에 대해 변환 확률을 계산하는 구문 구조 변환 지식 추출기와,
상기 복수의 병렬 말뭉치에서 소스 문장의 단어 정렬 정보와 타겟 문장의 단어 정렬 정보 및 타겟 문장의 구문 분석 정보를 이용하여 어휘 변환 지식을 추출하고 추출된 지식에 대해 변환 확률을 계산하는 어휘 변환 지식 추출기를 포함하며;
상기 어휘 변환 지식 추출기는,
상기 소스 문장의 단어 정렬 정보와 타겟 문장의 단어 정렬 정보 및 타겟 문장의 구문 분석 정보에 특정 제약 조건을 정의해 둔 자질 함수를 적용하여 상기 어휘 변환 지식에 대한 변환 확률을 계산하는 것을 특징으로 하는 번역 모델 구축 장치. - 제 4 항에 있어서,
상기 구문 구조 변환 추출기는,
상기 복수의 병렬 말뭉치에서 소스 문장과 타겟 문장의 단어 정렬 정보를 이용하여 타겟 문장의 구문 트리(타겟 트리)를 생성하는 트리 생성기;
상기 트리 생성기에서 생성된 타겟 트리와 상기 소스 문장의 구문 분석 정보에 따른 소스 트리를 중심으로 노드를 정렬하는 트리 노드 정렬기;
각 노드에서 서브 트리의 변환 지식을 추출하는 트리 변환 지식 추출기;
상기 트리 변환 지식 추출기에서 추출된 지식에 대하여 변환 확률을 통계적으로 계산하는 확률 계산기
를 포함하는 것을 특징으로 하는 번역 모델 구축 장치. - 삭제
- 제 4 항에 있어서,
상기 자질 함수는
상기 타겟 문장의 구문 구조와 소스 문장의 구문 구조 및 상호 구문 구조간 정렬 정보로부터 타겟 문장의 품사열과, 소스 문장에 속한 단어의 번역 순서를 제약하여 이를 자질로서 출력하는 함수인 것을 특징으로 하는 번역 모델 구축 장치. - 제 4 항에 있어서,
상기 자질 함수는
상기 타겟 문장의 구문 구조와 소스 문장의 구문 구조 및 상호 구문 구조간 정렬 정보로부터 소스 문장에 속한 단어의 번역 순서만을 자질로 출력하는 함수인 것을 특징으로 하는 번역 모델 구축 장치. - 실시간으로 입력되는 소스 문장에 대하여 구문 분석하고 분석한 소스 문장의 구문 구조로부터 타겟 문장의 구문 구조 변환 지식을 추출하고 추출된 지식에 대해 변환 확률을 학습시킨 구문 구조 변환기;
상기 구문 구조 변환기를 통해 추출된 타겟 문장의 구문 구조에 제약 조건을 둔 어휘 변환 모델을 기반으로 타겟 어휘열을 생성하는 어휘 변환기;
상기 구문 구조 변환기를 통해 학습시킨 변환 확률에서 상기 어휘 변환기를 통해 생성한 타겟 어휘열의 생성 확률을 결합한 후 가장 확률이 높은 타겟 어휘열을 번역문으로 생성하는 확률 계산기를 포함하며;
상기 어휘 변환기는,
상기 구문 구조 변환기로부터 입력되는 소스 문장의 단어 정렬 정보, 구문 분석 정보, 타겟 문장의 구문 분석 정보를 기반으로 자질(Feature)을 추출하고, 상기 자질에 제약할 번역 옵션을 설정하고, 상기 자질에 상기 번역 옵션을 반영하여 가설을 탐색하고, 탐색된 가설에 대하여 동일한 타겟 어휘열을 생성하는 확률을 계산하여 확률이 높은 타겟 어휘열을 선택하여 생성하는 것을 특징으로 하는 번역문 생성장치. - 제 9 항에 있어서,
상기 어휘 변환기는,
상기 구문 구조 변환기로부터 입력되는 소스 문장의 단어 정렬 정보, 구문 분석 정보, 타겟 문장의 구문 분석 정보를 기반으로 자질(Feature)을 추출하는 자질 추출기;
상기 자질 추출기에 의해 추출된 품사열과 번역 순서로부터 번역 옵션을 제약하는 번역 옵션 제약기;
상기 자질 추출기에 의해 추출된 어순 제약을 통해 번역 순서를 재배열하는 번역 디스톨션 제약기;
상기 자질 추출기를 통해 추출된 자질에 상기 번역 옵션 제약기 및 상기 번역 디스톨션 제약기를 통해 정한 제약 조건을 반영하여 가설을 탐색하는 가설 탐색기;
상기 가설 탐색기에서 탐색한 가설에 대하여 동일한 타겟 어휘열을 생성하는 것에 대한 확률을 계산하여 상기 확률이 높은 타겟 어휘열을 선택하는 M-Best 추적기
를 포함하는 것을 특징으로 하는 번역문 생성장치. - 번역 모델 구축 장치가 수행하는 번역 모델 구축 방법에 있어서,
(a) 상기 번역 모델 구축 장치가, 복수의 병렬 말뭉치에서 소스 문장의 단어 정렬 정보와 소스 문장의 구문 분석 정보 및 타겟 문장의 단어 정렬 정보를 이용하여 타겟 문장에 대한 구문 구조 변환 지식을 추출하는 단계;
(b) 상기 번역 모델 구축 장치가, 상기 복수의 병렬 말뭉치에서 소스 문장의 단어 정렬 정보와 타겟 문장의 단어 정렬 정보 및 타겟 문장의 구문 분석 정보를 이용하여 어휘 변환 지식을 추출하는 단계;
(c) 상기 번역 모델 구축 장치가, 상기 구문 구조 변환 지식 및 어휘 변환 지식에 대한 변환 확률을 각각 계산하고 각 변환 확률에 대하여 가중치를 학습시키는 단계를 포함하며;
상기 (c) 단계에서는,
상기 번역 모델 구축 장치가, 상기 소스 문장의 단어 정렬 정보와 타겟 문장의 단어 정렬 정보 및 타겟 문장의 구문 분석 정보에 특정 제약 조건을 정의해 둔 자질 함수를 적용하여 계산하는 것을 특징으로 하는 번역 모델 구축 방법. - [청구항 12은(는) 설정등록료 납부시 포기되었습니다.]제 11 항에 있어서,
상기 (a) 단계는,
상기 번역 모델 구축 장치가, 상기 복수의 병렬 말뭉치에서 소스 문장의 단어 정렬 정보와 타겟 문장의 단어 정렬 정보를 이용하여 타겟 문장의 구문 트리를 생성하는 단계;
상기 번역 모델 구축 장치가, 상기 타겟 문장의 구문 트리와 상기 소스 문장의 구문 분석 정보에 따른 소스 트리를 중심으로 노드를 정렬하는 단계;
상기 번역 모델 구축 장치가, 각 노드에서 서브 트리의 변환 지식을 추출하는 단계를 포함하는 것을 특징으로 하는 번역 모델 구축 방법. - 삭제
- [청구항 14은(는) 설정등록료 납부시 포기되었습니다.]제 11 항에 있어서,
상기 자질 함수는
상기 타겟 문장의 구문 구조와 소스 문장의 구문 구조 및 상호 구문 구조간 정렬 정보로부터 타겟 문장의 품사열과, 소스 문장에 속한 단어의 번역 순서를 제약하여 이를 자질로서 출력하는 함수를 이용한 것을 특징으로 하는 번역 모델 구축 방법. - [청구항 15은(는) 설정등록료 납부시 포기되었습니다.]제 11 항에 있어서,
상기 자질 함수는
상기 타겟 문장의 구문 구조와 소스 문장의 구문 구조 및 상호 구문 구조간 정렬 정보로부터 소스 문장에 속한 단어의 번역 순서만을 자질로 출력하는 함수를 이용한 것을 특징으로 하는 번역 모델 구축 방법. - 번역문 생성장치가 수행하는 기계 번역 방법에 있어서,
(a) 상기 번역문 생성장치가, 실시간으로 입력되는 소스 문장에 대하여 구문 분석하고 분석한 소스 문장의 구문 구조로부터 타겟 문장의 구문 구조 변환 지식 및 변환 확률을 추출하는 단계;
(b) 상기 번역문 생성장치가, 상기 타겟 문장의 구문 구조 변환 지식으로부터 추출한 타겟 문장의 구문 구조에 제약 조건을 둔 어휘 변환 모델을 기반으로 타겟 어휘열을 생성하는 단계;
(c) 상기 번역문 생성장치가, 상기 타겟 문장의 구문 구조 변환 확률과 상기 타겟 어휘열의 생성 확률을 결합하여 확률이 높은 타겟 어휘열을 번역문으로 생성하는 단계를 포함하며;
상기 (b) 단계는,
상기 번역문 생성장치가, 상기 입력되는 소스 문장의 단어 정렬 정보, 구문 분석 정보, 타겟 문장의 구문 분석 정보를 기반으로 자질(Feature)을 추출하는 단계,
상기 번역문 생성장치가, 상기 자질에 제약할 번역 옵션을 설정하는 단계,
상기 번역문 생성장치가, 상기 자질에 상기 번역 옵션을 반영하여 가설을 탐색하는 단계,
상기 번역문 생성장치가, 탐색된 가설에 대하여 동일한 타겟 어휘열을 생성하는 확률을 계산하여 확률이 높은 타겟 어휘열을 선택하는 단계를 포함하는 것을 특징으로 하는 기계 번역 방법. - 삭제
- 제 16 항에 있어서,
상기 번역 옵션은 품사열, 번역 어순 중 어느 하나 이상을 선택적으로 포함하는 것을 특징으로 하는 기계 번역 방법. - [청구항 19은(는) 설정등록료 납부시 포기되었습니다.]번역 모델 구축 장치 또는 번역문 생성 장치의 하드웨어와 결합되어, 제 11 항, 제 12 항, 제 14 항 내지 제 16 항 및 제 18 항 중 어느 한 항에 의한 과정을 결합된 장치에서 실행시키기 위한 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100109546A KR101762866B1 (ko) | 2010-11-05 | 2010-11-05 | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 |
CN201180053404.1A CN103189860B (zh) | 2010-11-05 | 2011-07-20 | 组合句法转换模型与词汇转换模型的机器翻译装置和机器翻译方法 |
PCT/KR2011/005325 WO2012060540A1 (ko) | 2010-11-05 | 2011-07-20 | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 |
US13/883,758 US10198437B2 (en) | 2010-11-05 | 2011-07-20 | Machine translation device and machine translation method in which a syntax conversion model and a word translation model are combined |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100109546A KR101762866B1 (ko) | 2010-11-05 | 2010-11-05 | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120048104A KR20120048104A (ko) | 2012-05-15 |
KR101762866B1 true KR101762866B1 (ko) | 2017-08-16 |
Family
ID=46024637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100109546A Active KR101762866B1 (ko) | 2010-11-05 | 2010-11-05 | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10198437B2 (ko) |
KR (1) | KR101762866B1 (ko) |
CN (1) | CN103189860B (ko) |
WO (1) | WO2012060540A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190042257A (ko) * | 2017-10-16 | 2019-04-24 | 삼성전자주식회사 | 문장 생성 모델의 업데이트 방법 및 문장 생성 장치 |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6334354B2 (ja) * | 2014-09-30 | 2018-05-30 | 株式会社東芝 | 機械翻訳装置、方法およびプログラム |
JP6466138B2 (ja) * | 2014-11-04 | 2019-02-06 | 株式会社東芝 | 外国語文作成支援装置、方法及びプログラム |
US9442922B2 (en) * | 2014-11-18 | 2016-09-13 | Xerox Corporation | System and method for incrementally updating a reordering model for a statistical machine translation system |
CN106383818A (zh) * | 2015-07-30 | 2017-02-08 | 阿里巴巴集团控股有限公司 | 一种机器翻译方法及装置 |
KR102577584B1 (ko) | 2016-08-16 | 2023-09-12 | 삼성전자주식회사 | 기계 번역 방법 및 장치 |
CN107818086B (zh) * | 2016-09-13 | 2021-08-10 | 株式会社东芝 | 机器翻译方法和装置 |
US10346547B2 (en) * | 2016-12-05 | 2019-07-09 | Integral Search International Limited | Device for automatic computer translation of patent claims |
KR102637338B1 (ko) | 2017-01-26 | 2024-02-16 | 삼성전자주식회사 | 번역 보정 방법 및 장치와 번역 시스템 |
KR102509822B1 (ko) * | 2017-09-25 | 2023-03-14 | 삼성전자주식회사 | 문장 생성 방법 및 장치 |
CN111104806B (zh) * | 2018-10-26 | 2024-09-20 | 澳门大学 | 神经机器翻译模型的构建方法及装置、翻译方法及装置 |
KR102740351B1 (ko) * | 2019-04-23 | 2024-12-10 | 현대자동차주식회사 | 자연어 생성 장치, 이를 포함하는 차량 및 자연어 생성 방법 |
CN110413753B (zh) * | 2019-07-22 | 2020-09-22 | 阿里巴巴集团控股有限公司 | 问答样本的扩展方法及装置 |
US11100412B2 (en) | 2019-07-22 | 2021-08-24 | Advanced New Technologies Co., Ltd. | Extending question and answer samples |
CN110598222B (zh) * | 2019-09-12 | 2023-05-30 | 北京金山数字娱乐科技有限公司 | 语言处理方法及装置、语言处理系统的训练方法及装置 |
KR102296405B1 (ko) * | 2019-12-11 | 2021-08-31 | 김월수 | 출입국 민원 대행 서비스 제공 방법 및 시스템 |
CN110728156B (zh) | 2019-12-19 | 2020-07-10 | 北京百度网讯科技有限公司 | 翻译方法、装置、电子设备及可读存储介质 |
CN111382581B (zh) * | 2020-01-21 | 2023-05-19 | 沈阳雅译网络技术有限公司 | 一种机器翻译中的一次剪枝压缩方法 |
US12032923B2 (en) | 2020-07-09 | 2024-07-09 | Samsung Electronics Co., Ltd. | Electronic device and method for translating language |
US11797781B2 (en) * | 2020-08-06 | 2023-10-24 | International Business Machines Corporation | Syntax-based multi-layer language translation |
CN112668326B (zh) * | 2020-12-21 | 2024-03-08 | 平安科技(深圳)有限公司 | 语句翻译方法、装置、设备及存储介质 |
CN112633019B (zh) * | 2020-12-29 | 2023-09-05 | 北京奇艺世纪科技有限公司 | 一种双语样本生成方法、装置、电子设备及存储介质 |
CN113887249B (zh) * | 2021-09-23 | 2024-07-12 | 内蒙古工业大学 | 一种基于依存句法信息和Transformer模型的蒙汉神经机器翻译方法 |
CN114722841B (zh) * | 2022-05-16 | 2022-09-02 | 北京百度网讯科技有限公司 | 翻译方法、装置及计算机程序产品 |
CN116304217B (zh) * | 2023-03-31 | 2024-04-26 | 易智瑞信息技术有限公司 | 地理空间数据查询方法、装置、电子设备和可读存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090112573A1 (en) | 2007-10-30 | 2009-04-30 | Microsoft Corporation | Word-dependent transition models in HMM based word alignment for statistical machine translation |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0261763A (ja) * | 1988-08-29 | 1990-03-01 | Sharp Corp | 機械翻訳装置 |
JP3220560B2 (ja) * | 1992-05-26 | 2001-10-22 | シャープ株式会社 | 機械翻訳装置 |
JP3066274B2 (ja) * | 1995-01-12 | 2000-07-17 | シャープ株式会社 | 機械翻訳装置 |
AU2002316581A1 (en) * | 2001-07-03 | 2003-01-21 | University Of Southern California | A syntax-based statistical translation model |
EP1488338B1 (en) * | 2002-03-27 | 2010-04-21 | University Of Southern California | Phrase-based joint probability model for statistical machine translation |
US7346493B2 (en) * | 2003-03-25 | 2008-03-18 | Microsoft Corporation | Linguistically informed statistical models of constituent structure for ordering in sentence realization for a natural language generation system |
KR100559472B1 (ko) * | 2003-12-24 | 2006-03-10 | 한국전자통신연구원 | 영한 자동번역에서 의미 벡터와 한국어 국소 문맥 정보를사용한 대역어 선택시스템 및 방법 |
US7593843B2 (en) * | 2004-03-30 | 2009-09-22 | Microsoft Corporation | Statistical language model for logical form using transfer mappings |
DE202005022113U1 (de) * | 2004-10-12 | 2014-02-05 | University Of Southern California | Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet |
US20060282255A1 (en) * | 2005-06-14 | 2006-12-14 | Microsoft Corporation | Collocation translation from monolingual and available bilingual corpora |
US7536295B2 (en) * | 2005-12-22 | 2009-05-19 | Xerox Corporation | Machine translation using non-contiguous fragments of text |
US20070265826A1 (en) * | 2006-05-10 | 2007-11-15 | Stanley Chen | Systems and methods for fast and memory efficient machine translation using statistical integrated phase lattice |
US8209163B2 (en) * | 2006-06-02 | 2012-06-26 | Microsoft Corporation | Grammatical element generation in machine translation |
US8886518B1 (en) * | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US8626486B2 (en) * | 2006-09-05 | 2014-01-07 | Google Inc. | Automatic spelling correction for machine translation |
US8204739B2 (en) * | 2008-04-15 | 2012-06-19 | Mobile Technologies, Llc | System and methods for maintaining speech-to-speech translation in the field |
KR100911372B1 (ko) | 2006-12-05 | 2009-08-10 | 한국전자통신연구원 | 통계적 기계번역 시스템에서 단어 및 구문들간의 번역관계를 자율적으로 학습하기 위한 장치 및 그 방법 |
US20080154577A1 (en) * | 2006-12-26 | 2008-06-26 | Sehda,Inc. | Chunk-based statistical machine translation system |
WO2008083503A1 (en) * | 2007-01-10 | 2008-07-17 | National Research Council Of Canada | Means and method for automatic post-editing of translations |
US8452585B2 (en) * | 2007-06-21 | 2013-05-28 | Microsoft Corporation | Discriminative syntactic word order model for machine translation |
KR100912501B1 (ko) * | 2007-08-09 | 2009-08-17 | 한국전자통신연구원 | 번역 지식 구축 방법 및 장치 |
US8423346B2 (en) * | 2007-09-05 | 2013-04-16 | Electronics And Telecommunications Research Institute | Device and method for interactive machine translation |
US9053089B2 (en) * | 2007-10-02 | 2015-06-09 | Apple Inc. | Part-of-speech tagging using latent analogy |
US8046211B2 (en) * | 2007-10-23 | 2011-10-25 | Microsoft Corporation | Technologies for statistical machine translation based on generated reordering knowledge |
US20090119090A1 (en) * | 2007-11-01 | 2009-05-07 | Microsoft Corporation | Principled Approach to Paraphrasing |
JP5112116B2 (ja) * | 2008-03-07 | 2013-01-09 | 株式会社東芝 | 機械翻訳する装置、方法およびプログラム |
CN101398815B (zh) * | 2008-06-13 | 2011-02-16 | 中国科学院计算技术研究所 | 一种机器翻译方法 |
US8150677B2 (en) * | 2008-06-26 | 2012-04-03 | Microsoft Corporation | Machine translation using language order templates |
KR100961717B1 (ko) * | 2008-09-16 | 2010-06-10 | 한국전자통신연구원 | 병렬 코퍼스를 이용한 기계번역 오류 탐지 방법 및 장치 |
WO2010046782A2 (en) * | 2008-10-24 | 2010-04-29 | App Tek | Hybrid machine translation |
US8494835B2 (en) * | 2008-12-02 | 2013-07-23 | Electronics And Telecommunications Research Institute | Post-editing apparatus and method for correcting translation errors |
US8244519B2 (en) * | 2008-12-03 | 2012-08-14 | Xerox Corporation | Dynamic translation memory using statistical machine translation |
CN101520775B (zh) * | 2009-02-17 | 2012-05-30 | 北京大学 | 一种融入语义信息的中文句法分析与解码方法 |
US8548796B2 (en) * | 2010-01-20 | 2013-10-01 | Xerox Corporation | Statistical machine translation system and method for translation of text into languages which produce closed compound words |
US8265923B2 (en) * | 2010-05-11 | 2012-09-11 | Xerox Corporation | Statistical machine translation employing efficient parameter training |
-
2010
- 2010-11-05 KR KR1020100109546A patent/KR101762866B1/ko active Active
-
2011
- 2011-07-20 CN CN201180053404.1A patent/CN103189860B/zh active Active
- 2011-07-20 US US13/883,758 patent/US10198437B2/en active Active
- 2011-07-20 WO PCT/KR2011/005325 patent/WO2012060540A1/ko active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090112573A1 (en) | 2007-10-30 | 2009-04-30 | Microsoft Corporation | Word-dependent transition models in HMM based word alignment for statistical machine translation |
Non-Patent Citations (1)
Title |
---|
황영숙, 통계기반 기계번역 기술의 소개 및 최신 연구동향 분석, 연세대학교 언어정보연구원 정기간행물, 제25권, pp.89-114, (2010.04.30)* |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190042257A (ko) * | 2017-10-16 | 2019-04-24 | 삼성전자주식회사 | 문장 생성 모델의 업데이트 방법 및 문장 생성 장치 |
KR102424540B1 (ko) | 2017-10-16 | 2022-07-25 | 삼성전자주식회사 | 문장 생성 모델의 업데이트 방법 및 문장 생성 장치 |
Also Published As
Publication number | Publication date |
---|---|
US20130226556A1 (en) | 2013-08-29 |
CN103189860A (zh) | 2013-07-03 |
KR20120048104A (ko) | 2012-05-15 |
CN103189860B (zh) | 2017-10-27 |
WO2012060540A1 (ko) | 2012-05-10 |
US10198437B2 (en) | 2019-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101762866B1 (ko) | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 | |
KR101266361B1 (ko) | 구조화된 번역 메모리 기반의 자동 번역 시스템 및 자동 번역 방법 | |
KR101732634B1 (ko) | 의존관계 포레스트를 이용한 통계적 기계 번역 방법 | |
CN111090727B (zh) | 语言转换处理方法、装置及方言语音交互系统 | |
JP2000353161A (ja) | 自然言語生成における文体制御方法及び装置 | |
Kaur et al. | Review of machine transliteration techniques | |
JP2017199363A (ja) | 機械翻訳装置及び機械翻訳のためのコンピュータプログラム | |
KR20230009564A (ko) | 앙상블 스코어를 이용한 학습 데이터 교정 방법 및 그 장치 | |
KR101709693B1 (ko) | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 | |
CN104239289A (zh) | 音节划分方法和音节划分设备 | |
JP2016164707A (ja) | 自動翻訳装置及び翻訳用モデル学習装置 | |
KR20120045906A (ko) | 코퍼스 오류 교정 장치 및 그 방법 | |
CN117094329B (zh) | 一种用于解决语音歧义的语音翻译方法及装置 | |
KR101134455B1 (ko) | 음성 인식 장치 및 그 방법 | |
Gao et al. | MARS: A statistical semantic parsing and generation-based multilingual automatic translation system | |
JP2018072979A (ja) | 対訳文抽出装置、対訳文抽出方法およびプログラム | |
JP3441400B2 (ja) | 言語変換規則作成装置、及びプログラム記録媒体 | |
KR20140079545A (ko) | 디코딩 방식에 기반한 다국어 형태소 분석 및 품사 태깅 방법 | |
KR100487716B1 (ko) | 단어레벨의 통계적 방법을 이용한 번역문 생성 방법 및 그장치 | |
JP5150277B2 (ja) | 言語処理装置、言語処理方法および言語処理プログラム並びに言語処理プログラムを記録した記録媒体 | |
JP2006338261A (ja) | 翻訳装置、翻訳方法及び翻訳プログラム | |
KR20040018008A (ko) | 품사 태깅 장치 및 태깅 방법 | |
JP4114526B2 (ja) | 機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラム | |
KR100911619B1 (ko) | 자동번역 시스템에서의 영어 어휘 패턴 구축 방법 및 장치 | |
Shukla et al. | A Framework of Translator from English Speech to Sanskrit Text |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20101105 |
|
N231 | Notification of change of applicant | ||
PN2301 | Change of applicant |
Patent event date: 20111102 Comment text: Notification of Change of Applicant Patent event code: PN23011R01D |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20151102 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20101105 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20160418 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20170428 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20170724 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20170725 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20200715 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20210715 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20220701 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20240610 Start annual number: 8 End annual number: 8 |