KR101794274B1 - 계층적 구문 기반의 통계적 기계 번역에서의 번역규칙 필터링과 목적단어 생성을 위한 방법 및 장치 - Google Patents
계층적 구문 기반의 통계적 기계 번역에서의 번역규칙 필터링과 목적단어 생성을 위한 방법 및 장치 Download PDFInfo
- Publication number
- KR101794274B1 KR101794274B1 KR1020100067635A KR20100067635A KR101794274B1 KR 101794274 B1 KR101794274 B1 KR 101794274B1 KR 1020100067635 A KR1020100067635 A KR 1020100067635A KR 20100067635 A KR20100067635 A KR 20100067635A KR 101794274 B1 KR101794274 B1 KR 101794274B1
- Authority
- KR
- South Korea
- Prior art keywords
- word
- translation
- source
- head
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/45—Example-based machine translation; Alignment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
Description
도 2는 원시단어와 목적단어 간의 관계를 나타낸 도면.
도 3은 본 발명에 따른 통계적 기계 번역 장치를 나타낸 도면.
Claims (15)
- 통계적 기계 번역에서 사용하기 위한 계층적 구문 기반의 번역규칙 생성 시, 원시언어 측 및 목적언어 측 모두에 특정 적격 의존 구조를 적용하여 번역규칙을 생성하여, 목적언어 측에만 적격 의존 구조를 적용해 번역규칙을 생성한 경우 대비 생성되는 번역규칙 개수를 감소시키는 단계,
상기 생성된 번역규칙을 이용하되, 서로 다른 원시단어에 의해 동일한 하나의 단어를 생성할 수 있는 헤드 단어 트리거(head word trigger) 방식을 적용하여, 원시언어 텍스트를 목적언어 텍스트로 번역하는 단계를 포함하는 것을 특징으로 하는 번역 방법.
- [청구항 2은(는) 설정등록료 납부시 포기되었습니다.]제1항에 있어서,
상기 특정 적격 의존 구조는,
w_i ... w_j이고, 하기의 조건을 만족하는 것을 특징으로 하는 번역 방법.
(1)
(2)
여기서, w_i ... w_j는 특정 적격 의존 구조를 이루는 단어들(i번째 단어부터 j번째 단어), d_h는 [w_i ... w_j] 중 공통의 헤드단어(w_h)가 의존하는 부모단어이며, 조건(1)은 공통의 헤드단어(w_h)가 의존하는 부모단어가 [w_i ... w_j]에 없는 것을 의미하며, 조건(2)는 [w_i ... w_j] 중에 속하는 임의의 단어(w_k)가 의존하는 부모단어가 [w_i ... w_j] 중에 있거나 또는 공통의 헤드단어(w_h)인 것을 의미. - [청구항 3은(는) 설정등록료 납부시 포기되었습니다.]제1항에 있어서,
상기 특정 적격 의존 구조는, 헤드 단어가 아닌 복수의 단어로 이루어진 집합을 포함하는 것을 특징으로 번역 방법.
- [청구항 4은(는) 설정등록료 납부시 포기되었습니다.]제3항에 있어서,
상기 집합을 이루는 복수의 단어는 공통의 헤드 단어에 의존되는 것을 특징으로 하는 번역 방법.
- 원시언어 및 목적언어의 문장을 구성하는 단어를 정렬하는 단계와,
상기 정렬된 단어를 매트릭스로 구성하는 단계와,
상기 매트릭스에서 공통의 헤드 단어에 의존되는 단어를 묶어 어구를 생성하는 단계와,
상기 생성된 어구를 이용하여 번역규칙을 생성하는 단계와,
상기 생성된 번역규칙을 이용하되, 서로 다른 원시단어에 의해 동일한 하나의 단어를 생성할 수 있는 헤드 단어 트리거(head word trigger) 방식을 적용하여, 원시언어 텍스트를 목적언어 텍스트로 번역하는 단계를 포함하는 것을 특징으로 하는 번역 방법.
- [청구항 6은(는) 설정등록료 납부시 포기되었습니다.]제5항에 있어서,
상기 생성된 어구를 구성하는 단어는 헤드 단어가 아닌 것을 특징으로 하는 번역 방법.
- [청구항 7은(는) 설정등록료 납부시 포기되었습니다.]제5항에 있어서,
상기 서로 다른 원시단어는 원시단어 및 그 원시단어의 헤드단어를 포함하는 것을 특징으로 하는 번역 방법. - [청구항 8은(는) 설정등록료 납부시 포기되었습니다.]제7항에 있어서,
상기 목적언어 텍스트를 구성하는 목적단어는,
상기 헤드 단어 트리거 방식에 따라서, 상기 원시언어 텍스트를 구성하는 원시단어 및 그 원시단어의 헤드단어에 트리거 되어 생성되는 것을 특징으로 하는 번역 방법.
- [청구항 9은(는) 설정등록료 납부시 포기되었습니다.]제7항에 있어서,
상기 헤드 단어에 의한 트리거는 로그 선형 모델에 통합되는 것을 특징으로 하는 번역 방법.
- 삭제
- 삭제
- 원시언어 및 목적언어 문장으로 구성된 언어 쌍 말뭉치를 단어 정렬하는 단어 정렬기와,
상기 언어 쌍 말뭉치를 파싱 하여 특정 적격 의존 구조에 따라 의존 트리를 생성하는 단어 분석기와,
상기 단어 정렬된 언어 쌍 말뭉치와 의존 트리를 이용하여 번역규칙을 생성하는 번역규칙 추출기와,
상기 생성된 번역규칙을 이용하되, 서로 다른 원시단어에 의해 동일한 하나의 단어를 생성할 수 있는 헤드 단어 트리거(head word trigger) 방식을 적용하여, 원시언어 텍스트를 목적언어 텍스트로 번역하는 디코더를 포함하는 것을 특징으로 하는 번역 장치.
- 삭제
- [청구항 14은(는) 설정등록료 납부시 포기되었습니다.]제12항에 있어서,
상기 서로 다른 원시단어는 원시단어 및 그 원시단어의 헤드단어를 포함하며,
상기 목적언어 텍스트를 구성하는 목적단어는,
상기 헤드 단어 트리거 방식에 따라서, 상기 원시언어 텍스트를 구성하는 원시단어 및 그 원시단어의 헤드단어에 트리거 되어 생성되는 것을 특징으로 하는 번역 장치.
- [청구항 15은(는) 설정등록료 납부시 포기되었습니다.]제1항 내지 제9항 중 어느 한 항에 의한 과정을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100067635A KR101794274B1 (ko) | 2010-07-13 | 2010-07-13 | 계층적 구문 기반의 통계적 기계 번역에서의 번역규칙 필터링과 목적단어 생성을 위한 방법 및 장치 |
PCT/KR2011/003977 WO2012008684A2 (ko) | 2010-07-13 | 2011-05-31 | 계층적 구문 기반의 통계적 기계 번역에서의 번역규칙 필터링과 목적단어 생성을 위한 방법 및 장치 |
US13/809,835 US20130117010A1 (en) | 2010-07-13 | 2011-05-31 | Method and device for filtering a translation rule and generating a target word in hierarchical-phase-based statistical machine translation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100067635A KR101794274B1 (ko) | 2010-07-13 | 2010-07-13 | 계층적 구문 기반의 통계적 기계 번역에서의 번역규칙 필터링과 목적단어 생성을 위한 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120006906A KR20120006906A (ko) | 2012-01-19 |
KR101794274B1 true KR101794274B1 (ko) | 2017-11-06 |
Family
ID=45469878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100067635A Active KR101794274B1 (ko) | 2010-07-13 | 2010-07-13 | 계층적 구문 기반의 통계적 기계 번역에서의 번역규칙 필터링과 목적단어 생성을 위한 방법 및 장치 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20130117010A1 (ko) |
KR (1) | KR101794274B1 (ko) |
WO (1) | WO2012008684A2 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101356417B1 (ko) * | 2010-11-05 | 2014-01-28 | 고려대학교 산학협력단 | 병렬 말뭉치를 이용한 동사구 번역 패턴 구축 장치 및 그 방법 |
US9582499B2 (en) * | 2014-04-14 | 2017-02-28 | Xerox Corporation | Retrieval of domain relevant phrase tables |
CN106383818A (zh) * | 2015-07-30 | 2017-02-08 | 阿里巴巴集团控股有限公司 | 一种机器翻译方法及装置 |
US20170308526A1 (en) * | 2016-04-21 | 2017-10-26 | National Institute Of Information And Communications Technology | Compcuter Implemented machine translation apparatus and machine translation method |
CN107656921B (zh) * | 2017-10-10 | 2021-01-08 | 上海数眼科技发展有限公司 | 一种基于深度学习的短文本依存分析方法 |
US11341340B2 (en) * | 2019-10-01 | 2022-05-24 | Google Llc | Neural machine translation adaptation |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008257737A (ja) * | 2008-04-14 | 2008-10-23 | Toshiba Corp | 機械翻訳装置および機械翻訳プログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2855409B2 (ja) * | 1994-11-17 | 1999-02-10 | 日本アイ・ビー・エム株式会社 | 自然言語処理方法及びシステム |
US6195631B1 (en) * | 1998-04-15 | 2001-02-27 | At&T Corporation | Method and apparatus for automatic construction of hierarchical transduction models for language translation |
JP2004362249A (ja) * | 2003-06-04 | 2004-12-24 | Advanced Telecommunication Research Institute International | 翻訳知識最適化装置、翻訳知識最適化のためのコンピュータプログラム、コンピュータ及び記憶媒体 |
US7200550B2 (en) * | 2004-11-04 | 2007-04-03 | Microsoft Corporation | Projecting dependencies to generate target language dependency structure |
US8433556B2 (en) * | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
GB2444084A (en) * | 2006-11-23 | 2008-05-28 | Sharp Kk | Selecting examples in an example based machine translation system |
US8452585B2 (en) * | 2007-06-21 | 2013-05-28 | Microsoft Corporation | Discriminative syntactic word order model for machine translation |
US8249856B2 (en) * | 2008-03-20 | 2012-08-21 | Raytheon Bbn Technologies Corp. | Machine translation |
-
2010
- 2010-07-13 KR KR1020100067635A patent/KR101794274B1/ko active Active
-
2011
- 2011-05-31 US US13/809,835 patent/US20130117010A1/en not_active Abandoned
- 2011-05-31 WO PCT/KR2011/003977 patent/WO2012008684A2/ko active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008257737A (ja) * | 2008-04-14 | 2008-10-23 | Toshiba Corp | 機械翻訳装置および機械翻訳プログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2012008684A3 (ko) | 2012-04-19 |
WO2012008684A2 (ko) | 2012-01-19 |
US20130117010A1 (en) | 2013-05-09 |
KR20120006906A (ko) | 2012-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pratapa et al. | Language modeling for code-mixing: The role of linguistic theory based synthetic data | |
Al-Onaizan et al. | Statistical machine translation | |
Quirk et al. | Dependency treelet translation: Syntactically informed phrasal SMT | |
CN100437557C (zh) | 基于语言知识库的机器翻译方法与装置 | |
KR101762866B1 (ko) | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 | |
JP3971373B2 (ja) | ルールベース方式と翻訳パターン方式とを混合したハイブリッド自動翻訳装置 | |
KR101794274B1 (ko) | 계층적 구문 기반의 통계적 기계 번역에서의 번역규칙 필터링과 목적단어 생성을 위한 방법 및 장치 | |
US20080046229A1 (en) | Disfluency detection for a speech-to-speech translation system using phrase-level machine translation with weighted finite state transducers | |
JP2008547093A5 (ko) | ||
KR101732634B1 (ko) | 의존관계 포레스트를 이용한 통계적 기계 번역 방법 | |
JP4085156B2 (ja) | テキスト生成方法及びテキスト生成装置 | |
Prószéky | MetaMorpho: A pattern-based machine translation system | |
Zhou et al. | Constrained phrase-based translation using weighted finite-state transducers | |
Nguyen et al. | A tree-to-string phrase-based model for statistical machine translation | |
Hasan et al. | Reranking translation hypotheses using structural properties | |
Tambouratzis et al. | Machine Translation with Minimal Reliance on Parallel Resources | |
Weese et al. | Using categorial grammar to label translation rules | |
CN114861628A (zh) | 训练机器翻译模型的系统、方法、电子设备及存储介质 | |
JP2011180941A (ja) | 句テーブル生成器及びそのためのコンピュータプログラム | |
JP4708682B2 (ja) | 対訳単語対の学習方法、装置、及び、対訳単語対の学習プログラムを記録した記録媒体 | |
Väyrynen et al. | Word category maps based on emergent features created by ICA | |
KR101670995B1 (ko) | 어순 조정 및 형태소 차이에 기반한 통계 기반 기계 번역 시스템 및 그 방법 | |
Bisazza | Linguistically Motivated Reordering Modeling for Phrase-Based Statistical Machine Translation | |
Mohaghegh et al. | Improved language modeling for English-Persian statistical machine translation | |
JP2521435B2 (ja) | 日本語生成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20100713 |
|
N231 | Notification of change of applicant | ||
PN2301 | Change of applicant |
Patent event date: 20111102 Comment text: Notification of Change of Applicant Patent event code: PN23011R01D |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20150713 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20100713 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20160621 Patent event code: PE09021S01D |
|
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20170228 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20170801 |
|
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20171031 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20171101 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20200925 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20211008 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20220915 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20230914 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20240905 Start annual number: 8 End annual number: 8 |