KR20040084856A - 자연 언어 생성 시스템에 있어서의 문장 실현에서서열화를 위한 구성 요소 구조의 언어학적으로 통지된통계적 모델들 - Google Patents
자연 언어 생성 시스템에 있어서의 문장 실현에서서열화를 위한 구성 요소 구조의 언어학적으로 통지된통계적 모델들 Download PDFInfo
- Publication number
- KR20040084856A KR20040084856A KR1020040020476A KR20040020476A KR20040084856A KR 20040084856 A KR20040084856 A KR 20040084856A KR 1020040020476 A KR1020040020476 A KR 1020040020476A KR 20040020476 A KR20040020476 A KR 20040020476A KR 20040084856 A KR20040084856 A KR 20040084856A
- Authority
- KR
- South Korea
- Prior art keywords
- component
- model
- tree
- statistical model
- features
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (23)
- 서열화되지 않은 구문 트리(unordered syntax tree)를 수신하고, 서열화되지 않은 구문 트리로부터 대안적인 서열화된 구문 트리(ordered syntax tree)의 점수화되고 순위가 매겨진 리스트를 생성하는, 문장 실현 시스템(sentence realization system) 내의 트리 서열화 컴포넌트(tree ordering component)로서,형식적 구조(formal structure)를 갖는, 특징들에 대해 조건부적인 구성 요소 구조의 통계적 모델 - 상기 통계적 모델의 파라미터들은 통계적 평가 기술(statistical estimation technique)을 사용하여 평가됨 - 과,상기 서열화되지 않은 구문 트리를 수신하고, 가능성이 있는 대안적인 서열화된 구문 트리들의 세트를 고려하고, 상기 구성 요소 구조의 통계적 모델에 따라 상기 대안적인 서열화된 구문 트리들 중 어느 것이 가장 높은 확률을 갖는지를 식별하는 탐색 컴포넌트(search component)를 포함하는 트리 서열화 컴포넌트.
- 제1항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 특징들은 자동적인 특징 선택 기술에 의해 선택되는 트리 서열화 컴포넌트.
- 제1항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 모델의 파라미터들은 언어 모델링 기술들(language modeling techniques)에 의해 평가되는 트리 서열화 컴포넌트.
- 제1항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 모델의 파라미터들은 최대 엔트로피 기술들(maximum entropy techniques)에 의해 평가되는 트리 서열화 컴포넌트.
- 제1항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 모델의 파라미터들은 결정 트리 학습 기술들(decision tree learning techniques)에 의해 평가되는 트리 서열화 컴포넌트.
- 제1항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 모델의 형식적 구조는 특정한 방위(orientation)를 갖는 마코프 문법(Markov grammar)인 트리 서열화 컴포넌트.
- 제6항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 마코프 문법 구조를 갖는 모델은 구성 요소 구조의 조인트 모델(joint model)인 트리 서열화 컴포넌트.
- 제6항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 마코프 문법 구조를 갖는 모델은 구성 요소 구조의 조건부 모델(conditional model)인 트리 서열화 컴포넌트.
- 제1항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 모델의 형식적 구조는 2진 조건부 모델(binary conditional model)인 트리 서열화 컴포넌트.
- 제1항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 모델의 특징 세트는 상기 비서열화된 트리 내에서의 구성 요소들의 1 이상의 사전적 특징들(lexical features)을 포함하는 트리 서열화 컴포넌트.
- 제1항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 모델의 특징 세트는 상기 서열화되지 않은 트리 내의 구성 요소들의 1 이상의 구문론적 특징들(syntactic features)을 포함하는 트리 서열화 컴포넌트.
- 제1항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 모델의 특징 세트는 상기 서열화되지 않은 트리 내의 구성 요소들의 1 이상의 의미론적 특징들(semantic features)을 포함하는 트리 서열화 컴포넌트.
- 제12항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 모델의 특징 세트는 상기 서열화되지 않은 트리 내에 주어진 구성 요소의 헤드(head)와 그 구성 요소의 도터들(daughters) 간의 의미론적 관계를 포함하는 트리 서열화 컴포넌트.
- 제1항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 모델의 특징 세트는 상기 서열화되지 않은 트리의 특별한 구성 요소의 단어들의 길이를 포함하는 트리 서열화 컴포넌트.
- 제1항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 모델의 특징 세트는, 상기 서열화되지 않은 트리의 특별한 구성 요소에 대하여, 서열화 탐색 중에 하나의 서열화 가설과 관련하여 상기 구성 요소의 도터들이 이미 서열화되도록 정의되는 구성 요소 세트의 특징들을 포함하는 트리 서열화 컴포넌트.
- 제15항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 관심 대상인 상기 구성 요소 세트의 특징들은 그 세트의 크기를 포함하는 트리 서열화 컴포넌트.
- 제15항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 관심 대상인 상기 구성 요소 세트의 특징들은 그 세트에서의 각각의 의미론적 카테고리의 발생의 총수를 포함하는 트리 서열화 컴포넌트.
- 제8항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 모델의 특징 세트는, 상기 서열화되지 않은 트리의 특별한 구성 요소에 대하여, 서열화 탐색 중에 하나의 서열화 가설과 관련하여 상기 구성 요소의 도터들이 서열화되도록 정의되는 구성 요소 세트의 특징들을 포함하는 트리 서열화 컴포넌트.
- 제18항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 관심 대상인 상기 구성 요소 세트의 특징들은 그 세트의 크기를 포함하는 트리 서열화 컴포넌트.
- 제18항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 관심 대상인 상기 구성 요소 세트의 특징들은 그 세트에서의 각각의 구문론적 카테고리의 발생의 총수를 포함하는 트리 서열화 컴포넌트.
- 제9항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 상기 모델의 특징 세트는, 상기 서열화되지 않은 트리의 특별한 구성 요소에 대하여, 서열화 탐색 중에 하나의 서열화 가설과 관련하여 상기 구성 요소의 도터들이 서열화되도록 정의되는 구성 요소 세트의 특징들을 포함하는 트리 서열화 컴포넌트.
- 제21항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 관심 대상인 상기 구성 요소 세트의 특징들은 그 세트의 크기를 포함하는 트리 서열화 컴포넌트.
- 제21항에 있어서,상기 구성 요소 구조의 통계적 모델에서, 관심 대상인 상기 구성 요소 세트의 특징들은 그 세트에서의 각각의 구문론적 카테고리의 발생의 총수를 포함하는 트리 서열화 컴포넌트.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/396,549 | 2003-03-25 | ||
US10/396,549 US7346493B2 (en) | 2003-03-25 | 2003-03-25 | Linguistically informed statistical models of constituent structure for ordering in sentence realization for a natural language generation system |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040084856A true KR20040084856A (ko) | 2004-10-06 |
KR101084786B1 KR101084786B1 (ko) | 2011-11-21 |
Family
ID=32824957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040020476A KR101084786B1 (ko) | 2003-03-25 | 2004-03-25 | 트리 서열화 컴포넌트를 저장하는 컴퓨터 판독가능 기록매체 |
Country Status (12)
Country | Link |
---|---|
US (1) | US7346493B2 (ko) |
EP (1) | EP1462948B1 (ko) |
JP (1) | JP2004295884A (ko) |
KR (1) | KR101084786B1 (ko) |
CN (1) | CN1542649B (ko) |
AT (1) | ATE347711T1 (ko) |
AU (1) | AU2004201089B2 (ko) |
BR (1) | BRPI0400778A (ko) |
CA (1) | CA2461777C (ko) |
DE (1) | DE602004003513T2 (ko) |
MX (1) | MXPA04002816A (ko) |
RU (1) | RU2336552C2 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101225333B1 (ko) * | 2010-11-12 | 2013-01-23 | 한양대학교 산학협력단 | 구문론적으로 분석된 텍스트 코퍼스로부터 정보를 추출하는 트리 패턴 표현식을 이용한 시스템 및 방법 |
KR101409413B1 (ko) * | 2012-07-20 | 2014-06-20 | 한양대학교 에리카산학협력단 | 단일화 문법을 이용한 자연어 처리 방법 |
Families Citing this family (109)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2002316581A1 (en) | 2001-07-03 | 2003-01-21 | University Of Southern California | A syntax-based statistical translation model |
US7526424B2 (en) | 2002-03-20 | 2009-04-28 | Microsoft Corporation | Sentence realization model for a natural language generation system |
WO2004001623A2 (en) * | 2002-03-26 | 2003-12-31 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
US7324927B2 (en) * | 2003-07-03 | 2008-01-29 | Robert Bosch Gmbh | Fast feature selection method and system for maximum entropy modeling |
US7711545B2 (en) * | 2003-07-02 | 2010-05-04 | Language Weaver, Inc. | Empirical methods for splitting compound words with application to machine translation |
US8548794B2 (en) * | 2003-07-02 | 2013-10-01 | University Of Southern California | Statistical noun phrase translation |
US7698125B2 (en) * | 2004-03-15 | 2010-04-13 | Language Weaver, Inc. | Training tree transducers for probabilistic operations |
US8296127B2 (en) | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
US8666725B2 (en) * | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
US7620541B2 (en) * | 2004-05-28 | 2009-11-17 | Microsoft Corporation | Critiquing clitic pronoun ordering in french |
JP2006065462A (ja) * | 2004-08-25 | 2006-03-09 | Canon Inc | ソフトウェア・システム、ソフトウェア停止方法、プログラム、及び、記憶媒体 |
DE202005022113U1 (de) * | 2004-10-12 | 2014-02-05 | University Of Southern California | Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet |
US20060115145A1 (en) * | 2004-11-30 | 2006-06-01 | Microsoft Corporation | Bayesian conditional random fields |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
US10319252B2 (en) * | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US7599861B2 (en) | 2006-03-02 | 2009-10-06 | Convergys Customer Management Group, Inc. | System and method for closed loop decisionmaking in an automated care system |
US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
US7552047B2 (en) * | 2006-05-02 | 2009-06-23 | International Business Machines Corporation | Instance-based sentence boundary determination by optimization |
US8379830B1 (en) | 2006-05-22 | 2013-02-19 | Convergys Customer Management Delaware Llc | System and method for automated customer service with contingent live interaction |
US7809663B1 (en) | 2006-05-22 | 2010-10-05 | Convergys Cmg Utah, Inc. | System and method for supporting the utilization of machine language |
US8209163B2 (en) * | 2006-06-02 | 2012-06-26 | Microsoft Corporation | Grammatical element generation in machine translation |
US7865352B2 (en) * | 2006-06-02 | 2011-01-04 | Microsoft Corporation | Generating grammatical elements in natural language sentences |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US8548795B2 (en) * | 2006-10-10 | 2013-10-01 | Abbyy Software Ltd. | Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system |
US9633005B2 (en) | 2006-10-10 | 2017-04-25 | Abbyy Infopoisk Llc | Exhaustive automatic processing of textual information |
US9645993B2 (en) | 2006-10-10 | 2017-05-09 | Abbyy Infopoisk Llc | Method and system for semantic searching |
US20080086298A1 (en) * | 2006-10-10 | 2008-04-10 | Anisimovich Konstantin | Method and system for translating sentences between langauges |
US9984071B2 (en) | 2006-10-10 | 2018-05-29 | Abbyy Production Llc | Language ambiguity detection of text |
US9235573B2 (en) | 2006-10-10 | 2016-01-12 | Abbyy Infopoisk Llc | Universal difference measure |
US8195447B2 (en) | 2006-10-10 | 2012-06-05 | Abbyy Software Ltd. | Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US8145473B2 (en) | 2006-10-10 | 2012-03-27 | Abbyy Software Ltd. | Deep model statistics method for machine translation |
US8214199B2 (en) * | 2006-10-10 | 2012-07-03 | Abbyy Software, Ltd. | Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US9047275B2 (en) | 2006-10-10 | 2015-06-02 | Abbyy Infopoisk Llc | Methods and systems for alignment of parallel text corpora |
US8433556B2 (en) | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
US8468149B1 (en) | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
US8996587B2 (en) | 2007-02-15 | 2015-03-31 | International Business Machines Corporation | Method and apparatus for automatically structuring free form hetergeneous data |
US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
US8959011B2 (en) | 2007-03-22 | 2015-02-17 | Abbyy Infopoisk Llc | Indicating and correcting errors in machine translation systems |
US8831928B2 (en) * | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
US8812296B2 (en) | 2007-06-27 | 2014-08-19 | Abbyy Infopoisk Llc | Method and system for natural language dictionary generation |
US8639509B2 (en) * | 2007-07-27 | 2014-01-28 | Robert Bosch Gmbh | Method and system for computing or determining confidence scores for parse trees at all levels |
US8521516B2 (en) * | 2008-03-26 | 2013-08-27 | Google Inc. | Linguistic key normalization |
US9262409B2 (en) | 2008-08-06 | 2016-02-16 | Abbyy Infopoisk Llc | Translation of a selected text fragment of a screen |
US20100076978A1 (en) * | 2008-09-09 | 2010-03-25 | Microsoft Corporation | Summarizing online forums into question-context-answer triples |
RU2399959C2 (ru) * | 2008-10-29 | 2010-09-20 | Закрытое акционерное общество "Авикомп Сервисез" | Способ автоматизированной обработки текста на естественном языке путем его семантической индексации, способ автоматизированной обработки коллекции текстов на естественном языке путем их семантической индексации и машиночитаемые носители |
RU2509350C2 (ru) * | 2008-11-07 | 2014-03-10 | Матрокс Профешнл Инк | Способ семантической обработки естественного языка с использованием графического языка-посредника |
US8374881B2 (en) * | 2008-11-26 | 2013-02-12 | At&T Intellectual Property I, L.P. | System and method for enriching spoken language translation with dialog acts |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
US20110035210A1 (en) * | 2009-08-10 | 2011-02-10 | Benjamin Rosenfeld | Conditional random fields (crf)-based relation extraction system |
US8380486B2 (en) | 2009-10-01 | 2013-02-19 | Language Weaver, Inc. | Providing machine-generated translations and corresponding trust levels |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US9378202B2 (en) * | 2010-03-26 | 2016-06-28 | Virtuoz Sa | Semantic clustering |
US8359311B2 (en) | 2010-06-01 | 2013-01-22 | Microsoft Corporation | Federated implicit search |
KR101762866B1 (ko) * | 2010-11-05 | 2017-08-16 | 에스케이플래닛 주식회사 | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US8972240B2 (en) * | 2011-05-19 | 2015-03-03 | Microsoft Corporation | User-modifiable word lattice display for editing documents and search queries |
JP5681041B2 (ja) * | 2011-06-03 | 2015-03-04 | 富士通株式会社 | 名寄せ規則生成方法、装置、およびプログラム |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
US8989485B2 (en) | 2012-04-27 | 2015-03-24 | Abbyy Development Llc | Detecting a junction in a text line of CJK characters |
US8971630B2 (en) | 2012-04-27 | 2015-03-03 | Abbyy Development Llc | Fast CJK character recognition |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US10354650B2 (en) * | 2012-06-26 | 2019-07-16 | Google Llc | Recognizing speech with mixed speech recognition models to generate transcriptions |
US10810368B2 (en) * | 2012-07-10 | 2020-10-20 | Robert D. New | Method for parsing natural language text with constituent construction links |
US8762133B2 (en) | 2012-08-30 | 2014-06-24 | Arria Data2Text Limited | Method and apparatus for alert validation |
US9135244B2 (en) | 2012-08-30 | 2015-09-15 | Arria Data2Text Limited | Method and apparatus for configurable microplanning |
US9336193B2 (en) | 2012-08-30 | 2016-05-10 | Arria Data2Text Limited | Method and apparatus for updating a previously generated text |
US9355093B2 (en) | 2012-08-30 | 2016-05-31 | Arria Data2Text Limited | Method and apparatus for referring expression generation |
US9405448B2 (en) | 2012-08-30 | 2016-08-02 | Arria Data2Text Limited | Method and apparatus for annotating a graphical output |
US8762134B2 (en) | 2012-08-30 | 2014-06-24 | Arria Data2Text Limited | Method and apparatus for situational analysis text generation |
US9600471B2 (en) | 2012-11-02 | 2017-03-21 | Arria Data2Text Limited | Method and apparatus for aggregating with information generalization |
WO2014076525A1 (en) | 2012-11-16 | 2014-05-22 | Data2Text Limited | Method and apparatus for expressing time in an output text |
WO2014076524A1 (en) | 2012-11-16 | 2014-05-22 | Data2Text Limited | Method and apparatus for spatial descriptions in an output text |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
WO2014102569A1 (en) | 2012-12-27 | 2014-07-03 | Arria Data2Text Limited | Method and apparatus for motion description |
WO2014102568A1 (en) | 2012-12-27 | 2014-07-03 | Arria Data2Text Limited | Method and apparatus for motion detection |
WO2014111753A1 (en) | 2013-01-15 | 2014-07-24 | Arria Data2Text Limited | Method and apparatus for document planning |
US9569425B2 (en) | 2013-03-01 | 2017-02-14 | The Software Shop, Inc. | Systems and methods for improving the efficiency of syntactic and semantic analysis in automated processes for natural language understanding using traveling features |
RU2625533C1 (ru) * | 2013-06-18 | 2017-07-14 | Общество с ограниченной ответственностью "Аби Девелопмент" | Устройства и способы, которые строят иерархически упорядоченную структуру данных, содержащую непараметризованные символы, для преобразования изображений документов в электронные документы |
US9946711B2 (en) | 2013-08-29 | 2018-04-17 | Arria Data2Text Limited | Text generation from correlated alerts |
US9244894B1 (en) * | 2013-09-16 | 2016-01-26 | Arria Data2Text Limited | Method and apparatus for interactive reports |
US9396181B1 (en) | 2013-09-16 | 2016-07-19 | Arria Data2Text Limited | Method, apparatus, and computer program product for user-directed reporting |
RU2540832C1 (ru) * | 2013-09-24 | 2015-02-10 | Российская Федерация, от имени которой выступает Министерство обороны Российской Федерации | Система поиска разнородной информации в локальной компьютерной сети |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
RU2592395C2 (ru) | 2013-12-19 | 2016-07-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Разрешение семантической неоднозначности при помощи статистического анализа |
RU2586577C2 (ru) | 2014-01-15 | 2016-06-10 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Фильтрация дуг в синтаксическом графе |
WO2015159133A1 (en) | 2014-04-18 | 2015-10-22 | Arria Data2Text Limited | Method and apparatus for document planning |
RU2596600C2 (ru) | 2014-09-02 | 2016-09-10 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы обработки изображений математических выражений |
US9626358B2 (en) | 2014-11-26 | 2017-04-18 | Abbyy Infopoisk Llc | Creating ontologies by analyzing natural language texts |
WO2016140100A1 (ja) * | 2015-03-05 | 2016-09-09 | 国立大学法人奈良先端科学技術大学院大学 | 構文評価装置、翻訳装置、構文評価方法及び構文評価プログラム |
US9858923B2 (en) * | 2015-09-24 | 2018-01-02 | Intel Corporation | Dynamic adaptation of language models and semantic tracking for automatic speech recognition |
RU2618374C1 (ru) * | 2015-11-05 | 2017-05-03 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Выявление словосочетаний в текстах на естественном языке |
CN106294325B (zh) * | 2016-08-11 | 2019-01-04 | 海信集团有限公司 | 自然语言生成语句的优化方法及装置 |
US10445432B1 (en) | 2016-08-31 | 2019-10-15 | Arria Data2Text Limited | Method and apparatus for lightweight multilingual natural language realizer |
RU2636098C1 (ru) * | 2016-10-26 | 2017-11-20 | Общество с ограниченной ответственностью "Аби Продакшн" | Использование глубинного семантического анализа текстов на естественном языке для создания обучающих выборок в методах машинного обучения |
US10467347B1 (en) | 2016-10-31 | 2019-11-05 | Arria Data2Text Limited | Method and apparatus for natural language document orchestrator |
CN106652534B (zh) * | 2016-12-14 | 2019-08-16 | 北京工业大学 | 一种预测公交车到站时间的方法 |
US11144735B2 (en) * | 2019-04-09 | 2021-10-12 | International Business Machines Corporation | Semantic concept scorer based on an ensemble of language translation models for question answer system |
RU2717718C1 (ru) * | 2019-11-10 | 2020-03-25 | Игорь Петрович Рогачев | Способ преобразования структурированного массива данных, содержащего простые суждения |
RU2717719C1 (ru) * | 2019-11-10 | 2020-03-25 | Игорь Петрович Рогачев | Способ формирования структуры данных, содержащей простые суждения |
CN111667057B (zh) * | 2020-06-05 | 2023-10-20 | 北京百度网讯科技有限公司 | 用于搜索模型结构的方法和装置 |
CN112463953B (zh) * | 2020-11-30 | 2022-06-17 | 杭州孚嘉科技有限公司 | 一种基于税务咨询问题的热句排序方法 |
US12174869B2 (en) | 2021-03-24 | 2024-12-24 | International Business Machines Corporation | Automated natural language generation and selection |
CN113901788B (zh) * | 2021-08-27 | 2024-08-02 | 北京邮电大学 | 语句中方面词对应的观点词抽取方法及电子设备 |
KR20240018229A (ko) | 2022-08-02 | 2024-02-13 | 김민구 | 시내퍼 모델을 이용한 자연어 처리 시스템 및 방법 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4887212A (en) * | 1986-10-29 | 1989-12-12 | International Business Machines Corporation | Parser for natural language text |
JPH02240769A (ja) * | 1989-03-14 | 1990-09-25 | Canon Inc | 自然言語文生成装置 |
US5146406A (en) * | 1989-08-16 | 1992-09-08 | International Business Machines Corporation | Computer method for identifying predicate-argument structures in natural language text |
JP2810750B2 (ja) * | 1990-01-31 | 1998-10-15 | 株式会社沖テクノシステムズラボラトリ | 語学訓練用装置 |
JPH0424767A (ja) * | 1990-05-15 | 1992-01-28 | Fujitsu Ltd | 機械翻訳システム |
SG49804A1 (en) * | 1996-03-20 | 1998-06-15 | Government Of Singapore Repres | Parsing and translating natural language sentences automatically |
JP3607462B2 (ja) | 1997-07-02 | 2005-01-05 | 松下電器産業株式会社 | 関連キーワード自動抽出装置及びこれを用いた文書検索システム |
US6374220B1 (en) * | 1998-08-05 | 2002-04-16 | Texas Instruments Incorporated | N-best search for continuous speech recognition using viterbi pruning for non-output differentiation states |
US7275029B1 (en) | 1999-11-05 | 2007-09-25 | Microsoft Corporation | System and method for joint optimization of language model performance and size |
JP4049543B2 (ja) | 2001-02-28 | 2008-02-20 | 株式会社リコー | 文書検索装置、文書検索プログラム、記録媒体 |
JP3693958B2 (ja) | 2001-04-05 | 2005-09-14 | 松下電器産業株式会社 | 分散型文書検索方法及び装置、並びに分散型文書検索プログラム及びそのプログラムを記録した記録媒体 |
JP2003030238A (ja) | 2001-07-18 | 2003-01-31 | Nippon Telegr & Teleph Corp <Ntt> | 並列型情報検索装置および方法と並列型情報検索プログラムおよび該プログラムを記録した記録媒体 |
US7003445B2 (en) | 2001-07-20 | 2006-02-21 | Microsoft Corporation | Statistically driven sentence realizing method and apparatus |
US7526424B2 (en) | 2002-03-20 | 2009-04-28 | Microsoft Corporation | Sentence realization model for a natural language generation system |
-
2003
- 2003-03-25 US US10/396,549 patent/US7346493B2/en not_active Expired - Fee Related
-
2004
- 2004-03-15 AU AU2004201089A patent/AU2004201089B2/en not_active Ceased
- 2004-03-16 JP JP2004075165A patent/JP2004295884A/ja active Pending
- 2004-03-19 AT AT04006714T patent/ATE347711T1/de not_active IP Right Cessation
- 2004-03-19 DE DE602004003513T patent/DE602004003513T2/de not_active Expired - Lifetime
- 2004-03-19 EP EP04006714A patent/EP1462948B1/en not_active Expired - Lifetime
- 2004-03-23 CA CA2461777A patent/CA2461777C/en not_active Expired - Fee Related
- 2004-03-24 RU RU2004108775/09A patent/RU2336552C2/ru not_active IP Right Cessation
- 2004-03-25 MX MXPA04002816A patent/MXPA04002816A/es active IP Right Grant
- 2004-03-25 KR KR1020040020476A patent/KR101084786B1/ko active IP Right Grant
- 2004-03-25 CN CN200410032691XA patent/CN1542649B/zh not_active Expired - Fee Related
- 2004-03-25 BR BR0400778-6A patent/BRPI0400778A/pt not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101225333B1 (ko) * | 2010-11-12 | 2013-01-23 | 한양대학교 산학협력단 | 구문론적으로 분석된 텍스트 코퍼스로부터 정보를 추출하는 트리 패턴 표현식을 이용한 시스템 및 방법 |
KR101409413B1 (ko) * | 2012-07-20 | 2014-06-20 | 한양대학교 에리카산학협력단 | 단일화 문법을 이용한 자연어 처리 방법 |
Also Published As
Publication number | Publication date |
---|---|
CN1542649B (zh) | 2010-06-16 |
DE602004003513T2 (de) | 2007-04-05 |
MXPA04002816A (es) | 2005-06-17 |
BRPI0400778A (pt) | 2005-01-11 |
JP2004295884A (ja) | 2004-10-21 |
KR101084786B1 (ko) | 2011-11-21 |
AU2004201089B2 (en) | 2009-09-17 |
DE602004003513D1 (de) | 2007-01-18 |
CA2461777C (en) | 2012-06-26 |
AU2004201089A1 (en) | 2004-10-14 |
RU2336552C2 (ru) | 2008-10-20 |
ATE347711T1 (de) | 2006-12-15 |
RU2004108775A (ru) | 2005-09-27 |
EP1462948A1 (en) | 2004-09-29 |
CA2461777A1 (en) | 2004-09-25 |
CN1542649A (zh) | 2004-11-03 |
US7346493B2 (en) | 2008-03-18 |
US20040193401A1 (en) | 2004-09-30 |
EP1462948B1 (en) | 2006-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101084786B1 (ko) | 트리 서열화 컴포넌트를 저장하는 컴퓨터 판독가능 기록매체 | |
EP1582997B1 (en) | Machine translation using logical forms | |
US7970600B2 (en) | Using a first natural language parser to train a second parser | |
JP4494706B2 (ja) | 2カ国語コーパスからの変換マッピングの自動抽出プログラム | |
KR101031970B1 (ko) | 구문들 사이의 번역 관계를 학습하기 위한 통계적 방법 | |
JP4554273B2 (ja) | 機械トランスレータをトレーニングする方法およびそのシステム | |
JP4714400B2 (ja) | スケーラブル機械翻訳システム | |
US6278967B1 (en) | Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis | |
US9098489B2 (en) | Method and system for semantic searching | |
US7239998B2 (en) | Performing machine translation using a unified language model and translation model | |
US8185377B2 (en) | Diagnostic evaluation of machine translators | |
EP1280069A2 (en) | Statistically driven sentence realizing method and apparatus | |
WO2002039318A1 (en) | User alterable weighting of translations | |
US7752033B2 (en) | Text generation method and text generation device | |
KR20040018008A (ko) | 품사 태깅 장치 및 태깅 방법 | |
Gavhal et al. | Sentence Compression Using Natural Language Processing | |
Verdú-Mas et al. | Parsing with probabilistic strictly locally testable tree languages | |
Foth et al. | Parsing unrestricted german text with defeasible constraints | |
Garcia-Varea et al. | Maximum Entropy Modeling: A Suitable Framework to Learn Context-Dependent Lexicon Models for Statistical Machine Translation: Basic Instructions | |
Erjavec et al. | Language technologies and corpus encoding | |
JP4036172B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
Sinding | Studien und Skizzen; für Klavier, op. 82. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20040325 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20090226 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20040325 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20101215 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20110825 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20111111 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20111111 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20141017 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20141017 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20151016 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20151016 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20161019 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20161019 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20171018 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20171018 Start annual number: 7 End annual number: 7 |
|
FPAY | Annual fee payment |
Payment date: 20181018 Year of fee payment: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20181018 Start annual number: 8 End annual number: 8 |
|
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20200822 |