CN106547733A - 一种面向特定文本的命名实体识别方法 - Google Patents
一种面向特定文本的命名实体识别方法 Download PDFInfo
- Publication number
- CN106547733A CN106547733A CN201610912437.1A CN201610912437A CN106547733A CN 106547733 A CN106547733 A CN 106547733A CN 201610912437 A CN201610912437 A CN 201610912437A CN 106547733 A CN106547733 A CN 106547733A
- Authority
- CN
- China
- Prior art keywords
- entity
- candidate
- speech
- name
- entity word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000001914 filtration Methods 0.000 claims abstract description 10
- 239000000284 extract Substances 0.000 claims abstract description 6
- 238000002372 labelling Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000009394 selective breeding Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Character Discrimination (AREA)
Abstract
Description
Claims (4)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610912437.1A CN106547733A (zh) | 2016-10-19 | 2016-10-19 | 一种面向特定文本的命名实体识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610912437.1A CN106547733A (zh) | 2016-10-19 | 2016-10-19 | 一种面向特定文本的命名实体识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106547733A true CN106547733A (zh) | 2017-03-29 |
Family
ID=58369278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610912437.1A Pending CN106547733A (zh) | 2016-10-19 | 2016-10-19 | 一种面向特定文本的命名实体识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106547733A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491373A (zh) * | 2018-02-01 | 2018-09-04 | 北京百度网讯科技有限公司 | 一种实体识别方法及系统 |
CN108664615A (zh) * | 2017-05-12 | 2018-10-16 | 华中师范大学 | 一种面向学科教育资源的知识图谱构建方法 |
CN108932340A (zh) * | 2018-07-13 | 2018-12-04 | 华融融通(北京)科技有限公司 | 一种不良资产经营领域下金融知识图谱的构建方法 |
CN109241269A (zh) * | 2018-07-27 | 2019-01-18 | 深圳追科技有限公司 | 任务型机器人词槽填充方法 |
CN110210023A (zh) * | 2019-05-23 | 2019-09-06 | 竹间智能科技(上海)有限公司 | 一种实用有效的命名实体识别的计算方法 |
CN110502738A (zh) * | 2018-05-18 | 2019-11-26 | 阿里巴巴集团控股有限公司 | 中文命名实体识别方法、装置、设备和查询系统 |
CN111091003A (zh) * | 2019-12-05 | 2020-05-01 | 电子科技大学广东电子信息工程研究院 | 一种基于知识图谱查询的并行抽取方法 |
CN111178076A (zh) * | 2019-12-19 | 2020-05-19 | 成都欧珀通信科技有限公司 | 命名实体识别与链接方法、装置、设备及可读存储介质 |
CN111353310A (zh) * | 2020-02-28 | 2020-06-30 | 腾讯科技(深圳)有限公司 | 基于人工智能的命名实体识别方法、装置及电子设备 |
CN112183096A (zh) * | 2020-08-21 | 2021-01-05 | 南京中新赛克科技有限责任公司 | 基于无监督模型与状态感知机的命名实体抽取系统及方法 |
CN117609403A (zh) * | 2023-10-30 | 2024-02-27 | 合肥工业大学 | 一种应用于服务热线智能派单的地名识别方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102682763A (zh) * | 2011-03-10 | 2012-09-19 | 北京三星通信技术研究有限公司 | 修正语音输入文本中命名实体词汇的方法、装置及终端 |
CN103164426A (zh) * | 2011-12-13 | 2013-06-19 | 北大方正集团有限公司 | 一种命名实体识别的方法及装置 |
CN103631948A (zh) * | 2013-12-11 | 2014-03-12 | 北京京东尚科信息技术有限公司 | 命名实体的识别方法 |
CN103838870A (zh) * | 2014-03-21 | 2014-06-04 | 武汉科技大学 | 基于信息单元融合的新闻原子事件抽取方法 |
CN104572625A (zh) * | 2015-01-21 | 2015-04-29 | 北京云知声信息技术有限公司 | 命名实体的识别方法 |
-
2016
- 2016-10-19 CN CN201610912437.1A patent/CN106547733A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102682763A (zh) * | 2011-03-10 | 2012-09-19 | 北京三星通信技术研究有限公司 | 修正语音输入文本中命名实体词汇的方法、装置及终端 |
CN103164426A (zh) * | 2011-12-13 | 2013-06-19 | 北大方正集团有限公司 | 一种命名实体识别的方法及装置 |
CN103631948A (zh) * | 2013-12-11 | 2014-03-12 | 北京京东尚科信息技术有限公司 | 命名实体的识别方法 |
CN103838870A (zh) * | 2014-03-21 | 2014-06-04 | 武汉科技大学 | 基于信息单元融合的新闻原子事件抽取方法 |
CN104572625A (zh) * | 2015-01-21 | 2015-04-29 | 北京云知声信息技术有限公司 | 命名实体的识别方法 |
Non-Patent Citations (1)
Title |
---|
庄明 等: "一种统计和词性相结合的命名实体发现方法", 《计算机应用》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664615A (zh) * | 2017-05-12 | 2018-10-16 | 华中师范大学 | 一种面向学科教育资源的知识图谱构建方法 |
CN108491373B (zh) * | 2018-02-01 | 2022-05-27 | 北京百度网讯科技有限公司 | 一种实体识别方法及系统 |
CN108491373A (zh) * | 2018-02-01 | 2018-09-04 | 北京百度网讯科技有限公司 | 一种实体识别方法及系统 |
CN110502738A (zh) * | 2018-05-18 | 2019-11-26 | 阿里巴巴集团控股有限公司 | 中文命名实体识别方法、装置、设备和查询系统 |
CN108932340A (zh) * | 2018-07-13 | 2018-12-04 | 华融融通(北京)科技有限公司 | 一种不良资产经营领域下金融知识图谱的构建方法 |
CN109241269A (zh) * | 2018-07-27 | 2019-01-18 | 深圳追科技有限公司 | 任务型机器人词槽填充方法 |
CN110210023A (zh) * | 2019-05-23 | 2019-09-06 | 竹间智能科技(上海)有限公司 | 一种实用有效的命名实体识别的计算方法 |
CN111091003A (zh) * | 2019-12-05 | 2020-05-01 | 电子科技大学广东电子信息工程研究院 | 一种基于知识图谱查询的并行抽取方法 |
CN111091003B (zh) * | 2019-12-05 | 2023-10-10 | 电子科技大学广东电子信息工程研究院 | 一种基于知识图谱查询的并行抽取方法 |
CN111178076B (zh) * | 2019-12-19 | 2023-08-08 | 成都欧珀通信科技有限公司 | 命名实体识别与链接方法、装置、设备及可读存储介质 |
CN111178076A (zh) * | 2019-12-19 | 2020-05-19 | 成都欧珀通信科技有限公司 | 命名实体识别与链接方法、装置、设备及可读存储介质 |
WO2021169400A1 (zh) * | 2020-02-28 | 2021-09-02 | 腾讯科技(深圳)有限公司 | 基于人工智能的命名实体识别方法、装置及电子设备 |
CN111353310A (zh) * | 2020-02-28 | 2020-06-30 | 腾讯科技(深圳)有限公司 | 基于人工智能的命名实体识别方法、装置及电子设备 |
CN111353310B (zh) * | 2020-02-28 | 2023-08-11 | 腾讯科技(深圳)有限公司 | 基于人工智能的命名实体识别方法、装置及电子设备 |
CN112183096A (zh) * | 2020-08-21 | 2021-01-05 | 南京中新赛克科技有限责任公司 | 基于无监督模型与状态感知机的命名实体抽取系统及方法 |
CN117609403A (zh) * | 2023-10-30 | 2024-02-27 | 合肥工业大学 | 一种应用于服务热线智能派单的地名识别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106547733A (zh) | 一种面向特定文本的命名实体识别方法 | |
CN110765257B (zh) | 一种知识图谱驱动型的法律智能咨询系统 | |
CN107729468B (zh) | 基于深度学习的答案抽取方法及系统 | |
CN112214610B (zh) | 一种基于跨度和知识增强的实体关系联合抽取方法 | |
CN110413783B (zh) | 一种基于注意力机制的司法文本分类方法及系统 | |
CN110717018A (zh) | 一种基于知识图谱的工业设备故障维修问答系统 | |
CN104572958A (zh) | 一种基于事件抽取的敏感信息监控方法 | |
CN110472203B (zh) | 一种文章的查重检测方法、装置、设备及存储介质 | |
CN103150303B (zh) | 汉语语义格分层识别方法 | |
CN104598535A (zh) | 一种基于最大熵的事件抽取方法 | |
CN105095196B (zh) | 文本中新词发现的方法和装置 | |
CN108509409A (zh) | 一种自动生成语义相近句子样本的方法 | |
CN106569993A (zh) | 一种挖掘领域术语间上下位关系的方法及装置 | |
CN109918649B (zh) | 一种基于微博文本的自杀风险识别方法 | |
CN104199840A (zh) | 基于统计模型的智能地名识别技术 | |
CN103176963A (zh) | 基于crf++汉语句义结构模型自动标注方法 | |
CN110910175A (zh) | 一种旅游门票产品画像生成方法 | |
CN107943786A (zh) | 一种中文命名实体识别方法及系统 | |
CN110826322A (zh) | 一种新词发现和词性预测及标注的方法 | |
CN109800309A (zh) | 课堂话语类型分类方法及装置 | |
CN109740164A (zh) | 基于深度语义匹配的电力缺陷等级识别方法 | |
CN109344233B (zh) | 一种中文人名识别方法 | |
CN112397201B (zh) | 一种面向智能问诊系统的复述句生成优化方法 | |
CN102521220B (zh) | 一种网络自杀遗书的识别方法 | |
CN113934814B (zh) | 古诗文主观题自动评分方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Niu Haibo Inventor after: Gao Hui Inventor after: Luo Wei Inventor after: Chen Jun Inventor after: Tian Changhai Inventor after: Tan Yushan Inventor before: Niu Haibo Inventor before: Gao Hui Inventor before: Luo Wei Inventor before: Chen Jun Inventor before: Tian Changhai |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170329 |