CN105095381A - 新词识别方法和装置 - Google Patents
新词识别方法和装置 Download PDFInfo
- Publication number
- CN105095381A CN105095381A CN201510374935.0A CN201510374935A CN105095381A CN 105095381 A CN105095381 A CN 105095381A CN 201510374935 A CN201510374935 A CN 201510374935A CN 105095381 A CN105095381 A CN 105095381A
- Authority
- CN
- China
- Prior art keywords
- search query
- word
- probability
- search
- segments
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510374935.0A CN105095381B (zh) | 2015-06-30 | 2015-06-30 | 新词识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510374935.0A CN105095381B (zh) | 2015-06-30 | 2015-06-30 | 新词识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105095381A true CN105095381A (zh) | 2015-11-25 |
CN105095381B CN105095381B (zh) | 2019-06-25 |
Family
ID=54575818
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510374935.0A Active CN105095381B (zh) | 2015-06-30 | 2015-06-30 | 新词识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105095381B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488209A (zh) * | 2015-12-11 | 2016-04-13 | 北京奇虎科技有限公司 | 一种词权重的分析方法及装置 |
CN105528430A (zh) * | 2015-12-10 | 2016-04-27 | 北京奇虎科技有限公司 | 一种确定搜索项的权重的方法和装置 |
CN106528523A (zh) * | 2016-09-22 | 2017-03-22 | 中山大学 | 一种网络新词识别方法 |
CN108182174A (zh) * | 2017-12-27 | 2018-06-19 | 掌阅科技股份有限公司 | 新词提取方法、电子设备及计算机存储介质 |
CN108664646A (zh) * | 2018-05-16 | 2018-10-16 | 电子科技大学 | 一种基于关键字的音视频自动下载系统 |
CN108984513A (zh) * | 2017-06-05 | 2018-12-11 | 阿里巴巴集团控股有限公司 | 一种词串识别方法和服务器 |
CN110175234A (zh) * | 2019-04-08 | 2019-08-27 | 北京百度网讯科技有限公司 | 未登录词识别方法、装置、计算机设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050251384A1 (en) * | 2004-05-05 | 2005-11-10 | Microsoft Corporation | Word extraction method and system for use in word-breaking |
CN1912872A (zh) * | 2006-07-25 | 2007-02-14 | 北京搜狗科技发展有限公司 | 一种提取新词的方法和系统 |
CN102043845A (zh) * | 2010-12-08 | 2011-05-04 | 百度在线网络技术(北京)有限公司 | 一种用于基于查询序列簇提取核心关键词的方法与设备 |
CN102930055A (zh) * | 2012-11-18 | 2013-02-13 | 浙江大学 | 结合内部聚合度和外部离散信息熵的网络新词发现方法 |
CN103544165A (zh) * | 2012-07-12 | 2014-01-29 | 腾讯科技(深圳)有限公司 | 新词挖掘方法和系统 |
-
2015
- 2015-06-30 CN CN201510374935.0A patent/CN105095381B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050251384A1 (en) * | 2004-05-05 | 2005-11-10 | Microsoft Corporation | Word extraction method and system for use in word-breaking |
CN1912872A (zh) * | 2006-07-25 | 2007-02-14 | 北京搜狗科技发展有限公司 | 一种提取新词的方法和系统 |
CN102043845A (zh) * | 2010-12-08 | 2011-05-04 | 百度在线网络技术(北京)有限公司 | 一种用于基于查询序列簇提取核心关键词的方法与设备 |
CN103544165A (zh) * | 2012-07-12 | 2014-01-29 | 腾讯科技(深圳)有限公司 | 新词挖掘方法和系统 |
CN102930055A (zh) * | 2012-11-18 | 2013-02-13 | 浙江大学 | 结合内部聚合度和外部离散信息熵的网络新词发现方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105528430B (zh) * | 2015-12-10 | 2019-05-31 | 北京奇虎科技有限公司 | 一种确定搜索项的权重的方法和装置 |
CN105528430A (zh) * | 2015-12-10 | 2016-04-27 | 北京奇虎科技有限公司 | 一种确定搜索项的权重的方法和装置 |
CN105488209A (zh) * | 2015-12-11 | 2016-04-13 | 北京奇虎科技有限公司 | 一种词权重的分析方法及装置 |
CN105488209B (zh) * | 2015-12-11 | 2019-06-07 | 北京奇虎科技有限公司 | 一种词权重的分析方法及装置 |
CN106528523A (zh) * | 2016-09-22 | 2017-03-22 | 中山大学 | 一种网络新词识别方法 |
CN106528523B (zh) * | 2016-09-22 | 2019-05-10 | 中山大学 | 一种网络新词识别方法 |
CN108984513B (zh) * | 2017-06-05 | 2022-03-04 | 阿里巴巴集团控股有限公司 | 一种词串识别方法和服务器 |
CN108984513A (zh) * | 2017-06-05 | 2018-12-11 | 阿里巴巴集团控股有限公司 | 一种词串识别方法和服务器 |
CN108182174A (zh) * | 2017-12-27 | 2018-06-19 | 掌阅科技股份有限公司 | 新词提取方法、电子设备及计算机存储介质 |
CN108182174B (zh) * | 2017-12-27 | 2019-03-26 | 掌阅科技股份有限公司 | 新词提取方法、电子设备及计算机存储介质 |
CN108664646B (zh) * | 2018-05-16 | 2021-11-16 | 电子科技大学 | 一种基于关键字的音视频自动下载系统 |
CN108664646A (zh) * | 2018-05-16 | 2018-10-16 | 电子科技大学 | 一种基于关键字的音视频自动下载系统 |
CN110175234A (zh) * | 2019-04-08 | 2019-08-27 | 北京百度网讯科技有限公司 | 未登录词识别方法、装置、计算机设备及存储介质 |
CN110175234B (zh) * | 2019-04-08 | 2022-02-25 | 北京百度网讯科技有限公司 | 未登录词识别方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN105095381B (zh) | 2019-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105095381B (zh) | 新词识别方法和装置 | |
US11544459B2 (en) | Method and apparatus for determining feature words and server | |
CN103984776B (zh) | 一种识别重复图片的方法、图片搜索去重方法及其装置 | |
CN103198057B (zh) | 一种自动给文档添加标签的方法和装置 | |
CN104036009B (zh) | 一种搜索匹配图片的方法、图片搜索方法及装置 | |
CN104965905B (zh) | 一种网页分类的方法和装置 | |
CN104537065A (zh) | 一种搜索结果的推送方法及系统 | |
JP2003242176A5 (zh) | ||
US20180210897A1 (en) | Model generation method, word weighting method, device, apparatus, and computer storage medium | |
CN103984757B (zh) | 在搜索结果页上插入新闻信息条目的方法和系统 | |
US20170154056A1 (en) | Matching image searching method, image searching method and devices | |
CN103605691A (zh) | 用于处理社交网络中发布内容的装置和方法 | |
CN106844571A (zh) | 识别同义词的方法、装置和计算设备 | |
US20250021608A1 (en) | System, Method, and Computer Program Product For Inserting Citations Into a Textual Document | |
CN105550169A (zh) | 一种基于字符长度识别兴趣点名称的方法和装置 | |
US20250021747A1 (en) | System, Method, and Computer Program Product for Automated Factual Citation Detection | |
CN108388556B (zh) | 同类实体的挖掘方法及系统 | |
CN104966109B (zh) | 医疗化验单图像分类方法及装置 | |
CN103744970B (zh) | 一种确定图片的主题词的方法及装置 | |
CN104281842A (zh) | 人脸图片人名识别方法和装置 | |
CN103455572B (zh) | 获取网页中影视主体的方法及装置 | |
CN109815337B (zh) | 确定文章类别的方法及装置 | |
CN106681994A (zh) | 查询词分类样本自动挖掘以及游戏项目推荐的方法和装置 | |
CN109284441B (zh) | 动态自适应网络敏感信息检测方法及装置 | |
CN105095203B (zh) | 同义词的确定、搜索方法及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220729 Address after: 300450 No. 9-3-401, No. 39, Gaoxin 6th Road, Binhai Science Park, Binhai New Area, Tianjin Patentee after: 3600 Technology Group Co.,Ltd. Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park) Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd. Patentee before: Qizhi software (Beijing) Co.,Ltd. |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230718 Address after: 1765, floor 17, floor 15, building 3, No. 10 Jiuxianqiao Road, Chaoyang District, Beijing 100015 Patentee after: Beijing Hongxiang Technical Service Co.,Ltd. Address before: 300450 No. 9-3-401, No. 39, Gaoxin 6th Road, Binhai Science Park, Binhai New Area, Tianjin Patentee before: 3600 Technology Group Co.,Ltd. |
|
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: 1765, floor 17, floor 15, building 3, No. 10 Jiuxianqiao Road, Chaoyang District, Beijing 100015 Patentee after: Beijing 360 Zhiling Technology Co.,Ltd. Country or region after: China Address before: 1765, floor 17, floor 15, building 3, No. 10 Jiuxianqiao Road, Chaoyang District, Beijing 100015 Patentee before: Beijing Hongxiang Technical Service Co.,Ltd. Country or region before: China |