CN102637205A - 一种基于Hadoop的文档分类方法 - Google Patents
一种基于Hadoop的文档分类方法 Download PDFInfo
- Publication number
- CN102637205A CN102637205A CN2012100725223A CN201210072522A CN102637205A CN 102637205 A CN102637205 A CN 102637205A CN 2012100725223 A CN2012100725223 A CN 2012100725223A CN 201210072522 A CN201210072522 A CN 201210072522A CN 102637205 A CN102637205 A CN 102637205A
- Authority
- CN
- China
- Prior art keywords
- data
- key
- document
- vector
- hadoop
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210072522.3A CN102637205B (zh) | 2012-03-19 | 2012-03-19 | 一种基于Hadoop的文档分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210072522.3A CN102637205B (zh) | 2012-03-19 | 2012-03-19 | 一种基于Hadoop的文档分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102637205A true CN102637205A (zh) | 2012-08-15 |
CN102637205B CN102637205B (zh) | 2014-10-15 |
Family
ID=46621599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210072522.3A Expired - Fee Related CN102637205B (zh) | 2012-03-19 | 2012-03-19 | 一种基于Hadoop的文档分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102637205B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103713885A (zh) * | 2013-12-27 | 2014-04-09 | 中国科学院计算机网络信息中心 | 一种面向多核集群的smo并行处理方法 |
CN105938561A (zh) * | 2016-04-13 | 2016-09-14 | 南京大学 | 一种基于典型相关性分析的计算机数据属性约简方法 |
CN115345584A (zh) * | 2022-08-15 | 2022-11-15 | 南方电网深圳数字电网研究院有限公司 | 一种基于项目自定义设置标签的方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1339756A (zh) * | 2000-08-23 | 2002-03-13 | 松下电器产业株式会社 | 文档检索和分类方法及其装置 |
CN1452098A (zh) * | 2002-04-19 | 2003-10-29 | 株式会社日立制作所 | 文档分类系统及其实现程序 |
WO2005118443A2 (en) * | 2004-06-04 | 2005-12-15 | De La Rue International Limited | Document sorting machine |
-
2012
- 2012-03-19 CN CN201210072522.3A patent/CN102637205B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1339756A (zh) * | 2000-08-23 | 2002-03-13 | 松下电器产业株式会社 | 文档检索和分类方法及其装置 |
CN1452098A (zh) * | 2002-04-19 | 2003-10-29 | 株式会社日立制作所 | 文档分类系统及其实现程序 |
WO2005118443A2 (en) * | 2004-06-04 | 2005-12-15 | De La Rue International Limited | Document sorting machine |
Non-Patent Citations (1)
Title |
---|
向小军等: "基于Hadoop平台的海量文本分类的并行化", 《计算机科学》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103713885A (zh) * | 2013-12-27 | 2014-04-09 | 中国科学院计算机网络信息中心 | 一种面向多核集群的smo并行处理方法 |
CN105938561A (zh) * | 2016-04-13 | 2016-09-14 | 南京大学 | 一种基于典型相关性分析的计算机数据属性约简方法 |
CN115345584A (zh) * | 2022-08-15 | 2022-11-15 | 南方电网深圳数字电网研究院有限公司 | 一种基于项目自定义设置标签的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN102637205B (zh) | 2014-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103020122B (zh) | 一种基于半监督聚类的迁移学习方法 | |
CN107330446B (zh) | 一种面向图像分类的深度卷积神经网络的优化方法 | |
CN108898225B (zh) | 基于人机协同学习的数据标注方法 | |
CN105117429A (zh) | 基于主动学习和多标签多示例学习的场景图像标注方法 | |
CN101770580B (zh) | 一种跨领域的文本情感分类器的训练方法和分类方法 | |
CN107729513A (zh) | 基于语义对齐的离散监督跨模态哈希检索方法 | |
WO2017035922A1 (zh) | 一种基于改进lda模型的互联网话题在线挖掘方法 | |
CN104239554A (zh) | 跨领域跨类别的新闻评论情绪预测方法 | |
CN103886048B (zh) | 一种基于聚类的增量数字图书推荐方法 | |
CN103425996B (zh) | 一种并行分布式的大规模图像识别方法 | |
CN102279844A (zh) | 汉语作文自动测试方法及系统 | |
CN101916376A (zh) | 基于局部样条嵌入的正交半监督子空间图像分类方法 | |
CN105512209A (zh) | 一种基于特征自动学习的生物医学事件触发词识别方法 | |
CN103020712B (zh) | 一种海量微博数据的分布式分类装置及方法 | |
CN103150383B (zh) | 一种短文本数据的事件演化分析方法 | |
CN103295032B (zh) | 基于空间Fisher向量的图像分类方法 | |
CN103412878B (zh) | 基于领域知识地图社区结构的文档主题划分方法 | |
CN108280164A (zh) | 一种基于类别相关单词的短文本过滤与分类方法 | |
CN113282701B (zh) | 作文素材生成方法、装置、电子设备及可读存储介质 | |
CN106776740A (zh) | 一种基于卷积神经网络的社交网络文本聚类方法 | |
CN102637205B (zh) | 一种基于Hadoop的文档分类方法 | |
CN103971136A (zh) | 一种面向大规模数据的并行结构化支持向量机分类方法 | |
Zhu et al. | Learning to classify short text with topic model and external knowledge | |
CN107292348A (zh) | 一种Bagging_BSJ短文本分类方法 | |
Han et al. | Diffusion model with clustering-based conditioning for food image generation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20161026 Address after: No. 163 Nanjing City, Jiangsu province 210046 Xianlin Avenue Patentee after: NANJING University Address before: No. 163 Nanjing City, Jiangsu province 210046 Xianlin Avenue Patentee before: Nanjing University Patentee before: Jiangyin Institute of Information Technology of Nanjing University |
|
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20120815 Assignee: Xiamen Nebula sea Mdt InfoTech Ltd Assignor: NANJING University Contract record no.: 2016320000239 Denomination of invention: Document classification method based on Hadoop Granted publication date: 20141015 License type: Exclusive License Record date: 20161228 |
|
LICC | Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20141015 |
|
CF01 | Termination of patent right due to non-payment of annual fee |