[go: up one dir, main page]

CN108874814B - 法律文书的处理方法及装置 - Google Patents

法律文书的处理方法及装置 Download PDF

Info

Publication number
CN108874814B
CN108874814B CN201710326902.8A CN201710326902A CN108874814B CN 108874814 B CN108874814 B CN 108874814B CN 201710326902 A CN201710326902 A CN 201710326902A CN 108874814 B CN108874814 B CN 108874814B
Authority
CN
China
Prior art keywords
legal
dimension
classified
target
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710326902.8A
Other languages
English (en)
Other versions
CN108874814A (zh
Inventor
石鹏
赵健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201710326902.8A priority Critical patent/CN108874814B/zh
Publication of CN108874814A publication Critical patent/CN108874814A/zh
Application granted granted Critical
Publication of CN108874814B publication Critical patent/CN108874814B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Technology Law (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种法律文书的处理方法及装置。该方法包括:确定待分类的法律文书;确定对待分类的法律文书进行分类依据的目标维度;对待分类的法律文书中的每篇法律文书进行解析,提取每篇法律文书中目标维度对应的维度信息;在目标路径下创建以目标维度命名的文件夹,得到目标维度文件夹;在目标维度文件夹下,基于维度信息创建其对应的法律文书的快捷方式。通过本申请,解决了相关技术中对法律文书进行分类的效率较低的问题。

Description

法律文书的处理方法及装置
技术领域
本申请涉及法律文书的处理领域,具体而言,涉及一种法律文书的处理方法及装置。
背景技术
从事法律行业的人在电脑中经常会存放各种类型的法律文书,随着时间的流逝以及文档的增加,很多文档已经不能仅仅从文件名称识别。当需要查找某个文件的时候,只能通过关键字进行检索,而通过各种文件夹进行分类,整理的成本极高,特别是文档数量达到数万数十万级别的时候。通常,通过文件夹进行分类,要么通过关键词进行检索,通过关键词检索不一定能准确命中所需文件,且Windows自带的检索功能过于简单。通过文件夹分类,虽然一定程度上降低了找文件的复杂程度,但是分类一旦改变,整理成本极高,分类效率较低。
针对相关技术中对法律文书进行分类的效率较低的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种法律文书的处理方法及装置,以解决相关技术中对法律文书进行分类的效率较低的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种法律文书的处理方法。该方法包括:确定待分类的法律文书;确定对所述待分类的法律文书进行分类依据的目标维度;对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中目标维度对应的维度信息;在目标路径下创建以目标维度命名的文件夹,得到目标维度文件夹;在所述目标维度文件夹下,基于所述维度信息创建其对应的法律文书的快捷方式。
进一步地,在所述目标维度文件夹下,基于所述维度信息创建其对应的法律文书的快捷方式包括:在所述目标维度文件夹下,创建以所述维度信息命名的文件夹;在以所述维度信息命名的文件夹下,创建所述维度信息对应的法律文书的快捷方式。
进一步地,所述目标维度为多个维度,对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中目标维度对应的维度信息包括:对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中每个目标维度对应的维度信息;对所述每个目标维度对应的维度信息进行缓存;在所述目标维度文件夹下,基于所述维度信息创建其对应的法律文书的快捷方式包括:遍历缓存中的维度信息,基于每个维度信息创建其对应的法律文书的快捷方式。
进一步地,在确定待分类的法律文书之前,所述方法还包括:确定待分类的法律文书的文档格式类型;采用与文档格式类型对应的提取方式对所述待分类的法律文书进行文本内容提取;对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中目标维度对应的维度信息包括:基于每篇法律文书中提取到的文本内容进行解析,提取所述每篇法律文书中目标维度对应的维度信息。
进一步地,基于每篇法律文书中提取的文本内容进行解析,提取所述每篇法律文书中目标维度对应的维度信息包括:对所述每篇法律文书的文本内容进行分段,得到多段文本内容;采用目标维度在每段文本内容中进行匹配;在文本内容中匹配到所述目标维度的情况下,在文本内容中提取所述目标维度对应的维度信息。
为了实现上述目的,根据本申请的另一方面,提供了一种法律文书的处理装置。该装置包括:第一确定单元,用于确定待分类的法律文书;第二确定单元,用于确定对所述待分类的法律文书进行分类依据的目标维度;解析单元,用于对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中目标维度对应的维度信息;第一创建单元,用于在目标路径下创建以目标维度命名的文件夹,得到目标维度文件夹;第二创建单元,用于在所述目标维度文件夹下,基于所述维度信息创建其对应的法律文书的快捷方式。
进一步地,所述第二创建单元包括:第一创建模块,用于在所述目标维度文件夹下,创建以所述维度信息命名的文件夹;第二创建模块,用于在以所述维度信息命名的文件夹下,创建所述维度信息对应的法律文书的快捷方式。
进一步地,所述目标维度为多个维度,所述解析单元还用于对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中每个目标维度对应的维度信息;对所述每个目标维度对应的维度信息进行缓存;所述第二创建单元还用于遍历缓存中的维度信息,基于每个维度信息创建其对应的法律文书的快捷方式。
为了实现上述目的,根据本申请的另一方面,提供了一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行上述任意一项所述的法律文书的处理方法。
为了实现上述目的,根据本申请的另一方面,提供了一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行上述任意一项所述的法律文书的处理方法。
通过本申请,采用以下步骤:确定待分类的法律文书;确定对待分类的法律文书进行分类依据的目标维度;对待分类的法律文书中的每篇法律文书进行解析,提取每篇法律文书中目标维度对应的维度信息;在目标路径下创建以目标维度命名的文件夹,得到目标维度文件夹;在目标维度文件夹下,基于维度信息创建其对应的法律文书的快捷方式,解决了相关技术中对法律文书进行分类的效率较低的问题。通过依据目标维度对待分类的法律文书进行分类,在目标路径下创建目标维度对应的维度信息对应的法律文书的快捷方式,进而达到了提升对法律文书进行分类的效率的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的法律文书的处理方法的流程图;以及
图2是根据本申请实施例提供的法律文书的处理装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了便于描述,以下对本申请实施例涉及的部分名词或术语进行说明:
法律文书是司法行政机关及当事人、律师等在解决诉讼和非讼案件时使用的文书,也包括司法机关的非规范性文件。包括规范性和非规范性两种。一般的法律文书是指我国公安机关(含国家安全机关)、检察院、法院、监狱或劳改机关以及公证机关、仲裁机关依法制作的处理各类诉讼案件和非诉讼案件的法律文书和案件当事人、律师及律师事务所自书或代书的具有法律效力或法律意义的文书的总称,亦即指规范性法律文书(国家立法机关颁布的各种法律)以外,所有非规范性的法律文书的总称。
根据本申请的实施例,提供了一种法律文书的处理方法。
图1是根据本申请实施例的法律文书的处理方法的流程图。如图1所示,该方法包括以下步骤:
步骤S101,确定待分类的法律文书。
在多篇法律文书中确定需要进行分类的法律文书,即为待分类的法律文书。
步骤S102,确定对待分类的法律文书进行分类依据的目标维度。
例如,确定对待分类的法律文书进行分类依据的维度为当事人、法院、案由等等,将当事人、法院、审结日期等等维度作为目标维度。
步骤S103,对待分类的法律文书中的每篇法律文书进行解析,提取每篇法律文书中目标维度对应的维度信息。
在本申请中提取每篇法律文书中目标维度对应的维度信息可以采用以下方式:采用预先训练的数据模型,查找每篇法律文书中目标维度对应的维度信息。需要说明的是,在本实施例中提及的数据模型可以为,通过人工对大量法律文书语料中的各个维度进行标注。通过机器对被标注后的法律文书语料中的各个维度进行学习,训练出数据模型。使用该数据模型,就可以对新的法律文书中的各个维度提取其对应的维度信息。
如果目标维度为当事人、法院、审结日期时,在待分类的法律文书中,针对每篇法律文书,分别提取每篇法律文书中当事人、法院、审结日期对应的维度信息。例如,法律文书1中的对应的维度信息为:当事人:张三,李四法院:北京市海淀区人民法院审结日期2016年1月2日;
法律文书2中的对应的维度信息为:当事人:李四,赵六法院:北京市朝阳区人民法院审结日期2016年9月2日;
法律文书3中的对应的维度信息为:当事人:张三,赵六法院:最高人民法院审结日期2013年1月2日;
法律文书4中的对应的维度信息为:当事人:张三,刘七法院:最高人民法院审结日期2013年2月2日;等等。
由于每篇法律文书中文本内容较多,为了提升对法律文书解析的速度,可选地,在本申请实施例提供的法律文书的处理方法中,基于每篇法律文书中提取的文本内容进行解析,提取每篇法律文书中目标维度对应的维度信息包括:对每篇法律文书的文本内容进行分段,得到多段文本内容;采用目标维度在每段文本内容中进行匹配;在文本内容中匹配到目标维度的情况下,在文本内容中提取目标维度对应的维度信息。
例如对法律文书1中的文本内容进行分段,得到多段文本内容,如果目标维度为当事人、法院、审结日期时,采用当事人、法院、审结日期在各段文本内容中进行逐一匹配;在文本内容中匹配到目标维度的情况下,在文本内容中提取目标维度对应的维度信息。需要说明的是,在各段文本内容中匹配到目标维度的词时,提取该目标维度后面预定字段的词,将其作为对应的维度信息。例如,文本内容中原告:张三,33岁,男;被告:李四,35岁,男。若当事人为目标维度,匹配到词原告和被告后,分别提取原告和被告后2或3个字段的词作为对应的维度信息,即提取到当事人对应的维度信息为张三,李四。
步骤S104,在目标路径下创建以目标维度命名的文件夹,得到目标维度文件夹。
如果目标维度为当事人,法官、审结日期,在目标路径下创建3个文件夹,文件夹命名分别为当事人、法院、审结日期。
步骤S105,在目标维度文件夹下,基于维度信息创建其对应的法律文书的快捷方式。
例如,在文件夹名为当事人的文件夹下,当事人对应的维度信息为张三,张三对应的法律文书1、法律文书3和法律文书4。在文件夹名为当事人的文件夹下,创建张三对应的法律文书1的快捷方式、法律文书3的快捷方式和法律文书4的快捷方式。
需要说明的是,在目标维度文件夹下,基于维度信息创建其对应的法律文书的快捷方式可以为:在目标维度文件夹下,创建维度信息对应的法律文书的快捷方式,基于维度信息对创建的快捷方式进行更名。例如,当事人对应的维度信息为张三,张三对应的法律文书1、法律文书3和法律文书4,在文件夹名为当事人的文件夹下,创建张三对应的法律文书1的快捷方式、法律文书3的快捷方式和法律文书4的快捷方式。并对张三对应的法律文书1的快捷方式更名为张三第一篇,对张三对应的法律文书3的快捷方式更名为张三第二篇,对张三对应的法律文书4的快捷方式更名为张三第三篇。用户可以在文件夹名为当事人的文件夹下直观的获取有关当事人张三的多篇法律文书,从而在多篇与张三相关的法律文书中去获取用户实际需要的查找的法律文书。
由于待分类的法律文书可能会存在多种文档格式类型,例如,法律文书的文档格式类型为TXT,DOC,DOCX等,为了保证对法律文书进行文本内容提取的准确性,可选地,在本申请实施例提供的法律文书的处理方法中,在确定待分类的法律文书之前,该方法还包括:确定待分类的法律文书的文档格式类型;采用与文档格式类型对应的提取方式对待分类的法律文书进行文本内容提取;对待分类的法律文书中的每篇法律文书进行解析,提取每篇法律文书中目标维度对应的维度信息包括:基于每篇法律文书中提取到的文本内容进行解析,提取每篇法律文书中目标维度对应的维度信息。
例如,首先进行文件后缀名判断,如果为TXT格式类型,可以使用文件流直接进行读取。如果为doc或者docx格式类型,首先使用文件流加载文件,然后使用NPOI进行读取;如果读取失败,再采用Aspose进行读取,其中,NPOI和Aspose是网上开源的框架。因此,在本申请中,通过采用与文档格式类型对应的提取方式对待分类的法律文书进行文本内容提取,保证了对法律文书进行文本内容提取的准确性,进而也保证了对每篇法律文书的文本内容进行解析的准确性。
例如,在文件夹名为当事人的文件夹下,创建张三对应的法律文书1的快捷方式、法律文书3的快捷方式和法律文书4的快捷方式。然而,当事人对应的维度信息为多个时,如,当事人为张三、李四、赵六、刘七等等,为了方便用户更加快速查询到各个当事人的信息,可选地,在本申请实施例提供的法律文书的处理方法中,在目标维度文件夹下,基于维度信息创建其对应的法律文书的快捷方式包括:在目标维度文件夹下,创建以维度信息命名的文件夹;在以维度信息命名的文件夹下,创建维度信息对应的法律文书的快捷方式。
例如,当事人对应的维度信息为张三和李四;张三对应的法律文书1、法律文书3和法律文书4。李四对应的法律文书1和法律文书2。在当事人的文件夹下,创建以张三命名的文件夹、以李四命名的文件夹。在张三命名的文件夹创建张三对应的法律文书1的快捷方式、法律文书3的快捷方式和法律文书4的快捷方式。在李四命名的文件夹创建李四对应的法律文书1的快捷方式和法律文书2的快捷方式。
可选地,在本申请实施例提供的法律文书的处理方法中,目标维度为多个维度,对待分类的法律文书中的每篇法律文书进行解析,提取每篇法律文书中目标维度对应的维度信息包括:对待分类的法律文书中的每篇法律文书进行解析,提取每篇法律文书中每个目标维度对应的维度信息;对每个目标维度对应的维度信息进行缓存;在目标维度文件夹下,基于维度信息创建其对应的法律文书的快捷方式包括:遍历缓存中的维度信息,基于每个维度信息创建其对应的法律文书的快捷方式。
例如,目标维度为当事人,法官、审结日期,当事人对应的维度信息为张三、李四、赵六、刘七;将当事人对应的维度信息为张三、李四、赵六、刘七进行缓存,在基于维度信息创建其对应的法律文书的快捷方式时,从缓存中遍历张三、李四、赵六、刘七等维度信息,在各个维度信息下创建其对应的法律文书的快捷方式。
通过上述技术方案在后续对法律文书进行查询时,能够快速的查询到对应法律文书的快捷方式,从而查阅到相应的法律文书。本申请通过依据目标维度对待分类的法律文书进行分类,在目标路径下创建目标维度对应的维度信息对应的法律文书的快捷方式,实现了快速将文书进行分类,由于使用文件夹与快捷方式进行关联,进而达到了提升对法律文书进行分类的效率的效果。
本申请实施例提供的法律文书的处理方法,通过确定待分类的法律文书;确定对待分类的法律文书进行分类依据的目标维度;对待分类的法律文书中的每篇法律文书进行解析,提取每篇法律文书中目标维度对应的维度信息;在目标路径下创建以目标维度命名的文件夹,得到目标维度文件夹;在目标维度文件夹下,基于维度信息创建其对应的法律文书的快捷方式,解决了相关技术中对法律文书进行分类的效率较低的问题。通过依据目标维度对待分类的法律文书进行分类,在目标路径下创建目标维度对应的维度信息对应的法律文书的快捷方式,进而达到了提升对法律文书进行分类的效率的效果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种法律文书的处理装置,需要说明的是,本申请实施例的法律文书的处理装置可以用于执行本申请实施例所提供的用于法律文书的处理方法。以下对本申请实施例提供的法律文书的处理装置进行介绍。
图2是根据本申请实施例的法律文书的处理装置的示意图。如图2所示,该装置包括:第一确定单元10、第二确定单元20、解析单元30、第一创建单元40和第二创建单元50。
具体地,第一确定单元10,用于确定待分类的法律文书。
第二确定单元20,用于确定对待分类的法律文书进行分类依据的目标维度。
解析单元30,用于对待分类的法律文书中的每篇法律文书进行解析,提取每篇法律文书中目标维度对应的维度信息。
第一创建单元40,用于在目标路径下创建以目标维度命名的文件夹,得到目标维度文件夹。
第二创建单元50,用于在目标维度文件夹下,基于维度信息创建其对应的法律文书的快捷方式。
本申请实施例提供的法律文书的处理装置,通过第一确定单元10确定待分类的法律文书,得到待分类的法律文书;第二确定单元20确定对待分类的法律文书进行分类依据的目标维度;解析单元30对待分类的法律文书中的每篇法律文书进行解析,提取每篇法律文书中目标维度对应的维度信息;第一创建单元40在目标路径下创建以目标维度命名的文件夹,得到目标维度文件夹;第二创建单元50在目标维度文件夹下,基于维度信息创建其对应的法律文书的快捷方式。通过依据目标维度对待分类的法律文书进行分类,在目标路径下创建目标维度对应的维度信息对应的法律文书的快捷方式,进而达到了提升对法律文书进行分类的效率的效果。
可选地,在本申请实施例提供的法律文书的处理装置中,第二创建单元50包括:第一创建模块,用于在目标维度文件夹下,创建以维度信息命名的文件夹;第二创建模块,用于在以维度信息命名的文件夹下,创建维度信息对应的法律文书的快捷方式。
可选地,在本申请实施例提供的法律文书的处理装置中,目标维度为多个维度,解析单元30还用于对待分类的法律文书中的每篇法律文书进行解析,提取每篇法律文书中每个目标维度对应的维度信息;对每个目标维度对应的维度信息进行缓存;第二创建单元50还用于遍历缓存中的维度信息,基于每个维度信息创建其对应的法律文书的快捷方式。
所述法律文书的处理装置包括处理器和存储器,上述第一确定单元10、第二确定单元20、解析单元30、第一创建单元40和第二创建单元50等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来对法律文书进行分类。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述法律文书的处理方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述法律文书的处理方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:确定待分类的法律文书;确定对所述待分类的法律文书进行分类依据的目标维度;对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中目标维度对应的维度信息;在目标路径下创建以目标维度命名的文件夹,得到目标维度文件夹;在所述目标维度文件夹下,基于所述维度信息创建其对应的法律文书的快捷方式。
在所述目标维度文件夹下,基于所述维度信息创建其对应的法律文书的快捷方式包括:在所述目标维度文件夹下,创建以所述维度信息命名的文件夹;在以所述维度信息命名的文件夹下,创建所述维度信息对应的法律文书的快捷方式。
所述目标维度为多个维度,对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中目标维度对应的维度信息包括:对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中每个目标维度对应的维度信息;对所述每个目标维度对应的维度信息进行缓存;在所述目标维度文件夹下,基于所述维度信息创建其对应的法律文书的快捷方式包括:遍历缓存中的维度信息,基于每个维度信息创建其对应的法律文书的快捷方式。
在确定待分类的法律文书之前,所述方法还包括:确定待分类的法律文书的文档格式类型;针对不同的文档格式类型,采用与文档格式类型对应的提取方式对所述待分类的法律文书进行文本内容提取;对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中目标维度对应的维度信息包括:基于每篇法律文书中提取的文本内容进行解析,提取所述每篇法律文书中目标维度对应的维度信息。
基于每篇法律文书中提取的文本内容进行解析,提取所述每篇法律文书中目标维度对应的维度信息包括:对所述每篇法律文书的文本内容进行分段,得到多段文本内容;采用目标维度在每段文本内容中进行匹配;在文本内容中匹配到所述目标维度的情况下,在文本内容中提取所述目标维度对应的维度信息。本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:确定待分类的法律文书;确定对所述待分类的法律文书进行分类依据的目标维度;对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中目标维度对应的维度信息;在目标路径下创建以目标维度命名的文件夹,得到目标维度文件夹;在所述目标维度文件夹下,基于所述维度信息创建其对应的法律文书的快捷方式。
在所述目标维度文件夹下,基于所述维度信息创建其对应的法律文书的快捷方式包括:在所述目标维度文件夹下,创建以所述维度信息命名的文件夹;在以所述维度信息命名的文件夹下,创建所述维度信息对应的法律文书的快捷方式。
所述目标维度为多个维度,对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中目标维度对应的维度信息包括:对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中每个目标维度对应的维度信息;对所述每个目标维度对应的维度信息进行缓存;在所述目标维度文件夹下,基于所述维度信息创建其对应的法律文书的快捷方式包括:遍历缓存中的维度信息,基于每个维度信息创建其对应的法律文书的快捷方式。
在确定待分类的法律文书之前,所述方法还包括:确定待分类的法律文书的文档格式类型;采用与文档格式类型对应的提取方式对所述待分类的法律文书进行文本内容提取;对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中目标维度对应的维度信息包括:基于每篇法律文书中提取的文本内容进行解析,提取所述每篇法律文书中目标维度对应的维度信息。
基于每篇法律文书中提取的文本内容进行解析,提取所述每篇法律文书中目标维度对应的维度信息包括:对所述每篇法律文书的文本内容进行分段,得到多段文本内容;采用目标维度在每段文本内容中进行匹配;在文本内容中匹配到所述目标维度的情况下,在文本内容中提取所述目标维度对应的维度信息。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (9)

1.一种法律文书的处理方法,其特征在于,包括:
确定待分类的法律文书;
确定对所述待分类的法律文书进行分类依据的目标维度;
对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中目标维度对应的维度信息;
在目标路径下创建以目标维度命名的文件夹,得到目标维度文件夹;
在所述目标维度文件夹下,基于所述维度信息创建其对应的法律文书的快捷方式;
在确定待分类的法律文书之前,所述方法还包括:确定待分类的法律文书的文档格式类型;采用与文档格式类型对应的提取方式对所述待分类的法律文书进行文本内容提取;对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中目标维度对应的维度信息包括:基于每篇法律文书中提取到的文本内容进行解析,提取所述每篇法律文书中目标维度对应的维度信息。
2.根据权利要求1所述的方法,其特征在于,在所述目标维度文件夹下,基于所述维度信息创建其对应的法律文书的快捷方式包括:
在所述目标维度文件夹下,创建以所述维度信息命名的文件夹;
在以所述维度信息命名的文件夹下,创建所述维度信息对应的法律文书的快捷方式。
3.根据权利要求1所述的方法,其特征在于,所述目标维度为多个维度,
对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中目标维度对应的维度信息包括:
对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中每个目标维度对应的维度信息;对所述每个目标维度对应的维度信息进行缓存;
在所述目标维度文件夹下,基于所述维度信息创建其对应的法律文书的快捷方式包括:遍历缓存中的维度信息,基于每个维度信息创建其对应的法律文书的快捷方式。
4.根据权利要求1所述的方法,其特征在于,基于每篇法律文书中提取的文本内容进行解析,提取所述每篇法律文书中目标维度对应的维度信息包括:
对所述每篇法律文书的文本内容进行分段,得到多段文本内容;
采用目标维度在每段文本内容中进行匹配;
在文本内容中匹配到所述目标维度的情况下,在文本内容中提取所述目标维度对应的维度信息。
5.一种法律文书的处理装置,其特征在于,包括:
第一确定单元,用于确定待分类的法律文书;
第二确定单元,用于确定对所述待分类的法律文书进行分类依据的目标维度;解析单元,用于对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中目标维度对应的维度信息;
第一创建单元,用于在目标路径下创建以目标维度命名的文件夹,得到目标维度文件夹;
第二创建单元,用于在所述目标维度文件夹下,基于所述维度信息创建其对应的法律文书的快捷方式;
所述装置还用于在确定待分类的法律文书之前,确定待分类的法律文书的文档格式类型;采用与文档格式类型对应的提取方式对所述待分类的法律文书进行文本内容提取;对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中目标维度对应的维度信息包括:基于每篇法律文书中提取到的文本内容进行解析,提取所述每篇法律文书中目标维度对应的维度信息。
6.根据权利要求5所述的装置,其特征在于,所述第二创建单元包括:
第一创建模块,用于在所述目标维度文件夹下,创建以所述维度信息命名的文件夹;
第二创建模块,用于在以所述维度信息命名的文件夹下,创建所述维度信息对应的法律文书的快捷方式。
7.根据权利要求5所述的装置,其特征在于,所述目标维度为多个维度,
所述解析单元还用于对所述待分类的法律文书中的每篇法律文书进行解析,提取所述每篇法律文书中每个目标维度对应的维度信息;对所述每个目标维度对应的维度信息进行缓存;
所述第二创建单元还用于遍历缓存中的维度信息,基于每个维度信息创建其对应的法律文书的快捷方式。
8.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1至4中任意一项所述的法律文书的处理方法。
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至4中任意一项所述的法律文书的处理方法。
CN201710326902.8A 2017-05-10 2017-05-10 法律文书的处理方法及装置 Active CN108874814B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710326902.8A CN108874814B (zh) 2017-05-10 2017-05-10 法律文书的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710326902.8A CN108874814B (zh) 2017-05-10 2017-05-10 法律文书的处理方法及装置

Publications (2)

Publication Number Publication Date
CN108874814A CN108874814A (zh) 2018-11-23
CN108874814B true CN108874814B (zh) 2022-05-27

Family

ID=64319105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710326902.8A Active CN108874814B (zh) 2017-05-10 2017-05-10 法律文书的处理方法及装置

Country Status (1)

Country Link
CN (1) CN108874814B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428466B (zh) * 2018-12-24 2022-04-01 北京国双科技有限公司 法律文书解析方法及装置
CN112559674A (zh) * 2019-09-25 2021-03-26 北京国双科技有限公司 裁判文书中法条内容的查询方法及相关装置
CN110765889B (zh) * 2019-09-29 2024-06-25 平安直通咨询有限公司上海分公司 法律文书的特征提取方法、相关装置及存储介质
CN112163072B (zh) * 2020-09-30 2024-05-24 北京金堤征信服务有限公司 基于多数据源的数据处理方法以及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1245938A (zh) * 1998-08-10 2000-03-01 株式会社理光 文件数据处理方法及文件系统
TW201008534A (en) * 2008-08-29 2010-03-01 Hon Hai Prec Ind Co Ltd Digital photo frame and picture sorting method thereof
CN104077385A (zh) * 2014-06-27 2014-10-01 北京海泰方圆科技有限公司 一种文件的分类及检索方法
CN104123129A (zh) * 2013-04-28 2014-10-29 腾讯科技(深圳)有限公司 一种快速选择文件的方法和装置
CN105183768A (zh) * 2015-07-31 2015-12-23 华为数字技术(成都)有限公司 一种文件管理方法、装置和终端设备
CN106569860A (zh) * 2016-11-04 2017-04-19 广东欧珀移动通信有限公司 一种应用管理方法及终端

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102841750B (zh) * 2012-07-18 2014-12-03 腾讯科技(深圳)有限公司 文件打开方法和装置
JP6012448B2 (ja) * 2012-12-14 2016-10-25 キヤノン株式会社 フォルダショートカットを作成する装置、方法、及びプログラム
JP6131648B2 (ja) * 2013-03-15 2017-05-24 株式会社リコー データ管理システム、情報システム、データ管理方法及び情報システムの制御方法、並びに、それら方法のプログラム及びそのプログラムを記録した記録媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1245938A (zh) * 1998-08-10 2000-03-01 株式会社理光 文件数据处理方法及文件系统
TW201008534A (en) * 2008-08-29 2010-03-01 Hon Hai Prec Ind Co Ltd Digital photo frame and picture sorting method thereof
CN104123129A (zh) * 2013-04-28 2014-10-29 腾讯科技(深圳)有限公司 一种快速选择文件的方法和装置
CN104077385A (zh) * 2014-06-27 2014-10-01 北京海泰方圆科技有限公司 一种文件的分类及检索方法
CN105183768A (zh) * 2015-07-31 2015-12-23 华为数字技术(成都)有限公司 一种文件管理方法、装置和终端设备
CN106569860A (zh) * 2016-11-04 2017-04-19 广东欧珀移动通信有限公司 一种应用管理方法及终端

Also Published As

Publication number Publication date
CN108874814A (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
Quick et al. Big forensic data reduction: digital forensic images and electronic evidence
Guarino Digital forensics as a big data challenge
Shanahan et al. Large scale distributed data science using apache spark
CN108874814B (zh) 法律文书的处理方法及装置
CN107368489B (zh) 一种资讯数据处理方法及装置
CN107729330B (zh) 获取数据集的方法和装置
TW201923629A (zh) 資料處理方法及裝置
Hamborg et al. Illegal aliens or undocumented immigrants? Towards the automated identification of bias by word choice and labeling
CN109697231A (zh) 一种案件文书的显示方法、系统、存储介质和处理器
CN116595173A (zh) 政策信息管理的数据处理方法、装置、设备及存储介质
Esquivel et al. On the long-tail entities in news
AlNoamany et al. Detecting off-topic pages in web archives
CN110689211A (zh) 网站服务能力的评估方法及装置
CN111428037A (zh) 一种分析行为政策匹配性的方法
CN110399431A (zh) 一种关联关系构建方法、装置及设备
Sheu et al. Design and implementation of file deduplication framework on HDFS
Lobbé Where the Dead Blogs Are: A Disaggregated Exploration of Web Archives to Reveal Extinct Online Collectives
Faria et al. Automatic preservation watch using information extraction on the Web: a case study on semantic extraction of natural language for digital preservation
Manzanares-Salor et al. Automatic evaluation of disclosure risks of text anonymization methods
CN110858214B (zh) 推荐模型训练、及进一步审计程序推荐方法、装置及设备
US10262056B2 (en) Method and system for performing search queries using and building a block-level index
CN109146395B (zh) 一种数据处理的方法、装置及设备
Donner Algorithmic identification of Ph. D. thesis-related publications: a proof-of-concept study
Souza et al. Semantic URL analytics to support efficient annotation of large scale web archives
CN112579747B (zh) 一种身份信息提取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant