[go: up one dir, main page]

CN108614839A - 基于浏览器的word文档转html页面可视化编辑方法及系统 - Google Patents

基于浏览器的word文档转html页面可视化编辑方法及系统 Download PDF

Info

Publication number
CN108614839A
CN108614839A CN201611147433.5A CN201611147433A CN108614839A CN 108614839 A CN108614839 A CN 108614839A CN 201611147433 A CN201611147433 A CN 201611147433A CN 108614839 A CN108614839 A CN 108614839A
Authority
CN
China
Prior art keywords
label
browser
html
control
word documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611147433.5A
Other languages
English (en)
Inventor
韩璐
高欣
高东华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Baosight Software Co Ltd
Original Assignee
Shanghai Baosight Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Baosight Software Co Ltd filed Critical Shanghai Baosight Software Co Ltd
Priority to CN201611147433.5A priority Critical patent/CN108614839A/zh
Publication of CN108614839A publication Critical patent/CN108614839A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提供了一种基于浏览器的WORD文档转HTML页面可视化编辑方法及系统,该方法包括以下步骤:步骤一,导入文档,选择需要转换的WORD文档;步骤二,根据预先定义的转换规则,将WORD文档转成HTML网页文件,并在浏览器中展现出来;步骤三,选择所需标记,拖拽标记在HTML网页文件相应位置上,并设置所述标记的相关属性;步骤四,根据标记类型将其转换成标准HTML标签及对应属性和事件。本发明实现WORD文档到HTML网页文件的快速转换,而且具有所见即所得编辑效果,保证了文档转换前后的一致性。

Description

基于浏览器的WORD文档转HTML页面可视化编辑方法及系统
技术领域
本发明涉及计算机信息技术领域及医药生产过程控制计算机领域,具体地,涉及一种基于浏览器的WORD文档转HTML页面可视化编辑方法及系统。
背景技术
在医药生产过程中,记录生产过程的批记录模板以Word文档形式存在,传统模式是将Word文档打印出来,带至生产现场交由操作人员手工填写。在生产过程信息化,电子化的大背景下,要求医院生产过程控制计算机系统能自动生成符合GMP和FDA要求的电子批记录(Electronic Batch Record),实现对产品生产过程的工艺参数、报警情况及超限处理情况及操作人员的实时跟踪记录,方便将来的历史追踪,符合GMP提出的:实时及如实记录生产操作的全过程。现有的大部分医药生产过程控制计算机系统是基于B/S架构,因此需要将数量庞大的批记录Word文档转换成HTML网页,并进行相应的编辑。通常传统的方式有,安装可以打开Word文档的相关软件,打开文档并另存为HTML格式,这种方式生产的HTML文件中含有大量无效标签,影响网页展示和进一步的编辑。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于浏览器的WORD文档转HTML页面可视化编辑方法及系统,其实现WORD文档到HTML网页文件的快速转换,而且具有所见即所得编辑效果,保证了文档转换前后的一致性。
根据本发明的一个方面,提供一种基于浏览器的WORD文档转HTML页面可视化编辑方法,其特征在于,包括以下步骤:
步骤一,导入文档,选择需要转换的WORD文档;
步骤二,根据预先定义的转换规则,将WORD文档转成HTML网页文件,并在浏览器中展现出来;
步骤三,选择所需标记,拖拽标记在HTML网页文件相应位置上,并设置所述标记的相关属性;
步骤四,根据标记类型将其转换成标准HTML标签及对应属性和事件。
优选地,所述预先定义的转换规则包括剔除无用标签,提取文本及文本属性,提取表格优选地,所述标记类型包括签名标记、发料标记、清场标记、称量标记、投料标记、搅拌标记、时间标记、数据标记。
优选地,所述标记提供拖拽的方式,设置在HTML页面上,双击标记控件即可以编辑标记的相关属性和事件。
优选地,所述步骤四根据标记类型,将标记属性和事件,转换成标准HTML的标签属性和事件,供浏览器解析展示。
本发明还提供一种基于浏览器的WORD文档转HTML页面可视化编辑系统,其特征在于,所述基于浏览器的WORD文档转HTML页面可视化编辑系统包括:
文档导入模块,选择需要转换的WORD文档;
文档格式转换模块,根据预先定义的转换规则,将WORD文档转成HTML网页文件,并在浏览器中展现出来;
标记设置及编辑模块,拖拽标记设置在HTML网页文件上,并编辑所述标记的相关属性;
标记转换模块,根据标记类型、属性及事件将其转换成标准HTML标签及对应属性和事件。
优选地,所述文档格式转换模块依据的转换规则包括剔除无用标签,提取文本及文本属性,提取表格及表格属性,提取图片及图片属性。
优选地,所述基于浏览器的WORD文档转HTML页面可视化编辑系统提供了可用于WORD文档转换成HTML页面的工具箱,包括导入文档控件、签名标记控件、发料标记控件、清场标记控件、称量标记控件、投料标记控件、搅拌标记控件、时间标记控件、数据标记控件。
优选地,所述所述签名标记控件、发料标记控件、清场标记控件、称量标记控件、投料标记控件、搅拌标记控件、时间标记控件、数据标记控件提供拖拽的方式,设置在HTML页面上。
与现有技术相比,本发明具有如下的有益效果:本发明不仅大幅提高了WORD文档转HTML网页文件的效率,而且提供了所见即所得编辑效果,保证了文档转换前后的一致性。本发明借助浏览器,自动化地把WORD文档转HTML页面,同时对HTML页面可进行可视化的编辑,不仅大幅提高了WORD文档转HTML网页文件的效率,而且提供了所见即所得编辑效果,保证了文档转换前后的一致性。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明第一实施例的基于基于浏览器的WORD文档转HTML页面可视化编辑方法的实施流程图。
图2是本发明第二实施例的基于基于浏览器的WORD文档转HTML页面可视化编辑系统的结构示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
如图1所示,本发明基于浏览器的WORD文档转HTML页面可视化编辑方法包括以下步骤:
步骤一,导入文档,选择需要转换的WORD文档。
步骤二,根据预先定义的转换规则,将WORD文档转成HTML网页文件,并在浏览器中展现出来。
步骤三,选择所需标记,拖拽标记在HTML网页文件相应位置上,并设置所述标记的相关属性。
步骤四,根据标记类型将其转换成标准HTML标签及对应属性和事件。
进一步的,所述预先定义的转换规则,包括剔除无用标签,提取文本及文本属性,提取表格及表格属性,提取图片及图片属性。
进一步的,所述标记类型,包括签名标记、发料标记、清场标记、称量标记、投料标记、搅拌标记、时间标记、数据标记。
进一步的,所述标记提供拖拽的方式,设置在HTML页面上,双击标记控件即可以编辑标记的相关属性和事件。
进一步的,所述标记的相关属性包括bctype,bcoptime,bccmd,bcpostcmd,bcsave,bcconfirm,bcparam,bconce。
进一步的,所述标记的相关事件包括matbatchEV,clearEV,weighEV,feedEV,mixEV,timeEV,tagEV。
进一步的,所述步骤四根据标记类型将标记属性和事件,转换成标准HTML的标签属性和事件,供浏览器解析展示。
对应地,图2为本发明一种基于浏览器的WORD文档转HTML页面可视化编辑系统的结构示意图,所述装置包括:
文档导入模块,选择需要转换的WORD文档;
文档格式转换模块,根据预先定义的转换规则,将WORD文档转成HTML网页文件,并在浏览器中展现出来;
标记设置及编辑模块,拖拽标记设置在HTML网页文件上,并编辑所述标记的相关属性;
标记转换模块,根据标记类型、属性和事件将其转换成标准HTML标签及对应属性和事件。
进一步的,所述文档格式转换模块依据的转换规则包括剔除无用标签,提取文本及文本属性,提取表格及表格属性,提取图片及图片属性。
进一步的,本发明提供了可用于WORD文档转换成HTML页面的工具箱,包括导入文档控件、签名标记控件、发料标记控件、清场标记控件、称量标记控件、投料标记控件、搅拌标记控件、时间标记控件、数据标记控件。
进一步的,所述签名标记控件、发料标记控件、清场标记控件、称量标记控件、投料标记控件、搅拌标记控件、时间标记控件、数据标记控件提供拖拽的方式,设置在HTML页面上,双击标记控件即可以编辑标记的相关属性和事件。
进一步的,所述签名标记控件、发料标记控件、清场标记控件、称量标记控件、投料标记控件、搅拌标记控件、时间标记控件、数据标记控件的相关属性包括bctype,bcoptime,bccmd,bcpostcmd,bcsave,bcconfirm,bcparam,bconce。
进一步的,所述标记控件的相关事件包括matbatchEV,clearEV,weighEV,feedEV,mixEV,timeEV,tagEV。
进一步的,所述标记转换模块根据标记类型,将标记控件属性和事件,转换成标准HTML的标签属性和事件,供浏览器解析展示。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (9)

1.一种基于浏览器的WORD文档转HTML页面可视化编辑方法,其特征在于,包括以下步骤:
步骤一,导入文档,选择需要转换的WORD文档;
步骤二,根据预先定义的转换规则,将WORD文档转成HTML网页文件,并在浏览器中展现出来;
步骤三,选择所需标记,拖拽标记在HTML网页文件相应位置上,并设置所述标记的相关属性;
步骤四,根据标记类型将其转换成标准HTML标签及对应属性和事件。
2.根据权利要求1所述的基于浏览器的WORD文档转HTML页面可视化编辑方法,其特征在于,所述预先定义的转换规则包括剔除无用标签,提取文本及文本属性,提取表格及表格属性,提取图片及图片属性。
3.根据权利要求1所述的基于浏览器的WORD文档转HTML页面可视化编辑方法,其特征在于,所述标记类型包括签名标记、发料标记、清场标记、称量标记、投料标记、搅拌标记、时间标记、数据标记。
4.根据权利要求1所述的基于浏览器的WORD文档转HTML页面可视化编辑方法,其特征在于,所述标记提供拖拽的方式,设置在HTML页面上,双击标记控件即可以编辑标记的相关属性和事件。
5.根据权利要求1所述的基于浏览器的WORD文档转HTML页面可视化编辑方法,其特征在于,所述步骤四根据标记类型,将标记属性和事件,转换成标准HTML的标签属性和事件,供浏览器解析展示。
6.一种基于浏览器的WORD文档转HTML页面可视化编辑系统,其特征在于,所述基于浏览器的WORD文档转HTML页面可视化编辑系统包括:
文档导入模块,选择需要转换的WORD文档;
文档格式转换模块,根据预先定义的转换规则,将WORD文档转成HTML网页文件,并在浏览器中展现出来;
标记设置及编辑模块,拖拽标记设置在HTML网页文件上,并编辑所述标记的相关属性;
标记转换模块,根据标记类型、属性及事件将其转换成标准HTML标签及对应属性和事件。
7.根据权利要求6所述的基于浏览器的WORD文档转HTML页面可视化编辑系统,其特征在于,所述文档格式转换模块依据的转换规则包括剔除无用标签,提取文本及文本属性,提取表格及表格属性,提取图片及图片属性。
8.根据权利要求6所述的基于浏览器的WORD文档转HTML页面可视化编辑系统,其特征在于,所述基于浏览器的WORD文档转HTML页面可视化编辑系统提供了可用于WORD文档转换成HTML页面的工具箱,包括导入文档控件、签名标记控件、发料标记控件、清场标记控件、称量标记控件、投料标记控件、搅拌标记控件、时间标记控件、数据标记控件。
9.根据权利要求8所述的基于浏览器的WORD文档转HTML页面可视化编辑系统,其特征在于,所述所述签名标记控件、发料标记控件、清场标记控件、称量标记控件、投料标记控件、搅拌标记控件、时间标记控件、数据标记控件提供拖拽的方式,设置在HTML页面上。
CN201611147433.5A 2016-12-13 2016-12-13 基于浏览器的word文档转html页面可视化编辑方法及系统 Pending CN108614839A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611147433.5A CN108614839A (zh) 2016-12-13 2016-12-13 基于浏览器的word文档转html页面可视化编辑方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611147433.5A CN108614839A (zh) 2016-12-13 2016-12-13 基于浏览器的word文档转html页面可视化编辑方法及系统

Publications (1)

Publication Number Publication Date
CN108614839A true CN108614839A (zh) 2018-10-02

Family

ID=63656708

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611147433.5A Pending CN108614839A (zh) 2016-12-13 2016-12-13 基于浏览器的word文档转html页面可视化编辑方法及系统

Country Status (1)

Country Link
CN (1) CN108614839A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376346A (zh) * 2018-10-16 2019-02-22 周金明 基于标签和视图的多终端电子文档编辑管理方法及系统
CN110633251A (zh) * 2019-08-02 2019-12-31 深圳木成林科技有限公司 一种文件转换方法及设备
CN111143749A (zh) * 2019-12-31 2020-05-12 中国银行股份有限公司 一种网页展示方法、装置、设备及存储介质
CN111708956A (zh) * 2020-06-15 2020-09-25 江西金格科技股份有限公司 基于HTML5技术的在网页浏览器中编辑Office文件的方法
CN112783957A (zh) * 2019-11-11 2021-05-11 上海遴睿教育科技有限公司 一种英语阅读word文档格式化导入方法及系统
CN114492334A (zh) * 2022-01-28 2022-05-13 北京索为系统技术股份有限公司 基于文档编辑器的需求条目在线编辑方法及装置
CN116612491A (zh) * 2023-07-17 2023-08-18 中国电子科技集团公司第十研究所 一种arm麒麟word文件内容提取方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060136353A1 (en) * 2004-12-16 2006-06-22 Microsoft Corporation Systems and methods for converting a formatted document to a web page
CN102662928A (zh) * 2012-03-28 2012-09-12 福建榕基软件股份有限公司 带文档导入的富文本编辑方法及装置
CN102799371A (zh) * 2012-06-29 2012-11-28 北京奇虎科技有限公司 一种扩展的数据输入装置及方法
CN103136173A (zh) * 2011-11-29 2013-06-05 北京建龙重工集团有限公司 大批量转换word或excel格式表单文档为网页页面的方法
CN105095160A (zh) * 2015-07-31 2015-11-25 河南大学 一种文档转换阅读方法与系统
CN105630753A (zh) * 2015-12-28 2016-06-01 中广核核电运营有限公司 一种核电站数字化规程的升级转换方法及系统
CN106168944A (zh) * 2015-05-20 2016-11-30 柯尼卡美能达株式会社 文档转换方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060136353A1 (en) * 2004-12-16 2006-06-22 Microsoft Corporation Systems and methods for converting a formatted document to a web page
CN103136173A (zh) * 2011-11-29 2013-06-05 北京建龙重工集团有限公司 大批量转换word或excel格式表单文档为网页页面的方法
CN102662928A (zh) * 2012-03-28 2012-09-12 福建榕基软件股份有限公司 带文档导入的富文本编辑方法及装置
CN102799371A (zh) * 2012-06-29 2012-11-28 北京奇虎科技有限公司 一种扩展的数据输入装置及方法
CN106168944A (zh) * 2015-05-20 2016-11-30 柯尼卡美能达株式会社 文档转换方法
CN105095160A (zh) * 2015-07-31 2015-11-25 河南大学 一种文档转换阅读方法与系统
CN105630753A (zh) * 2015-12-28 2016-06-01 中广核核电运营有限公司 一种核电站数字化规程的升级转换方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马龙: "理想的HTML文档自动转换工具-HTML TRANSIT", 《中国计算机用户》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376346A (zh) * 2018-10-16 2019-02-22 周金明 基于标签和视图的多终端电子文档编辑管理方法及系统
CN109376346B (zh) * 2018-10-16 2023-07-18 周金明 基于标签和视图的多终端电子文档编辑管理方法及系统
CN110633251A (zh) * 2019-08-02 2019-12-31 深圳木成林科技有限公司 一种文件转换方法及设备
CN110633251B (zh) * 2019-08-02 2022-05-06 深圳木成林科技有限公司 一种文件转换方法及设备
CN112783957A (zh) * 2019-11-11 2021-05-11 上海遴睿教育科技有限公司 一种英语阅读word文档格式化导入方法及系统
CN111143749A (zh) * 2019-12-31 2020-05-12 中国银行股份有限公司 一种网页展示方法、装置、设备及存储介质
CN111708956A (zh) * 2020-06-15 2020-09-25 江西金格科技股份有限公司 基于HTML5技术的在网页浏览器中编辑Office文件的方法
CN114492334A (zh) * 2022-01-28 2022-05-13 北京索为系统技术股份有限公司 基于文档编辑器的需求条目在线编辑方法及装置
CN116612491A (zh) * 2023-07-17 2023-08-18 中国电子科技集团公司第十研究所 一种arm麒麟word文件内容提取方法

Similar Documents

Publication Publication Date Title
CN108614839A (zh) 基于浏览器的word文档转html页面可视化编辑方法及系统
US11354490B1 (en) Systems, methods, and computer readable media for creating slide presentations
CN111259202B (zh) 一种文档结构化数据嵌入方法及系统
US8407585B2 (en) Context-aware content conversion and interpretation-specific views
JP4423613B2 (ja) 電子化サービスマニュアル生成方法、電子化サービスマニュアル生成装置、電子化サービスマニュアル生成用プログラム並びにこのプログラムが記録された記録媒体
US7890486B2 (en) Document creation, linking, and maintenance system
US20120303645A1 (en) System and method for extraction of structured data from arbitrarily structured composite data
CN102855243A (zh) 用于提取文档结构的方法和装置
CN108021632A (zh) 非结构化数据与结构化数据相互转换处理方法
CN109271616A (zh) 一种基于标准文献题录特征值的智能提取方法
CN104298705A (zh) 一种关系型数据和非结构化数据的转换方法
JP2005004726A (ja) 電子化サービスマニュアル生成方法、付加データ生成方法、電子化サービスマニュアル生成用プログラム、並びに付加データ生成用プログラム
KR101500598B1 (ko) Xml 생성 시스템 및 방법
CN110956029B (zh) 一种技术文档处理方法和系统
CN111241955A (zh) 一种票据信息提取方法及系统
CN111444230A (zh) 一种基于大数据平台的数据可视化分析方法
CN105373562A (zh) 一种pdf文档注释的获取方法及装置
CN112686013A (zh) 一种电缆号头编写系统及其方法
CN109359202B (zh) 基于音频视频记录的电子运维工单自动生成方法及系统
CN102521359B (zh) 界面数据文件的比较方法及装置
CN111191423A (zh) 一种适用公文正文在线编辑的方法及系统
CN116704540A (zh) 将纸质文件内容进行标识并高保真的转换为ofd文件的技术
Shiraiwa et al. Tools to export published datasets together with metadata from IDL/Python/MATLAB and πScope
CN105205790B (zh) 一种可视化数据和结构化数据合成图片的方法及装置
WO2006103760A1 (ja) 文書変換活用システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181002