CN108614839A - 基于浏览器的word文档转html页面可视化编辑方法及系统 - Google Patents
基于浏览器的word文档转html页面可视化编辑方法及系统 Download PDFInfo
- Publication number
- CN108614839A CN108614839A CN201611147433.5A CN201611147433A CN108614839A CN 108614839 A CN108614839 A CN 108614839A CN 201611147433 A CN201611147433 A CN 201611147433A CN 108614839 A CN108614839 A CN 108614839A
- Authority
- CN
- China
- Prior art keywords
- label
- browser
- html
- control
- word documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 238000006243 chemical reaction Methods 0.000 claims abstract description 15
- 230000009466 transformation Effects 0.000 claims abstract description 13
- 230000008676 import Effects 0.000 claims abstract description 10
- 230000000007 visual effect Effects 0.000 claims description 13
- 239000000463 material Substances 0.000 claims description 11
- 238000003756 stirring Methods 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 9
- 238000005303 weighing Methods 0.000 claims description 5
- 235000021050 feed intake Nutrition 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 5
- 238000004519 manufacturing process Methods 0.000 description 6
- 239000003814 drug Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明提供了一种基于浏览器的WORD文档转HTML页面可视化编辑方法及系统,该方法包括以下步骤:步骤一,导入文档,选择需要转换的WORD文档;步骤二,根据预先定义的转换规则,将WORD文档转成HTML网页文件,并在浏览器中展现出来;步骤三,选择所需标记,拖拽标记在HTML网页文件相应位置上,并设置所述标记的相关属性;步骤四,根据标记类型将其转换成标准HTML标签及对应属性和事件。本发明实现WORD文档到HTML网页文件的快速转换,而且具有所见即所得编辑效果,保证了文档转换前后的一致性。
Description
技术领域
本发明涉及计算机信息技术领域及医药生产过程控制计算机领域,具体地,涉及一种基于浏览器的WORD文档转HTML页面可视化编辑方法及系统。
背景技术
在医药生产过程中,记录生产过程的批记录模板以Word文档形式存在,传统模式是将Word文档打印出来,带至生产现场交由操作人员手工填写。在生产过程信息化,电子化的大背景下,要求医院生产过程控制计算机系统能自动生成符合GMP和FDA要求的电子批记录(Electronic Batch Record),实现对产品生产过程的工艺参数、报警情况及超限处理情况及操作人员的实时跟踪记录,方便将来的历史追踪,符合GMP提出的:实时及如实记录生产操作的全过程。现有的大部分医药生产过程控制计算机系统是基于B/S架构,因此需要将数量庞大的批记录Word文档转换成HTML网页,并进行相应的编辑。通常传统的方式有,安装可以打开Word文档的相关软件,打开文档并另存为HTML格式,这种方式生产的HTML文件中含有大量无效标签,影响网页展示和进一步的编辑。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于浏览器的WORD文档转HTML页面可视化编辑方法及系统,其实现WORD文档到HTML网页文件的快速转换,而且具有所见即所得编辑效果,保证了文档转换前后的一致性。
根据本发明的一个方面,提供一种基于浏览器的WORD文档转HTML页面可视化编辑方法,其特征在于,包括以下步骤:
步骤一,导入文档,选择需要转换的WORD文档;
步骤二,根据预先定义的转换规则,将WORD文档转成HTML网页文件,并在浏览器中展现出来;
步骤三,选择所需标记,拖拽标记在HTML网页文件相应位置上,并设置所述标记的相关属性;
步骤四,根据标记类型将其转换成标准HTML标签及对应属性和事件。
优选地,所述预先定义的转换规则包括剔除无用标签,提取文本及文本属性,提取表格优选地,所述标记类型包括签名标记、发料标记、清场标记、称量标记、投料标记、搅拌标记、时间标记、数据标记。
优选地,所述标记提供拖拽的方式,设置在HTML页面上,双击标记控件即可以编辑标记的相关属性和事件。
优选地,所述步骤四根据标记类型,将标记属性和事件,转换成标准HTML的标签属性和事件,供浏览器解析展示。
本发明还提供一种基于浏览器的WORD文档转HTML页面可视化编辑系统,其特征在于,所述基于浏览器的WORD文档转HTML页面可视化编辑系统包括:
文档导入模块,选择需要转换的WORD文档;
文档格式转换模块,根据预先定义的转换规则,将WORD文档转成HTML网页文件,并在浏览器中展现出来;
标记设置及编辑模块,拖拽标记设置在HTML网页文件上,并编辑所述标记的相关属性;
标记转换模块,根据标记类型、属性及事件将其转换成标准HTML标签及对应属性和事件。
优选地,所述文档格式转换模块依据的转换规则包括剔除无用标签,提取文本及文本属性,提取表格及表格属性,提取图片及图片属性。
优选地,所述基于浏览器的WORD文档转HTML页面可视化编辑系统提供了可用于WORD文档转换成HTML页面的工具箱,包括导入文档控件、签名标记控件、发料标记控件、清场标记控件、称量标记控件、投料标记控件、搅拌标记控件、时间标记控件、数据标记控件。
优选地,所述所述签名标记控件、发料标记控件、清场标记控件、称量标记控件、投料标记控件、搅拌标记控件、时间标记控件、数据标记控件提供拖拽的方式,设置在HTML页面上。
与现有技术相比,本发明具有如下的有益效果:本发明不仅大幅提高了WORD文档转HTML网页文件的效率,而且提供了所见即所得编辑效果,保证了文档转换前后的一致性。本发明借助浏览器,自动化地把WORD文档转HTML页面,同时对HTML页面可进行可视化的编辑,不仅大幅提高了WORD文档转HTML网页文件的效率,而且提供了所见即所得编辑效果,保证了文档转换前后的一致性。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明第一实施例的基于基于浏览器的WORD文档转HTML页面可视化编辑方法的实施流程图。
图2是本发明第二实施例的基于基于浏览器的WORD文档转HTML页面可视化编辑系统的结构示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
如图1所示,本发明基于浏览器的WORD文档转HTML页面可视化编辑方法包括以下步骤:
步骤一,导入文档,选择需要转换的WORD文档。
步骤二,根据预先定义的转换规则,将WORD文档转成HTML网页文件,并在浏览器中展现出来。
步骤三,选择所需标记,拖拽标记在HTML网页文件相应位置上,并设置所述标记的相关属性。
步骤四,根据标记类型将其转换成标准HTML标签及对应属性和事件。
进一步的,所述预先定义的转换规则,包括剔除无用标签,提取文本及文本属性,提取表格及表格属性,提取图片及图片属性。
进一步的,所述标记类型,包括签名标记、发料标记、清场标记、称量标记、投料标记、搅拌标记、时间标记、数据标记。
进一步的,所述标记提供拖拽的方式,设置在HTML页面上,双击标记控件即可以编辑标记的相关属性和事件。
进一步的,所述标记的相关属性包括bctype,bcoptime,bccmd,bcpostcmd,bcsave,bcconfirm,bcparam,bconce。
进一步的,所述标记的相关事件包括matbatchEV,clearEV,weighEV,feedEV,mixEV,timeEV,tagEV。
进一步的,所述步骤四根据标记类型将标记属性和事件,转换成标准HTML的标签属性和事件,供浏览器解析展示。
对应地,图2为本发明一种基于浏览器的WORD文档转HTML页面可视化编辑系统的结构示意图,所述装置包括:
文档导入模块,选择需要转换的WORD文档;
文档格式转换模块,根据预先定义的转换规则,将WORD文档转成HTML网页文件,并在浏览器中展现出来;
标记设置及编辑模块,拖拽标记设置在HTML网页文件上,并编辑所述标记的相关属性;
标记转换模块,根据标记类型、属性和事件将其转换成标准HTML标签及对应属性和事件。
进一步的,所述文档格式转换模块依据的转换规则包括剔除无用标签,提取文本及文本属性,提取表格及表格属性,提取图片及图片属性。
进一步的,本发明提供了可用于WORD文档转换成HTML页面的工具箱,包括导入文档控件、签名标记控件、发料标记控件、清场标记控件、称量标记控件、投料标记控件、搅拌标记控件、时间标记控件、数据标记控件。
进一步的,所述签名标记控件、发料标记控件、清场标记控件、称量标记控件、投料标记控件、搅拌标记控件、时间标记控件、数据标记控件提供拖拽的方式,设置在HTML页面上,双击标记控件即可以编辑标记的相关属性和事件。
进一步的,所述签名标记控件、发料标记控件、清场标记控件、称量标记控件、投料标记控件、搅拌标记控件、时间标记控件、数据标记控件的相关属性包括bctype,bcoptime,bccmd,bcpostcmd,bcsave,bcconfirm,bcparam,bconce。
进一步的,所述标记控件的相关事件包括matbatchEV,clearEV,weighEV,feedEV,mixEV,timeEV,tagEV。
进一步的,所述标记转换模块根据标记类型,将标记控件属性和事件,转换成标准HTML的标签属性和事件,供浏览器解析展示。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
Claims (9)
1.一种基于浏览器的WORD文档转HTML页面可视化编辑方法,其特征在于,包括以下步骤:
步骤一,导入文档,选择需要转换的WORD文档;
步骤二,根据预先定义的转换规则,将WORD文档转成HTML网页文件,并在浏览器中展现出来;
步骤三,选择所需标记,拖拽标记在HTML网页文件相应位置上,并设置所述标记的相关属性;
步骤四,根据标记类型将其转换成标准HTML标签及对应属性和事件。
2.根据权利要求1所述的基于浏览器的WORD文档转HTML页面可视化编辑方法,其特征在于,所述预先定义的转换规则包括剔除无用标签,提取文本及文本属性,提取表格及表格属性,提取图片及图片属性。
3.根据权利要求1所述的基于浏览器的WORD文档转HTML页面可视化编辑方法,其特征在于,所述标记类型包括签名标记、发料标记、清场标记、称量标记、投料标记、搅拌标记、时间标记、数据标记。
4.根据权利要求1所述的基于浏览器的WORD文档转HTML页面可视化编辑方法,其特征在于,所述标记提供拖拽的方式,设置在HTML页面上,双击标记控件即可以编辑标记的相关属性和事件。
5.根据权利要求1所述的基于浏览器的WORD文档转HTML页面可视化编辑方法,其特征在于,所述步骤四根据标记类型,将标记属性和事件,转换成标准HTML的标签属性和事件,供浏览器解析展示。
6.一种基于浏览器的WORD文档转HTML页面可视化编辑系统,其特征在于,所述基于浏览器的WORD文档转HTML页面可视化编辑系统包括:
文档导入模块,选择需要转换的WORD文档;
文档格式转换模块,根据预先定义的转换规则,将WORD文档转成HTML网页文件,并在浏览器中展现出来;
标记设置及编辑模块,拖拽标记设置在HTML网页文件上,并编辑所述标记的相关属性;
标记转换模块,根据标记类型、属性及事件将其转换成标准HTML标签及对应属性和事件。
7.根据权利要求6所述的基于浏览器的WORD文档转HTML页面可视化编辑系统,其特征在于,所述文档格式转换模块依据的转换规则包括剔除无用标签,提取文本及文本属性,提取表格及表格属性,提取图片及图片属性。
8.根据权利要求6所述的基于浏览器的WORD文档转HTML页面可视化编辑系统,其特征在于,所述基于浏览器的WORD文档转HTML页面可视化编辑系统提供了可用于WORD文档转换成HTML页面的工具箱,包括导入文档控件、签名标记控件、发料标记控件、清场标记控件、称量标记控件、投料标记控件、搅拌标记控件、时间标记控件、数据标记控件。
9.根据权利要求8所述的基于浏览器的WORD文档转HTML页面可视化编辑系统,其特征在于,所述所述签名标记控件、发料标记控件、清场标记控件、称量标记控件、投料标记控件、搅拌标记控件、时间标记控件、数据标记控件提供拖拽的方式,设置在HTML页面上。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611147433.5A CN108614839A (zh) | 2016-12-13 | 2016-12-13 | 基于浏览器的word文档转html页面可视化编辑方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611147433.5A CN108614839A (zh) | 2016-12-13 | 2016-12-13 | 基于浏览器的word文档转html页面可视化编辑方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108614839A true CN108614839A (zh) | 2018-10-02 |
Family
ID=63656708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611147433.5A Pending CN108614839A (zh) | 2016-12-13 | 2016-12-13 | 基于浏览器的word文档转html页面可视化编辑方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108614839A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376346A (zh) * | 2018-10-16 | 2019-02-22 | 周金明 | 基于标签和视图的多终端电子文档编辑管理方法及系统 |
CN110633251A (zh) * | 2019-08-02 | 2019-12-31 | 深圳木成林科技有限公司 | 一种文件转换方法及设备 |
CN111143749A (zh) * | 2019-12-31 | 2020-05-12 | 中国银行股份有限公司 | 一种网页展示方法、装置、设备及存储介质 |
CN111708956A (zh) * | 2020-06-15 | 2020-09-25 | 江西金格科技股份有限公司 | 基于HTML5技术的在网页浏览器中编辑Office文件的方法 |
CN112783957A (zh) * | 2019-11-11 | 2021-05-11 | 上海遴睿教育科技有限公司 | 一种英语阅读word文档格式化导入方法及系统 |
CN114492334A (zh) * | 2022-01-28 | 2022-05-13 | 北京索为系统技术股份有限公司 | 基于文档编辑器的需求条目在线编辑方法及装置 |
CN116612491A (zh) * | 2023-07-17 | 2023-08-18 | 中国电子科技集团公司第十研究所 | 一种arm麒麟word文件内容提取方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060136353A1 (en) * | 2004-12-16 | 2006-06-22 | Microsoft Corporation | Systems and methods for converting a formatted document to a web page |
CN102662928A (zh) * | 2012-03-28 | 2012-09-12 | 福建榕基软件股份有限公司 | 带文档导入的富文本编辑方法及装置 |
CN102799371A (zh) * | 2012-06-29 | 2012-11-28 | 北京奇虎科技有限公司 | 一种扩展的数据输入装置及方法 |
CN103136173A (zh) * | 2011-11-29 | 2013-06-05 | 北京建龙重工集团有限公司 | 大批量转换word或excel格式表单文档为网页页面的方法 |
CN105095160A (zh) * | 2015-07-31 | 2015-11-25 | 河南大学 | 一种文档转换阅读方法与系统 |
CN105630753A (zh) * | 2015-12-28 | 2016-06-01 | 中广核核电运营有限公司 | 一种核电站数字化规程的升级转换方法及系统 |
CN106168944A (zh) * | 2015-05-20 | 2016-11-30 | 柯尼卡美能达株式会社 | 文档转换方法 |
-
2016
- 2016-12-13 CN CN201611147433.5A patent/CN108614839A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060136353A1 (en) * | 2004-12-16 | 2006-06-22 | Microsoft Corporation | Systems and methods for converting a formatted document to a web page |
CN103136173A (zh) * | 2011-11-29 | 2013-06-05 | 北京建龙重工集团有限公司 | 大批量转换word或excel格式表单文档为网页页面的方法 |
CN102662928A (zh) * | 2012-03-28 | 2012-09-12 | 福建榕基软件股份有限公司 | 带文档导入的富文本编辑方法及装置 |
CN102799371A (zh) * | 2012-06-29 | 2012-11-28 | 北京奇虎科技有限公司 | 一种扩展的数据输入装置及方法 |
CN106168944A (zh) * | 2015-05-20 | 2016-11-30 | 柯尼卡美能达株式会社 | 文档转换方法 |
CN105095160A (zh) * | 2015-07-31 | 2015-11-25 | 河南大学 | 一种文档转换阅读方法与系统 |
CN105630753A (zh) * | 2015-12-28 | 2016-06-01 | 中广核核电运营有限公司 | 一种核电站数字化规程的升级转换方法及系统 |
Non-Patent Citations (1)
Title |
---|
马龙: "理想的HTML文档自动转换工具-HTML TRANSIT", 《中国计算机用户》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376346A (zh) * | 2018-10-16 | 2019-02-22 | 周金明 | 基于标签和视图的多终端电子文档编辑管理方法及系统 |
CN109376346B (zh) * | 2018-10-16 | 2023-07-18 | 周金明 | 基于标签和视图的多终端电子文档编辑管理方法及系统 |
CN110633251A (zh) * | 2019-08-02 | 2019-12-31 | 深圳木成林科技有限公司 | 一种文件转换方法及设备 |
CN110633251B (zh) * | 2019-08-02 | 2022-05-06 | 深圳木成林科技有限公司 | 一种文件转换方法及设备 |
CN112783957A (zh) * | 2019-11-11 | 2021-05-11 | 上海遴睿教育科技有限公司 | 一种英语阅读word文档格式化导入方法及系统 |
CN111143749A (zh) * | 2019-12-31 | 2020-05-12 | 中国银行股份有限公司 | 一种网页展示方法、装置、设备及存储介质 |
CN111708956A (zh) * | 2020-06-15 | 2020-09-25 | 江西金格科技股份有限公司 | 基于HTML5技术的在网页浏览器中编辑Office文件的方法 |
CN114492334A (zh) * | 2022-01-28 | 2022-05-13 | 北京索为系统技术股份有限公司 | 基于文档编辑器的需求条目在线编辑方法及装置 |
CN116612491A (zh) * | 2023-07-17 | 2023-08-18 | 中国电子科技集团公司第十研究所 | 一种arm麒麟word文件内容提取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108614839A (zh) | 基于浏览器的word文档转html页面可视化编辑方法及系统 | |
US11354490B1 (en) | Systems, methods, and computer readable media for creating slide presentations | |
CN111259202B (zh) | 一种文档结构化数据嵌入方法及系统 | |
US8407585B2 (en) | Context-aware content conversion and interpretation-specific views | |
JP4423613B2 (ja) | 電子化サービスマニュアル生成方法、電子化サービスマニュアル生成装置、電子化サービスマニュアル生成用プログラム並びにこのプログラムが記録された記録媒体 | |
US7890486B2 (en) | Document creation, linking, and maintenance system | |
US20120303645A1 (en) | System and method for extraction of structured data from arbitrarily structured composite data | |
CN102855243A (zh) | 用于提取文档结构的方法和装置 | |
CN108021632A (zh) | 非结构化数据与结构化数据相互转换处理方法 | |
CN109271616A (zh) | 一种基于标准文献题录特征值的智能提取方法 | |
CN104298705A (zh) | 一种关系型数据和非结构化数据的转换方法 | |
JP2005004726A (ja) | 電子化サービスマニュアル生成方法、付加データ生成方法、電子化サービスマニュアル生成用プログラム、並びに付加データ生成用プログラム | |
KR101500598B1 (ko) | Xml 생성 시스템 및 방법 | |
CN110956029B (zh) | 一种技术文档处理方法和系统 | |
CN111241955A (zh) | 一种票据信息提取方法及系统 | |
CN111444230A (zh) | 一种基于大数据平台的数据可视化分析方法 | |
CN105373562A (zh) | 一种pdf文档注释的获取方法及装置 | |
CN112686013A (zh) | 一种电缆号头编写系统及其方法 | |
CN109359202B (zh) | 基于音频视频记录的电子运维工单自动生成方法及系统 | |
CN102521359B (zh) | 界面数据文件的比较方法及装置 | |
CN111191423A (zh) | 一种适用公文正文在线编辑的方法及系统 | |
CN116704540A (zh) | 将纸质文件内容进行标识并高保真的转换为ofd文件的技术 | |
Shiraiwa et al. | Tools to export published datasets together with metadata from IDL/Python/MATLAB and πScope | |
CN105205790B (zh) | 一种可视化数据和结构化数据合成图片的方法及装置 | |
WO2006103760A1 (ja) | 文書変換活用システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181002 |