[go: up one dir, main page]

CN103150300A - 拼音的排版方法和装置 - Google Patents

拼音的排版方法和装置 Download PDF

Info

Publication number
CN103150300A
CN103150300A CN2011104064456A CN201110406445A CN103150300A CN 103150300 A CN103150300 A CN 103150300A CN 2011104064456 A CN2011104064456 A CN 2011104064456A CN 201110406445 A CN201110406445 A CN 201110406445A CN 103150300 A CN103150300 A CN 103150300A
Authority
CN
China
Prior art keywords
word
pinyin
typesetting
phonetic
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011104064456A
Other languages
English (en)
Inventor
王斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN2011104064456A priority Critical patent/CN103150300A/zh
Publication of CN103150300A publication Critical patent/CN103150300A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明提供了一种拼音的排版方法和装置,方法包括:将文本中的各个词与其拼音居中对齐。在本发明还提供了一种拼音的排版装置,包括:读取模块,用于读取文本中的各个词与其拼音;排版模块,用于将读取文本中的各个词与其拼音居中对齐。本发明的排版的过程,可实现每个词与其拼音居中对齐的排版效果。排版后的每个词的各个字之间,间距相等,版面效果整齐。有效避免了拼音偏移较多、词中的各个字之间距离较宽的现象。

Description

拼音的排版方法和装置
技术领域
本发明涉及排版技术领域,具体而言,涉及一种拼音的排版方法和装置。
背景技术
在出版物的排版过程中,出版物的内容可能包括如图1所示的拼音和文字。图1的汉字,每个字与其拼音在版面上通过居中的效果显示。
图1中显示的版面效果,存在版面的拼音、词组之间的位置不美观的问题。例如:当词内的每个字的拼音较长时,词内的各个字之间的距离较大,如“装潢”、“双方”这两个词中的字间距较宽;词中包含的拼音长度不同的字,如“发生”这个词,“发”和“生”的拼音长度不同,排版的效果上,拼音整体上存在偏右的效果。
发明内容
本发明旨在提供一种拼音的排版方法和装置,以解决版面的拼音、词组之间的位置不美观的问题。
在本发明的实施例中,提供了一种拼音的排版方法,包括:将文本中的各个词与其拼音居中对齐。
在本发明的实施例中,提供了一种拼音的排版装置,包括:读取模块,用于读取文本中的各个词与其拼音;排版模块,用于将读取文本中的各个词与其拼音居中对齐。
通过实施例排版的过程,可实现每个词与其拼音居中对齐的排版效果。排版后的每个词的各个字之间,间距相等,版面效果整齐。有效避免了拼音偏移较多、词中的各个字之间距离较宽的现象。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了现有的拼音和字排版后的效果示意图;
图2示出了通过本发明实施例的排版的效果示意图;
图3示出了实施例中通过分词的排版流程图;
图4示出了实施例中排版过程中调整间隔、比例的流程图;
图5示出了装置实施例的结构框图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
本发明的实施例包括:在排版过程中,将文本中的各个词与其拼音居中对齐。
参见图2,通过实施例排版的过程,可实现每个词与其拼音居中对齐的排版效果。排版后的每个词的各个字之间,间距相等,版面效果整齐。有效避免了拼音偏移较多、词中的各个字之间距离较宽的现象。
优选地,参见图3,本发明的实施例包括:
S11:构建词库。
通过词库,应用预定的匹配规则,来建立一个相对于文本的拼音阵列。该拼音阵列可能包含单字拼音和词组拼音,通过一个bool值进行区分。
S12:判断排版过程是否添加拼音,如果是,则执行S13;如果否,则执行S15,直接排版。
排版过程中需添加拼音时,首先判断文本的内容是否为词组和拼音,如果是,则执行S13;如果否,则执行S15,直接排版。
S13:排版词之后,排版词所对应的拼音。
将文本内容中的字,按照顺序逐个增加作为对比的对象,与词库中的词进行比较,以确定文本内容中的词。例如:文本中的词“直升机”,先将“直升”比较后,再添加“机”字,以“直升机”作为对象与词库中的内容比较,确定该词。
以词为单位的拼音,在词排完后,将整个拼音添加到词的第一个字上。按照居中对齐的方式,确定出拼音中的每个字符相对于第一个字的位置偏移。
S14:设置词与相邻内容的间距。
通过以词中的各个字的顺序逐个增加作为对比的对象,与设置词库的内容比较,进行分词。可准确的将文本的内容划分为多个各个用于排版的词,便于将划分的词用于后续排版。
优选地,参见图4,实施例包括以下步骤:
S201:启动排版,取得第一个排版的字符;
S202:对该字符进行判断,在确定为中文之后,在拼音阵列里查找,该文字是否带有拼音;如果带有拼音,如果是则进入S203,如果不带有拼音,则进入S211;
S203:取得该文字的拼音参数,根据参数来判断该拼音是否为词组拼音。如果是则进入S205,如果不是则进入S204。
例如:通过拼音的长度、拼音的标识等参数确定是否为词组拼音。
S204:对单字拼音的处理,可按照字与拼音居中对齐的形式排版。处理完毕后,进入S211。
S205:缓存当前字在段落中的索引Index,该索引可用于在后续计算中对间隔glue进行设置。缓存后结束该字的排版;
S206:继续取得下一个排版文字;
S207:将该字的Index与缓存中Index的差值,同词组内文字的个数进行比较,以判断该文字是否为词组内的最后一个字。如果不是,则返回S206继续;如果是,则进入S208;
S208:完整取出词组拼音,并将此拼音设置到之前缓存的Index对应的文字上,并根据该文字的大小来相应设置拼音的大小。
优选地,在排版中,词中的字的大小与其对应的拼音的大小保持比例。词中有的字为了便于识别或为了突出显示,该字与词中的其它的大小不同。例如:“直升机”在排版时位于段首,需要突出显示,“直”字的字体格式比“升机”的字体格式要大,对应的拼音,也需要相应按比例增加,以保持版面的美观。例如:排版“直升机”时,每个的格式应该为四号,拼音为五号;由于“直”字位于段首,字体格式为三号,该字对应的拼音应该相应增加,调整为四号。
S209:确定拼音所占用的长度,并和整个词中的各个字所占用的长度比较,计算出词的所有拼音字符基于该文字(缓存中的Index对应的文字)X偏移和Y偏移,用于版面的显示。
具体包括:确定所述词及其拼音的中间位置;通过计算出的X偏移和Y偏移,将所述词的中间位置对准其拼音的中间位置。
S210:调整词与相邻内容之间的间隔。
在排版过程中,如果词的拼音长度A大于词的长度B,则将间隔glue设置为(A-B)/2,对于拼音较短的情况,也可将B设置为0;如果拼音长度A小于词的长度B,则将间隔设置为默认值。
确定间隔后,将词第一个文字的左边,与相邻的词或字之间增加一个间隔glue;在词的最后一个文字的右边,增加一个glue。此时,便完成了这个词组拼音的排版。
S211:取得下一个文字继续排版;
S212:如果排版到段落或者文章结束符,则结束排版。否则返回202。
通过上述步骤,可实现词与拼音的居中对齐排版。通过拼音、词的长度的比较,调整排版的词与相邻内容之间的间隔。排版的拼音和词,词与相应的词或字之间具有间隔,版面效果美观。
参见图5,本发明提供一种拼音的排版装置,包括:
读取模块31,用于读取文本中的各个词与其拼音;
排版模块32,用于将读取模块31读取文本中的各个词与其拼音居中对齐。
实施例中的装置,可实现每个词与其拼音居中对齐的排版效果。排版后的每个词的各个字之间,间距相等,版面效果整齐。有效避免了拼音偏移较多、词中的各个字之间距离较宽的现象。
优选地,装置还包括:
分词模块33,用于顺序读取的各个字;将所述各个字与词库中的词匹配获得所述各个词用于读取模块31读取。
优选地,所述排版模块32包括:
位置模块321,用于确定读取模块31读取的所述词及其拼音的中间位置;
位置调整模块322,用于按照位置模块321确定的中间位置,将所述词的中间位置对准其拼音的中间位置。
优选地,装置还包括:
比较模块34,用于确定读取模块31读取的词的长度大于其拼音的长度;
间隔调整模块35,用于按照比较模块34的触发,在排版模块32排版过程中,调整所述当前词与相邻内容之间的距离。
优选地,装置还包括:
拼音调整模块36,用于在排版模块32排版过程中,用于将排版的所述词中的字的大小与其对应的拼音的大小按比例调整。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种拼音的排版方法,其特征在于,包括:将文本中的各个词与其拼音居中对齐。
2.根据权利要求1所述的方法,其特征在于,还包括:
顺序读取的各个字;将所述各个字与词库中的词匹配获得所述各个词。
3.根据权利要求1所述的方法,其特征在于,所述居中对齐的过程包括:
确定所述词及其拼音的中间位置;
将所述词的中间位置对准其拼音的中间位置。
4.根据权利要求1所述的方法,其特征在于,还包括:
确定当前词的长度大于其拼音的长度;
调整所述当前词与相邻内容之间的距离。
5.根据权利要求1所述的方法,其特征在于,排版的所述词中的字的大小与其拼音的大小保持比例。
6.一种拼音的排版装置,其特征在于,包括:
读取模块,用于读取文本中的各个词与其拼音;
排版模块,用于将读取文本中的各个词与其拼音居中对齐。
7.根据权利要求6所述的装置,其特征在于,还包括:
分词模块,用于顺序读取的各个字;将所述各个字与词库中的词匹配获得所述各个词。
8.根据权利要求6所述的装置,其特征在于,所述排版模块包括:
位置模块,用于确定所述词及其拼音的中间位置;
位置调整模块,用于将所述词的中间位置对准其拼音的中间位置。
9.根据权利要求6所述的装置,其特征在于,还包括:
比较模块,用于确定当前词的长度大于其拼音的长度;
间隔调整模块,用于调整所述当前词与相邻内容之间的距离。
10.根据权利要求6所述的装置,其特征在于,拼音调整模块,用于将排版的所述词中的字的大小与其对应的拼音的大小按比例调整。
CN2011104064456A 2011-12-06 2011-12-06 拼音的排版方法和装置 Pending CN103150300A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011104064456A CN103150300A (zh) 2011-12-06 2011-12-06 拼音的排版方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011104064456A CN103150300A (zh) 2011-12-06 2011-12-06 拼音的排版方法和装置

Publications (1)

Publication Number Publication Date
CN103150300A true CN103150300A (zh) 2013-06-12

Family

ID=48548386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011104064456A Pending CN103150300A (zh) 2011-12-06 2011-12-06 拼音的排版方法和装置

Country Status (1)

Country Link
CN (1) CN103150300A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106598934A (zh) * 2016-12-14 2017-04-26 掌阅科技股份有限公司 电子书数据的显示方法、装置及终端设备
CN107783956A (zh) * 2017-11-23 2018-03-09 掌阅科技股份有限公司 文字信息的排版方法、电子设备及计算机存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1052960A (zh) * 1989-12-23 1991-07-10 方晖 华语自动分词注音新技术
CN1731389A (zh) * 2004-08-04 2006-02-08 华建电子有限责任公司 盲汉对照编辑排版系统及编辑排版方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1052960A (zh) * 1989-12-23 1991-07-10 方晖 华语自动分词注音新技术
CN1731389A (zh) * 2004-08-04 2006-02-08 华建电子有限责任公司 盲汉对照编辑排版系统及编辑排版方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106598934A (zh) * 2016-12-14 2017-04-26 掌阅科技股份有限公司 电子书数据的显示方法、装置及终端设备
CN106598934B (zh) * 2016-12-14 2018-09-14 掌阅科技股份有限公司 电子书数据的显示方法、装置及终端设备
CN107783956A (zh) * 2017-11-23 2018-03-09 掌阅科技股份有限公司 文字信息的排版方法、电子设备及计算机存储介质
CN107783956B (zh) * 2017-11-23 2019-03-15 掌阅科技股份有限公司 文字信息的排版方法、电子设备及计算机存储介质

Similar Documents

Publication Publication Date Title
US20100235780A1 (en) System and Method for Identifying Words Based on a Sequence of Keyboard Events
US20140176564A1 (en) Chinese Character Constructing Method and Device, Character Constructing Method and Device, and Font Library Building Method
CN101295290B (zh) 一种多行文字行中排版的方法
US20180239743A1 (en) Keyboard input corresponding to multiple languages
JP2012256197A (ja) 表記ゆれ検出装置及び表記ゆれ検出プログラム
US20140244238A1 (en) Native-script and cross-script chinese name matching
CN102147790A (zh) 文本排版方法及排版引擎
KR101954552B1 (ko) 이미지의 제시 정보를 제공하는 방법 및 장치
CN110263792A (zh) 图像识读及数据处理方法、智能笔、系统及存储介质
CN103150300A (zh) 拼音的排版方法和装置
Finch et al. Rescoring a phrase-based machine transliteration system with recurrent neural network language models
CN104699662B (zh) 识别整体符号串的方法和装置
CN104424337B (zh) 文档分割系统和文档分割方法
US20160283597A1 (en) Fast substring fulltext search
US20130227444A1 (en) Method and Device for Improving Page Rendering Speed of Browser
CN101021841A (zh) 一种维文排版中自动添加连音符控制行格式撑满的方法
JP6538563B2 (ja) 入力支援装置、入力支援方法及びプログラム
CN113743409A (zh) 一种文本识别方法和装置
CN103176953B (zh) 一种文本处理方法及系统
CN103488616A (zh) 一种内嵌字体处理方法与装置
TWI310522B (en) Method for generating characters
JP5773289B2 (ja) 手書き入力方式を最適化するための方法および装置
CN103514145B (zh) 标点符号转换方法及装置
CN104516866B (zh) 文字沿线排版的方法
WO2024087298A1 (zh) 文本处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130612