空格
空格 | |
空格是行文为防止混淆或有特定用途的空位。古代中文在书写上一般不用标点[1],字与字之间亦无空格。空格通常作特定用途,如每段起首须缩入两个字位[2],尊称前要留空一格作挪抬等等。
欧洲语言
[编辑]在拉丁语族和日耳曼语族的语言中,字与字之间以及标点符号与其后的字之间会以空格作间隔。在句号后面,一般以一个空格与其后的字分隔,这种分隔称为“法式分隔”。[3] 有时候在处理文书上,会在句号后以两个空格作间隔,这种分隔称为“英式分隔”。
东亚语言
[编辑]在东亚语言里,空格运用的程度有异。中文、日文比较少在文书上使用空格,而日文会在正式场合里在人名上运用空格,以分隔姓氏与名字。在韩文,书写的时候运用大量的空格,称为“隔写法”(韩文:띄어쓰기)。韩文的隔写法有标点符号的作用。比如说“아버지가방에들어가신다.”这个句子会因不同的隔写方式,而有不同的意思:
|
中文排版
[编辑]在使用中文电脑初期,文书处理及网页编辑工具大多改自英文软体,与BIG5编码并不完全相容;英文ASCII字元编码为1byte、中文BIG5则是2byte,假使边界或断行排版没设定好,不足容纳中文字时会造成该字或整段乱码,因此比照英文排版在各字间加半形空格(多出1byte缓冲)以避开程式错误。
及至中文文书和网页编辑软体发展成熟后,不再产生乱码情形,也就无须在字间加空格。少数香港媒体新闻网页直到2010年代初,如香港电台当时还维持早期排版方式[4]。
Unicode定义
[编辑]Unicode定义了大量空格符号,列表如下:
编码 | 不换行 | 用于URL | HTML | 名称 | 区域 | 显示 | |
---|---|---|---|---|---|---|---|
U+0009 | 文字制表符(Character Tabulation) | 基本拉丁文 | |||||
同ASCII字元0x09 | |||||||
U+0020 | 空格 | 基本拉丁文 | |||||
普通半形空格,同ASCII字元0x20 | |||||||
U+00A0 | ✓ | | 不换行空格(No-Break Space) | Latin-1 Supplement | |||
同U+0020,但不换行 | |||||||
U+1680 | ✓ | 欧甘空格(Ogham Space Mark) | 欧甘字母 | ||||
用于分隔欧甘文单词。通常情况下显示为一条直线,而在没有字干的字型中会显示成空格。需要欧甘文字型。 | |||||||
U+180E | ✓ | 蒙古文元音分隔符(Mongolian Vowel Separator,MVS) | 蒙古文 | | |||
作用近似不换行空格,用于蒙古文时使得词尾两个字母呈现不同的字形。自Unicode 6.3.0起不再定义为空格。 | |||||||
U+2002 |   | En空格(En Space)或Nut | 通用标点 | ||||
与en同宽(em之一半)。 | |||||||
U+2003 |   | Em空格(Em Space)或Mutton | 通用标点 | ||||
与em同宽。 | |||||||
U+2004 |   | Em三分之一空格(Three-Per-Em Space)或Thick Space | 通用标点 | ||||
em之三分之一宽 | |||||||
U+2005 |   | Em四分之一空格(Four-Per-Em Space)或Mid Space | 通用标点 | ||||
em之四分之一宽 | |||||||
U+2006 | Em六分之一空格(Six-Per-Em Space) | 通用标点 | |||||
em之六分之一宽。电脑字型有时与U+2009等同。 | |||||||
U+2007 | ✓ |   | 数字空格(Figure Space) | 通用标点 | |||
用于分隔数字之定位符,与单一数字同宽 | |||||||
U+2008 | 标点空格 | 通用标点 | |||||
与同字型之窄标点同宽,即句号或逗号(西方语文)之宽度[5] | |||||||
U+2009 |   | 窄空格(Thin Space) | 通用标点 | ||||
em之六分之一(有时设计成五分之一)宽。建议用作SI单位数字之千位分隔符。与U+2002至U+2008不同,其宽可根据排版调整[6] | |||||||
U+200A | 发宽空格(Hair Space) | 通用标点 | |||||
窄于窄空格(thin space) | |||||||
U+200B | 零宽空格(Zero Width Space,简称“ZWSP”) | 通用标点 | | ||||
U+200C | ✓ | ‌ | 零宽不连字(Zero Width Non Joiner,简称“ZWNJ”) | 通用标点 | | ||
U+200D | ✓ | ‍ | 零宽连字(Zero Width Joiner,简称“ZWJ”) | 通用标点 | | ||
U+202F | ✓ | 窄式不换行空格(Narrow No-Break Space) | 通用标点 | ||||
作用近似U+00A0不换行空格。用于蒙古文时宽度通常为普通空格三分之一,用于其他文字时宽度有时相当于U+2009窄空格。 | |||||||
U+205F | 中数学空格(Medium Mathematical Space,简称“MMSP”) | 通用标点 | |||||
用于数学方程式。em之18分之4宽[7]在数学排版领域,空格宽度通常以十八份之几的方式给定;4/18 em可用于数个情况,例如数式a + b中a与 +及 +与b之间[8] | |||||||
U+2060 | ✓ | ✓ | 文字连接符(Word Joiner) | 通用标点 | | ||
同U+200B,但该处不能换行。Unicode 3.2新增,以代替U+FEFF字元废止之零宽不换行空格功能 | |||||||
U+3000 | 表意文字空格 | CJK符号及标点 | |||||
与CJK文字同宽(全形) | |||||||
U+FEFF | ✓ | ✓ | 零宽不换行空格(Zero Width No-Break Space) = 位元组顺序记号(Byte Order Mark,简称“BOM”) | Arabic Presentation Forms-B | | ||
主要用作位元组次序标记字元。原来之不换行指示功能于Unicode 3.2起废止,代之以U+2060。 |
Unicode在控制图形(Control Pictures)区域亦提供一些具像字元用来代表空格,例如␠
(Symbol For Space,U+2420)、␢
(Blank Symbol,U+2422)和␣
(Open Box,U+2423)[9]。有些文书处理软件如Microsoft Word会使用间隔号·
代表半形空格。
注释
[编辑]- ^ 御定康熙字典 (四库全书本)/卷28#读:
"又集韵韵㑹 𡘋大透切音豆义同 周礼天官小宰宫正注郑司农读火绝之徐音豆 又增韵句读凡经书成文语绝处谓之句 语未绝而点分之以便诵咏谓之读 今秘省挍书式凡句绝则点于字之旁 读分则微点于字之中闲";可见直到清朝时书写习惯都不加标点,研究解读时才另加标记辅助。
详见标点符号#历史, 古人书写实物见: 兰亭集序。
《汉典》:句读 (页面存档备份,存于互联网档案馆) - ^ 沿自1919年胡适、周作人、钱玄同等向中华民国教育部提出《请颁行新式标点符号议案(修正案)》存档副本. [2010-09-30]. (原始内容存档于2009-12-13).[1] (页面存档备份,存于互联网档案馆)
- ^
Einsohn, Amy. Punctuation, Eyeballing every mark. The Copyeditor's Handbook: A Guide for Book Publishing and Corporate Communications 2nd. Berkeley, Los Angeles, London: University of California Press. 2006: 113 [2010-04-25]. ISBN 9780520246881.
If you are working on documents that will be printed without any intervention from a compositor (e.g., documents produced on the office laser printer), you will have to carefully scrutinize every piece of punctuation to be sure that the document contains the correct character (see table 5). You should also delete any extra wordspacing before and after punctuation marks. The conventions are: One space follows sentence-ending punctuation mark (period, question mark, or exclamation point). One space follows comma, colon, or semicolon ...
- ^ 天文台明日考慮需否發三號強風信號. 香港电台. 2012-07-21 [2012-07-22]. (原始内容存档于2013-04-30) (中文(香港)).
- ^ Character design standards - space characters. Character design standards. Microsoft. 1998–1999 [2009-05-18]. (原始内容存档于2018-01-09).
- ^ The Unicode Standard 5.0, printed edition, p.205
- ^ General Punctuation (PDF). The Unicode Standard 5.1. Unicode Inc. 1991–2008 [2009-05-13]. (原始内容存档 (PDF)于2011-09-17).
- ^ Sargent, Murray III. Unicode Nearly Plain Text Encoding of Mathematics (Version 2). Unicode Technical Note #28. Unicode Inc: 19–20. 2006-08-29 [2009-05-19]. (原始内容存档于2021-03-08).
- ^ Control Pictures (PDF). Unicode, Inc. [2017-03-06]. (原始内容存档 (PDF)于2021-04-20).
延伸阅读
[编辑]- Saenger, Paul. Space Between Words: The Origin of Silent Reading. Stanford, Calif: Stanford University Press. 1997. ISBN 9780804726535. OCLC 35548786.