Skip to content

现代标准阿拉伯语

本文简单整理了阿拉伯字母及其在现代标准阿拉伯语中使用的基本信息,并就如何使用Unicode书写阿拉伯语提供建议。本文不包括古兰经的用法。

阿拉伯字母是一种辅音音素文字,通常使用辅音和长元音来区分单词。除了阿拉伯语之外,乌尔都语和维吾尔语等语言也使用阿拉伯字母来拼写,不过并非所有这些语言都是辅音音素文字。

阿拉伯字母从右往左书写,而其中包含的数字和拉丁字母则从左往右书写。

阿拉伯字母会根据所处的位置(词首、词中或词尾)不同,有不同的书写形式。

阿拉伯字母不区分大小写。

本文所涵盖的语言

现代标准阿拉伯语是北非和西亚国家在书面和大多数正式演讲中使用的阿拉伯语变体。阿拉伯语的其他变体在排版上可能会有所不同。

文字书写方向

阿拉伯字母从右往左书写,而其中包含的数字和拉丁字母则从左往右书写。

如果页面和文档的主要文字为阿拉伯字母,布局和结构也会从右往左排列。

Unicode双向文本算法

Unicode 双向文本算法(简称为bidi算法)[2]详细介绍了一种从右到左渲染文本的算法。

基本原则

阿拉伯字母的一些特征对字体设计师来说是具有挑战性的。

纵向连接

字母除了由右至左连接,还可以纵向(自上而下)连接,不过并非所有字体都支持。

纵向连接横向连接
几乎是纵向的的连接(左)和水平的连接(右)

需要注意的是,这不仅具有审美上的意义,而且还会影响文字两端对齐时的宽度。在手写文本中,作者可自行决定选择适合指定行长的连接方式。

“牙齿”字母

当连续字母的中部形式一致时,它们就可以呈现出类似牙齿的形状。

牙齿字母
“牙齿”字母

伊斯兰手稿传统

起源

阿拉伯字母属于闪语族书写系统,由纳巴泰字母演变而来,在公元4世纪产生,与叙利亚字母和希伯来字母关系密切。

伊斯兰教认为,先知穆罕默德是用阿拉伯语接受启示的,因此阿拉伯语被赋予了宗教含义。穆罕默德于公元632年去世后,在阿布·伯克尔和奥斯曼两位哈里发的带领下,他的启示首次以书面形式进行了汇编和标准化,由此产生的经典《古兰经》成为了信仰的核心载体。因此,阿拉伯字母随着伊斯兰文明的传播而超越了其起源地,并开始用于书写其他语言。由于伊斯兰教的广泛传播,过去和现在都有许多不同的语言使用阿拉伯字母书写,因此出现了不同的正字法。

常用字体风格

伊斯兰手稿是随着伊斯兰艺术和文明的发展而演变的。早在公元7世纪,在岩石圆顶的马赛克中就可以找到装饰性的阿拉伯字母。除了在建筑中频繁出现之外,书法也成为伊斯兰最重要的艺术形式之一。通过抄写书籍和书法艺术,手稿逐渐成为伊斯兰文明的核心要素。《古兰经》的书写被视为宗教信仰的表达,并为抄写员和书法家提供了出色的创作环境。

随着时间的推移,字体风格也在不断演变,很多字体已不再被使用,也有一些保留了下来。

如今,只有少数风格还在广泛使用。最有名的风格是誊抄体,这是阿拉伯字母在大多数情况下的默认形式。不过,阿拉伯字母的风格存在很大的地区差异。

@@TODO: 伊朗和巴基斯坦@@

TBD

字符

字符编码

阿拉伯字母在Unicode标准中是按语义编码的。也就是说,不管一个字母有多少种形式,都只有一个Unicode码位,

Unicode还为阿拉伯字母提供了部分非语义编码字符,分布在阿拉伯字母表达形式-A(Arabic Presentation Forms-A)和阿拉伯字母表达形式-B(Arabic Presentation Forms-B)两个区块中。这些字符已被弃用,不应在一般的信息交换中使用。

字符列表

下面的表格列出了用阿拉伯字母书写现代标准阿拉伯语时使用的Unicode字符。

字母

字符码位名称
ءU+0621ARABIC LETTER HAMZA
آU+0622ARABIC LETTER ALEF WITH MADDA ABOVE
أU+0623ARABIC LETTER ALEF WITH HAMZA ABOVE
ؤU+0624ARABIC LETTER WAW WITH HAMZA ABOVE
إU+0625ARABIC LETTER ALEF WITH HAMZA BELOW
ئU+0626ARABIC LETTER YEH WITH HAMZA ABOVE
اU+0627ARABIC LETTER ALEF
بU+0628ARABIC LETTER BEH
ةU+0629ARABIC LETTER TEH MARBUTA
تU+062AARABIC LETTER TEH
ثU+062BARABIC LETTER THEH
جU+062CARABIC LETTER JEEM
حU+062DARABIC LETTER HAH
خU+062EARABIC LETTER KHAH
دU+062FARABIC LETTER DAL
ذU+0630ARABIC LETTER THAL
رU+0631ARABIC LETTER REH
زU+0632ARABIC LETTER ZAIN
سU+0633ARABIC LETTER SEEN
شU+0634ARABIC LETTER SHEEN
صU+0635ARABIC LETTER SAD
ضU+0636ARABIC LETTER DAD
طU+0637ARABIC LETTER TAH
ظU+0638ARABIC LETTER ZAH
عU+0639ARABIC LETTER AIN
غU+063AARABIC LETTER GHAIN
فU+0641ARABIC LETTER FEH
قU+0642ARABIC LETTER QAF
كU+0643ARABIC LETTER KAF
لU+0644ARABIC LETTER LAM
مU+0645ARABIC LETTER MEEM
نU+0646ARABIC LETTER NOON
هU+0647ARABIC LETTER HEH
وU+0648ARABIC LETTER WAW
ىU+0649ARABIC LETTER ALEF MAKSURA
يU+064AARABIC LETTER YEH
ٯU+066FARABIC LETTER DOTLESS QAF
پU+067EARABIC LETTER PEH
چU+0686ARABIC LETTER TCHEH
ژU+0698ARABIC LETTER JEH
ڜU+069CARABIC LETTER SEEN WITH THREE DOTS BELOW AND THREE DOTS ABOVE
ڢU+06A2ARABIC LETTER FEH WITH DOT MOVED BELOW
ڤU+06A4ARABIC LETTER VEH
ڥU+06A5ARABIC LETTER FEH WITH THREE DOTS BELOW
ڧU+06A7ARABIC LETTER QAF WITH DOT ABOVE
ڨU+06A8ARABIC LETTER QAF WITH THREE DOTS ABOVE
کU+06A9ARABIC LETTER KEHEH
گU+06AFARABIC LETTER GAF
یU+06CCARABIC LETTER FARSI YEH

音符

字符码位名称
ARABIC FATHATANU+064BARABIC FATHATAN
ARABIC DAMMATANU+064CARABIC DAMMATAN
ARABIC KASRATANU+064DARABIC KASRATAN
ARABIC FATHAU+064EARABIC FATHA
ARABIC DAMMAU+064FARABIC DAMMA
ARABIC KASRAU+0650ARABIC KASRA
ARABIC SHADDAU+0651ARABIC SHADDA
ARABIC SUKUNU+0652ARABIC SUKUN

数字

字符码位名称
٠U+0660ARABIC-INDIC DIGIT ZERO
١U+0661ARABIC-INDIC DIGIT ONE
٢U+0662ARABIC-INDIC DIGIT TWO
٣U+0663ARABIC-INDIC DIGIT THREE
٤U+0664ARABIC-INDIC DIGIT FOUR
٥U+0665ARABIC-INDIC DIGIT FIVE
٦U+0666ARABIC-INDIC DIGIT SIX
٧U+0667ARABIC-INDIC DIGIT SEVEN
٨U+0668ARABIC-INDIC DIGIT EIGHT
٩U+0669ARABIC-INDIC DIGIT NINE

词汇表

英语简体中文
baseline基线
bleed出血
block (Unicode)区块,块(Unicode)
code point码位
contextual form内文形式
diacritics音符
Eastern Arabic numerals阿拉伯文数字
European numerals阿拉伯数字
final form尾部形式
font字体
horizontal writing mode横排
initial form首部形式
isolated form独立形式
medial form中部形式
vertical writing mode直排

参考文献

[1] Richard Ishida. Arabic & Persian Layout Requirements. 30 April 2024. W3C Note. URL: https://www.w3.org/TR/alreq/

[2] Manish Goregaokar मनीष गोरेगांवकर; Robin Leroy. Unicode Bidirectional Algorithm. 15 August 2023. Unicode Standard Annex #9. URL: https://www.unicode.org/reports/tr9/tr9-48.html

Licence CC-By