ISO 2022的有限状态机描述


Autoria(s): 谢谦; 芮建武; 吴健
Data(s)

2006

Resumo

ISO 2022编码体系对字符集国家标准的制订有很大影响,然而标准条款存在不确定性,有时难于理解。本文引入有限状态机(FSM)模型来形式化地刻画ISO 2022的特征。针对FSM五元组,详细说明了其状态空间的构成,提出了输入字母表的等效分类方法,给出了初始状态以及终结状态集合,分析了状态转移函数的规模,并采用FSM描述方法分析了ISO-2022-CN、EUC-CN、复合文本等标准,揭示了这些标准与ISO 2022的内在联系。这些工作有助于ISO 2022标准符合性检测、扩展标准的制订与系统实现复杂度评估。鉴于形式化描述方法在编码字符集标准领域未得到广泛应用,本文工作为该类研究引入了新的思路和方法。

中国中文信息学会

Identificador

http://ir.iscas.ac.cn/handle/311060/4100

http://www.irgrid.ac.cn/handle/1471x/68202

Fonte

谢谦; 芮建武; 吴健.ISO 2022的有限状态机描述,中文信息学报,2006,20(6):97-103

Palavras-Chave #计算机应用 #中文信息处理 #编码字符集 #ISO2022 #有限状态机
Tipo

期刊论文