藏文联机手写识别若干算法研究


Autoria(s): 孙嫣
Contribuinte(s)

吴健

Data(s)

05/06/2009

Resumo

  语言文字的信息处理技术是人类社会现代化的重要成果。信息处理技术的水平已成为一个国家、一个民族发展进步的重要标志。改革开放以来,在实现汉语言文字信息处理技术的同时,我国少数民族语言文字信息处理技术也取得了巨大成就。从上世纪80、90年代起,藏语文信息处理工作取得突破性进展,然而在藏文的联机手写识别领域却仍处于起步阶段。   本文在总结了汉字识别和已有的藏文联机识别成果的基础上,在预处理过程、特征提取部分以及聚类部分进行了改进。在预处理过程中,使用了应用于图像处理中的数学形态学操作作为预处理中的去噪声方法,主要操作包括膨胀,腐蚀和细化;在特征提取阶段,在分析了原始特征值在后续计算中存在缺陷的基础上,本文对原始特征值进行了非线性变换,在网格方向特征提取时加入了网格的权值,从而增强了特征向量的区分能力;聚类使用的是k-means聚类方法,在聚类距离方面,我们在对比了各种距离测度方法后,提出了一种变型的欧氏距离计算方法,并将硬聚类方法改为模糊聚类方法,提高了算法的鲁棒性;为了提高系统区分相似字的能力,本文在借鉴了签名识别的方法后,实现了二级分类器,增强了其对细微差别的辨别能力。   实验结果表明,本文提出的改进方法对识别率有一定的提高,说明方法可行有效,适用于藏文的联机手写识别。

Identificador

http://ir.iscas.ac.cn/handle/311060/192

http://www.irgrid.ac.cn/handle/1471x/67288

Idioma(s)

中文

Fonte

孙嫣.藏文联机手写识别若干算法研究[硕士论文].中国科学院软件研究所.中国科学院研究生院.2009

Palavras-Chave #人工智能::模式识别 #手写识别
Tipo

学位论文