题目:印刷体维文识别系统研究与实现
要求:
(1)整体流程如下:
(2)预处理部分:
预处理中的字符切分是重点,有三个模块。行切分采用像素积分投影法,单词切分采用连通域搜索法,字母切分采用改进的像素积分投影法,这三种方法的参考文献参见“字符切分部分文献”文件夹。
(3)特征提取部分采用方向线素法与投影归一化方法相结合的方法
(4)匹配和识别:分类器部分采用模板匹配识别方法。
(5)整体界面如下:
点击进入应用出现以下界面:
1.左边的文本框显示原始图片;
2.点击“切分”有下拉菜单,分为行切分,单词切分,字母切分
点击“行切分”时,右边的文本框显示这样的结果:
点击“单词切分”时,右边的文本框显示到这样的结果:
点击“字母切分”时,右边的文本框显示这样的结果
3.下面的文本框显示最终识别结果;
4.导出按钮将识别结果以txt或者word形式保存。
(6)其他要求:
1.测试图片为两种字体三种字号的文本图片,每种字号的测试图片数量在10张左右
2.识别率要达到95%