新疆大学学报(自然科学版)(中英文)

2010, v.27;No.120(04) 482-485

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

多语种eml文件编码及语种识别算法研究
The Research of Recognition Algorithms Based on Multi-language EML File-coding and Language Identification

张健;任炜;蒋欣;陈辰;赖跃群;袁保社;

摘要(Abstract):

Eml文件是当前流行的邮件正文格式之一,国内国际对汉、英、俄语种的识别和研究技术已比较成熟,但维吾尔语、哈萨克语及阿拉伯语研究还处于起步阶段.本文研究了包含汉、维、哈、阿拉伯、俄、英文六个语种的eml文件编码格式及编码获取算法,尤其是采用维吾尔语、哈萨克语及阿拉伯语书写的的eml邮件,正确解析邮件头信息和正文内容,实现了对eml文件的语种精确识别.

关键词(KeyWords): eml;编码识别;多语种;语种识别

Abstract:

Keywords:

基金项目(Foundation): 2009年新疆维吾尔自治区高技术研究项目(项目号:200912117)

作者(Author): 张健;任炜;蒋欣;陈辰;赖跃群;袁保社;

Email:

DOI:

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享