汉文-维吾尔文双语语料库中基于词典译文的句子对齐方法研究Research on Dictionary Based Sentense Alignment Method in Chinese and Uighur Bilingual Corpus
热西旦·塔依;吐尔根·依布拉音;
摘要(Abstract):
双语语料库的自动对齐已成为机器翻译研究中一个十分重要的研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,本文根据汉文-维吾尔文的特点,在分析目前双语句子对齐方法的基础上,提出了基于译文的对齐方法,通过使用一部翻译较完整的词典作为桥梁,将汉维句子关联起来.根据维吾尔语文本中的单词,在词典中找到其对应的译文,并将译文到汉语句子中去匹配,根据评价函数和动态规划算法找到对齐句对.
关键词(KeyWords): 汉文;维吾尔文;机器翻译;句子对齐;双语语料库
基金项目(Foundation): 国家自然科学基金资助(编号:60663006);; 新疆维吾尔自治区高新技术计划项目(200712109)
作者(Authors): 热西旦·塔依;吐尔根·依布拉音;
参考文献(References):
- [1]姚天顺.自然语言理解:一种让机器懂得人类语言的研究[M].中文信息处理丛书(第二版).清华大学出版社,1995,20-35.
- [2]董振东.中国机器翻译的世纪回顾[J].中国计算机世界,2000,1:37-39.
- [3]Sato S,Nagao M.Toward Memory-Based Translation[C].Proceedings of COLING-90,1990,247-252.
- [4]Sumita E,Iida H.Experiments and Prospects of Example-Based Machine Translation[C].In Proceedings of the ACL'29, 1991,65-72.
- [5]柏晓静,常宝宝,詹卫东.构建大规模的汉英双语平行语料库[C].黄河燕主编《2002全国机器翻译研讨会文集:机器翻译研究进展》,北京:电子工业出版社,2002,124-131.
- [6]张艳,柏冈秀纪.基于长度的扩展方法的汉英句子对齐[J].中文信息学报,2005,5:31-37.
- [7]钱丽萍,赵铁军,杨沫昀.基于译文的英汉双语句子的自动对齐[J].计算机工程与应用,2000,12:123-125.
- [8]William A Gale,Kenneth W Church.A Program for Aligning Sentences in Bilingual Corpora[C].In Proceedings of th 29th Annual Meeting of the Association for Computational Linguistics(ACL'91),1991,75-102.
- [9]周明,朱胜火.基于自动抽取词汇信息的双语句子对齐[J].计算机学报,1998,21(8):151-158.
- [10]陈鹏.基于语料库的维吾尔语词干提取和词性标注[D].新疆大学硕士学位论文,2006,22-25.
- [10]杨沐昀.汉英句子对齐及翻译词典和翻译规则的自动获取[D].哈尔滨工业大学博士论文,2004,4-10.
- [11]热西旦木,吐尔根.汉文-维吾尔文双语语料构建实验性研究[J].伊犁师范学院学报(自然科学版),2008,4:33-37.