新疆大学学报(自然科学版)

2010, v.27;No.117(01) 102-105

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

汉文-维吾尔文双语语料库中段落对齐技术研究
Research on Paragraph Alignment Technology in Chinese-Uighur Bilingual Corpus

热西旦·塔依;吐尔根·依布拉音;

摘要(Abstract):

随着信息技术的普及与推广,双语电子文本资源呈指数形式增长,这给构建大规模双语语料库提供了可能.双语对齐作为语料库加工过程中的关键技术,已经引起研究者的高度重视.针对目前可收集到的双语资源大都没有做到段落对齐,本文提出了基于回车符段落对齐基础上的多层次分段对齐思想,充分利用汉文-维吾尔文双语文本中的语言特点,根据双语文本中的数字信息,找出互为译文的句对,从而达到高质量的段落对齐目的.

关键词(KeyWords): 汉文-维吾尔文双语语料库;段落对齐;多层次分段对齐

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金(编号:60663006);; 新疆维吾尔自治区高新技术计划项目(200712109)

作者(Author): 热西旦·塔依;吐尔根·依布拉音;

Email:

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享