新疆大学学报(自然科学版)

2017, v.34;No.147(03) 316-321

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

用于双语科技术语对齐的汉维文可比语料库构建
Construction of Chinese-Uyghur Comparable Corpus for Alignment of Bilingual Technical Terms

彭飞;吐尔根·依布拉音;艾山·吾买尔;米尔夏提·力提甫;

摘要(Abstract):

面向汉文维吾尔文(以下简称汉维)双语科技术语抽取这一应用目标,本文提出新闻科技领域的汉维可比语料库设计方案并进行实验.将网络采集的汉维语料利用机器翻译系统进行初加工后映射到向量空间中并使用LSI算法计算出各向量间的相关性,利用计算后的向量建立索引并依次计算出源文本与候选文本的相似值.本文设计两种实验进行对比,对选取的可比语料进行评估、筛选,最终达到构建汉维可比语料库的目的.

关键词(KeyWords): 可比语料库;汉维可比语料库构建;双语术语抽取;LSI

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金项目(61463048,61462083,61331011);; 国家重点基础研究发展计划(973)项目(2014cb340506)

作者(Author): 彭飞;吐尔根·依布拉音;艾山·吾买尔;米尔夏提·力提甫;

Email:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享