新疆大学学报(自然科学版)(中英文)

2017, v.34;No.146(02) 195-199+217

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Archive) | 高级检索(Advanced Search)

汉维医疗平行语料库构建及特征分析
The Construction and Analysis of Character of Chinese-Uyghur Medical Parallel Corpus

于清,孙浩男,陈永杰

摘要(Abstract):

面对稀缺、专业性强的汉维双语医疗平行语料库建设,本文探索数据采集、标准化、去噪、自动录入方法,进行语料库特征分析,并根据语料数据特性,设计语料库网页检索系统.目前已建成110多万字、2.6万句汉语医疗语料和3 000句对汉维双语对齐语料,不仅对构建中小型语料库有参考价值,而且奠定了医疗自然语言处理研究基础,尤其汉维双语对齐语料,将促进机器翻译技术在医疗领域突破,对新疆边远地区无汉语表达能力的少数民族群众获得医疗救助搭建桥梁.

关键词(KeyWords): 医疗;汉维平行语料库;特征分析

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金(61562082)资助项目

作者(Author): 于清,孙浩男,陈永杰

DOI: 10.13568/j.cnki.651094.2017.02.013

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享