现代哈萨克语词级标注语料库的构建研究A Study of Word Tagging Corpus for the Modern Kazakh Language
古丽拉·阿东别克,达吾勒·阿布都哈依尔,木合亚提·尼亚孜别克,刘晓洁
摘要(Abstract):
建设高质量的标注语料库是现代哈萨克语自然语言信息处理领域的基础性工程,本文根据哈萨克语独特的语言特点,进行词级带标注的哈萨克语语料库构建研究,首先介绍了不同语言语料库的国内外研究现状,随后针对语料库构建中涉及的主要问题,实现了哈萨克语词级基本语料库的设计与构建.
关键词(KeyWords): 哈萨克语;语料库;语料库构建;词附加成分的切分;词性标注
基金项目(Foundation): 国家自然科学基金项目(NO:60763005);; 国家教育部语信司项目(NO:MZ115-92)
作者(Author): 古丽拉·阿东别克,达吾勒·阿布都哈依尔,木合亚提·尼亚孜别克,刘晓洁
参考文献(References):
- [1]俞士汶.计算语言学概论[M].北京:商务印书馆,2003.
- [2]冯志伟.中国语料库研究的历史与现状[J].Journal of Chinese Language and Computing,2002,11(2):127-136.
- [3]俞士汶,朱学锋,段慧明.大规模现代汉语标注语料库的加工规范[J].中文信息学报,2000,14(6):58-64.
- [4]黄昌宁,等.语料库语言学[M].北京:商务印书馆,2002.
- [5]Galcin Cebi and G(o|¨)khan Dalkilic.Turkish Word N-gram Analyzing Algorithms for a Large Scale Turkish Corpus Turco[C]. Proceedings of the International Conference on Information Technology:Coding and Computing(ITCC'04),2004.
- [6]Eric Brill.A Simple rule-based part of speech tagger[C].Proc.of the Third conference on Applied Natural Language Processing(ACL),Trento Italy,1992,152-155.
- [7]Evangelos Dermatas,George K.Automatic Stochastic Tagging of Natural Language Texts[J].Computational linguistics, 1995,21(2):137-163.
- [8]新疆哈萨克自治区语委会.现代哈萨克语[M].乌鲁木齐:新疆人民出版社,2002.
- [9]张定京.现代哈萨克语实用语法[M].北京:中央民族大学出版社,2004.
- [10]《哈萨克语详解词典》.乌鲁木齐:新疆人民出版社,1998.
扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享