新疆大学学报(自然科学版)(中英文)

2013, v.30;No.129(01) 81-86

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

微博语料分词及标注方法初探
Preliminary Study of Chinese Word Segmentation and Part-of-Speech Tagging Being Used for Microblog Data

于清;阿里甫·库尔班;

摘要(Abstract):

本文将清华大学中文分词和词性标注系统应用于部分微博语料数据,检测系统对微博新词识别能力及对识别错误进行了分类总结,并对识别率低的新词制定了标注规范.通过人工校对获得新的训练语料数据集,提高系统对微博文本的处理能力,为建立微博专用语料库做前期准备工作.

关键词(KeyWords): 分词;标注系统;专有名词;新词;微博语料库

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金(61163029)

作者(Author): 于清;阿里甫·库尔班;

Email:

DOI:

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享