新疆大学学报(自然科学版)(中英文)

2012, v.29;No.125(01) 104-107

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于相似度计算的维吾尔语词聚类
Uyghur Words Clustering Based on the Similarity Calculation

谭勋;吐尔根·依布拉音;艾山·吾买尔;张韦煜;

摘要(Abstract):

词聚类是一种面向词语的聚类技术,广泛应用于自然语言处理的各个方向.传统的K-means算法是基于距离的聚类算法,该算法认为两个词的距离越近,其相似度就越大.本文提出了基于词形相似度计算的K-means聚类算法,它是基于词的相似度的聚类算法.实验表明,效用测度E达到了0.555.

关键词(KeyWords): 自然语言处理;词聚类;词语相似度

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金(60963018,60663006);; 国家社会科学基金重点资助项目(10AYY006);; 电子信息产业发展基金维哈柯语言文字软件开发及产业化维哈柯文辅助翻译软件项目;; 新疆维吾尔自治区自然科学基金(2011211B07)

作者(Author): 谭勋;吐尔根·依布拉音;艾山·吾买尔;张韦煜;

Email:

DOI:

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享