新疆大学学报(自然科学版)(中英文)

2018, v.35;No.149(01) 73-79

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于生存法则的稳定新词识别方法的研究
Research on the Method of Stable New Words Identification Based on the Law of Survival

符贤哲;刘胜全;刘艳;郭竹为;赵美玲;

摘要(Abstract):

针对新词识别过程中出现大量噪声词和伪新词的问题,提出一种基于生存法则模型的稳定新词识别方法.该方法借鉴自然法则和遗忘定律,分析候选词串在时序分布中的词频变化,通过词串在语言环境中表现的综合竞争力淘汰突发性特征的噪声词以及词义不稳定的伪新词,识别网络短文本中出现的稳定新词.该方法可以保证网络新词的新颖性和稳定性,可为舆情本体新概念的抽取提供基础支持,有助于提高舆情本体概念抽取的准确率和查全率.

关键词(KeyWords): 新词识别;稳定新词;时序分析;新词生存法则

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金重点项目(61331011);; 新疆自治区自然科学基金项目(2014211A016);; 国家社会科学基金项目(13BYY062)

作者(Author): 符贤哲;刘胜全;刘艳;郭竹为;赵美玲;

Email:

DOI: 10.13568/j.cnki.651094.2018.01.012

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享