内容简介:(内容由AI生成)
本书聚焦网络舆情分析的关键技术与系统实现,构建了以‘分领域’为前提的完整技术体系。核心内容包括:(1)提出‘元素共现法’实现面向特定领域的舆情检测,通过主题词、背景词、情感词三类特征词的组合与聚合关系动态识别舆情;(2)从内容与形式两个维度研究热点话题识别,创新性提出‘基于最低相似度的高频共现聚类策略’,并融合点击数、评论数等时效性参数提升识别效率;(3)针对倾向性分析难题,区分短文本与长文本:短文本采用‘归总法’锁定归总句,长文本首创‘双题法’——结合标题与6个主题句的倾向性加权计算,建立可验证的篇章倾向判定流程;(4)依托‘国家语言文字舆情数据库’‘某高校信息监测系统’‘985高校信息监测系统’三大实例,系统论述舆情数据库的建设路径、可视化分析及BS/CS/移动端多模态应用。全书强调技术实用化导向,所有方法均经COAE评测、真实系统部署与多年运行验证。作者简介:
程南昌 :程南昌,博士,现就职于中国传媒大学,硕士生导师。主要研究领域为计算语言学(自然语言处理)、模式识别与智能系统。长期从事自然语言处理、网络舆情和语料库相关系统开发设计。多次参与国内、国际自然语言处理领域的评测,曾获得COAE情感计算电子与汽车两个领域倾向强度比赛全国第一名,SIGHAN国际评测中文人物属性抽取第一名。