ZKX's LAB

段建国帖子 网络舆情的监测技术

2020-10-12知识12

网络舆情的监测技术 近几年,中国着力于利用技术手段实现对海量的网络舆情信息进行深度挖掘与分析,以快速汇总成舆情信息,从而代替人工阅读和分析网络舆情信息的繁复工作。网络舆情相关的关键性技术归结为:单体化技术与系统化技术两类,现逐一论述。网络舆情相关的单体化技术主要包含以下四个:(1)网络舆情采集与提取技术:网络舆情主要通过新闻、论坛/BBS、博客、即时通信软件等渠道形成和传播,这些通道的承载体主要为动态网页,它们承载着松散的结构化信息,使得舆情信息的有效抽取很有难度。梅雪等人(2007)通过全自动生成网页信息抽取Wrapper的方法在一定程度上实现了动态网页数据的抽取与集成,具有一定的处理准确率以及抽取效率。(2)网络舆情话题发现与追踪技术:网民讨论的话题繁多,涵盖社会方方面面,如何从海量信息中找到热点、敏感话题,并对其趋势变化进行追踪成为研究热点。早期的Allan James、J.Allan、G.Hulten、Qiaozhu Mei等人的研究思路是基于文本聚类,即文本的关键词作为文本的特征。这种方法虽然能将一个大类话题下的文本进行聚合,但没有保证话题的可读性与准确性。段建国等人(2007)在此思路的基础上进行改进,实现了话题发现与追踪:即将文本聚类问题转换为。

段建国帖子 网络舆情的监测技术

#网络舆情监测#舆情#舆情信息#舆情分析

随机阅读

qrcode
访问手机版