案例概述

基于SaCa DeepCogni构建了专门面向人社业务的舆情系统。从数据采集到语义分析,均高度融合人社相关业务,为工作人员提供热点分析、舆情统计、舆情预警、舆情报告自动生成等多种便利功能。

 

客户介绍

吉林省人力资源和社会保障厅是省政府组成部门,负责促进就业工作。根据《中共中央办公厅、国务院办公厅关于印发〈吉林省人民政府机构改革方案〉的通知》(厅字〔2008〕25号),组建吉林省人力资源和社会保障厅,为省政府组成部门。吉林省人力资源和社会保障厅挂吉林省外国专家局牌子。

 

面临挑战

随着互联网的日益普及,舆论环境发生了本质的变化,各级政府逐步认识到舆论环境对社会环境的重要影响作用。越来越多的社会民众通过网络来表达自己的态度、观点、意见、要求等,从而互联网能更快速、更直接、更尖锐、更真实地映射出社情民意。

各级政府对网络舆论的及时监测、有效引导,以及对网络舆论危机的积极化解的需求愈发迫切。在加强互联网管理的同时,通过先进技术手段,开展互联网信息的汇集整理和分析研判,从网络上海量的信息中发掘出对政府有价值的信息,对于全面了解社情民意,为领导决策提供支持和依据,做好各项工作具有重要意义。

 

解决方案

通过原始发布内容的基础信息数据以及文本相似度算法发掘文本的传播路径,形成各重要信息的传播路径分析图表,包括对新闻网站、论坛、贴吧、博客、微博、微信、新闻客户端的传播路径图。每个传播路径图中可视化展示包括信息原点、爆发点、重要节点、发布时间、发布平台等信息,实现重点信息的源头分析。

文本通过中文分词,词嵌入、语义分析模型,词表特征模型等技术实现文本的数值向量化表示,再通过聚类分析算法比如层次聚类、密度聚类、深度学习聚类实现基于内容的文本聚类,在聚类的基础上通过热点统计模型,文本主题模型发掘不同时间段内的热点信息,并利用热点匹配的方式发现热点随着时间变化的发展趋势,最终形成热点舆情主题,代表性事件,事件摘要,事件关键词等综合信息。同时,通过对舆情事件进行多维度分析、知识关联分析、事件关联分析、实体关联分析形成舆情图谱,业务人员可以通过舆情图谱更直观的了解事件、人物、时间、地点的关联脉络。

此外,为了方便业务人员能够更简单,更精准的完成信息查询,需要对各文本数据进行多维度的索引或者标签建立,通过对原始文本数据进行聚类,将具有相同属性的文本内容进行分组,对各组内的文本进行标签标注处理,再对各标签进行索引,通过这种方式,业务人员可以更高效的通过标签来查询相关的信息。

此外,针对网民对某一事件或企业的大量评论数据,通过情感分析计算,统计出大众对该事件或企业的情感态度占比,以便及时的了解民情。典型意见挖掘是通过意见触发词对文本进行意见抽取,然后通过文本片段聚类算法将相似的意见聚成组,对同类意见的占比量进行统计,并按情感极性进行分类展示,典型意见抽取能够将民众的评论进行同类型的聚合,并通过自然语言的方式进行结果呈现,方便业务人员更直观理解民众意见的关注点。

 

实施效果

主要针对人社方面以及吉林省内的新闻进行采集分析。每天针对人社范围关注的25家官方媒体及人社官方网站,通过近300条爬虫进行海量信息搜集,与人社有关的新闻采集量日平均近1500条左右;上线使用近半年,提供人社舆情约27万条,有效涵盖了日常所需要了解的人社咨询信息及敏感舆论信息。每天自动导出舆情简报,替代了原来每天人工方式收集整理报告的方式,节省了工作量,并提供更为全面准确的信息。针对突发的事件,通过预警机制发送给管理员,及时有效应对。

 

相关产品