新媒体自诞生以来,企业、个人、科研院所自建微信公众号的趋势愈演愈烈,几乎每个单位都期望通过新媒体这个广阔的平台将自己广而告之。
不过,在信息爆炸的网络上,受众浏览的信息数以万计,哪些内容才能抓住目标受众群体的眼球,哪些文章受到人们的欢迎呢?为了获取后台的数据进行分析,不少公司也开拓了大数据分析业务。
中国科学院计算技术研究所恰逢其时推出了一款名为“微秘”的大数据分析技术。“微秘可以对全网新媒体数据进行获取分析,包括微信、微博、知乎、豆瓣、论坛以及搜索等平台。通过数据采集和分析,可以针对分析目标提供客观详实的自媒体分析报告和企业舆情报告。”中国科学院计算技术研究所InsightTeam负责人翟立东博士在接受《中国科学报》采访时说。
小微秘的大作用
11月9日,由中国能源报社主办的全国能源行业微信传播大会暨能源行业百强微信公众号颁奖典礼举办。这份榜单就是通过微秘技术支持,经过筛选后得出。
与粗略的数据分析不同,“能源行业微信号仅筛选工作就进行了三轮”,InsightTeam执行负责人鲁辉博士介绍说。第一轮抓取的参数主要分为七大方面,包括阅读量、点赞量、评论数、平均阅读量、平均点赞量、平均评论数、文章数;第二轮则通过优化算法,围绕阅读、点赞、评论三大方面得出各个微信公号的影响力系数,通过文章质量和运营稳定性得出运营系数;最后再综合第一、第二级排榜指数,全方位立体化对微信公号评估后,得到微秘综合指数,即最后排榜结果。
不仅如此,微秘联合主办单位分析,还给出微信公众号“好文”的特点:其文章标题字数集中在14至23个字之间,平均字数为19,使用强调符号的微信公众号占比达到90%以上,叹号的使用达30%,问号的使用同样达到30%,引号的使用更是神同步地达到了30%。这至少可以说明文章中用符号来表示强调、吸引眼球是有效的。
“这些监测数据并不需要专人进行操作,只需要安装相关软件就可以完成对感兴趣的媒体号的数据爬取工作。”鲁辉说。
大数据的独特技术
强大的计算程序自然有深厚的技术作为保证。鲁辉坦言,关于微秘的主要关键技术包括三点。第一项技术就是全网多平台数据的爬取技术。
“我们的技术都是对公开数据进行获取,不涉及隐私。”翟立东补充道。首先,获取数据时,微秘会随平台的规定变化进行迅速调整,保证有效获取。其次,微秘包括几百项相关分析算法策略,可以根据不同需求,随时调用,可扩充可重构。
第二项技术是自媒体报告数据分析自动生成技术。研究人员可以针对数据进行极短间隔获取,从宏观和微观角度,保证分析的角度深入和全面。“这是由InsightTeam独立研发的算法将其实现的。”鲁辉继续说。
第三项技术则是文本内容的情感处理批量准确判定技术。一般来说,机器很难体会文字中的情感,特别是面对大批量文本时,正负向评论很难进行准确的评估。“这个就牵涉到情感分析具体技术。首先我们有完善的情感分析分词库进行正负情感判定,再者,对大量文本进行了大数据训练,整个系统能快速实现判定。”鲁辉表示。
当然,数据爬取只是微秘的“小作为”,有了大数据做基础后,科研人员可以根据这些数据进行分析,得出深层次行业排榜和报告。
应用对接:深度分析报告
在大数据的基础上,微秘还可以准确迅速掌握某个企业在全网各个社交媒体平台上的相关评论和反馈,进而得出多平台、全局性的结论,还能从地域维度,对企业的不同正负口碑进行统计展现。
“我们可以给企业提供深度分析报告,这些报告可以引导企业精准地对其缺陷进行定位,进而改进质量,提升品牌。”翟立东说,“另外,除了企业自身监测,大数据还能及时了解竞品的相关口碑、报道、评论,掌握相关行业动态以及主要用户市场行为,分析对比竞品表现,从而有效为市场部、营销部、产品部、企业高层决策提供重要的信息参考。”
“对各网络媒体平台进行综合数据分析,这将有利于科研或国家相关部门的资源统计整合工作。”翟立东说,他们正在与社科院谈合作,想从微秘角度设计,讨论分析经济宏观指数的方案。