小议节目监管的实践和特征

时间:2022-01-26 03:23:35

小议节目监管的实践和特征

本文作者:殳雯娟工作单位:江苏省广播电视总台

对互联网视音频监管策略的实践

1.系统概述根据我台监管互联网视听节目的工作任务要求,建设的互联网视音频监管系统,能针对互联网中各种形式的视听节目实现全面发现、分类监控和有效管理,该系统24小时不间断的扫描管辖范围内的互联网网站,利用智能数据分析系统实现最新更新情况、未批网站监控、审批网站监控、重点网站监控、敏感信息、专项任务的专项分析和管理,进而形成相关数据源的有效取证及相关报表,为视听节目方便、快捷的的有效监管提供了可靠的资源和技术保证。2.软件构架系统采用分布式数据采集、分布式数据分析处理、集中式数据存储、浏览器方式显示的整体构架。底层利用爬虫技术,通过智能分析模块对互联网中的网站搜索获取视音频网站的站点和节目信息数据,并存入主数据库中,视音频网站的管理员可通过输入敏感关键字以及IP地址定位等信息用文本检索、视频检索、音频检索的方式对主数据库中的数据进行分析、汇总和统计。系统上层通过B/S架构,以web网页形式将汇总分析后的数据,以用户所需要的形式显示出来,主要表现形式为:最新节目源更新情况、审批网站监控、非审批网站监控、重点网站监控、敏感信息、专项任务、编报信息。视听节目监管系统软件功能架构如下图所示:3.逻辑构架系统从上到下分为4层:应用层、业务逻辑层、数据存储层、数据采集层。应用层实现人机交互,将人为需求通过应用层的WEB网页提交中间服务层,数据通信交换完毕后,显示相应的数据,以完成对任务的处理。业务逻辑层是系统的核心组成部分,主要利用智能分析模块,获得网站信息以及处理视音频结果。网站信息包括网站名称、网站访问数、网站的更新时间、ICP备案号、网站所属城市、第三方网站公布的站点排名等;视音频智能分析通过对视音频的解码、索引、切分、分类、比对、识别、图像分析以及敏感信息发现等,获取分类处理结果。数据采集层和数据存储层,主要提供数据采集以及数据存储的服务。其中数据采集包括网络信息的抓取与网络音视频文件的下载,数据存储包括数据库存储以及文件存储。系统逻辑结构图如下所示:图2逻辑结构图4.网络拓扑图视听节目监控系统硬件设备由服务器、网络设备、监看终端组成。服务器由未批网站搜索服务器群、审批网站搜索服务器、重点网站搜索服务器、web服务器、流媒体下载服务器、视音频分析服务器、数据库服务器组成;网络设备由防火墙、交换机、路由器组成。系统的硬件设备为实现公共信息网络视听节目监控系统提供支持平台,系统网络拓扑图如下图所示:

互联网视听节目监管特点分析

1.快速、高效的专用搜索引擎互联网上的网站和各种资源多不胜数,快捷高效的搜索引擎是整个系统的心脏之所在,是系统运行的能力之源,将直接影响系统的工作效率。我们通过先进的爬虫技术,采用先进的动态调度负载均衡的算法来实现了系统效率和处理能力的模块化扩展。系统采用分布式、并行负载技术,通过多级任务分布可以充分利用计算机资源,搜索引擎24小时不间断的扫描需要监控网络范围的站点,从而找到其中的网络视音频站点,系统支持多站点,多任务爬行的功能,提高对网络资源提取的效率。2.稳定、准确的视听节目智能分析模块视听节目智能分析技术是本项目的重要组成部分,根据互联网上传播的视听节目的特性,提取视听节目的信息数据,包括视听节目的来源网站、视频节目作者、视频节目时间、视频节目标题、视频节目点击数和评论数等各种信息;利用关键字、图像、视音频信息、模版等多种技术组合进行判断,分析出各种视音频站点和视听节目,最大程度地提高监管效率。按照功能,将视听节目智能分析技术分为以下三类:(1)节目类型自动审核技术。从关键词、网页文本、语音内容、图像内容等方面综合进行自动匹对和处理,完成对数据源自动审核,并给出判断的置信度。对于高置信度判断结果(操作员可根据实际情况自行设置),系统可直接读入数据库,以备调取。本技术的特点是能对各类淫秽低俗、反动邪教、涉赌涉毒等明显违规节目进行快速、准确的自动判断。(2)辅助人工审核技术。对于无明显违规的视听节目,系统判别置信度较低,此类节目会通过列表的方式显示,供人工确认审核,进一步去重或者存入库。本技术弥补了自动识别的弱点,排除了错监、漏监的可能性,提高了系统分析的准确性。(3)管理视听节目库。对历史节目库进行综合管理,添加、删除各类信息,以保证节目库的完整性和准确性,同时对长期未使用节目数据进行清理,去除数据冗余,以便高效的完成检索功能。系统硬件结构搭建简单,软件系统成熟稳定,高效的搜索技术使系统运行方便快捷,先进的智能分析技术使系统稳定可靠,模块化程度大幅提高,可拓展性大幅加强,可由多个客户端同时操作管理,提高了操作效率,为互联网视听节目监管提供了有效的保障。