融云音视频审核服务 解决应用对绿色通信的迫切需求

5G商用后 , 语音视频内容的生产非常繁荣 , 网民们的注意力也被各种短视频、直播、语音视频社交等平台吸引 , 这些UGC平台显然成为了新的流量聚集地 。但当流量不再是问题 , UGC平台的音视频内容合规性问题变得日益凸显 。

音频视频内容审查的行业困境

【融云音视频审核服务 解决应用对绿色通信的迫切需求】前几天 , 很多网络应用的音频业务暴露了涉黄、暴力、涉政、违禁等不良内容 。平台成了间接作恶工具 , 面临约谈、整顿、关停等违规处理 , 这给企业造成了难以估量的损失 。而对音视频平台来说 , 针对海量内容逐一审核绝非易事 , 目前主要面临两大行业难题:

首先 , 审核效率低下 。平台作为网络服务提供者 , 视频内容大部分来自于用户上传 , 当用户达到一定基数 , 每天百万甚至千万的视频内容 , 客观上给审核带来了极大困难 。

其次 , 很难发现有害信息 。对于窒息呻吟、骂声识别、垃圾广告、政治、恐怖、特殊标志等不良内容 , 不仅量大 , 类型也不同 , 从中调查这些危险因素需要很高的技术手段 。

为解决行业痛点 , 帮助客户从源头发现并杜绝这类不良信息 , 互联网通信云厂商融云提供的音视频审核服务 , 可高效精准地自动识别违规内容 , 保障平台业务的稳定运营 。特别是平台对新闻和音频有双重审查需求时 , 融云可以帮助企业一站式审查图、文、音、全内容 , 有效解决多种类型、大容量信息难以识别的问题 。同时 , 也帮客户节省了对接第三方审核公司的商务沟通成本 , 以及研发适配所耗用的成本 , 为开发者及各互联网平台构筑起绿色通信的护城河 。

多维度音视频审核能力 , 为不同业务场景提供安全保障

目前 , 融云提供的音视频审核功能主要应用在 1v1、1v多通话场景 , 会议场景以及直播场景 。融云客户在使用CallLib的SDK、RTCLibSDK实现音频通话、在线会议和直播等类型应用后 , 可以将各参加者的音频、视频数据发送到审查服务 , 进行内容审查 。

当企业开通审核功能后 , 融云支持音视频流自动审核 , 审核结果会通过融云的回调服务发送到开发者的应用服务器 。具体来说 , 融云媒体服务器(RTC Server)会把收到的音视频流转码成审核服务需要的格式(RTMP)来送审 , 不需要开发者转码或者截帧再去送审 。启动审查任务后 , 融云可以根据一定的周期和中止事件时将审查结果召回给用户 , 帮助用户简单地分析审查结果 , 开发人员可以根据审查结果决定是否需要切断直播期间的播音员 , 例如踢播音员或禁止播音员 。

图1:融云音频影像审查服务结构

在音频审查功能方面 , 融云提供政治语音识别、喘息语音识别、国歌识别、色情语音识别、辱骂语音识别、垃圾广告识别六个审查维度 。基于Bi-GRU、Attention模型、NAR模型 , 构建混合深度神经网络模型等多种先进手段 , 正确识别各种场景中的政治人物、政治事件、反动分裂、恐怖主义等百馀种政治声音 , 正确识别声音中含有呼吸、呻吟、耳骚、呼吸等违规声音 , 声音中含有色情、俗气、污秽、爱等黄色内容

在视频审查功能方面 , 融云提供政治视频识别、色情视频识别、暴力视频识别、广告视频识别、垃圾广告识别、标志水印识别 。尤其可以实时精准识别和拦截各类场景的手机号、微信、QQ、微博、网址、二维码等各种变体垃圾广告内容 , 并通过高精度LOGO水印检测识别技术 , 支持竞品LOGO检测、涉政LOGO检测 , 维护客户品牌形象 。

融云音视频审查四大优势:正确、灵活、全面、稳定

根据开发人员的使用调查反馈 , 融云音视频审查服务的最大特点是正确 , 不仅审查能力正确 , 而且迅速正确定位问题源 , 缩短问题排查时间 , 同时审查模式灵活 , 支持指定房间、指定用户的审查另外 , 支持半个月的测试时间 , 让客户熟悉和理解相关功能 , 使用安心 。

具体来说 , 融云音像审查服务具有四大技术优势:第一 , 从服务结构来看 , CNN、RNN、GAN、TDN、LSTM等模型深度融合 , 违规识别精度高 , 第二 , 违规态势实时跟踪 , 实时监视舆论趋势 , 动态跟踪违规态势 , 增量模型小时级更新 , 帮助产品快速反复升级 , 第三 , 全面识别数百种涉政暴力图像 , 数十种色情图像 , 各种变体广告图像等违规内容

复合审查服务构建一站式全内容审查能力

在实际应用中 , 融云对图、文、音、视全内容提供双重审查服务 , 重叠IM即时通信审查和音视频审查功能 , 构成联合预防联合的一站式内容审查云服务产品 , 融合云反垃圾和内容安全经验 , 构建系统化、专业化的审查系统

图2:融云IM内容审查服务

融云IM内容审查服务主要包括文本过滤、图像过滤、音频视频文件过滤三种功能 。其中 , 融云的文本过滤具有多语种识别能力 , 支持中文(简繁体)、维语、藏语、英语、日语等 。具有毫秒级响应速度 , 通过机器学习、智能算法、语义分析等多维数据分析 , 识别精度可达95%以上 。

融云图像过滤能力基于融云大量样品库 , 识别精度达到90%以上 , 支持水印、倾斜、扭曲、异体等多种变形文字的提取识别 , 提高垃圾图像过滤的精度 。同时 , 还可以承受一天千万级图像数据的处理 , 支持数据高峰时段的弹性扩张 , 检测结果毫秒级返回 。

融云音频文件过滤能力可承载日平均千万级数据处理 , 支持检测结果以秒速返回的场景化定制、多种模型组合训练 , 提高手机号码图像、IP图像等维度判定 , 识别精度达到98% 。

综上所述 , 融云可以正确过滤文本、照片、声音视频信息和声音视频流中的不良信息 , 有效避免运营风险 , 保证内容平台的健康安全 , 并且该服务提供机械审查和人工审查的双重保障 , 用户可以根据自己的情况同时使用

结语

由于各行各业的通信云应用对绿色通信有着迫切的需求 , 融云的音频视频审查专门为有安全过滤和防范需求的客户设置 。同时 , 音频视频审查功能与其文字审查功能重复审查 , 全面过滤 , 正确识别所有通信形式的内容 , 构成审查闭环的防护系统 , 在解决企业通信内容安全问题的同时 , 使业务运行安心省力 , 节约成本 。

    推荐阅读