智能算法|人机协同时代,记者要警惕失去感性

来源|全媒派
作者|腾讯传媒
随着AR、AI等智能技术的发展 , 新闻生产与传播中也越来越多应用到了这些功能 , 传统的新闻组织架构和生产模式则进一步遭受冲击 。 经历剧变的新闻业展现出哪些新面貌?机器与人如何协同分工?未来的生产模式将是怎样的?作为新闻从业者 , 我们又该适应什么、警惕什么?
智能技术+新闻生产的4类主要应用
智能技术在新闻当中的应用场景可能要超出大家的想象 。 现在比较成熟的应用 , 可以分为语音类、语义类、图像类 , 以及一个比较综合的数据洞察类 。
语音类在新闻生产中的应用 , 典型如虚拟主持人 , 大家都听说过 。 新华社推出过虚拟主持人 , 央视也有外貌、声音都像康辉的虚拟主持人 , 后台运用到的就是语音合成技术 。 现在的语音合成技术已经可以做到跟真人声音几乎一样 。 上观新闻APP上的每一篇文章都带语音阅读输出功能 , 你点一下按钮 , 就有人工合成的声音把文章念出来 , 不方便看文章时可以用听的方式 。

智能算法|人机协同时代,记者要警惕失去感性
本文图片


语义智能技术 , 如机器人写作 , AI通过对知识库的学习、合成、分析 , 可以生成稿件 。 机器人写作有两种模式 , 一种是原生类的文章 , 比如说写诗 , 写一些速报类的新闻 , 以及报道地震和体育赛事这些 。 还有一些就是聚合类的新闻 , 比如说话题盘点、热门新闻回顾 。 现在有一些网络小说 , 也是这样写出来的 , 当然小说不属于新闻 , 只是类似的内容生产都可以通过AI完成 。
语义类在新闻生产当中还有一个很广泛的应用是智能审核 , 可以通过上下文进行审核 , 更多还是关键词的直接识别 。 智能审核不光是算法分发平台在运用 , 很多传统媒体的App、网站都在用 。 还有基于文字的智能分类、智能标签 , 都是语义类的应用 。
另一类应用大家可能没什么太大的感觉 , 就是图片识别、人脸识别 。 在新闻业当中 , 尤其是一些图片社中 , 其实是被大量应用的 。 比如说 , 视觉中国就运用了大量智能识别的技术 。 一些聚合类新闻平台也用人工智能配图 , 大大提高了编辑的效率 。
图片类的智能应用在新闻产品里面也有出现 。 比如《人民日报》几年前做的军装照H5 , 今年新中国成立70周年 , 它又做了一个民族服装换脸的产品 , 可以选择不同民族的服装 , 把自己的头像换上去 。 这个技术不是它自己开发的 , 用的是腾讯的天天P图的API接口 , 其背后就是图片识别和图片合成的技术 。

智能算法|人机协同时代,记者要警惕失去感性
本文图片


如今现在很火的Deepfake , 在视频里就可以把自己的脸换上去 。 《人民日报》今年也做了一个产品 , 叫做“70年 , 我是主角” , 由杨洋主演 , 你可以把杨洋的脸换成你自己的 。 这个产品不光有人脸识别的技术 , 还有融合生成的技术 。
数据洞察类 , 我们可以说它是基于大量数据的特征提取 , 可以给机器一个算法 , 让它去自动学习 , 找出规律 。 比如很多平台会分析读者的行为数据 , 算法推荐就是数据洞察类的应用 。 在数据新闻的生产里 , 我们也会用到 。 上观新闻做了一个干部人事的数据库 , 可以自动收集政府网站上公开的一些人事变动 , 也可以基于采访人员提出的模型对这些人事变动进行一些比较和分析 。
还有一些评论的情绪识别、情绪倾向分析 , 在一类叫作舆情分析类的产品中也是有很多应用的 。
所以 , 按照人工智能技术的应用类别去看平时接触到的新闻产品的话 , 你会发现它在前后台都在被广泛应用 。
【智能算法|人机协同时代,记者要警惕失去感性】机器与人:难以互替的角色
在新闻生产当中 , 如果要去仔细分别角色的差异 , 其实有的时候是很难的 。 但我觉得基本上人工很难被机器取代 。 机器的很多操作要基于人先天的一些工作 。 比如说图片的智能识别 , 需要对机器进行名为“监督学习”的训练 , 人工先对图片打标签 , 然后再训练机器通过人打的标签进行识别 。
还有一种倒过来 , 机器跑很大的数据 , 自己跑出一些特征来 。 但是机器不知道这些特征是什么 , 有什么用 , 需要人来做进一步的分析、总结 。
简单来说 , 机器基本上不能从事创造性的工作 , 人基本上不能从事大数据量的计算 。 所以一般大计算量的工作由机器承担 , 创造性的、逻辑性的工作就由人来承担 。
所以机器不能取代人 , 人也取代不了机器 。 当然 , 有一些简单的重复性工作 , 比如改错别字、简单的排版分段等 , 可以由机器来做 , 但是新闻生产当中大部分工作还是不能被机器取代的 。
如何厘清机器的真实性和优质性问题
机器其实是不会造假的 , 或者说它没有故意造假的能力 。
如果出现了真实性的问题 , 那么第一 , 它是在数据的使用当中出现了问题;其次就是我们人的模型或者是人的算法出现了问题 。

智能算法|人机协同时代,记者要警惕失去感性
本文图片


实际上 , AI反而被应用到fact check中 。 如果我们先通过人工标签设定某一种差异值就意味着撒谎的话 , 机器比人更容易在海量的数据里发现谎言 。 杜克大学有一个AI应用叫ClaimBuster , 它用机器学习的方法来跑美国总统辩论的内容 , 可以在几万条陈述中辨别需要核实的事实性声明 。
如果我们把虚拟也称为智能的话 , Deepfake换脸或者VR其实就是机器做出来的虚拟信息 。 怎么判断虚拟的信息是真实的还是完全虚假的 , 这确实会带来很大的伦理问题 。
比如VR的战场报道 , 我在千里之外的地方看到一个士兵开了一枪 , 怎么保证这是真实的?这确实需要从新闻伦理层面去探讨 , 但我觉得目前技术的应用还没到这一步 。
关于优质性的问题 , 现在谈论比较多的是算法推荐 , 即机器推荐的是不是我真实需要的优质内容?
如果大家理解算法的理论基础——贝叶斯方程 , 就知道它计算的是一个相对的概率 , 推荐的结果并不一定是读者最想看的 。 所以 , 即使从纯技术的角度你也不能放弃人在这个过程当中的功能性价值 。 你不能把所有的东西都交给机器 , 因为机器背后的算法是不完善的 , 它不是全知全能的 , 不能扮演上帝的角色 , 它会受很多因素干扰 。 所以这几年我们强调算法也要有价值观 , 一直在用人工干预的方式不断调整算法 。

智能算法|人机协同时代,记者要警惕失去感性
本文图片


但不管是真实性还是优质性 , 目前机器在新闻生产中的介入是非常初步的 , 还是长途旅行中刚开始的那几步 。 你不知道要走到哪个方向去 , 也还没有看到最美好的风景 , 还不能断定说它一定不真实 , 或者一定不优质 。 它就像刚满周岁的婴儿一样 , 外界完全不知道它将成长为什么模样 , 更多还是要去完善它 , 这个路程很长 。
采访人员面临跨学科的挑战
虽然智能技术已有很多应用 , 但它在新闻生产中怎么跟原有的组织架构、生产模式对接呢?
从学科背景来说 , 大部分采访人员其实是文科生 , 计算机知识、数学知识、统计知识等相对都比较薄弱 。 但是智能技术本身是建立在纯计算科学的基础上 , 它是典型的工程学科 。 所以它对知识性的要求更偏工程类 , 这就意味着它是一个跨学科的应用 。
我们碰到两个问题 , 一个问题是原有的新闻生产长久以来都是由人文学科主导 , 那么人文学科的人群怎么去理解智能生产、理解计算机科学的逻辑?
这个需要通过在职的培训、或者通过新闻学科的课程改革进行强化 。 现在国内外很多新闻学院意识到了这一点 , 开始引入一些编程、可视化和人工智能的课程 。
第二个问题是 , 你很难要求一个采访人员既是编程高手 , 同时具有很强的采编素质 , 会采访 , 会写稿子 , 会策划 , 这个要求是不合理的 。 这就意味着智能技术在新闻当中的应用是一个团队化的操作 , 随之而来的便是组织的问题 。 怎么把不同的人聚集在一起 , 把不同人的想法融合到产品当中 。
这几年其实趋势是非常明显的 , 比如《人民日报》作为一个传统媒体 , 其在产品中用到图像识别和算法的技术 , 这背后一定有一个跨专业的团队作为支撑 。
这种协作生产对整个行业的影响是非常大的 , 它意味着组织架构的变迁 , 这种变迁当然不是今天才发生 , 过去从铅与火的时代(传统铅字印刷时代) , 到后来变成电子印刷 , 也发生过类似的变化 , 但可能相对来说那个冲击没有现在这么大 。 因为现在智能技术不只是在传播这一端 , 其在生产的前端就已经介入了 。 最大的挑战还是人才的问题 , 怎么跨专业、跨学科去合作 。

智能算法|人机协同时代,记者要警惕失去感性
本文图片

智能技术时代的新闻生产图景
从经验来看 , 我觉得自己并没有预测对过任何一次未来式的媒体发展 。 在微信诞生之前 , 我无法想象微信这样的东西;在抖音诞生之前 , 也没有办法想象抖音的产生 。 现在你会觉得微信很正常 , 抖音也很正常 , 感觉它们是生下来就有的东西 , 但其实我们仔细想想 , 十年以前这些东西都是没有的 。
所以十年以后 , 新闻生产的模式是怎样的?我很难去想象 , 还有一些想象过很可能没有实现 。 就好像三四年前 , 大家都看好VR , 看好裸眼3D技术 , 看好可穿戴设备 。 但事实上我们看到的是短视频的兴起 , 大家越来越依赖手机设备 。
可以在一些具体的点上做一些判断 。 比如说 , 人工智能技术 , 现在大家觉得这是一个很高大上、很深奥的技术 , 但我相信它在将来的内容生产当中会越来越像Excel一样的工具 , 帮助我们去收集和分析数据 , 去提取里面有特征性的东西 。
大部分采访人员在工作当中有一个习惯 , 收集大量的背景资料 。 我刚工作的时候 , 很多老采访人员收集背景资料还用剪报本 , 把报纸上的文章一篇一篇剪下来 , 用这种非常物理的方式在收集 。 后来有了Excel表之后 , 可以创建自己的资料表格 , 现在可能还会用My SQL等 , 处理更加海量的数据 。
数据洞察方面的算法也有很多 , 可以去类似Github这样的网站上去查开源的软件 。 我们也看到了很多工具化的、便捷的人工智能技术应用 。 比如说做图像识别 , 可以用天天P图这样的API接口 , 没必要自己开发一个东西 。 今后能够用的API非常多 , 能用的开放数据也非常多 。 人工智能会变成一个工具性的东西 。

智能算法|人机协同时代,记者要警惕失去感性
本文图片


其次在交互的界面上 , 人工智能技术会大规模的介入 。 它会提供更多具备互动性、智能化、真实感的东西 , 让你身临其境 。 比如说有游戏产品仿照Pokemon Go , 在一个实景里嵌入虚拟的东西 , 放到现实的环境当中去 , 跟人产生一些游戏交互 , 将来这种技术可能会被广泛地应用 。
再比如虚拟主播 。 现在的虚拟主播基本只有语音合成的功能 , 是不能自己来组织思维的 , 将来虚拟主播可能有更多的功能 , 跟现在人类主播的区别会越来越小 。 此外 , 战地采访人员也可以用虚拟的人物代替 , 从现有的技术来说 , 我觉得这个目标不是太遥远 。
但是 , 让我想象一个完全的人工智能的媒体 , 其实是很难的 。 因为 , 你很难预判机器智能会发展到什么样的程度 , 它到底是一种像人一样综合的智能还是一种比较垂直类的?就只会做这一类事情 , 比如说驾驶、翻译……而媒体其实是非常综合的知识的体现 , 这一点的确需要更多想象力 。
越智能 , 越要注意什么?
要警惕失去直觉 , 或者说人的感性的东西 。 我看到的一个趋势是这个社会的知识越来越量化 , 很多东西可能是基于量化的一种反映 , 它的优点是非常精确 。 人工智能会加强这种趋势 , 因为它的计算很厉害 , 而且它本身是机器 , 不带有价值判断 , 它更关注的是一个统计的结果 , 不管是对特征的提取还是对模型的识别 , 机器学习的本质是基于一种量化的思考模式 。
但是 , 在新闻生产当中 , 或者说新闻业的发展当中 , 我们这些从业者作为人类 , 是一直很关注边缘人群、关注少数人群的利益的 。 如果我们大量依赖机器去观察的话 , 是不是会对这部分人的生活失去感知呢?对媒体人来说 , 新闻还是人文主义的 , 不能失去跟这个社会边边角角直接的联系 。 我在工作中做数据新闻 , 也非常强调除了数据之外 , 采访人员一定要亲身去采访、去体会 。
一位媒体人曾说 , “假如没有对人真正的关切 , 就不能成为采访人员;假如仅仅停留在对人的关切 , 而不是对问题的求解上 , 就不会成为一个好采访人员 。 ”在智能技术的时代 , 我们应保持自我的初心 , 用技术武装自己 , 于传统新闻业的“良夜”高举前行之炬 。
编辑|谢美浴

    推荐阅读