来源|现代出版
作者|陈昌凤、张舒媛
智能算法正在不易觉察地影响着我们的观点和决策 , 以至于影响到现代社会的运行机制 。 在欣欣然于技术推动的进步时 , 我们也不能不时刻保有价值理性 , 突出人的主体、理性、价值和尊严 。 清华大学陈昌凤教授以智能算法运用于新闻生产阶段为例 , 通过分析算法运用的技术路径 , 探讨了其价值逻辑及风险 。
本文图片
以新闻文本的生产为主要目的 , 由机器学习或者神经网络为技术基础生产和分发的新闻被称作算法新闻 。 算法新闻的流程包括三个阶段——数据输入、数据吞吐和新闻产品输出 。 内容生成属于自然语言生成算法领域的一个应用分支 , 基于模板的静态算法和基于上下文的动态算法是主流的自然语言生成方法 。
基于模板的静态算法主要将模板填空式算法作为主流算法 , 最初主要使用在“预定义结构”的填充上 。 预定义结构俗称为“模板” , 类似于完形填空式的内容 , 对于具有预定义结构且只需要填充少量数据的文本可生成一段完整的描述 。 但也正因为“预定义结构” , 其并不被认为是真正的自然语言生成 。 在该方式下 , 无论是句子模板还是词汇模板 , 基本上都来源于人工总结提取 , 并形成固定模板 , 优点在于简单、可控和严谨 , 但模板的丰富性和实时性都很难得到保证 。
基于上下文的动态算法通过上下文语法语义结构信息来动态地创建句子 , 允许系统在语言上以多种方式优化句子 , 包括引用、聚合、排序和添加连接词 , 能够生成更长的内容 。 根据文本的目标人群及个性化信息体系是否完整 , 其可以在“微观层面”生成句子 , 或者在“宏观层面”生成与读者相关、结构良好的有用的叙事性文档 。 近年来 , 主流的基于上下文的动态算法主要包括马尔可夫链、循环神经网络、长短期记忆网络和自注意力模型等 。 这种方式不需要过多的人工干预 , 但也存在不可控性以及前后逻辑矛盾的缺陷 。 为了克服这些缺陷 , 目前大量的研究开始探索如何将人类经验和生成模型结合起来 。
算法运用于新闻生产 , 主要涉及三个方面的价值观问题 。 首先是人在生产中的创造性和主体性 。 基于计算机智能的生产者和研究人员降低了人性 。 算法技术还存在写作模式固定、缺乏举一反三的创造性 , 原生创造力缺失、应对突发情况能力差 , 知识和感知可能无法自洽等缺陷 。 其次是算法的权力关系与道德风险 。 这里有两层权力关系:一层是算法对新闻业的介入引发的“权力迁移” , 算法使权力从公共机构迁移到资本驱动的技术公司;另一层是在人工智能系统的生产过程中 , 存在两种不平衡的权力关系——决策权和技术知识的联手 。 数据驱动型技术的不可解释性、不透明性 , 以及技术人员的价值观和意识形态取向 , 都可能导致算法偏见 。 最后是工具价值与终极价值的矛盾 。 掌握技术的商业公司可能使用户成为被权力工具宰制的对象 , 成为实现其商业化目标的手段 。 此外 , 基于既有数据(包括非理性用户)的智能技术 , 有时会走向反智的一面 , 进而反人类价值观 。 但技术的积极意义在于其使用户认为它代表了一个“良好”社会的价值观 , 也就是不只强调技术的工具理性 , 还应关注技术的价值理性 。
【自然语言处理|陈昌凤 | 新闻生产中算法运用的技术路径与价值逻辑】编辑|谢美浴
推荐阅读
- 公司|科思科技:正在加速推进智能无线电基带处理芯片的研发
- 国家|2022上海国际热处理、工业炉展览会
- 芯片|Exynos 2200 来了!三星官宣 1 月 11 日发布新 Exynos 处理器
- 平板|消息称 ROG Flow Z13 游戏平板搭载锐龙 6000 处理器
- 处理器|AYANEO NEXT 掌机预热:拥有更好手感,探索掌机形体之美
- 硬件|AAEON推出NanoCOM-TGU嵌入式开发板 搭载11代酷睿处理器
- 该机|荣耀畅玩 20 推出新版本:搭载国产处理器,4GB+64GB 存储 799 元
- 消息资讯|污水处理市场-PLC远程监控如何发挥巨大的作用-华辰智通
- 充电|三星携手 AMD:曝 Exynos 2200 处理器CPU 提升 5%、GPU 提升 17%
- 画质|海思越影新一代AI ISP图像处理引擎技术硬核