决策问题|从围棋到交通:用算法探索城市的精细化治理之路

【编者按】
2021世界人工智能大会7月8日在上海拉开帷幕 。 以“智联世界 众智成城”为主题的本届大会将围绕“AI赋能城市数字化转型”方向 , 探讨人工智能技术创新与产业落地的前沿进展 。
在迈向全球卓越城市的途中 , 上海近年来不断创新实践 , 探索城市精细化治理的新路径 。 城市管理要切实做到“像绣花一样精细” , 需要怎样的“绣花针”?如何持针走线?人工智能和大数据等技术的落地发挥了重要作用 。
2021世界人工智能大会开幕之际 , 澎湃新闻联合上海人工智能研究院推出《算法周刊》创刊号“世界人工智能大会特刊” , 聚焦城市管理“绣花针功夫”背后的人工智能软实力 。
2016年 , 谷歌人工智能机器人AlphaGo约战围棋世界冠军韩国棋手李世石 , 以4:1的总比分取胜 。 也是这一年 , 国内一家刚刚成立的人工智能企业也开始模仿AlphaGo开发一套AI围棋程序 , 看似无用之用 , 实则探索出了一条城市精细化治理之路 。
围棋和交通信号灯调控都是复杂巨系统下的决策问题 。 围棋盘纵横各19条线 , 19×19形成361个交叉点 , 每次落子都是一次决策 。 一横一竖代表一个十字路口 , 两横两竖形成4个路口 , 而城市路网的规模远超于此 。 想象一下 , 如果依靠人工调度交通信号灯 , 极限是几个路口?
实际上 , 在2×2的“井”字型路口情况下 , 人脑思维就难以跟上 , 眼睛只能盯着路口看 , 人为调控信号灯就变得吃力了 。
子怎么落 , 灯怎么控 , 牵一发而动全身 , 都要考量局部和全局决策 。 上海天壤智能科技有限公司通过AI围棋程序磨练技术底层 , 基于深度强化学习的算法模型 , 拟定场景化的调控策略 , 在保持道路畅通的同时最大化单位时间内的道路通行量 。
“从我第一天开始做算法的时候就希望自己做的算法能够智能一点 。 那时候人工智能比较冷门 , 到后来人工智能那么热 , 其实我们的初心没有变 , 就是希望它够帮助人去做更多的事儿 。 ”天壤创始人薛贵荣说 。
门口的野蛮人来了
薛贵荣是人工智能学术人才从学界走向业界的典型之一 。 他是国家科技部云计算专家组成员 , 2006年-2009年担任上海交通大学计算机系副教授 , 研究方向包括信息检索算法、Web挖掘、用户行为分析、迁移学习等 。
走出学术圈后 , 薛贵荣担任了阿里巴巴集团旗下阿里云研究员、阿里妈妈首席数据科学家 , 直到2016年创立天壤 。 看中了上海的营商环境和算法人才 , 2016年 , 天壤落地徐汇滨江 , 那时候西岸智塔(AI Tower)还未开放 , 如今人工智能企业已在此集聚 。
“我们在交大的时候 , 那段时间互联网应该算是技术发展非常快的几年 。 国内以交易、搜索、通信为代表的互联网大厂慢慢出现了 , 当然国外就更厉害了 , 谷歌、亚马逊、Facebook已经慢慢变成国际上非常顶级的互联网企业 。 ”
那时候 , 云计算、大规模分布式计算、海量数据处理技术等互联网基础技术处于井喷状态 , 谷歌发布的Gmail邮箱有1G的存储空间 , 这让做邮箱的人都懵了 。 以谷歌为代表的大规模分布式处理能力改变了以前处理数据的全部思路 , 服务器存储能力增强后海量信息可以存在网上 , 这对当时的薛贵荣冲击很大 。
SIGIR是展示信息检索领域中各种新技术和新成果的重要国际论坛 。 2003年 , 薛贵荣成为国内第一位在这一国际顶级会议上以第一作者发表论文的学者 , 慢慢进入了信息检索圈子 。

决策问题|从围棋到交通:用算法探索城市的精细化治理之路
文章图片

薛贵荣
在上海交大时 , 薛贵荣做出了100万规模的网页搜索索引 , 这是当时他所能做到的最大规模 。 而这已经是非常挑战的一件事了 , 因为没有分布式计算 , 每台服务器都要搭一套系统 , 存储空间也小 , 跑一个实验需要几十台服务器支持数据处理 。
而当时的谷歌已经能做到1000亿规模的网页搜索索引 。 “后来我们总结 , 我们做的工作相当于是个toy problem , 所以他们的文章在我们看来很震撼 。 ”他把这称为“门口的野蛮人来了” 。
为了扩大实验规模 , 薛贵荣动员实验室购置了30台服务器组成集群 , “搞来搞去大概搞到1000万的规模” , 比原先扩大了10倍 。 但谷歌、微软、Facebook的规模实实在在地摆着 , 他们的解法更有实用价值 。 “我自己也觉得再往下做会变成纸上谈兵 , 我也担心学术这一块走偏了 。 ”
不能再这么折腾下去 , 薛贵荣决定一定要把搜索引擎规模做上去 。 2009年 , 阿里巴巴找上门 , 可以为薛贵荣提供1000台服务器 。 “我一听这个东西 , 就觉得终于可以跟谷歌和Facebook这些机构在同样量级上PK了 。 ”
从学界走向业界的那天开始 , 薛贵荣觉得处理问题的方法和手段和以前不一样了 。 花了4年时间 , 2012年在云上搭出了一套搜索平台后 , 阿里搜索框架也换成了这套技术底座 , 这一平台也为一万多个网站提供了搜索和推荐技术 。
AlphaGo这件事有点不一样的味道
回过头来看 , “我们那时候也是真正地体验了一把 。 ”但不安分的薛贵荣发现 , 这离真正的智能还是有差距 , 他更希望用人工智能技术做些事 。 “我一开始就想怎么帮助企业做一个商业大脑 , 让企业在做业务时有一个AI大脑支持分析决策 。 ”
这件事想了一年多 , 碰上了谷歌人工智能机器人AlphaGo约战围棋世界冠军韩国棋手李世石 。 “关于围棋 , 我也想了很多 。 在局部决策上 , 棋子放在哪里我们还能预测 , 但我们想不明白 , 子落下去还能告诉他输赢 。 ”
“这个事儿有点不一样的味道 。 ”2016年3月 , 李世石对阵AlphaGo的最后一场中 , 经过5个小时激战 , 李世石最终执黑不敌机器人AlphaGo , 机器人以4:1的总比分取得了胜利 。
在深度学习已经广泛应用在图像处理之时 , 还从来没有人把它用在决策上 , 而且这是人工智能第一次做到局部和全局决策的统一 , 这对薛贵荣触动很大 。
人工智能包括感知智能和决策智能 , 其中决策智能更具挑战 。 “决策这一块是最难的 , 基本上没有什么好的解法 , 但AlphaGo告诉我们这是可以做到的 。 ”
从感知识别到认知决策 , 人工智能跨了一大步 。 薛贵荣觉得“还是要再往前走一步” , 得跟上时代的步伐 , 把自己所积累的和真正有挑战的问题结合起来 。 这才有了后来天壤的创业故事 。
AlphaGo一时名声大噪 , 我国也涌现出多个人工智能围棋程序玩家 , 包括腾讯AI Lab开发的“绝艺”、清华大学的“神算子” 。 而当时薛贵荣创业的第一个目标也是做一套AI围棋出来 , 他把这项决定称之为“试练” , 团队一头扎入了AlphaGo论文中 。
2018年5月 , 杭州云栖小镇的2050大会有场重头戏 。 来自天壤的AI围棋执白子对战世界围棋冠军朴廷桓 , 激战三小时后 , 朴廷桓认负 。
【决策问题|从围棋到交通:用算法探索城市的精细化治理之路】
决策问题|从围棋到交通:用算法探索城市的精细化治理之路
文章图片

薛贵荣和朴廷桓合影
AI围棋程序相当于超复杂空间下博弈场景的决策问题 , 而这种超越能力的算法也体现了大算力的势头 , 需要通过算力解决智力问题 。
在系统维度 , 天壤搭建了大规模分布式深度强化学习平台 , 实现了大规模GPU上的模拟、训练、模型迭代更新、参数自动调优等 。
从策略上 , 天壤通过创新型的伴随训练方式 , 搭建渐进式的加深网络 , 先从小网络开始训练模型 , 再逐步切换到更大的网络 。 在更快的迭代速度下 , 实现深度神经网络训练 。
“做AI围棋对我的触动还是很大的 。 所有人都以为 , AlphaGo的论文出来了 , 全世界都能做到这件事 , 其实根本不是这样 。 ”薛贵荣说 , 这里面还有很多挑战 。
当时有人说 , “只要有算力就能做出AlphaGo , 还有人说不就是用了一个算法吗?”最终做了一遍AI围棋才发现 , 算力很重要 , 算法很重要 , 数据、系统和细节也很重要 。
围棋盘与城市交通路网
“从我第一天开始做算法的时候就希望自己做的算法能够智能一点 。 那时候人工智能比较冷门 , 到后来人工智能那么热 , 其实我们的初心没有变 , 就是希望它够帮助人去做更多的事儿 。 ”
薛贵荣自己都没想到 , 机缘巧合之下 , 天壤的这套AI围棋程序最后用在了交通信号灯的控制上 。 城市交通路网类似于围棋棋盘 , 信号灯调控和围棋落子都是基于海量数据连续决策 。
想象一下 , 如果依靠人工调度交通信号灯 , 极限是几个路口?天壤开发了一套交通模拟系统用作信控游戏 , 其中包含1×1路口、2×2路口、2×1路口、4×1路口 。 实际上 , 在2×2的“井”字型路口情况下 , 人为调控信号灯就变得吃力了 。

决策问题|从围棋到交通:用算法探索城市的精细化治理之路
文章图片

而现实中的城市道路很可能是100×100的规模 , 这就意味着一万个路口有调控的需求 。 “人脑的思维肯定跟不上 , 再加上每天通行车辆的实时反馈 , 基本上不能有更直观的判断了 , 只能眼睛盯着路口 , 调通了就不管了 , 因为能力有限 。 ”
2018年 , 天壤与杭州交警部门合作 , 项目的第一个试点是天壤要承担杭州城市交通流量50%以上的高架道路 。 团队建立了基于深度强化学习的算法模型 , 拟定场景化的调控策略 , 保持高架道路畅通的同时 , 最大化单位时间内的道路通行量 。
经过天壤团队和杭州交警的反复探索和实践 , AI逐步接管高架道路信号灯 , 接管数量也由早期的55个扩展到100个 , 帮助杭州整体高架道路日常平均提速20% , 通行流量增加15% 。 AI信号灯调控系统上线后不仅提升了信号灯的调控效率 , 也降低了交警工作的人力和时间成本 。
从AI围棋到信号灯调控 , 薛贵荣说 , 一开始花了很大精力去做AI围棋 , 就是想把技术底层磨练出来 。 围棋也好 , 城市交通也好 , 都是复杂巨系统的决策问题 。 子怎么落 , 灯怎么控 , 都要考量局部和全局 。
“围棋里 , 局部空间上可能会争取一个很小的胜利 , 但大局可能全部搞没了 。 但也有可能局部没做好 , 全局布得很好 。 一个是全局布局能力 , 第二个是局部的战斗能力 , 这两个得协同起来 。 ”信号灯的调控也一样 , 牵一发而动全身 , 一个信号灯调控不好 , 就可能导致整片区域瘫痪 。
城市实时车辆究竟有多少?
相比于二三线城市 , 超大型城市的精细化管理之路 , 尤其是在交通治理方面 , 又有哪些不同和难点?薛贵荣说 , 无论是超大型城市还是二三线城市 , 交通治理的关键在于数清实时车辆的底数 , 并且决策反应一定要快 。
信息化的典型特征是数据在线化 。 交通治理的信息化场景中 , 摄像头监测车辆行驶 , 公安指挥大厅调动摄像头观测 , 发现堵点时手调信号灯 。 薛贵荣说 , 今天的交通治理做到了信息化 , 但没做到智能化 , 交通治理普遍停留在“视频靠眼睛看、指挥靠嗓子吼、信控靠手调”的阶段 。
自主发现堵点、自动调控信号灯 , 从信息化走向智能化还要跨越一条鸿沟 。 算法、数据和算力三要素中 , 今天算力基本上都能找得到 , 而做算法就必须先有数据 , 但相比基于数亿人脸数据开展的人脸识别训练 , 像交通治理这样复杂场景下的决策 , 最大的挑战是缺乏数据 , “不要谈大数据了 , 连数据都没有 。 ”训练数据不够 , 就做不到智能 。
如果要调控信号灯 , 最直观的数据是要知道汽车实时在途量 。 每个路口、每个片区实时车辆究竟有多少?高峰和平峰时路上又有多少车?只有数清楚底数 , 才能了解道路通行状况 , 判断堵点位置 , 及时做出最优调度 。 “底数不清 , 做什么事都错了 。 ”
那么如何才能数清楚底数?薛贵荣说 , 不用互联网企业的地图软件 , 也不必添置新设备 , 天壤利用城市本身自有的数据 , 将摄像头卡口数据、公交车和出租车等GPS定位数据融合 。 随后 , 这套实时数据映射到包含2000多个路口的真实路网以及100多万实时车流的宏观交通仿真推演引擎中 , 通过推演得到第一批训练数据和训练模型 。
接下来就是跑一次数据更新一次模型 , 经过几轮迭代 , 薛贵荣把这件事“整通了” , 还发现了个有趣现象:一个城市的最大汽车在途量是汽车保有量的10% 。 以杭州为例 , 杭州汽车保有量300万辆 , 高峰时在途量大约30万辆 , 平峰时20万辆 。
推演引擎还可以探索不同调度策略 , 推演出交通调度大模型 。 相比其他地图软件发现堵点滞后5-10分钟 , 天壤“交通大脑”一分钟内得知堵点 。 天下武功唯快不破 , 一个信号灯周期2-3分钟 , 抢先5-10分钟就意味着抢先两三个周期 。 “如果在几个信号周期里没有适时采取措施 , 堵点就开始蔓延了 。 ”

决策问题|从围棋到交通:用算法探索城市的精细化治理之路
文章图片

去年 , 这套“交通大脑”投放到江西南昌 , 与南昌市交管“135快反机制”联动 , 1分钟发现拥堵 , 3分钟交管到现场 , 5分钟撤离 , 实现突发事件的快速响应及处置 。 目前南昌试验区已实现交通拥堵指数环比下降4% , 主干道10分钟以上的交通事故量环比下降46.44% , 车速环比提高3.67% 。 南昌也成为中国首个从“限行”到“不限行”的标杆城市 。
(本文来自澎湃新闻 , 更多原创资讯请下载“澎湃新闻”APP)

    推荐阅读