從圍棋到交通：用算法探索城市的精細化治理之路

　　[文章轉自新華報業網]

　　2021世界人工智能大會7月8日在上海拉開帷幕。以「智聯世界眾智成城」為主題的本屆大會將圍繞「AI賦能城市數字化轉型」方向，探討人工智能技術創新與產業落地的前沿進展。

　　在邁向全球卓越城市的途中，上海近年來不斷創新實踐，探索城市精細化治理的新路徑。城市管理要切實做到「像繡花一樣精細」，需要怎樣的「繡花針」？如何持針走線？人工智能和大數據等技術的落地發揮了重要作用。

　　2021世界人工智能大會開幕之際，澎湃新聞聯合上海人工智能研究院推出《算法週刊》創刊號「世界人工智能大會特刊」，聚焦城市管理「繡花針功夫」背後的人工智能軟實力。

　　2016年，谷歌人工智能機器人AlphaGo約戰圍棋世界冠軍韓國棋手李世石，以4：1的總比分取勝。也是這一年，國內一家剛剛成立的人工智能企業也開始模仿AlphaGo開發一套AI圍棋程序，看似無用之用，實則探索出了一條城市精細化治理之路。

　　圍棋和交通信號燈調控都是複雜巨系統下的決策問題。圍棋盤縱橫各19條線，19×19形成361個交叉點，每次落子都是一次決策。一橫一豎代表一個十字路口，兩橫兩豎形成4個路口，而城市路網的規模遠超於此。想像一下，如果依靠人工調度交通信號燈，極限是幾個路口？

　　實際上，在2×2的「井」字型路口情況下，人腦思維就難以跟上，眼睛只能盯著路口看，人為調控信號燈就變得吃力了。

　　子怎麼落，燈怎麼控，牽一髮而動全身，都要考量局部和全局決策。上海天壤智能科技有限公司通過AI圍棋程序磨練技術底層，基於深度強化學習的算法模型，擬定場景化的調控策略，在保持道路暢通的同時最大化單位時間內的道路通行量。

　　「從我第一天開始做算法的時候就希望自己做的算法能夠智能一點。那時候人工智能比較冷門，到後來人工智能那麼熱，其實我們的初心沒有變，就是希望它夠幫助人去做更多的事兒。」天壤創始人薛貴榮說。

　　門口的野蠻人來了

　　薛貴榮是人工智能學術人才從學界走向業界的典型之一。他是科學技術部雲計算專家組成員，2006年-2009年擔任上海交通大學計算機系副教授，研究方向包括信息檢索算法、Web挖掘、用戶行為分析、遷移學習等。

　　走出學術圈後，薛貴榮擔任了阿里巴巴集團旗下阿里雲研究員、阿里媽媽首席數據科學家，直到2016年創立天壤。看中了上海的營商環境和算法人才，2016年，天壤落地徐匯濱江，那時候西岸智塔（AI Tower）還未開放，如今人工智能企業已在此集聚。

　　「我們在交大的時候，那段時間互聯網應該算是技術發展非常快的幾年。國內以交易、搜索、通信為代表的互聯網大廠慢慢出現了，當然國外就更厲害了，谷歌、亞馬遜、Facebook已經慢慢變成國際上非常頂級的互聯網企業。」

　　那時候，雲計算、大規模分佈式計算、海量數據處理技術等互聯網基礎技術處於井噴狀態，谷歌發佈的Gmail郵箱有1G的存儲空間，這讓做郵箱的人都懵了。以谷歌為代表的大規模分佈式處理能力改變了以前處理數據的全部思路，服務器存儲能力增強後海量信息可以存在網上，這對當時的薛貴榮衝擊很大。

　　SIGIR是展示信息檢索領域中各種新技術和新成果的重要國際論壇。2003年，薛貴榮成為國內第一位在這一國際頂級會議上以第一作者發表論文的學者，慢慢進入了信息檢索圈子。

　　薛貴榮

　　在上海交大時，薛貴榮做出了100萬規模的網頁搜索索引，這是當時他所能做到的最大規模。而這已經是非常挑戰的一件事了，因為沒有分佈式計算，每台服務器都要搭一套系統，存儲空間也小，跑一個實驗需要幾十台服務器支持數據處理。而當時的谷歌已經能做到1000億規模的網頁搜索索引。「後來我們總結，我們做的工作相當於是個toy problem，所以他們的文章在我們看來很震撼。」他把這稱為「門口的野蠻人來了」。

　　為了擴大實驗規模，薛貴榮動員實驗室購置了30台服務器組成集群，「搞來搞去大概搞到1000萬的規模」，比原先擴大了10倍。但谷歌、微軟、Facebook的規模實實在在地擺著，他們的解法更有實用價值。「我自己也覺得再往下做會變成紙上談兵，我也擔心學術這一塊走偏了。」

　　不能再這麼折騰下去，薛貴榮決定一定要把搜索引擎規模做上去。2009年，阿里巴巴找上門，可以為薛貴榮提供1000台服務器。「我一聽這個東西，就覺得終於可以跟谷歌和Facebook這些機構在同樣量級上PK了。」

　　從學界走向業界的那天開始，薛貴榮覺得處理問題的方法和手段和以前不一樣了。花了4年時間，2012年在雲上搭出了一套搜索平台後，阿里搜索框架也換成了這套技術底座，這一平台也為一萬多個網站提供了搜索和推薦技術。

　　AlphaGo這件事有點不一樣的味道

　　回過頭來看，「我們那時候也是真正地體驗了一把。」但不安分的薛貴榮發現，這離真正的智能還是有差距，他更希望用人工智能技術做些事。「我一開始就想怎麼幫助企業做一個商業大腦，讓企業在做業務時有一個AI大腦支持分析決策。」

　　這件事想了一年多，碰上了谷歌人工智能機器人AlphaGo約戰圍棋世界冠軍韓國棋手李世石。「關於圍棋，我也想了很多。在局部決策上，棋子放在哪裡我們還能預測，但我們想不明白，子落下去還能告訴他輸贏。」

　　「這個事兒有點不一樣的味道。」2016年3月，李世石對陣AlphaGo的最後一場中，經過5個小時激戰，李世石最終執黑不敵機器人AlphaGo，機器人以4：1的總比分取得了勝利。

　　在深度學習已經廣泛應用在圖像處理之時，還從來沒有人把它用在決策上，而且這是人工智能第一次做到局部和全局決策的統一，這對薛貴榮觸動很大。

　　人工智能包括感知智能和決策智能，其中決策智能更具挑戰。「決策這一塊是最難的，基本上沒有什麼好的解法，但AlphaGo告訴我們這是可以做到的。」

　　從感知識別到認知決策，人工智能跨了一大步。薛貴榮覺得「還是要再往前走一步」，得跟上時代的步伐，把自己所積累的和真正有挑戰的問題結合起來。這才有了後來天壤的創業故事。

　　AlphaGo一時名聲大噪，我國也湧現出多個人工智能圍棋程序玩家，包括騰訊AI Lab開發的「絕藝」、清華大學的「神算子」。而當時薛貴榮創業的第一個目標也是做一套AI圍棋出來，他把這項決定稱之為「試練」，團隊一頭扎入了AlphaGo論文中。

　　2018年5月，杭州雲棲小鎮的2050大會有場重頭戲。來自天壤的AI圍棋執白子對戰世界圍棋冠軍朴廷桓，激戰三小時後，朴廷桓認負。

　　薛貴榮和朴廷桓合影

　　AI圍棋程序相當於超複雜空間下博弈場景的決策問題，而這種超越能力的算法也體現了大算力的勢頭，需要通過算力解決智力問題。在系統維度，天壤搭建了大規模分佈式深度強化學習平台，實現了大規模GPU上的模擬、訓練、模型迭代更新、參數自動調優等。

　　從策略上，天壤通過創新型的伴隨訓練方式，搭建漸進式的加深網絡，先從小網絡開始訓練模型，再逐步切換到更大的網絡。在更快的迭代速度下，實現深度神經網絡訓練。

　　「做AI圍棋對我的觸動還是很大的。所有人都以為，AlphaGo的論文出來了，全世界都能做到這件事，其實根本不是這樣。」薛貴榮說，這裡面還有很多挑戰。

　　當時有人說，「只要有算力就能做出AlphaGo，還有人說不就是用了一個算法嗎？」最終做了一遍AI圍棋才發現，算力很重要，算法很重要，數據、系統和細節也很重要。

　　圍棋盤與城市交通路網

　　「從我第一天開始做算法的時候就希望自己做的算法能夠智能一點。那時候人工智能比較冷門，到後來人工智能那麼熱，其實我們的初心沒有變，就是希望它夠幫助人去做更多的事兒。」

　　薛貴榮自己都沒想到，機緣巧合之下，天壤的這套AI圍棋程序最後用在了交通信號燈的控制上。城市交通路網類似於圍棋棋盤，信號燈調控和圍棋落子都是基於海量數據連續決策。

　　想像一下，如果依靠人工調度交通信號燈，極限是幾個路口？天壤開發了一套交通模擬系統用作信控遊戲，其中包含1×1路口、2×2路口、2×1路口、4×1路口。實際上，在2×2的「井」字型路口情況下，人為調控信號燈就變得吃力了。

　　而現實中的城市道路很可能是100×100的規模，這就意味著一萬個路口有調控的需求。「人腦的思維肯定跟不上，再加上每天通行車輛的實時反饋，基本上不能有更直觀的判斷了，只能眼睛盯著路口，調通了就不管了，因為能力有限。」2018年，天壤與杭州交警部門合作，項目的第一個試點是天壤要承擔杭州城市交通流量50%以上的高架道路。團隊建立了基於深度強化學習的算法模型，擬定場景化的調控策略，保持高架道路暢通的同時，最大化單位時間內的道路通行量。

　　經過天壤團隊和杭州交警的反覆探索和實踐，AI逐步接管高架道路信號燈，接管數量也由早期的55個擴展到100個，幫助杭州整體高架道路日常平均提速20%，通行流量增加15%。AI信號燈調控系統上線後不僅提升了信號燈的調控效率，也降低了交警工作的人力和時間成本。

　　從AI圍棋到信號燈調控，薛貴榮說，一開始花了很大精力去做AI圍棋，就是想把技術底層磨練出來。圍棋也好，城市交通也好，都是複雜巨系統的決策問題。子怎麼落，燈怎麼控，都要考量局部和全局。

　　「圍棋裡，局部空間上可能會爭取一個很小的勝利，但大局可能全部搞沒了。但也有可能局部沒做好，全局布得很好。一個是全局佈局能力，第二個是局部的戰鬥能力，這兩個得協同起來。」信號燈的調控也一樣，牽一髮而動全身，一個信號燈調控不好，就可能導致整片區域癱瘓。

　　城市實時車輛究竟有多少？

　　相比於二三線城市，超大型城市的精細化管理之路，尤其是在交通治理方面，又有哪些不同和難點？薛貴榮說，無論是超大型城市還是二三線城市，交通治理的關鍵在於數清實時車輛的底數，並且決策反應一定要快。

　　信息化的典型特徵是數據在線化。交通治理的信息化場景中，攝像頭監測車輛行駛，公安指揮大廳調動攝像頭觀測，發現堵點時手調信號燈。薛貴榮說，今天的交通治理做到了信息化，但沒做到智能化，交通治理普遍停留在「視頻靠眼睛看、指揮靠嗓子吼、信控靠手調」的階段。

　　自主發現堵點、自動調控信號燈，從信息化走向智能化還要跨越一條鴻溝。算法、數據和算力三要素中，今天算力基本上都能找得到，而做算法就必須先有數據，但相比基於數億人臉數據開展的人臉識別訓練，像交通治理這樣複雜場景下的決策，最大的挑戰是缺乏數據，「不要談大數據了，連數據都沒有。」訓練數據不夠，就做不到智能。

　　如果要調控信號燈，最直觀的數據是要知道汽車實時在途量。每個路口、每個片區實時車輛究竟有多少？高峰和平峰時路上又有多少車？只有數清楚底數，才能瞭解道路通行狀況，判斷堵點位置，及時做出最優調度。「底數不清，做什麼事都錯了。」

　　那麼如何才能數清楚底數？薛貴榮說，不用互聯網企業的地圖軟件，也不必添置新設備，天壤利用城市本身自有的數據，將攝像頭卡口數據、公交車和出租車等GPS定位數據融合。隨後，這套實時數據映射到包含2000多個路口的真實路網以及100多萬實時車流的宏觀交通仿真推演引擎中，通過推演得到第一批訓練數據和訓練模型。

　　接下來就是跑一次數據更新一次模型，經過幾輪迭代，薛貴榮把這件事「整通了」，還發現了個有趣現象：一個城市的最大汽車在途量是汽車保有量的10%。以杭州為例，杭州汽車保有量300萬輛，高峰時在途量大約30萬輛，平峰時20萬輛。

　　推演引擎還可以探索不同調度策略，推演出交通調度大模型。相比其他地圖軟件發現堵點滯後5-10分鐘，天壤「交通大腦」一分鐘內得知堵點。天下武功唯快不破，一個信號燈週期2-3分鐘，搶先5-10分鐘就意味著搶先兩三個週期。「如果在幾個信號週期裡沒有適時採取措施，堵點就開始蔓延了。」

　　去年，這套「交通大腦」投放到江西南昌，與南昌市交管「135快反機制」聯動，1分鐘發現擁堵，3分鐘交管到現場，5分鐘撤離，實現突發事件的快速響應及處置。目前南昌試驗區已實現交通擁堵指數環比下降4%，主幹道10分鐘以上的交通事故量環比下降46.44%，車速環比提高3.67%。南昌也成為中國首個從「限行」到「不限行」的標桿城市。（作者：澎湃新聞記者張靜）