透過語音落地300家法院這扇窗,一窺阿里雲「產業 AI」的四大特點

2017 年可謂人工智能波瀾壯闊的一年,這一年,我們見證了各種「人機」大戰,也被一次次 PPT 上炫酷的未來場景所震驚,同時又在霍金、馬斯克等人的「警告」中陷入對人類未來命運的絕望中,但所有這些看似炫酷、又聽起來發自肺腑的聲音卻都有意無意遮蓋了一個事實——同時也是人工智能的出發點,那就是

技術應該為人類所用

這恰好也是本週雲棲大會·北京峰會上所傳遞出來的聲音,正如阿里雲的掌舵者胡曉明所言:「人工智能不應僅僅是實驗室裡的、PPT裡的概念上的‘AI’,更是‘產業AI’。」所謂產業 AI,也就是將人工智能(以下簡稱 AI)的相關技術與不同的垂直行業相結合,從而真正實現人工智能新技術(如語音、圖像、自然語言處理)在各個「舊」行業的落地實踐。

事實上,自 2016 年開始,阿里雲就已經在城市交通、工業製造、醫療、金融等垂直行業推動人工智能的落地實施,到了 2017 年,產業 AI 的理念又在智慧法院、智能家居、民航機場調度等行業有了充分展現。

透過語音落地300家法院這扇窗,一窺阿里雲「產業 AI」的四大特點

這其中,智慧法院的產業 AI 實踐頗具代表性。

根據相關媒體報道,阿里雲已經將自身的 AI 技術,尤其是語音技術「滲透」到了 300 多家法院、6000 多個法庭之中,而在此次北京峰會上,阿里雲又和深耕法律信息化二十多年的華宇軟件達成深度合作框架協議,將進一步推進 AI 在法院的落地和普及。

作為政務信息化的一部分,司法行業的信息化一直在有條不紊地進行中,然而過往的技術發展,儘管一定程度上提升了行業效率,但還無法給行業帶來真正意義的改變。那麼,不妨將鏡頭拉近到這 300 家法院裡每個法庭,透過這些落地案例,可以窺見產 AI 實踐中的三大特點。

特點一:新技術與特定場景的融合

以法院法庭為例,長期以來,如何將庭審時的記錄自動化,曾是一件遙不可及的事情。當然,有需求一定會有解決方案,比如就有一些公司將語音識別賣給法院使用,當另一個尷尬的事實是,當一個語音識別系統將一個小時的庭審語音轉化為幾百頁的文本記錄時,不管是原被告雙方現場簽字還是後續的搜索摘錄,反而又成了一件效率低下的事情。

透過語音落地300家法院這扇窗,一窺阿里雲「產業 AI」的四大特點

此時,再炫酷的新技術,倘若無法與特定產業場景的結合,都無法帶來真正的價值。對此,負責阿里巴巴 iDST 語音團隊的鄢志傑表示,這種特定場景下的語音識別,還需要和自然語言理解進行深度整合,比如,可以不可以通過自然語言理解的其他技術,將這些庭審記錄的精華提取出來,這樣不僅能解決了庭審記錄的自動化,還大大減輕了法庭書記員的工作,從而大大提升了法庭的庭審效率。

類似地,如何讓 AI 與工業製造相結合,不僅是考驗包括傳感器、實時數據分析等技術能力,更考驗這些技術如何在製造業工廠現實場景下的應用困難。也因此,在推動工業大腦的過程中,阿里雲的工程師們往往會在車間第一線瞭解不同場景下的技術需求,從而能夠有針對性部署相關技術,畢竟,對於製造業企業而言,不存在所謂非要不可的炫酷技術,而一定需要真正能給企業帶來價值提升的實用技術。

特點二:技術平臺與生態共贏

產業 AI 的落地實施不可能由一家公司完成,需要技術平臺供應商,如阿里雲,與不同垂直行業合作伙伴共同合作努力才能實現。從城市大腦項目的十幾家包括軟硬件的合作伙伴,到工業大腦中與行業龍頭徐工集團共建「徐工工業雲」,阿里雲踐行了技術平臺供應商的義務和責任,在此次智慧法院的落地實施中,華宇軟件成為重要的合作伙伴。

透過語音落地300家法院這扇窗,一窺阿里雲「產業 AI」的四大特點

當記者問及為何選擇阿里雲作為合作伙伴時,華宇軟件全資子公司華宇元典總經理鄒劭坤錶示:相比於某些公司什麼都想獨佔的做法,阿里雲的生態平臺理念更具吸引力。

而從技術公司的發展角度去看,依託技術平臺,共建行業生態的做法也是一個最理性也具有長遠價值的選擇。這意味著,技術平臺公司可以更專注於底層技術的開發和維護,不同行業合作伙伴都可以在這個技術平臺上獲取不同的接口和應用程序,結合自己對行業的理解和標註的知識庫,從而開發行業應用或提供行業專屬服務,其最終結果就是:技術平臺供應商、應用服務開發/提供商、終端企業用戶的三方共贏。

特點三:單點技術突圍後的聯動效應

從技術上看,自 2015 年興起的這波人工智能浪潮並無太大心意,所解決的也是人工智能過往 60 多年裡的幾個難題:語音、圖像和自然語言理解。但這一次技術發展的卻有一個不同,那就是上述幾個技術的爆發幾乎都出現在同一個時間點。

透過語音落地300家法院這扇窗,一窺阿里雲「產業 AI」的四大特點

這一點意義重大。這意味著,當語音、圖像與自然語言理解都到了一定發展階段後,機器智能在某種程度上具有了所謂「能聽、會看以及基本理解」的能力,這些能力與現實場景,尤其是產業場景的整合,所帶來的效果遠遠超過單點技術,如語音、圖像所能產生的價值。

比如在杭州的「城市大腦」蕭山區的 120 救護車優先調度的案例裡,就將圖像識別與自主決策等系統進行了深度整合。這是因為,從 120 接到電話到患者進入醫院,這個過程中涉及到多個交通參與主體,而且交通路況又是隨機、動態變化,如何讓機器自主決策,制定一個最快路線成為關鍵。緊接著,120 救護車上路後,實時的定位和道路上每個攝像頭的實時圖像捕捉,都需要精確計算才能完美實現。

而在智慧法院的推進過程中,正如上文所言,單點語音識別無法解決真實場景下的需求,再結合自然語言理解後所帶來的效率提升已經超過「1+1=2」的效果。更進一步,能不能讓機器成為法官的小助理呢?比如,結合語音(庭審記錄)、文本(筆錄、判決文書)和歷史案例的數據,在阿里雲平臺上調用數據分析、文本挖掘以及機器學習/深度學習的技術,從而讓機器也具有「智能判案」的本領,既能解決法官的時間,又保證了案件審理的公正、透明。

特點四:新技術帶來的人機協同

人與機器的關係是自工業革命以來長期困擾人類社會的問題,人工智能的到來更加劇了這類擔憂。但從技術發展的現狀而言,儘管語音、圖像、自然語言處理發展速度奇快,但這些技術所形成的所謂「智能」,與人類「智能」又本質差異。包括深度學習「教父」級別的 Hinton 也表示無需過度擔憂這個問題。

透過語音落地300家法院這扇窗,一窺阿里雲「產業 AI」的四大特點

我們更應該思考,則是如何實現新一代人機協同,即充分發揮人與機器在不同領域的優勢,實現優勢互補。

今年的雙十一購物節中,阿里巴巴就展現了人機協同的新模式,從機器智能推薦系統、客服機器人「阿里小蜜」、AI設計師「魯班」、機房運維機器人「天巡」,它們與人類員工一起完成各項任務,其結果就是,在不增加人力成本的前提下創造了又一個商業奇蹟,同時也是「有史以來最大規模的人機協同」。

在司法領域,法庭庭審記錄過往都是速記員記錄,書記員審核並做摘要,而在語音識別和自然語言處理的幫助下,從語音識別到摘要生成都實現了自動化、智能化處理;法律行業規則複雜、知識量較多、知識邊界模糊,這種記憶、分類的工作完全可以交給機器,結合深度學習的算法,可以讓機器越來越「懂法」,成為法官們的重要協作夥伴。

寫在最後

正如上文所言,人工智能的各項技術都不是什麼新技術。上世紀 50 年代初,美國喬治敦大學就通過對於語言規則的理解,結合自然語言處理技術,推出一款俄語英語翻譯機;語音識別的最早出現是在上世紀 70 年代,從聲音模型到語言模型,整個語音識別的框架基本形成。

但 60 多年來,一代代的人工智能從業者們卻陷入了「為技術而技術」的漩渦裡。多少次,那些在實驗室裡完美無缺的技術一遇到現實問題就像離開河水的小魚一樣瞬間失去魔力,多少次,當政府、大公司開始減少相關投入,人工智能從業者們或失業、或轉行,人工智能寒冬(AI winter)甚至成了一個專有名詞。

如今,人工智能在經歷了 2016、17 的瘋狂炒作之後,也走到了一個十字路口。放眼全球,過去兩到三年人工智能所取得的成績,不過是海量數據、優質算法與計算能力結合後的特定展現,它當然可以用來炫技,也可以用來與人類對戰,但歷史經驗一次次告訴我們,倘若沒有將人工智能應用在經濟社會的現實挑戰裡,下一次 AI Winter 並不太遙遠。


分享到:


相關文章: