2018年12月23日 星期日

【2018 AI 發展總整理】帶你了解 AI 的 5 大領域進展,各種開放原始碼任你取用

2018 AI 發展總整理】帶你了解 AI  5 大領域進展,各種開放原始碼任你取用
Posted on2018/12/22
2018 ,仍是 AI 領域激動人心的一年。
這一年成為 NLPNatural Language Processing,自然語言處理)研究的分水嶺,各種突破接連不斷;
 CVComputer Vision,電腦視覺)領域同樣精采紛呈,與四年前相比GANGenerative Adversarial Network,生成對抗網路)生成的假臉逼真到讓人不敢相信;
新工具、新框架的出現,也讓這個領域的明天特別讓人期待。

報告共涉及了五個主要部分:
自然語言處理(NLP
電腦視覺(CV
工具和庫 
強化學習(RL
AI 道德

自然語言處理(NLP


詳細的說明可以讀他們的 論文 
Fast.ai 
網站 上放出了訓練腳本、模型
這裡  ELMo 的更多介紹和資源
如果你還沒有讀過 BERT  論文 ,真的應該在 2018 年結束前補完這一課。
另外,Google 官方開源了 訓練代碼和預訓練模型 
如果你是 PyTorch 黨,也不怕。這裡還有官方推薦的 PyTorch 重實現和轉換腳本 
PyText 基於 PyTorch ,能夠加速從研究到應用的進度,從模型的研究到完整實施只需要幾天時間。框架裡還包含了一些預訓練模型,可以直接拿來處理文本分類、序列標註等任務。
想試試?開源地址 在此
 Duplex
如果前面這些研究對你來說都太抽象的話, Duplex 則是 NLP 進展的最生動例證。
名字有點陌生?不過這個產品你一定聽說過,它就是 Google  2018  I/O 開發者大會上展示的「打電話 AI」。
它能主動打電話給美髮店、餐館預約服務,全程流暢交流,簡直以假亂真。Google 董事長 John Hennessy 後來稱之為「非凡的突破」,還說:「在預約領域,這個 AI 已經通過了圖靈測試」。
Duplex 在多輪對話中表現出的理解能力、合成語音的自然程度,都是 NLP 目前水平的體現。

電腦視覺(CV

Fast.ai 團隊只用了 16  AWS 雲實例,每個實例搭載 8 塊英偉達 V100 GPU ,結果比 Google  TPU Pod 在斯坦福 DAWNBench 測試上達到的速度還要快 40%
這樣拔群的成績,成本價只需要 40 美元(約 1200 元新台幣), Fast.ai 在博客中將其稱作人人可實現。
 vid2vid 技術 今年 8 月,英偉達和 MIT 的研究團隊高出一個超逼真高解析影片生成 AI
只要一幅動態的語義地圖,就可獲得和真實世界幾乎一模一樣的影片。換句話說,只要把你心中的場景勾勒出來,無需實拍,電影級的影片就可以自動 P 出來:
好消息, vid2vid 現已被英偉達開源。
今年,機器學習領域的工具和框架仍在快速的發展,下面就是這方面的總結和展望。
 PyTorch 1.0
根據 10  GitHub 發佈的 2018 年度報告, PyTorch 在增長最快的開源項目排行上,名列第二。也是唯一入圍的深度學習框架。
作為谷歌 TensorFlow 最大的「勁敵」, PyTorch 其實是一個新兵, 2017  1  19 日才正式發佈。 2018  5 月, PyTorch  Caffe2 整合,成為新一代 PyTorch 1.0 ,競爭力更進一步。
相較而言, PyTorch 速度快而且非常靈活,在 GitHub 上有越來越多的開碼都採用了 PyTorch 框架。可以預見,明年 PyTorch 會更加普及。
至於 PyTorch  TensorFlow 怎麼選擇?在我們之前發過的一篇報導裡,不少大老站 PyTorch
實際上,兩個框架越來越像。前 Google Brain 深度學習研究員 Denny Britz 認為,大多數情況下,選擇哪一個深度學習框架,其實影響沒那麼大。
 AutoML
很多人將 AutoML 稱為深度學習的新方式,認為它改變了整個系統。有了 AutoML,我們就不再需要設計複雜的深度學習網絡。
這個庫的作者是美國德州農工大學(Texas A&M University)助理教授胡俠和他的兩名博士生:金海峰、 Qingquan Song  Auto Keras 直擊谷歌 AutoML 的三大缺陷:
第一,得付錢。
第二,因為在雲端上,還得配置 Docker 容器和 Kubernetes 
第三,服務商 Google 保證不了你的數據安全和隱私。
 TensorFlow.js今年 3 月底的 TensorFlow 開發者會峰會 2018 上, TensorFlow.js 正式發佈。
谷歌還給了幾個 TensorFlow.js 的應用案例。比如借用你的攝影機,來玩經典遊戲:吃豆人(Pac-Man)。

強化學習(RL

 OpenAI 的強化學習入門教程 全無機器學習基礎的人類,現在也可以迅速上手強化學習。
11 月初, OpenAI 發佈了強化學習入門教程: Spinning Up 。從一套重要概念,到一系列關鍵演算法實現代碼,再到熱身練習,每一步都以清晰簡明為上,全程站在初學者角度。
團隊表示,目前還沒有一套比較通用的強化學習教材, RL 領域只有一小撮人進得去。這樣的狀態要改變啊!因為強化學習真的很有用。
 谷歌的強化學習新框架「多巴胺」
Dopamine
(多巴胺),這是谷歌今年 8 月發佈的強化學習開源框架,基於TensorFlow 
另外,還有一組 Dopamine 的教學 colab 
 2019 趨勢展望 
DataHack Summit 2018 
發言人、 ArxivInsights 創始人 Xander Steenbrugge ,也是一名強化學習專家,以下是來自他的總結和展望。
1、由於輔助學習任務越來越多,增加了稀疏的外在獎勵,樣本的複雜性將繼續提高。在非常稀疏的獎勵環境中,效果非常好。
2、正因如此,直接在物理世界訓練將越來越可行,替代當前大多先在虛擬環境中訓練的方法。我預測 2019 年,會出現第一個只由深度學習訓練,沒有人工參與而且表現出色的機器人 demo 出現。
3、在 DeepMind  AlphaGo 的故事延續到生物領域之後(AlphaFold),我相信強化學習將逐步在學術領域外創造實際的商業價值。例如新藥探索、電子晶片架構優化、車輛等等。
4、強化學習會有一個明顯的轉變,以前在訓練數據上測試智能體的行為將不再視為「允許」。泛化指標將成為核心,就像監督學習一樣。

AI 道德

AI 被濫用事故在 2018 年被頻頻爆出: Facebook AI 幫助川普當選美國總統、Google 與美國軍方聯手開發 AI 武器、微軟為移民和海關執法局(ICE)提供雲端計算和人臉識別服務。
每一次事故都會重新掀起一波對 AI 道德準則的討論高潮,一些矽谷科技公司也再次期間制定了企業 AI 準則。
Analytics Vidhya 認為, AI 道德現在還是一個灰色地帶,目前還沒有所有人可以遵循的框架, 2019 年將有更多企業和政府制定相關條例。
AI 道德規範的制定,現在才剛剛起步。

去除圖片浮水印

去除圖片浮水印網址:https://reurl.cc/AjqjOe