科技風: 12/23/18

2018年12月23日星期日

【2018 AI 發展總整理】帶你了解 AI 的 5 大領域進展，各種開放原始碼任你取用

Posted on2018/12/22

https://buzzorange.com/techorange/2018/12/22/ai-breakthrough-in-2018/

2018 ，仍是 AI 領域激動人心的一年。

這一年成為 NLP（Natural Language Processing，自然語言處理）研究的分水嶺，各種突破接連不斷；

CV（Computer Vision，電腦視覺）領域同樣精采紛呈，與四年前相比GAN（Generative Adversarial Network，生成對抗網路）生成的假臉逼真到讓人不敢相信；

新工具、新框架的出現，也讓這個領域的明天特別讓人期待。

報告共涉及了五個主要部分：
自然語言處理（NLP）
電腦視覺（CV）
工具和庫
強化學習（RL）
AI 道德

自然語言處理（NLP）

詳細的說明可以讀他們的論文
Fast.ai 網站上放出了訓練腳本、模型

這裡有 ELMo 的更多介紹和資源

如果你還沒有讀過 BERT 的論文，真的應該在 2018 年結束前補完這一課。
另外，Google 官方開源了訓練代碼和預訓練模型。
如果你是 PyTorch 黨，也不怕。這裡還有官方推薦的 PyTorch 重實現和轉換腳本。

PyText 基於 PyTorch ，能夠加速從研究到應用的進度，從模型的研究到完整實施只需要幾天時間。框架裡還包含了一些預訓練模型，可以直接拿來處理文本分類、序列標註等任務。

想試試？開源地址在此

■ Duplex
如果前面這些研究對你來說都太抽象的話， Duplex 則是 NLP 進展的最生動例證。

名字有點陌生？不過這個產品你一定聽說過，它就是 Google 在 2018 年 I/O 開發者大會上展示的「打電話 AI」。

它能主動打電話給美髮店、餐館預約服務，全程流暢交流，簡直以假亂真。Google 董事長 John Hennessy 後來稱之為「非凡的突破」，還說：「在預約領域，這個 AI 已經通過了圖靈測試」。

Duplex 在多輪對話中表現出的理解能力、合成語音的自然程度，都是 NLP 目前水平的體現。

電腦視覺（CV）

研究論文

延伸閲讀：
驚！史上最佳 GAN 現身，超真實 AI 假照片，行家們都沸騰了
訓練史上最佳 GAN 用了 512 塊 TPU，一作自述：這不是算法進步，是算力進步
史上最強 GAN：訓練費 10 萬起，現在免費體驗，畫風鬼畜又逼真

Fast.ai 團隊只用了 16 個 AWS 雲實例，每個實例搭載 8 塊英偉達 V100 GPU ，結果比 Google 用 TPU Pod 在斯坦福 DAWNBench 測試上達到的速度還要快 40%。

這樣拔群的成績，成本價只需要 40 美元（約 1200 元新台幣）， Fast.ai 在博客中將其稱作人人可實現。

Fast.ai 博客介紹

延伸閲讀：
40 美元 18 分鐘訓練整個 ImageNet！人人可實現
224 秒！ImageNet 上訓練 ResNet-50 最佳戰績出爐，索尼下血本破紀錄

■ vid2vid 技術今年 8 月，英偉達和 MIT 的研究團隊高出一個超逼真高解析影片生成 AI。

只要一幅動態的語義地圖，就可獲得和真實世界幾乎一模一樣的影片。換句話說，只要把你心中的場景勾勒出來，無需實拍，電影級的影片就可以自動 P 出來：

好消息， vid2vid 現已被英偉達開源。

研究論文
GitHub 地址

延伸閲讀：
真實到可怕！英偉達 MIT 造出馬良的神筆
一文看盡深度學習這半年

今年，機器學習領域的工具和框架仍在快速的發展，下面就是這方面的總結和展望。

■ PyTorch 1.0

根據 10 月 GitHub 發佈的 2018 年度報告， PyTorch 在增長最快的開源項目排行上，名列第二。也是唯一入圍的深度學習框架。

作為谷歌 TensorFlow 最大的「勁敵」， PyTorch 其實是一個新兵， 2017 年 1 月 19 日才正式發佈。 2018 年 5 月， PyTorch 和 Caffe2 整合，成為新一代 PyTorch 1.0 ，競爭力更進一步。

相較而言， PyTorch 速度快而且非常靈活，在 GitHub 上有越來越多的開碼都採用了 PyTorch 框架。可以預見，明年 PyTorch 會更加普及。

至於 PyTorch 和 TensorFlow 怎麼選擇？在我們之前發過的一篇報導裡，不少大老站 PyTorch。

實際上，兩個框架越來越像。前 Google Brain 深度學習研究員 Denny Britz 認為，大多數情況下，選擇哪一個深度學習框架，其實影響沒那麼大。

PyTorch 官網

延伸閲讀：
PyTorch 還是 TensorFlow？這有一份新手指南
嘗鮮 PyTorch 1.0 必備伴侶
TensorFlow 王位不保？ICLR 投稿論文 PyTorch 出鏡率快要反超了

■ AutoML
很多人將 AutoML 稱為深度學習的新方式，認為它改變了整個系統。有了 AutoML，我們就不再需要設計複雜的深度學習網絡。

這個庫的作者是美國德州農工大學（Texas A&M University）助理教授胡俠和他的兩名博士生：金海峰、 Qingquan Song 。 Auto Keras 直擊谷歌 AutoML 的三大缺陷：

第一，得付錢。
第二，因為在雲端上，還得配置 Docker 容器和 Kubernetes 。
第三，服務商 Google 保證不了你的數據安全和隱私。

官網
GitHub

延伸閲讀：
一文看懂深度學習新王者「AutoML」
開源的"谷歌 AutoML 殺手"來了
谷歌放大招！全自動訓練 AI 無需寫代碼，全靠剛發佈的 Cloud AutoML

■ TensorFlow.js今年 3 月底的 TensorFlow 開發者會峰會 2018 上， TensorFlow.js 正式發佈。

谷歌還給了幾個 TensorFlow.js 的應用案例。比如借用你的攝影機，來玩經典遊戲：吃豆人（Pac-Man）。

官網

延伸閲讀：
有筆記本就能玩的體感遊戲！TensorFlow.js 實現體感格鬥教程
谷歌 AI 魔鏡：看你手舞足蹈，就召喚出 8 萬幅照片學你跳
我不是偷拍的變態，只是在找表情包的本尊

強化學習（RL）

■ OpenAI 的強化學習入門教程全無機器學習基礎的人類，現在也可以迅速上手強化學習。

11 月初， OpenAI 發佈了強化學習入門教程： Spinning Up 。從一套重要概念，到一系列關鍵演算法實現代碼，再到熱身練習，每一步都以清晰簡明為上，全程站在初學者角度。

團隊表示，目前還沒有一套比較通用的強化學習教材， RL 領域只有一小撮人進得去。這樣的狀態要改變啊！因為強化學習真的很有用。

教程入口
GitHub 傳送門

延伸閲讀：
強化學習如何入門？看這篇文章就夠了
人人能上手：OpenAI 發射初學者友好的強化學習教程 | 代碼簡約易懂
強化學習算法 Q-learning 入門：教電腦玩"抓住芝士"小遊戲

■ 谷歌的強化學習新框架「多巴胺」
Dopamine（多巴胺），這是谷歌今年 8 月發佈的強化學習開源框架，基於TensorFlow

另外，還有一組 Dopamine 的教學 colab 。

Dopamine 谷歌博客
Dopamine github 下載
colabs
遊戲訓練可視化網頁

■ 2019 趨勢展望
DataHack Summit 2018 發言人、 ArxivInsights 創始人 Xander Steenbrugge ，也是一名強化學習專家，以下是來自他的總結和展望。

1、由於輔助學習任務越來越多，增加了稀疏的外在獎勵，樣本的複雜性將繼續提高。在非常稀疏的獎勵環境中，效果非常好。

2、正因如此，直接在物理世界訓練將越來越可行，替代當前大多先在虛擬環境中訓練的方法。我預測 2019 年，會出現第一個只由深度學習訓練，沒有人工參與而且表現出色的機器人 demo 出現。

3、在 DeepMind 把 AlphaGo 的故事延續到生物領域之後（AlphaFold），我相信強化學習將逐步在學術領域外創造實際的商業價值。例如新藥探索、電子晶片架構優化、車輛等等。

4、強化學習會有一個明顯的轉變，以前在訓練數據上測試智能體的行為將不再視為「允許」。泛化指標將成為核心，就像監督學習一樣。

AI 道德

AI 被濫用事故在 2018 年被頻頻爆出： Facebook AI 幫助川普當選美國總統、Google 與美國軍方聯手開發 AI 武器、微軟為移民和海關執法局（ICE）提供雲端計算和人臉識別服務。

每一次事故都會重新掀起一波對 AI 道德準則的討論高潮，一些矽谷科技公司也再次期間制定了企業 AI 準則。

Analytics Vidhya 認為， AI 道德現在還是一個灰色地帶，目前還沒有所有人可以遵循的框架， 2019 年將有更多企業和政府制定相關條例。

AI 道德規範的制定，現在才剛剛起步。

延伸閲讀：
谷歌將禁止 AI 用於武器，李飛飛等"反對與軍方合作"事件始末
剛剛，Google 發佈 AI 七原則：不開發武器，但會繼續與軍方合作
AI 助特朗普當選？FB 史上最大數據濫用曝光，牽出 ACL 終身獎得主

訂閱：文章 (Atom)

科技風

2018年12月23日星期日

【2018 AI 發展總整理】帶你了解 AI 的 5 大領域進展，各種開放原始碼任你取用

自然語言處理（NLP）

電腦視覺（CV）

強化學習（RL）

AI 道德

順口溜 :最近有什麼不開心的事

既有文章

Vital CRM影音教學目錄

2018年12月23日 星期日

【2018 AI 發展總整理】帶你了解 AI 的 5 大領域進展，各種開放原始碼任你取用

自然語言處理（NLP）

電腦視覺（CV）

強化學習（RL）

AI 道德

順口溜 :最近有什麼不開心的事

2018年12月23日星期日