^
top
2018 IEKTopics|人工智慧大躍進 機器將與人類共生共榮

人工智慧多元發展
機器學習成為市場主流

「機器學習」屬於人工智慧分支技術之一。過去人類分析資料時,透過資料觀察定義規則,並集結規則寫成程式後,藉自動化執行提高對資料的處理效率。然現代面對天量數據,透過觀察找出規則本已不易,將為數眾多規則化為程式編碼又需耗費許多資源。 機器學習 提供另一種不同方式進行分析:藉由提供真實資料,設計讓機器可自行學習的演算法,透過分析了解資料規律性後,在一群函數集(Function Set)中找到最適函數,以此函數對未知資料進行 預測 、 分類 等的過程。「機器學習」主要依資料標註完整性進行分類:

  1. 監督式學習(Supervised Learning)-訓練資料有完整的標註,如分類問題
  2. 非監督式學習(Unsupervised Learning)-訓練資料無標註,如群集分析
  3. 半監督式學習(Semi-Supervised Learning)-訓練資料僅有不完整標註,例如圖片中標註有車子,但未標註車子的位置
人工智慧多元發展
 

機器發展深度學習
如同人類神經網絡

「機器學習」已使用在日常生活中,例如早期垃圾郵件識別、搜尋引擎等;然近期使 機器學習 廣泛應用的關鍵,在於其分支技術「深度學習」重大突破。「深度學習」可使機器對複雜的資料結構,學習如何自動提取特徵(Features)並使用特徵進行學習,避免過去一定要藉由手動提取特徵的麻煩;而深度學習框架最為人所熟知的是應用各種神經網路(Neural network)所建構者,「深度學習」與「神經網路」幾已成同義詞。

如2015年底由Microsoft亞洲研究院參與ImageNet競賽,藉神經網路使機器視覺辨識錯誤率降到3.57%,擊敗人眼,所使用網路層數也多達152。而在2016年知名的AlphaGo也征服了圍棋, 大幅提升「深度學習」知名度;同年9月在自然語言處理領域,Google也運用了神經網路進行網頁中翻英的工作,讓錯誤率一下降低了55%-85%。一個月後Microsoft則發表了新的語音辨識技術,錯誤率僅5.9%,達到人類水準;自此之後藉新經濟興起的國際大廠(USA FAMGA+China TAB),都開始利用「深度學習」做各種應用探索。

 

2030機器深度學習技術
將成功應用於產業並促進社會發展

由於目前機器學習個別模型僅能用於單一特定領域,且相當依賴大規模數據集與人工修正微調;故未來發展將朝「強人工智慧」(Strong AI)與「元學習」(Meta Learning)兩方向前進。「強人工智慧」指的是「具備與人類同等智慧」,能表現正常人類所有的各種智慧行為;「元學習」指的是如同人類可利用以往經驗,藉由少數樣本即可達成學習,也就是解決「學習如何學習的問題」。

若能達到「強人工智慧」與「元學習」,則機器學習才具備真正獨立學習的能力。預期在2030年機器學習將可不須人為調校而自動建置;在產業中降低成本、提高產量、提升消費者體驗的首要手段也皆須透過該技術;而該技術亦將為生活與商業決策支援系統中的核心。

 

仰賴成熟市場技術開發
新興市場需求大增

從本次問卷調查的基礎分析來看,機器學習在三項主要指標上(「影響性」、「滲透率」、「投資優先度」)皆屬遙遙領先,在亞洲Top 10總排名上不意外地贏得第一,在眾國家中給予冠亞軍排名者亦達七個之多;足見各國充分體認此技術對國家競爭力的重要性。但在「本土企業整備度」指標上,成熟市場(台、中、日、韓、新)平均給4.2分,相對新興市場(雙印、泰、馬、菲)僅3.6分(4分表該國企業具商業量產能力);可看出新興市場預期到2030年時仍對此技術掌握不足,需仰賴成熟市場;故亞洲近期對機器學習投入,將仍以成熟市場為主,以下將僅介紹中國、日、韓、新加坡四國發展作為亞洲代表。

 

以世界人工智慧創新中心為目標
中國鎖定八大重點

憑藉著過去在大數據、雲端運算優勢,大廠如阿里巴巴、百度、騰訊不僅將機器學習廣泛運用在原有的電子商務、搜尋引擎、自然語言處理等領域,更進一步鎖定八大重點培育產品:聯網汽車、服務機器人、無人機、醫療影像輔助診斷系統、影片圖像身份識別系統、語音交互系統、翻譯系統、家居產品等, 皆為需進行高度系統整合的市場,成為少數可跟美國抗衡的大國,目標也設定在2030年成為世界主要人工智慧創新中心。

由於對隱私權保障寬鬆,加上政府將資料視為國家戰略資源大力扶植,容許企業對於一般消費者、電信用戶、就診病患歷史資料可做最大限度運用,故可產生諸如芝麻信用(新興徵信)、鷹眼盒子(電信反詐騙)、Airdoc(各類型醫療影像辨識)等具獨特性的產品或新創。

 

雖具有軟硬體實力基礎
日本仍以解決社會需求為首要目標

產學界已長期投入自然語言處理或理解、多語轉譯、大數據分析、大型災害預防、電腦視覺等相關領域,再加上在硬體上有如NEC高階晶片供應商及世界第一超級電腦「後京」(Post-K,由理研與富士通共同研發)等的支持,以及過去在工業自動化/機器人累積的能力,基礎相當穩固。然因該國科技主要針對解決高齡化社會問題,故在問卷結果上可發現,機器學習得分稍低於醫療/健康相關技術,亦低於量子運算此種高度不確定科技,與其他成熟市場國家稍有不同。

另從創投來看,日本擁有全球規模最大(1,000 億美元),針對人工智慧、物聯網、機器人等先端技術進行投資的軟銀願景基金(SoftBank Vision Fund,主要由軟體銀行和沙烏地主權基金共同發起)。此基金不僅投資國內,對整個亞洲新創皆有相當注資且具指標作用。

 

強調與民生消費做連結
韓國發展智慧生活應用

大型財團很早就從國際高市占率的消費者3C產品,與國內具壟斷性質的電信市場,開始發展應用機器學習的「智慧助理」產品。龍頭三星企業收購了美國新創Viv Labs,把智慧助理運用智慧型手機、電視、家電三項產品上,並藉由API串接生態系廠商。LG電子則專注於如智慧冰箱、智慧洗衣機與智慧空調的家電市場;同時也跟知名車廠福斯合作,將智慧家電與車聯網鏈結加值。

該國最大電信商KT則透過推出內建攝影機與電視互動、具備語音與影像辨識的智慧電視機上盒,將媒體、智慧助理、物聯網裝置控制與電信四種服務結合; 另一家電信商SKT則推出第一款以韓文溝通的實體助理,結合電視、電信、影音串流與即時交通等服務。

 

積極推動數位國家
新加坡從國家基礎建設佈局

透過政府投資與機器學習相關之特定計畫,以達成智慧城市/國家的目標。例如虛擬對話助理Ask Jamie與KeyReply,可解決公民和政府互動與跨機構查詢需求;利用AI以提高法院運作效率;投資新防禦技術實驗室以發展戰鬥用機器人;利用無人車與無人機作為輔助大眾運輸與檢查交通設施的高效率工具等。

 

掌握趨勢形成多元觸角
台灣具有軟硬體產業鏈發展優勢

本地在部分相關基礎技術研究,如分類器、矩陣分解、深度學習等已累積多年成果;在相近的資料探勘基礎領域,如特徵探勘、知識發現、社群網路分析等,亦有多位學者從事研究。另以可運用之特定應用來切入,特別是電腦視覺(Computer Vision)於近期在藉由神經網路運算後,在圖形/影像識別準確性上有了跳躍性改進。國內從事電腦視覺研究產學單位眾多,主題包括人臉辨識、車輛偵測、視訊物件追蹤、計算攝影學、3D視覺、車牌辨識、醫學影像等; 在此部分已有許多廠商將兩者結合形成產品與服務。

若將台灣現有與機器學習相關的產業鏈做說明, 可分為四個主要部分:

  1. 基礎軟體-目前常用的開源碼與平台框架,因普及性與便利性之故,主要仍是國際大廠(如Google、IBM、Microsoft等)或知名機構(如Berkeley)的天下,難有本地自生系統存在。
  2. 基礎硬體-台灣藉過去在「半導體垂直分工」與「PC代工」兩項霸主地位所累積的資源,建構起基礎硬體上完整的供應圖譜。從專用ASIC的IP業者、設計業者、代工業者,到從CPU主機板跨域到GPGPU主機板或雲端專用機櫃系統業者,台灣皆具高度自製能力跟國際大廠進行密切配合,確保掌握主流規格。至於大型神經網路運算農場, 則工研院與國網中心皆有相當規模建置可供產學研使用。
  3. 應用產業區隔 I -除先前所說與電腦視覺相關的視覺與影像(Vision & Image)領域已有許多國內廠商投入開發外,在語音與情緒(Speech & Emotion)及語言與社群媒體(Language & Social Media)領域也有數家業者深耕多年,專注華文利基市場。
  4. 應用產業區隔 II -國內有數家廠商專注於精準廣告投放、電子商務主動推薦等;製造與物聯網則有大小規模不同廠商投入開發中;另智慧家庭/企業則由具「最後一哩優勢」的電信商主導;服務業參與則非常多元,從計程車、人力銀行、影音串流、房仲、零售服務等皆有相當投入;最後是客服業者,以高度自動化達成人力有效運用。
掌握趨勢形成多元觸角

IEKView

「機器學習」屬於人工智慧分支;藉由提供真實資料,讓機器可自動分析資料後找到最適函數,對未知資料進行「預測」、「分類」等。「機器學習」近期廣泛應用的關鍵,在於分支技術「深度學習」重大突破;「深度學習」避免過去藉手動提取特徵,其主要框架即「神經網路」。機器學習在問卷三項主要指標上遙遙領先,在亞洲Top 10總排名上也是第一;對該技術投入目前仍以成熟市場為主,故僅介紹四國作為代表。台灣在機器學習基礎研究已累積多年成果;「電腦視覺」為特定應用,已有許多廠商結合兩者形成產品與服務。台灣現有相關產業鏈可分為數個主要部分:基礎軟體(國際平台為主流)、基礎硬體(具高度自製能力)、應用產業區隔(有特定發展蓬勃的區隔)。