- 2023/08/06
- 3574
- 105
去年底ChatGPT問世後,讓不同國籍的民眾也能輕易使用AI在其生活或工作環境中;ChatGPT開放註冊後,五天內就達到百萬個使用者,用戶成長速度比知名App的Instagram快15倍,比Spotify快30倍;僅兩個月總用戶人數就突破1億,每天約1,300萬個活躍用戶;且付費升級版的ChatGPT Plus服務還因需求太大,發生暫時停售的現象。
新創研究機構CB Insights今年2月初發布今年的11大科技趨勢時,就提過生成式AI會是今年重大主題。其實2017年起,全球對生成式AI創投不論是案件數跟金額皆呈上升趨勢,去年達到最高;而視覺媒體、生成介面、文字、語音、程式撰寫是其中五大熱門領域。
2022年8月是重要轉捩點,新創Stability AI發布Stable Diffusion,吸引數百萬使用者並讓該工具成為網路熱門話題,對Google、Meta及OpenAI等造成壓力,OpenAI在9月開放Dall-E 2,於11月開放ChatGPT給公眾;Google則在今年2月推出Bard聊天機器人。同時間很多新創開發生成式AI工具,包括C3.ai、BigBear.ai和SoundHound AI等股價也受市場追捧。中國大陸搜尋引擎龍頭百度也在3月推出「文心一言」聊天機器人。
目前國內程式撰寫、文案生成、靈感啟發、藝術教學、動畫創作相關產業,已受益在工作中導入ChatGPT進行人機協作;而生成式AI因在對話問答具優異表現,吸引金融、電信、客服等導入。如玉山金以ChatGPT取代原客服對話機器人,也用其進行KYC(Know Your Customer),讓顧客開戶時間大幅縮短;另有電信業者與華碩旗下台智雲合作,使用自有資料再透過開源模型,建置自用的客服對話機器人;還有企業希望直接掌握優化過的大型模型,避免未來被外商壟斷,如聯發科、中研院、國教院合作使用開源BLOOM模型進行繁體語料再訓練與優化,該模型已公開讓外界下載,未來可用於問答系統、文字編修、廣告文案生成、客服系統等。
雖然台灣缺乏基礎模型開發所需的資料量、算力、財力等,在此方面難與國際大廠競爭,但是在「基礎模型」或「客製模型」兩方面,國內廠商至少各有方案可選擇適合者使用。
台廠可直接連國際大廠Microsoft或Google的API,此時導入生成式AI成本低且立即可用,但不易客製且僅能透過雲端使用;未來資訊會留在雲端,也將面對未來服務斷鏈的風險。台廠也可用國際大廠雲端訓練工具,自行上傳資料來調整大型模型;可符合特定領域需求,但也有服務斷鏈風險。台廠亦可用開源模型結合自有資料,微調模型後建置應用;能提供最安全、正確的服務,但有賴多次訓練且算力需求不低;優點是可掌握核心技術,也可將模型部署在企業內部,避免洩密與資安問題。
除金融、電信、客服外,從生成式AI特性來看,國內尚有多種其他應用,如醫療、照護、心理諮詢、法律服務、補教機構、製造場域、IC設計與資訊軟體、電商、3D設計與動畫/音樂創作、新藥物及新材料開發等。
對通用型生成式AI,若是模型參數規模大、所需資料量多、所需算力/財力高,國內後進者難與國際大廠競爭,但這也並非代表沒有機會。據研究文獻、實務經驗、算力、標記資料量等因素來觀察,若用在特定領域的生成式AI,模型參數約落在1B~20B之間即有相當競爭力,此為國內可考慮積極發展的一個可行技術區間。
以BioMedLM為例,該模型為史丹福大學基礎模型研究中心(CRFM)和MosaicML兩者聯合開發,可用於醫學任務問答;例如可生成簡明相關的問題來總結患者的需求。該模型是基於GPT-2的小型模型,以美國國立衛生研究院線上生物醫學數據庫論文摘要和全文訓練而成;該模型在美國醫學院學生成為醫生須通過的醫學執照考試中取得最佳的50.3分,表現勝過多種大型模型,但BioMedLM參數2.7B,僅通用型生成式AI的數十分之一。
此現象說明在特定領域資料上重新訓練小型模型,可表現跟大型者一樣好或更好;但所需資料量、算力、成本相對少很多。其他如程式撰寫的CodeGen、圖像生成的DALL-E及Diffusion Model等表現突出的生成式AI模型,都落在此區間。而部分台灣特定產業如高科技設計或製造業,基於保護商業機密、資安等考量,不想將機密資訊留在雲端,不會考慮使用國際大廠的雲端方案,這也創造出特定領域生成式AI的本土需求,可交由本土廠商解決。