從雲到端:模型輕量化與晶片革新,驅動2025年AI應用全面落地
From Cloud to Edge: The Twin Engines of Model Optimization and Chip Innovation Powering Widespread AI Adoption in 2025
- 2025/06/30
- 192
- 24
自2022年生成式AI浪潮興起,人工智慧已從雲端展示邁向實質的生產力應用階段。2025年的全球技術趨勢,如NVIDIA GTC、CES及COMPUTEX,共同揭示了AI算力從雲端資料中心走向邊緣與個人裝置的明確圖景。AI應用落地的關鍵,在於AI模型自身技術的進步大幅降低了對算力的需求。過去動輒上兆參數的龐大模型,已透過模型壓縮技術與架構優化,在維持相近效能的前提下顯著縮小模型參數規模。為滿足邊緣AI的算力需求,晶片產業迎來了重大變革。晶片大廠也透過提供具價格吸引力的AI PC處理器,普及AI算力至主流消費市場;在企業端應用上,晶片大廠紛紛提供了企業伺服器用GPU顯示卡,讓工作站成為高效的邊緣AI推論平台。
【內容大綱】
- 一、前言
-
二、AI技術進步降低AI算力需求,釋放創新潛力
- (一)模型壓縮技術,使用邊緣式AI應用得以落地
- (二)開源模型促成邊緣式AI發展
- 三、AI應用落地驅動晶片發展變革
- IEKView
【圖表大綱】
- 圖1、AI模型壓縮技術
- 圖2、開源模型在Chatbot Areana得分表現
- 圖3、AI PC 價格邁向親民化
- 圖4、NVIDIA、Intel、AMD推出伺服器用AI晶片