2021第一屆

字級:
小字級
中字級
大字級

探訪本土神經網路語言HarDNet之父

研發服務平台亮點成果獎─佳作獎
使用平台:國家高速網路與計算中心「臺灣AI雲(TWCC)平台」

2022ChatGPT橫空出世,為全球投下一顆震撼彈,宣告人工智慧(AI)世代正式來臨,生成式AI應用產品如雨後春筍般出現,在創造能力上展現了「媲美人類」的無限潛力。然而,在AI蓬勃發展的背後,需要大量的超級電腦運算能力來支持,用來存放超級電腦設備的資料中心,每年消耗龐大用電量,這讓AI科技成為隱形的耗能巨獸。

在淨零碳排的意識崛起之下,已經有許多科學家意識到AI耗能的問題,紛紛投入研發更快速、更省電、更準確的解決方案。近年,一個名為「HarDNet」的神經網路架構,因優越的準確度、運算效率以及節能成效,獲得全世界的矚目,HarDNet的創始人就是國立清華大學資訊工程學系榮譽退休教授、現任創鑫智慧股份有限公司董事長的林永隆,「我希望臺灣在國際AI上不要缺席。」這個使命讓林永隆退而不休,從學界到產業界持續為AI發展付出。

帶領臺灣搶占AI算力市場

台積電總裁魏哲家在2023台積電技術論壇中提到:「台積電有一個做AI的客戶,台積電賣它一個晶片600元,但是卻要花20萬向這個客戶買AI的應用。」魏哲家的感慨突顯出IC設計的價值所在,與林永隆共同研究的國立陽明交通大學電子研究所教授黃俊達說道:「臺灣在資料中心的發展上落後了國際一段時間,但是新的大型語言模型和生成式AI領域,有點像是重新鳴槍的起跑點,臺灣有機會可以趕上。」

2018年科技部(現國科會)推動「半導體射月計畫」,林永隆時任清大資工系教授,以「智慧終端系統晶片研發與新創事業計畫」獲得科技部的支持。當時林永隆分析未來AI發展趨勢,認為半導體設計和製造是提升AI運算力的核心,臺灣已經擁有頂尖的半導體製造能量,然而在針對AI運算的IC設計領域卻還有很大的發展空間。因此林永隆一開始設定的目標,就是要成立一間AI運算IC設計公司,並且要能夠自製量產資料中心等級的晶片,藉此向世界證明臺灣的實力,並在AI運算晶片的國際市場中為臺灣搶占一席之地。

HarDNet急起直追主流CNN架構

林永隆研究團隊以DenseNet(密集卷積網路) 為基礎,成功研發一種更節能、高效率的神經網路架構,並命名為「HarDNet(Harmonic Densely Connected Networks)。林永隆說:「科技發展與節能減碳是相輔相成的,節能除了對環境好,也能夠在有限的預算和資源當中,發揮最高的經濟價值。」HarDNet最大的優勢在於速度更快又能滿足低耗電量的需求,其中關鍵便是在於HarDNet所具備的三大特點:簡化不必要的連線來形成諧波式的規格、減少記憶體存取次數、精算卷積核數量。雖然HarDNet剛起步不久,然而在許多實際應用上的表現,已經超越其他的CNN(卷積神經網路)架構模型,例如與ResNet(殘差網路)較量之下,HarDNet只要ResNet三分之二的運算時間便能達到相同的準確度,效能令人驚艷。

除了在CNN架構上有傑出的表現,HarDNet衍生產品也有優越的性能。陽明交大教授黃俊達也是研究團隊的靈魂人物之一,負責硬體加速器設計研發,目前擔任創鑫智慧的技術顧問,「創鑫智慧運用HarDNet骨幹所開發的晶片,在一樣的電費之下,只要NVIDIA20~30%電費就能做到同樣的事情,也就表示每瓦電發揮的性能更強。經過這幾年的努力,終於將7奈米的晶片做出來,現在的目標希望可以把產品推向客戶端。」黃俊達說。

HarDNet神經網路模型HarDNet神經網路模型
HarDNet應用於自駕車影像語義分割HarDNet應用於自駕車影像語義分割


國網中心是HarDNet茁壯的搖籃

「沒有國家高速網路與計算中心(簡稱國網中心),就沒有HarDNet。」這是林永隆和黃俊達共同的心聲。林永隆表示,在國網中心剛起步的時候,學界還不太習慣使用集中化GPU,大家習慣在自己實驗室擴充設備做研究,可是訓練神經網路模型需要投入大量的軟硬體資源,學術研究經費對於開發神經網路模型所需投入的費用簡直是杯水車薪。「所幸當時國網中心主動發掘對於GPU有重度需求、研究題目有意義的實驗室,提供免費的使用時數,大力扶植研究團隊,HarDNet才有機會誕生。」黃俊達說。

HarDNet在國網中心的孵化之下,也不負眾望發展成為世界級的神經網路模型,林永隆將HarDNet放上GitHub開源,目前全球已有20多個國家的企業或研究機構應用於多元產業領域,例如自駕車、無人機、智慧醫療、衛星影像監測等,在臺灣更已成立了兩家以HarDNet作為核心技術的新創企業,一家就是由林永隆領導的創鑫智慧,專注AI運算加速器設計;另一家是戴克智慧,將HarDNet技術應用於發展智慧醫療影像判讀。 

AI是新一代的軍備競賽

林永隆認為,國網中心除了是國內首屈一指的高速運算資源平台,更在推動臺灣發展本土化語言模型具有非常大的貢獻。除了建置「TWCC臺灣AI雲平台」,更由於科技部的遠見,將國網中心資源推動民營化,於2021年與廣達、華碩、台灣大哥大合作成立「台灣智慧雲端服務股份有限公司」,拓展商業服務領域,台智雲公司也推出了第一個本土化大型語言模型「福爾摩沙大模型」(Formosa Foundation Mode, FFM)。

林永隆表示,目前創鑫智慧所研發的晶片正與台智雲公司合作進行試用,國網中心孵化了創鑫智慧,產品再回到台智雲公司進行商轉測試,這背後所使用的設備都是國網中心的資源,也許能夠藉此建立學校、國網中心、企業三方合作的一條龍模式。林永隆真切地指出:「AI就是一場軍備競賽,期望政府未來持續擴充國網中心的設備和人力,維持一流的國際水準,讓國網中心成為臺灣AI發展最有力的後盾。」

林永隆表示國網中心作為服務平台,將學校、國網中心、企業三方進行串接合作,才能有效地將人力、資源整合起來。林永隆表示國網中心作為服務平台,將學校、國網中心、企業三方進行串接合作,才能有效地將人力、資源整合起來。
黃俊達認為國網中心認真發掘及培育具潛力的科研題目,加速推動學研成果落地應用,是臺灣AI的重要推手。黃俊達認為國網中心認真發掘及培育具潛力的科研題目,加速推動學研成果落地應用,是臺灣AI的重要推手。