現在國人常用的生成式AI服務,多為美國企業開發,如ChatGPT、Claude、Google Gemini等。輝達(NVIDIA)執行長黃仁勳今年訪台時便曾提到,每個國家都應投資發展自身的AI能力,也就是「主權AI」(Sovereign AI)的概念。
如今,繼中研院、聯發科等產學團隊開發繁中在地化的大型語言模型(台版GPT)後,現有產業界找來台大團隊,結合NVIDIA支援的算力,開發出全球首創的「繁體中文專家模型開源專案Taiwan Mixture of Experts」(以下簡稱Project TAME)。
跨業合作,期待創造「AI生態系」
Project TAME由長春集團與和碩聯合科技共同發起,邀集醫藥業長庚集團、電子業欣興電子、媒體業科技報橘等產業界加入,由台大資工系、資管系和法律科技新創律果科技合作研發,使用NVIDIA支援的「Taipei-1」超級電腦算力執行。
長春集團董事長林顯東致詞表示,本次合作無合約約束,各家公司各自出動工程師合作,成功催化Project TAME的誕生。
Project TAME已於7月1日正式上線,以開源形式邀請更多企業加入,期待能創造出屬於台灣產業界的「AI應用生態系」。這項專案的特點在於,使用Meta的Llama-3模型作為基底,加入台灣文化與產業資訊微調,預訓練近5,000億個字(token),含括法律、石化、電子製造、醫療服務、流行文化等產業知識,現為70B參數模型(Llama-3-Taiwan-70B)。
在記者會上展示時,Project TAME不僅在駕照、法律考試、大學學測、導遊證照等與台灣在地文化高度相關的測驗中表現優異,在39項綜合評測、近3,000個題目中,Project TAME的分數也超過所有模型,正確率相較第2名的Claude-Opus模型高了6.8%,亦比GPT-4o高了9.3%。
TAME基礎模型加入專業知識,可望打造「私有AI」
計畫主要發起人之一、和碩聯合科技新產品發展事業處暨人工智慧發展處處長蕭安助表示,本次專案合作歷經不到半年,屬於試驗性質(trial)。而他希望,未來能找到更多業界夥伴,擴大這個生態圈,並發展出各自的AI應用;至於商模?他表示現在並非以獲利為目標,希望先擴大規模。
此外,律果科技執行長陳啟桐也說明,英美的法律體系和台灣不同,且國外的AI語言模型,是吸收了較多簡體語料來訓練,因此使用AI查詢法律知識時,國外開發的AI語言模型容易出現錯誤,「若不標準化,會導致花費太多算力,結果卻不如預期。」
律果科技使用Project TAME模型,全面使用繁體中文和台灣的教材,訓練出台灣法律專屬的大型語言模型,再加入搜尋分析功能(RAG資料庫),即可做到「解決不同公司、特定的法律問題」。而他們的目標是使用TAME,打造台灣第1個法律專屬的代理模型。
有了Project TAME的基礎模型,各企業進行訓練、微調時,只需要花費1,600萬元的成本,以及大約4小時進行1次迭代。相較於企業從零開始自行訓練,這樣做可降低23倍導入成本、165倍導入時間,並大幅加速企業導入私有LLM模型的競爭力。
亞太智能科技執行長吳伯翰引述戴爾電腦研究指出,未來有超過7成企業擁有私有的生成式AI工具,而TAME模型可望成為台灣企業擁有私有AI的重要墊腳石。
本文獲「風傳媒」授權轉載,原文:「最台AI」上線免費開放!團隊盼建台灣產業界的AI生態系
臉書粉絲專頁,請按此
延伸閱讀
▶AI浪潮掀起程式交易3新趨勢
▶蘋果AI發展落後,原因竟是Google?挖角研發高層,卻引發內部對立拖累創新
▶想投資AI又怕買在高點?專家建議這「方法」聰明投資,不當AI韭菜!
小檔案_風傳媒
「風傳媒集團」是一間從媒體、優質內容出發的網路科技公司。秉持「忠於真實,看見未來」的理念,由一群來自各個領域,對社會進步發展有熱情的人所組成。期望藉由先進的網路技術、社群的凝聚及擴散,讓多元的意見被包容接納,並開啟更多理性思辨與對話的空間,進而為社會帶來正面的影響。
《風傳媒》以宏觀的視野,掌握台灣、國際、兩岸、地方的政經脈動及生活態度,用真實與進步的價值觀,持續耕耘原生新聞、深度報導及多元觀點,為全球華人提供最優質的內容,帶來對生活的美好實踐。