上證報中國證券網訊(記者 劉怡鶴)10月30日,昆侖萬維宣布開源百億級大語言模型“天工”Skywork-13B系列,并配套開源了600GB、150B Tokens的超大高質量開源中文數據集。
昆侖萬維天工Skywork-13B系列目前包括130億參數的兩大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,它們在CEVAL、GSM8K等多個權威測與基準測試上都展現了同等規模模型的最佳效果,其中文能力尤為出色,在中文科技、金融、政務等領域表現均高于其他開源模型。
除模型開源外,Skywork-13B系列大模型還將開源600GB、150B Tokens的高質量中文語料數據集Skypile/Chinese-Web-Text-150B,這是目前最大的開源中文數據集之一。同時,昆侖萬維天工Skywork-13B系列大模型即將全面開放商用,即開發者無需申請即可商用。
開源生態建設是AI技術和應用融合的重要一環,可以降低模型的研發門檻和使用成本,最大化共享技術能力和經驗,讓更多企業和開發者參與到AI變革中。
今年4月,昆侖萬維發布了大語言模型天工3.5,并啟動邀請測試。8月,昆侖萬維發布國內第一款AI搜索產品——天工AI搜索。9月,昆侖萬維正式控股艾捷科芯,布局AI芯片。