阿裡巴巴推出嶄新AI語言模型 – 通義千問 – 李梓敬 –

阿裡巴巴推出嶄新AI語言模型 – 通義千問

中國的科技巨頭阿裡巴巴集團控股有限公司,發佈了一款新的AI語言模型。該語言模型,由負責雲計算的阿里雲公司開發。12月1日,阿裡雲開源通義千問720億參數模型Qwen-72B。這是一款由AI驅動的大型語言模型,將成為OpenAI ChatGPT的潛在競爭對手。

這款名為Qwen-72B的大型語言模型,在眾多任務中的表現,比GPT-3.5和GPT-4更勝一籌,尤其是在英文和中文、數學推理和編碼方面,具有更高的理解能力。

阿裡巴巴還發佈了Qwen-1.8B和音頻模型Qwen-Audio,並且已經開源70億參數和140億參數的大型語言模型。

阿裡雲首席技術官周靖人表示,開源生態系統,對於促進中國大型語言模型的技術進步和應用,至關重要。他補充說,「公司將繼續投資,旨在提供人工智能時代,最開放的大型語言模型。」

他還說道,「開源大型語言模型,將幫助企業簡化模型訓練和使用的過程,降低使用門檻,並以更快的速度,建立起由企業自己定制的人工智能模型。」