阿里雲發布通義家族首個端到端全模態大模型Qwen2.5-Omni-7B,該模型專為全模態感知設計,可處理文本、圖像、音頻、視頻等多模態輸入,並實時生成文本與自然語言應答,預期為在手機及手提電腦等終端設備部署多模態AI設立新標準。該模型現已在Hugging Face 與GitHub上開源,並可透過Qwen Chat及阿里雲開源社區ModelScope獲取。目前阿里雲已開源超過200個生成式AI模型。(gc/da)