3月27日|通義千問發佈了 Qwen2.5-Omni,Qwen 模型家族中新一代端到端多模態旗艦模型。該模型專為全方位多模態感知設計,能夠無縫處理文本、圖像、音頻和視頻等多種輸入形式,並通過實時流式響應同時生成文本與自然語音合成輸出。
該模型現已在 Hugging Face、ModelScope、DashScope 和 GitHub上開源開放,用户可以通過我們的Demo體驗互動功能,或是通過Qwen Chat 直接發起語音或視頻聊天,沉浸式體驗全新的 Qwen2.5-Omni 模型強大性能。
新聞來源 (不包括新聞圖片): 格隆匯