阿里巴巴发布 Qwen3.5-Omni:支持 10 小时以上音频输入,Plus 版音频基准领先 Gemini 3.1 Pro
阿里巴巴发布了多模态模型 Qwen3.5-Omni。
阿里巴巴发布 Qwen3.5-Omni:支持 10 小时以上音频输入,Plus 版音频基准领先 Gemini 3.1 Pro
Daily Signal
来源:Techmeme River / Qwen 原文链接:https://qwen.ai/blog?id=qwen3.5-omni 发布时间:March 30, 2026 5:15 PM
核心摘要
阿里巴巴发布了多模态模型 Qwen3.5-Omni。
最新进展
据 Techmeme River 报道,阿里巴巴发布 Qwen3.5-Omni:支持 10 小时以上音频输入,Plus 版音频基准领先 Gemini 3.1 Pro。Techmeme River 当前页面将这条消息标注为 March 30, 2026 5:15 PM。
已知细节
从当前可见标题与摘要来看,阿里巴巴发布了多模态模型 Qwen3.5-Omni;官方称该模型支持超过 10 小时的音频输入,并表示 Plus 版本在音频基准上超过 Gemini 3.1 Pro;如果这些指标在更多公开评测中得到验证,Qwen 在音频与多模态交互上的竞争力会显著增强。
这条消息目前可归入产品与服务更新。这类更新通常反映出公司正在把新产品、新模型或新的订阅能力推向更明确的商业化场景。 公开标题里出现的功能、订阅或上线节奏,往往就是后续用户采用和竞争对比最先观察的变量。
标题中可直接确认的关键数字包括:3.5;10;3.1 。
延伸解读
Qwen3.5-Omni 值得关注的地方,在于阿里把多模态竞争推进到了更长时长的音频处理和更完整的交互链条。支持 10 小时以上音频输入,意味着它瞄准的不只是即时问答,而是会议、课程、客服录音和长时媒体内容这类更接近企业工作流的场景。 如果 Plus 版本在音频基准上真的能压过 Gemini 3.1 Pro,阿里就不只是补齐能力,而是在一个具体维度上争取领先叙事。对模型厂商来说,这类 benchmark 竞争的价值在于,它能更快影响开发者试用、企业采购和生态伙伴判断,比笼统谈“多模态很强”更容易转化成市场动作。 同时,这也会把竞争进一步推向“谁更擅长处理连续、多源、长上下文输入”。文本推理能力依然重要,但对下一阶段应用落地来说,音频和视频等连续信号的理解能力会越来越直接决定模型能不能进入真实生产环境。阿里这次发布,本质上是在争夺这个入口。
信息来源
- 来源:Techmeme River / Qwen
- 链接:https://qwen.ai/blog?id=qwen3.5-omni
来源
syq