塔斯娱乐资讯网

谁能想到,AI聊天的巨大短板,终于被阿里解决了。 你说话的时候,它终于不用等你

谁能想到,AI聊天的巨大短板,终于被阿里解决了。

你说话的时候,它终于不用等你说完才能回答,而是像真人一样,一边听、一边思考、一边回应。

6月28日,阿里通义 Wan 团队正式发布并开源 WanStreamer v0.1。这不是一款新的大模型,而是一套原生流式全双工音视频多模态模型,让AI真正进入了"边听边说"时代。

它的一大变化,就是打破了传统AI"你一句、我一句"的交互方式。WanStreamer支持全双工实时对话,AI在回答你的同时,还能继续听你说话,支持实时打断、连续交流,整个过程更接近人与人之间的自然沟通。

除此之外,它还采用端到端架构,把语音理解、推理、语音生成以及视频生成整合到同一个模型中,减少多个模块切换带来的延迟和误差。同时还能同步生成声音、表情、口型等音视频内容,让数字人的互动更加自然。

过去的大模型更像"问答工具",只有等你说完才能开始思考;未来的大模型则更像一个真正的助手,可以随时插话、实时理解上下文、持续与你交流。这种能力对于AI助手、数字人直播、智能客服、机器人以及智能座舱等场景,都有着更大的价值。

你觉得,未来AI最重要的是模型能力,还是交互体验?