Seeduplex – 字节跳动推出的原生全双工语音大模型

AI工具集2小时前发布商道网

Seeduplex是什么

Seeduplex是字节跳动Seed团队推出的原生全双工语音大模型，实现”边听边说”的实时交互。模型能精准抗干扰（误打断率降50%）、动态判停（抢话率降40%），在嘈杂环境、多人对话等复杂场景下表现自然流畅。Seeduplex已在豆包App全量上线，为亿级用户提供高质量语音通话体验，标志着全双工语音技术首次实现大规模商业化落地。

Seeduplex – 字节跳动推出的原生全双工语音大模型

Seeduplex的主要功能

全双工实时交互：实现”边听边说”，打破传统”一问一答”的回合制限制，支持真正的实时双向语音交流。
精准抗干扰：持续感知全局声学环境，在车内、咖啡厅等嘈杂场景中精准锁定主用户声音，误回复率和误打断率降低50%。
动态判停：联合语音与语义特征智能判断对话节奏：用户思考时耐心倾听，说完后秒速响应，抢话比例下降40%，判停延迟降低250ms。
敏捷打断响应：随时响应用户打断指令（如”等一下”），打断响应延迟缩短300ms，实现平滑切换。
环境感知联动：自动解析背景环境音（如广播、导航声）纳入推理上下文，主动结合环境信息回应。
复杂表达理解：支持用户边思考边修正的碎片化表达（如反复调整点单需求），准确捕捉最终意图。

如何使用Seeduplex

下载/更新豆包App：将豆包App更新至最新版本。
进入语音通话：在对话框内选择「打电话」图标，进入语音通话界面可体验。

Seeduplex的关键信息和使用要求

产品名称：Seeduplex（Seed-Full-Duplex）
开发团队：字节跳动 Seed 团队
技术类型：原生全双工语音大模型
核心突破：实现”边听边说”实时交互，支持同时倾听与说话，突破传统”一问一答”的回合制限制
关键指标：
- 误打断率和误回复率降低 50%
- 抢话比例下降 40%
- 判停延迟降低约 250ms
- 打断响应延迟缩短约 300ms
- 用户通话满意度绝对值提升 8.34%
上线状态：已在豆包 App 全量上线，为业界首个实现规模化落地的全双工语音模型
平台限制：仅支持通过豆包 App 使用

Seeduplex的核心优势

原生全双工架构：业界率先实现规模化落地的”边听边说”语音大模型，突破传统”一问一答”的回合制限制，交互自然度接近真人对话。
精准抗干扰能力：通过全局声学环境感知，在嘈杂场景（车内、咖啡厅等）中精准锁定主用户声音，误回复率和误打断率降低50%。
智能动态判停：联合语音+语义特征实时判断对话节奏，用户思考时耐心倾听，说完后秒速响应（延迟降低250ms），抢话比例下降40%。
超低延迟响应：打断响应延迟缩短300ms，支持随时插话打断，实现真正流畅的实时双向交流。

Seeduplex的应用场景

嘈杂环境下的语音交互：在车内（导航播报、广播混杂）、咖啡厅、商场等高噪音场景中，精准剥离背景干扰，锁定主用户声音。
多人对话场景：当用户与他人交谈时（如应答外卖员、朋友插话），能识别出真正针对 AI 的指令，避免误触发。在多人重叠对话中，精准甄别哪些话是对 AI 说的，哪些是他人闲聊。
碎片化/犹豫式表达：支持用户边思考边修正的复杂表达，如点单时反复调整需求（”要冰的…不对，热的…再加两泵糖浆”）。
高频互动游戏：在快问快答、飞花令等需要秒速响应的场景中，实现低延迟（降低约 250ms）的无缝对答，支持流畅的竞技性对话。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

LTX-2.3 – Lightricks 开源的最新一代视频生成模型

LTX-2.3 – Lightricks 开源的最新一代视频生成模型

4周前

560

EzRemover – 免费的在线 AI 图片背景移除工具

EzRemover – 免费的在线 AI 图片背景移除工具

AI工具集 # EzRemover

2个月前

920

Lyria 3 – Google DeepMind推出的新一代AI音乐生成模型

Lyria 3 – Google DeepMind推出的新一代AI音乐生成模型

AI工具集 # Lyria

1个月前

700

Covo-Audio – 腾讯开源的端到端语音模型

Covo-Audio – 腾讯开源的端到端语音模型

3周前

750