语音能力

实时对话代理

全双工实时对话:阿里云 Omni、火山引擎对话。

MCP API

realtime 包提供全双工实时对话代理,将 ASR、LLM、TTS 串联为低延迟语音交互。

创建代理

import "github.com/LingByte/lingllm/realtime"

agent, err := realtime.NewAgentFromCredential(cfg, realtime.AgentOptions{
    // ASR / TTS / LLM 供应商配置
})
if err != nil {
    panic(err)
}

agent.Start(ctx)
agent.SendAudio(audioData)  // 持续送入音频
// 通过回调接收合成音频和转写文本
agent.Stop()

支持的代理类型

类型包路径说明
阿里云 Omnirealtime/aliyunomni阿里云全模态实时对话
火山引擎对话realtime/volcdialogue火山引擎实时语音对话

交互流程

100%

与 protocol/voice 的区别

层级说明
供应商代理realtime封装特定云厂商的全双工 API
会话协议protocol/voice传输无关的通用会话层,自行组装 ASR/TTS/LLM

简单场景用 realtime 快速接入;需要自定义对话逻辑和传输层时用 protocol/voice

相关地址

此页面对您有帮助吗?

本页内容