产品概览
什么是灵语 / 它能干什么 / 跟传统呼叫中心有什么不一样 / 谁该用它——零基础也能 5 分钟看懂。
它到底是什么
灵语 = "电话 + AI" 的一体化联络中心。把 SIP 电话协议、实时语音 AI(ASR/TTS/LLM)、ACD 路由、外呼引擎、知识库打包成一个 Go 二进制,部署即用。
一句话总结使用体验:
- 客户打进来 → 灵语自动接听,AI 用自然语言对话;遇到搞不定的,无缝转人工座席。
- 企业想外呼 → 上传一批联系人 + 一段对话脚本 → 启动任务,灵语批量打电话;AI 自己问、自己听、自己判断、自己转人工。
三个最常见的疑问
Q1: 跟传统呼叫中心比,区别在哪?
| 对比项 | 传统呼叫中心 | 灵语 |
|---|---|---|
| 接电话的是 | 人 | AI(必要时转人工) |
| 单座席每天接听上限 | 100–200 通 | 无上限(受并发限制) |
| 7×24 在线 | 需排班 + 夜班补贴 | 天然 24h |
| 一致性 | 因人而异 | 完全一致(脚本驱动) |
| 改话术 | 培训所有座席 | 改一份脚本,秒级生效 |
| 弹性扩容 | 招人 + 培训(数周) | 加几台机器(数分钟) |
| 成本 | 人力 + 工位 + 系统 | 算力 + 模型调用 |
适用:重复性高、问题集中、需要稳定一致体验的场景,例如客服、催收、回访、提醒、咨询。
Q2: AI 不万能,搞不定的怎么办?
灵语的设计哲学是 "AI 优先 + 人工兜底":
- 触发条件:脚本里写好"什么情况转人工",比如客户说"我要找人工"、"投诉"、问到 AI 答不上的领域。
- LLM 自决策:通过 Function Calling,LLM 自己决定调用转人工工具。
- ACD 选人:座席池 + 权重/排班 + 排除列表 → 选最合适的人接。
- 平滑桥接:AI 静默退出,用户不会感觉到"换人"那一下。
- 记忆上下文:座席能看到 AI 之前跟客户聊过什么,不用客户从头再说。
Q3: 部署难吗?依赖多吗?
最小依赖:
- 一个 Go 二进制(< 100MB)
- SQLite(默认)或 PostgreSQL / MySQL(可选)
- 若干外部 AI 服务(ASR / TTS / LLM;至少各 1 家)
- 可选:S3 / MinIO / OSS(录音存储)、Qdrant(知识库向量检索)
单机就能跑:一台 4 核 8G 的服务器即可承载 50–100 路并发。
核心能力速览
SIP 电话
- 内置完整 SIP 协议栈(SIP / RTP / DTMF / STIR-SHAKEN),无需外部 SIP Server
- 支持 REGISTER / INVITE / BYE / REFER / INFO / CANCEL 等核心方法
- 入呼 / 外呼全链路,多 Trunk 线路集成
- 实时通话质量监控(QoS)
AI 语音对话
- 多供应商 ASR:腾讯云、百度、Deepgram、Google、FunASR、Whisper、火山等 12+ 厂商热切换
- 流式 TTS:MiniMax、Azure、ElevenLabs、火山、讯飞等 16+ 厂商,首包延迟 < 300ms
- LLM 对话:OpenAI / 阿里通义 / Coze / Ollama,支持 Function Calling 触发业务动作
- 对话引擎:级联式(ASR → LLM → TTS)+ 实时多模态(GPT-4o / Qwen-Omni)
- 热词检测 & 打断支持
联络中心
- ACD 路由:加权 / 轮询 / 自定义策略,SIP 话机 + WebSeat 浏览器座席
- 外呼引擎:批量任务、并发控制、重试策略、联系人变量注入
- 脚本驱动:JSON 脚本节点(say / listen / branch / function / transfer / hangup)
- IVR 流程编排:可视化编辑器
知识库
- 向量检索:Qdrant 向量数据库,支持语义搜索
- 混合检索:Bleve 全文检索 + Qdrant 向量检索,可配置权重
- 智能分片:按标题/段落切分,带重叠;可选 LLM 智能分片
- 多租户隔离:每个租户独立知识库命名空间
多租户 & 安全
- JWT + AK/SK 双鉴权模式
- RBAC 角色权限(平台管理员 / 租户管理员 / 普通用户)
- 租户数据完全隔离
- STIR/SHAKEN 来电号码验证
实时监控
- WebSocket 实时通话状态推送
- 坐席状态分布(空闲 / 忙碌 / 振铃 / 离线)
- 队列深度跟踪
- Prometheus 指标集成
技术栈
| 层 | 技术 |
|---|---|
| 后端 | Go 1.26 + Gin + GORM |
| SIP | 自研嵌入式 SIP 栈(28 个子包:Transaction / Dialog / Kernel / RTP / SDP / STIR...) |
| 对话引擎 | 级联式(ASR → LLM → TTS)+ 实时多模态(WebRTC) |
| AI 适配层 | 工厂模式,统一接口,单条配置切换厂商 |
| 前端 | React 18 + TypeScript + Vite + Arco Design + Tailwind CSS |
| 状态管理 | Zustand |
| 数据库 | SQLite(默认)/ PostgreSQL / MySQL |
| 对象存储 | S3 / MinIO / OSS / COS / 七牛 / 本地 |
| 知识库 | Qdrant(向量)+ Bleve(全文)混合检索 |
| 监控 | Prometheus + WebSocket 实时推送 |
| 部署 | 单进程 / Docker / k8s 均可 |
系统架构
100%
典型呼入流程
100%
典型呼出流程
100%
谁该用?
强烈推荐:
- 客服中心:账单查询、政策咨询、订单状态、产品答疑
- 外呼营销:活动通知、产品推荐、回访确认
- 金融/政务:信贷催收、投保提醒、医保通知
- 生活服务:预约确认、维修跟进、满意度调研
需慎重评估:
- 强情感场景(心理咨询、危机干预)—— 建议人工为主,AI 仅辅助
- 复杂法律/医疗专业判断 —— 模型幻觉风险高
- 极个性化销售(高客单价 B2B 大单)—— 高客单更需要"人感"
应用场景示例
- 智能客服:AI 自动接听,解决 80% 常见问题,剩余 20% 无缝转人工
- 外呼营销:批量外呼 + AI 对话筛选意向 → 高意向客户当场转销售
- 回访确认:自动回访订单/预约/满意度,收集结构化反馈入库
- 通知提醒:账单催收、预约提醒、验证码语音播报
- IVR 替代:用自然语言对话替代传统按键 IVR 菜单
- 知识库问答:结合企业知识库,AI 给出精准专业答复
接下来该看什么
此页面对您有帮助吗?