ElevenLabs
语音 AI 领域的品类龙头平台:文本转语音、语音克隆、配音与对话式智能体。
1. 核心产品 / 服务
ElevenLabs 构建 AI 音频模型,以及覆盖完整语音技术栈的开发者/企业级平台。其旗舰文本转语音(TTS)引擎能在 70 多种语言中合成情感与语调,并配套语音克隆能力(VoiceLab 与社区化的 Voice Library)。产品线早已超出 TTS,包括:可在翻译语音的同时保留原说话人声线与情感的 AI 配音工作室(Dubbing Studio);带说话人分离与字符级时间戳的语音转文本模型 Scribe;音效;以及 Eleven Music(2025 年 8 月发布,已获商用授权)。
商业化业务由两条产品线支撑:ElevenAgents(对话式语音与文字智能体,具备大规模客户运营所需的集成、测试与监控能力)和 ElevenAPI(面向开发者的低延迟、生产级语音基础设施)。近期模型工作同时强调质量与速度——V3 用于富情感、有表现力的叙述,Flash v2.5 实现低于 100 毫秒的延迟,适合实时轮流对话(据 aitoolranked,2026-06-29;Sacra,2026-06-29)。
2. 目标用户与痛点
ElevenLabs 服务两类不同的买家。开发者与产品团队通过 API 嵌入语音功能(互动媒体、智能体、无障碍),因为自建 TTS 并不现实。企业则采用 ElevenAgents 来自动化语音密集型的客户运营。已披露的部署包括:Revolut 在英国与欧洲跑客服智能体(400 万以上客户、30 多种语言);Klarna 用语音 AI 智能体为其美国 3500 万客户做一线电话支持(据 Sacra,2026-06-29)。它解决的痛点是人工语音工作(配音、旁白、呼叫中心人力)在成本、延迟与多语言覆盖上的缺口,且质量高到足以面向客户上线。
3. 竞争格局
2026 年的语音生成越来越是按使用场景而非按单一厂商来选择。ElevenLabs 在整体输出质量与克隆保真度上领先,而对手在各自的窄维度上做差异化。
| 竞争对手 | 相对 ElevenLabs 的差异化 |
|---|---|
| Cartesia(Sonic) | 延迟领先;首字节时间低于 100 毫秒,适合实时对话 |
| Hume | 显式情感控制;情感优先的生成 |
| OpenAI(TTS / Realtime) | 可用提示词指令化地塑造声音角色;与前沿大模型捆绑 |
| Google Cloud TTS | 最成熟的大规模基础设施;220+ 声音、深度 GCP 集成、企业级可用性 |
| Amazon Polly | 更强的 AWS 原生企业集成 |
| Play.ht | 被 Meta 收购(2025 年 7 月),2025 年 12 月 31 日关停 |
ElevenLabs 的护城河在于全栈的广度叠加质量(TTS、STT、配音、音乐、智能体),而非某一项单点最优指标,并由品类领先的中端市场变现能力加固(据 SurePrompts;YipitData,均 2026-06-29)。
4. 独到观察
- ElevenLabs 是少有的、在前沿实验室(OpenAI、Google)已推出能打的原生语音之后仍守住品类龙头地位的单模态 AI 公司。其防御性来自于成为默认的首次采购对象——YipitData 称在截至 2026 年 1 月的三个月里约 95% 的首次语音 AI 买家是经由 ElevenLabs 入场的(上年同期为 81%),这种分发飞轮更像 harvey 在法律领域的格局,而非纯粹的模型质量领先。
- 它与 suno(音乐)、runway-ml(视频)、synthesia(数字人视频)同属"创意媒体 AI"队列,但它是唯一一个转化为深层企业基础设施(智能体、电话语音)、而没有停留在创作者工具形态的——把 ARR 从约 3.5 亿美元(2025 年底)推向约 5 亿美元(2026 年 4 月,据 Sacra),并公开瞄准 IPO。
- 驱动采用的克隆能力同时是其声誉负债:2024 年新罕布什尔州的拜登 robocall 被追溯到 ElevenLabs;而 10 亿美元的"免费嗓音修复"承诺(2026 年 3 月)在一定程度上也是面对深度伪造审视时的善意定位。
5. 财务 / 融资
- 累计融资额(主要股权):$0.78B
- 最新估值:$11.0B
| 日期 | 轮次 | 金额 | 投后估值 | 领投方 |
|---|---|---|---|---|
| 2023-01 | Pre-Seed | $0.00B | — | Credo Ventures |
| 2023-06 | Series A | $0.02B | $0.1B | Andreessen Horowitz (a16z); Nat Friedman; Daniel Gross |
| 2024-01 | Series B | $0.08B | $1.1B | Andreessen Horowitz (a16z); Sequoia Capital; Nat Friedman; Daniel Gross |
| 2025-01 | Series C | $0.18B | $3.3B | Andreessen Horowitz (a16z); ICONIQ Growth |
| 2026-02 | Series D | $0.50B | $11.0B | Sequoia Capital |
6. 团队与关系
- 创始人 / 核心人物:Mati Staniszewski(CEO,前 Palantir 部署策略师)与 Piotr Dąbkowski(CTO,前 Google 机器学习)。两人均为波兰人;公司成立于 2022 年,据称灵感源自配音糟糕的影片。
- 重要投资人:Andreessen Horowitz(a16z,多轮持续)、Sequoia Capital(Series D 领投,合伙人 Andrew Reed 进入董事会)、ICONIQ Growth,以及天使投资人 Nat Friedman 与 Daniel Gross。战略投资方包括 Deutsche Telekom、LG Technology Ventures、HubSpot Ventures 与 NTT DOCOMO Ventures。
- 合作伙伴 / 客户:Meta、Epic Games、Salesforce、MasterClass、Revolut、Klarna,以及法律 AI 同行 harvey 均为其 API/企业客户;约 41% 的财富 500 强据称在使用该平台。
- 竞争对手:Cartesia、Hume、OpenAI、Google Cloud TTS、Amazon Polly。