AssemblyAI API

Q: 是什么让AssemblyAI与其他转录API不同？

AssemblyAI不仅仅提供转录功能——它还包括说话人分离（谁说了什么）、情感分析、内容审核、章节检测、实体识别和PII（个人身份信息）脱敏，所有这些都可以通过一次API调用完成。这使得它在构建生产级音频智能应用时，比像Whisper这样的原始转录API更为强大。

Q: AssemblyAI的费用是多少？

AssemblyAI定价：核心转录每小时音频为0.37美元。说话人分离每小时增加0.52美元。情感分析和实体检测各自每小时增加0.13美元。PII脱敏每小时为0.26美元。提供有限用量的免费套餐。与其他产品相比，AssemblyAI在其提供的综合功能集上具有竞争力的价格。

Q: AssemblyAI支持实时转录吗？

支持。AssemblyAI提供了一个流式语音转文本API，通过WebSocket连接实现实时转录，延迟低于300毫秒。适用于实时字幕、语音助手和实时会议智能。实时转录价格为每小时0.65美元，略高于异步转录。

Q: 什么是LeMUR，它是如何工作的？

LeMUR是AssemblyAI基于转录构建的LLM（大语言模型）框架。它允许你就音频内容提问——总结会议、提取行动项、回答关于播客的问题——通过AssemblyAI统一API调用Claude或其他LLM。这简化了音频智能功能的开发，无需分别管理转录和LLM集成。

语音识别 + 音频智能、转录、情感分析、摘要

免费增值 ✓ 已认证 ★ 4.6 🇺🇸 美国

查看文档 → 访问官网

AssemblyAI 不仅仅提供基础的转录服务，还提供了完整的音频智能平台。除了支持 99+ 种语言的高精度语音转文字外，还提供情感分析、说话人分离、主题检测、内容审核、个人敏感信息去除以及通过单一 API 实现的自动章节生成。实时流式转录支持直播音频。被播客平台、会议工具、呼叫中心和媒体公司广泛使用。在语音 API 领域拥有最优质的免费套餐之一，赠送 $50 额度。

API 详情

认证方式

API 密钥

定价模式

免费增值

免费额度

是的 — 注册即可获得 $50 免费额度

请求限制

按方案并发文件限制

数据格式

REST / WebSocket / JSON

版本策略

SLA / 可用率

99.5%

合规认证

SOC 2，GDPR，HIPAA

地理限制

全球

类别

语音与声音

常见问题

是什么让AssemblyAI与其他转录API不同？

AssemblyAI的费用是多少？

AssemblyAI支持实时转录吗？

什么是LeMUR，它是如何工作的？