AssemblyAI 不仅仅提供基础的转录服务,还提供了完整的音频智能平台。除了支持 99+ 种语言的高精度语音转文字外,还提供情感分析、说话人分离、主题检测、内容审核、个人敏感信息去除以及通过单一 API 实现的自动章节生成。实时流式转录支持直播音频。被播客平台、会议工具、呼叫中心和媒体公司广泛使用。在语音 API 领域拥有最优质的免费套餐之一,赠送 $50 额度。
API 详情
认证方式
API 密钥
定价模式
免费增值
免费额度
是的 — 注册即可获得 $50 免费额度
请求限制
按方案并发文件限制
数据格式
REST / WebSocket / JSON
版本策略
v2
SLA / 可用率
99.5%
合规认证
SOC 2,GDPR,HIPAA
地理限制
全球
最近验证
2026-02-20
类别
常见问题
AssemblyAI不仅仅提供转录功能——它还包括说话人分离(谁说了什么)、情感分析、内容审核、章节检测、实体识别和PII(个人身份信息)脱敏,所有这些都可以通过一次API调用完成。这使得它在构建生产级音频智能应用时,比像Whisper这样的原始转录API更为强大。
AssemblyAI定价:核心转录每小时音频为0.37美元。说话人分离每小时增加0.52美元。情感分析和实体检测各自每小时增加0.13美元。PII脱敏每小时为0.26美元。提供有限用量的免费套餐。与其他产品相比,AssemblyAI在其提供的综合功能集上具有竞争力的价格。
支持。AssemblyAI提供了一个流式语音转文本API,通过WebSocket连接实现实时转录,延迟低于300毫秒。适用于实时字幕、语音助手和实时会议智能。实时转录价格为每小时0.65美元,略高于异步转录。
LeMUR是AssemblyAI基于转录构建的LLM(大语言模型)框架。它允许你就音频内容提问——总结会议、提取行动项、回答关于播客的问题——通过AssemblyAI统一API调用Claude或其他LLM。这简化了音频智能功能的开发,无需分别管理转录和LLM集成。
