Google Cloud Text-to-Speech API

Über 380 Stimmen in mehr als 50 Sprachen mit WaveNet und Neural2

Freemium ✓ Verifiziert ★ 4.6 🇺🇸 Vereinigte Staaten

Google Cloud Text-to-Speech bietet eine der größten Auswahlen an Stimmen (über 380) in der Branche, verteilt auf mehr als 50 Sprachen und Varianten. WaveNet- und Neural2-Stimmen erzeugen mithilfe von Deep Learning eine äußerst natürlich klingende Sprache. Das großzügige kostenlose Kontingent von 4 Millionen Zeichen pro Monat macht es zur ersten Wahl für Prototyping und Anwendungen mit mittlerem Volumen. Die SSML-Unterstützung ermöglicht eine präzise Steuerung von Aussprache, Geschwindigkeit, Tonhöhe und Pausen. Wird in IVR-Systemen, Barrierefreiheits-Tools, E-Learning-Plattformen und Smart Speakern eingesetzt.

API-Details

Authentifizierungsmethode
API-Schlüssel
Preismodell
Freemium
Gratis-Kontingent
Ja — 4 Millionen Zeichen/Monat kostenlos
Anfragelimit
300 U/min
Format
REST / JSON / gRPC
Versionierung
v1, v1beta1
SLA / Verfügbarkeit
99.9%
Compliance
SOC 2, ISO 27001, HIPAA, DSGVO
Geografische Einschränkungen
Global (30+ Regionen)
Zuletzt geprüft
2026-02-20

Häufig gestellte Fragen