Google Text-to-Speech

What is Google Text-to-Speech?

Google 的文字轉語音 API 利用尖端的 AI 技術，將文字轉換成栩栩如生、自然逼真的語音。它由 DeepMind 先進的語音合成技術驅動，提供高保真音訊、豐富多樣的語音選擇，以及可自訂選項，以滿足各種應用需求。無論是提升客戶互動、啟用語音介面，或是建立無障礙內容，此 API 都能提供無縫、如同真人般的語音體驗。新用戶可享高達 300 美元的免費額度，探索其功能。

主要功能：

?️ 高保真語音
運用 DeepMind 的 WaveNet 技術產生語音，聽起來幾乎與人聲難以分辨，確保自然的聆聽體驗。
? 50 多種語言，380 多種語音
從龐大的語音庫中選擇，包含中文普通話、印地語、西班牙語、阿拉伯語等，以符合您的目標群體的語言和文化偏好。
? 自訂語音建立
使用您自己的錄音訓練獨特的語音模型，讓您的品牌在所有客戶接觸點都能展現真實的聲音。
? SSML 與文字自訂
使用語音合成標記語言 (SSML) 微調語音，加入停頓、發音規則，以及日期、數字等的格式設定。
⚙️ 彈性整合
透過 REST 或 gRPC，輕鬆將 API 整合到應用程式、裝置和物聯網系統中，支援多種音訊格式，例如 MP3 和 OGG Opus。

使用案例：

客戶支援聊天機器人
以動態的 AI 產生語音取代靜態的預錄回應，打造更個人化、自然的客戶互動。例如，電信公司可以使用文字轉語音建立語音聊天機器人，以逼真的語氣和清晰度處理常見問題。
語音啟用裝置
讓智慧型裝置（例如家用助理或車載系統）能夠以擬人化的語音朗讀文字，提升使用者參與度和易用性。想像一下，智慧型喇叭以自然、對話式的語氣朗讀食譜或新聞文章。
無障礙內容建立
為視障使用者產生電子節目表 (EPG) 或電子書的音訊版本，確保包容性和易用性。串流平台可以使用文字轉語音來旁白節目描述，讓所有使用者都能更輕鬆地瀏覽。

結論：

Google 的文字轉語音 API 對於想要創造自然、可自訂語音體驗的企業和開發人員而言，是一項突破性的技術。憑藉其高品質音訊、廣泛的語言支援和彈性的整合選項，它是提升客戶互動、啟用語音介面和提升內容易用性的理想解決方案。立即開始免費試用，探索這個強大工具如何提升您的應用程式。

常見問題：

文字轉語音支援哪些語言和語音？
此 API 提供 50 多種語言的 380 多種語音，包括中文普通話、印地語、西班牙語和阿拉伯語，並且持續新增中。
我可以為我的品牌建立自訂語音嗎？
可以，您可以使用您自己的錄音訓練獨特的語音模型，確保您的品牌聲音脫穎而出並引起您的目標群體共鳴。
定價機制如何運作？
定價根據每月處理的字元數計算。WaveNet 語音每月提供 100 萬個免費字元，而標準語音則提供 400 萬個免費字元。
我可以調整語音速度、音調和音量嗎？
當然可以。此 API 允許您自訂語音速度（最高可快 4 倍或慢 4 倍）、音調（最高可提高或降低 20 半音）和音量（最高可達 16db 或降低至 -96db）。
支援哪些音訊格式？
文字轉語音支援多種格式，包括 MP3、Linear16 和 OGG Opus，確保與各種裝置和應用程式的相容性。

More information on Google Text-to-Speech

Launched

2024

Pricing Model

Free Trial

Starting Price

Global Rank

1000

Month Visit

34.2M

Top 5 Countries

23.18%

7.11%

6.71%

4.7%

3.67%

United States (23.18%) India (7.11%) Japan (6.71%) Brazil (4.7%) United Kingdom (3.67%)

Traffic Sources

60.54%

25.7%

7.6%

4.12%

Direct (60.54%) Search (25.7%) Referrals (7.6%) Social (4.12%) Paid Referrals (1.99%) Mail (0.06%)

Source: Similarweb (Jul 23, 2024)

Google Text-to-Speech was manually vetted by our editorial team and was first featured on 2023-10-11.