2025年最好的 MaskGCT 替代方案
-

-

-

-

-

-

-

Kyutai TTS 實現極速、低延遲的文字轉語音功能。當文字生成時,音訊即時串流,專為即時語音應用程式與人工智慧打造。高傳真音質。
-

-

Spark-TTS:自然AI文字轉語音。輕鬆進行語音複製(EN/CN)。透過大型語言模型(LLMs)產生流暢、高效且高品質的音訊。
-

-

即時語音複製:在幾秒內複製聲音!用於研究與客製化語音助理的開源 SV2TTS。Python, PyTorch。
-

All Voice Lab 是 AI 語音平台,提供極度逼真的 TTS (文字轉語音) 及語音複製功能。採用 SOTA MaskGCT 2.0 模型技術,為創作者和開發者提供多語言、富有表現力的音訊。
-

-

-

Higgs Audio V2:開源AI語音模型,專為生成富有表現力、栩栩如生的語音而設計。無須額外微調,即可生成多說話者對話、複製語音並彈性調整情緒。
-

透過 SpeechGPT 以口說方式練習英文,並與 ChatGPT 進行輕鬆的對話。使用 Azure 或 Amazon Polly 金鑰,增強語音合成/識別。
-

隆重推出 Voicebox,劃時代的生成式 AI 語音合成和操作模型。利用多功能、精準與多語言的 Voicebox,增進溝通並革新虛擬體驗。
-

VoiceCraft 是一個基於令牌填入的神經編解碼器語言模型,在野生數據(包括有聲書、網路影片和播客)上的語音編輯和零樣本文字轉語音 (TTS) 方面都達到了最先進的性能。
-

ChatTTS 是一款專為對話場景設計的語音生成模型,特別適用於大型語言模型 (LLM) 助理的對話任務,以及對話式音訊和視訊介紹等應用。
-

免費線上文字轉語音製作工具 輕鬆將文字轉換成自然流暢的語音。支援多種語言和語音。快速產生和下載高品質的 TTS MP3 檔案。非常適合有聲書、簡報和無障礙使用。
-

Faceless Video Generator 使用 AI 從主題生成有說話臉部的影片。它結合了 sadtalker 動畫、gTTS 語音和 OpenAI 腳本,提供端到端的客製化影片解決方案。
-

FireRedTTS-2 讓您的播客和聊天機器人煥然一新,提供自然流暢的多角色長篇語音。同時,您還能體驗超低延遲及多語言語音複製的強大功能。
-

Supertonic: Blazing-fast, on-device text-to-speech for developers. Delivers private, real-time audio synthesis with zero latency & no cloud APIs.
-

運用 Google 最先進的 AI 技術所驅動的 API,將文字轉換成自然流暢的語音。
-

TTSFree 是一個免費的線上文字轉語音工具,能將您的文字轉換為超過140種語言的自然語音。搭載 AI 技術的語音,聽起來猶如真人發聲。
-

-

MetaVoice-1B 係一款 1.2B 參數基礎模型,經由 100K 小時語音訓練,用於 TTS(文字轉語音)。
-

一款免費且一應俱全的音訊工具,不僅能生成逼真的文字轉語音旁白,更提供豐富的高音質音效素材庫。無論是用於影片、播客,或是各種創意專案,皆能完美滿足您的需求。
-

-

發現 TextGen 如何透過廣泛的模型相容性徹底革新語言生成任務。輕鬆建立內容、開發聊天機器人和擴增數據集。
