2025年最好的 MARS5 TTS 替代方案
-

-

-

使用 Open-VoiceCanvas 複製聲音,並以 50 多種語言產生栩栩如生的語音。開放原始碼、可自訂的 TTS 平台。
-

FireRedTTS-2 讓您的播客和聊天機器人煥然一新,提供自然流暢的多角色長篇語音。同時,您還能體驗超低延遲及多語言語音複製的強大功能。
-

All Voice Lab 是 AI 語音平台,提供極度逼真的 TTS (文字轉語音) 及語音複製功能。採用 SOTA MaskGCT 2.0 模型技術,為創作者和開發者提供多語言、富有表現力的音訊。
-

-

-

即時語音複製:在幾秒內複製聲音!用於研究與客製化語音助理的開源 SV2TTS。Python, PyTorch。
-

-

MetaVoice-1B 係一款 1.2B 參數基礎模型,經由 100K 小時語音訓練,用於 TTS(文字轉語音)。
-

Higgs Audio V2:開源AI語音模型,專為生成富有表現力、栩栩如生的語音而設計。無須額外微調,即可生成多說話者對話、複製語音並彈性調整情緒。
-

Spark-TTS:自然AI文字轉語音。輕鬆進行語音複製(EN/CN)。透過大型語言模型(LLMs)產生流暢、高效且高品質的音訊。
-

-

Respeecher:專業級 AI 聲音複製技術,能創造出自然逼真且情感豐沛的聲音。這項語音轉語音技術已廣泛應用於電影、遊戲等領域,並堅守道德規範,成果備受實證。
-

-

MaskGCT (Masked Generative Codec Transformer) 是一個完全非自迴歸的 TTS 模型,它消除了文本和語音監督之間顯式對齊資訊的需要,以及音素級別的持續時間預測。
-

只要 10 秒鐘就能使用 Speaking AI 錄製和複製您的聲音。加入社群並解鎖獨家功能,塑造生成式聲音 AI 的未來。
-

-

-

Muyan-TTS:為 Podcast 打造的開源 TTS 引擎。可訓練、客製化聲音,並具備快速推論能力。基於 Llama-3。以最少量資料,滿足您的需求。
-

PlayHT 是擁有 600 多種 AI 聲音的頭號 AI 語音產生器,可創造出超逼真的文字轉語音旁白。將文字轉換為音訊並以 MP3 和 WAV 檔案下載。
-

-

VoiceCraft 是一個基於令牌填入的神經編解碼器語言模型,在野生數據(包括有聲書、網路影片和播客)上的語音編輯和零樣本文字轉語音 (TTS) 方面都達到了最先進的性能。
-

開放原始碼的 Orpheus TTS:運用大型語言模型打造媲美真人語音品質的語音合成技術。可以複製聲音、控制情緒,並且即時串流。輕鬆客製化與整合!
-

一款免費且一應俱全的音訊工具,不僅能生成逼真的文字轉語音旁白,更提供豐富的高音質音效素材庫。無論是用於影片、播客,或是各種創意專案,皆能完美滿足您的需求。
-

探索 Step - Audio:首款可立即投入生產的開源框架,適用於智慧語音互動。協調理解與生成,支援多語系、富含情感,以及方言的對話。
-

-

探索 OpenVoice V2,最新的 AI 聲音複製創新技術!享受卓越的音訊保真度、多語言支援,以及適用於免費商業用途的多元化語音控制。
-

免費線上文字轉語音製作工具 輕鬆將文字轉換成自然流暢的語音。支援多種語言和語音。快速產生和下載高品質的 TTS MP3 檔案。非常適合有聲書、簡報和無障礙使用。
-

