FireRedTTS-2| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Voice To Text,Audio Transcript,Transcript |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Text To Voice,Voice Cloning,Audio Generation |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
Omnilingual ASR - Omnilingual ASR 是一款开源语音识别系统,支持超过1600种语言,其中甚至涵盖了数百种此前任何ASR技术都未曾涉足的语言。
Aero-1-Audio - Aero-1-Audio:高效的15亿参数模型,可处理长达15分钟的连续音频。无需分割即可实现精准的语音识别(ASR)和语义理解。开源!
Step-Audio - 探索 Step - Audio:首个可直接用于生产的开源智能语音交互框架。它协调理解与生成,支持多语言、情感化和方言丰富的对话。
Reverb - Reverb 提供开源语音识别和说话人分离模型。高精度自动语音识别 (ASR),说话人分离,逐字控制。非常适合播客转录、会议记录和视频字幕。重新定义了语音技术的基准。