Step-Audio| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Voice To Text,Audio Transcript,Transcript |
| Launched | |
| Pricing Model | Free |
| Starting Price | |
| Tech used | |
| Tag | Voice Generators,Voice Cloning,Audio Generation |
| Global Rank | |
| Country | |
| Month Visit |
| Global Rank | |
| Country | |
| Month Visit |
Estimated traffic data from Similarweb
Omnilingual ASR - Omnilingual ASRは、1,600以上の言語に対応するオープンソースの音声認識システムです。その中には、これまでいかなるASR技術も対象としたことのない数百もの言語も含まれています。
Aero-1-Audio - Aero-1-Audio:15分間の連続した音声処理に最適化された、効率的な15億パラメータモデル。セグメンテーションなしで、高精度なASR(自動音声認識)と理解を実現。オープンソースで公開!
FireRedTTS-2 - FireRedTTS-2で、ポッドキャストやチャットボットを飛躍的に進化させましょう。自然で多人数に対応した長尺音声を提供し、超低遅延と多言語音声クローニングも実現します。
Reverb - Reverb はオープンソースの音声認識および話者分離モデルを提供しています。高精度 ASR、話者分離、逐語性制御。ポッドキャストの書き起こし、会議議事録、ビデオキャプションに最適です。音声技術の基準を再定義します。