収録した音声をそのままテキストに自動で文字起こしするSpeech to Text(STT、音声テキスト変換)モデルや、入力したテキストを自動音声で読み上げるText to Speech(TTS、テキスト音声変換)モデルをオープンソースで開発する企業が「Coqui」です。 Coquiの創設者たちは ...
Microsoftは2018年2月5日(現地時間)、Bing Speech APIでサポートするTTS(Text-to-Speech)言語数が34言語に拡大したことを公式ブログで発表した。今回新たにブルガリア語、クロアチア語、マレーシア語、スロベニア語、タミル語、ベトナム語の6言語を追加。開発者や ...
On Tuesday, Meta announced SeamlessM4T, a multimodal AI model for speech and text translations. As a neural network that can process both text and audio, it can perform text-to-speech, speech-to-text, ...
Voice Reader Text to Speechは、画面上のテキストを英語やその他の言語で読み上げてくれるアプリだ。対応言語は、英国英語、米国英語、ドイツ語、フランス語、イタリア語などのヨーロッパ言語17カ国語で、残念ながら日本語には対応していない。通信が必要な ...
ElevenLabs, an AI startup that just raised a $180 million mega-funding round, has been primarily known for its audio-generation prowess. The company took a step in another technological direction by ...
There are several AI tools available that can generate humanlike speech. Some AI voices can whisper, laugh, and perform other expressive feats. TTS tools vary in terms of level of realism and their ...
現在アクセス不可の可能性がある結果が表示されています。
アクセス不可の結果を非表示にする