mocoVoice よくある質問
このページでは、mocoVoiceに関するよくある質問をまとめています。
サービス全般について
他社の音声認識サービスとの違いは何ですか?
mocoVoiceは、以下の点で他社の音声認識サービスと差別化しています。
- シンプルなAPI設計で容易に統合できます。
- 音声ファイルに加え、動画ファイルからも書き起こしも可能です。
- 高精度な書き起こし品質を実現しています。
- 辞書登録時に読み仮名は必須ではありません。
- 話者分離機能を搭載しています。
- 日本語と英語の両方に対応し、高精度な書き起こしを提供します。
mocoVoiceの性能は継続的に改善されますか?
はい。mocoVoiceは継続的にデータ学習とアーキテクチャの改善を行っており、最新の用語にも対応できる高性能なモデルを提供し続けます。
どんな人の声でも認識しますか?
はい。どのような話者の声にも対応するように設計されています。
イントネーションや方言の違いに対応していますか?
はい、対応しています。さらに、辞書登録や専用モデルを利用することで、精度を向上させることも可能です。
単語ごとの発話でも認識精度は維持されますか?
はい。単語ごとの発話でも問題なく書き起こし可能です。
書き起こしの仕組みについて教えてください。
mocoVoiceは、音響情報と言語情報の両方を考慮したAIを用いて書き起こしを行います。また、LLM(大規模言語モデル)も活用することで、さらに精度を高めています。
料金・契約について
mocoVoiceを試しに使ってみたいです。どのように契約すればよいですか?
お問い合わせフォームはこちら から、mocoVoice試用希望の旨をお問い合わせください。担当者よりご連絡させていただきます。
定額プランや個別価格での提供はありますか?
はい、個別の契約プランをご用意しています。お問い合わせフォームはこちら から、個別契約希望の旨をお問い合わせください。
利用料金の小数点以下の計算方法を教えてください。
小数点以下は切り上げとなります。
「学習なしプラン」と「学習ありプラン」の違いは何ですか?
学習ありプラン: お客様のデータは匿名化された上で、mocoVoiceのサービス改善や精度向上に利用させていただきます。
学習なしプラン: お客様のデータはサービス改善に利用されません。プライバシー保護を重視されるお客様におすすめです。
新しいチームを作成すると、そのチームのプランはNONEとなります。有料プラン契約後、新しいチームで書き起こしが可能となります。
技術的な質問
書き起こしの処理時間はどのくらいですか?
サーバーの負荷状況によりますが、1時間の音声ファイルであれば最短3分で書き起こしが完了します。
書き起こしの精度が悪い場合はどうすれば良いですか?
録音環境や音声ファイルのフォーマットは、書き起こしの精度に影響を与える可能性があります。以下の点をご確認ください。
- 録音環境:ノイズが少ない、クリアな音声が録音されているか
- ファイル形式:推奨形式(wav、モノラル、16kHz)であるか
また、辞書登録や専用モデルの利用も精度向上に有効です。
どの言語に対応していますか?
日本語と英語に加え、以下の言語に対応しています。
中国語、ドイツ語、スペイン語、ロシア語、韓国語、フランス語、ポルトガル語、トルコ語、ポーランド語、カタルーニャ語、オランダ語、アラビア語、スウェーデン語、イタリア語、インドネシア語、ヒンディー語、フィンランド語、ベトナム語、ヘブライ語、ウクライナ語、ギリシャ語、マレー語、チェコ語、ルーマニア語、デンマーク語、ハンガリー語、タミル語、ノルウェー語、タイ語、ウルドゥー語、クロアチア語、ブルガリア語、リトアニア語、ラテン語、マオリ語、マラヤーラム語、ウェールズ語、スロバキア語、テルグ語、ペルシア語、ラトビア語、ベンガル語、セルビア語、アゼルバイジャン語、スロベニア語、カンナダ語、エストニア語、マケドニア語、ブルトン語、バスク語、アイスランド語、アルメニア語、ネパール語、モンゴル語、ボスニア語、カザフ語、アルバニア語、スワヒリ語、ガリシア語、マラーティー語、パンジャブ語、シンハラ語、クメール語、ショナ語、ヨルバ語、ソマリ語、アフリカーンス語、オック語、ジョージア語、ベラルーシ語、タジク語、シンド語、グジャラート語、アムハラ語、イディッシュ語、ラオス語、ウズベク語、フェロー語、ハイチ・クレオール語、パシュトー語、トルクメン語、ニーノシュク、マルタ語、サンスクリット語、ルクセンブルク語、ミャンマー語、チベット語、タガログ語、マダガスカル語、アッサム語、タタール語、ハワイ語、リンガラ語、ハウサ語、バシキール語、ジャワ語、スンダ語、広東語
リアルタイム書き起こしは可能ですか?
現在開発中です。今後のアップデートにご期待ください。
APIレスポンスの形式について教えてください。
APIの詳細は、mocoVoice API リファレンスをご確認ください。
アップロード可能な音声データのサイズに制限はありますか?
最大1GBまでのファイルを処理可能です。ただし、登録単語数によっては、1GB未満でも処理できない場合があります。
アップロード可能なデータ形式に制限はありますか?
以下の音声・動画フォーマットに対応しています。
音声: wav, mp3, m4a, caf, aiff, wma, flac, ogg, aac
動画: avi, mp4, rmvb, flv, mov, wmv
その他、8kHz, 16kHz, 22.05kHz, 44.1kHz, 48kHz, 96kHz、モノラル/ステレオに対応しています。音声の長さは最大2時間、容量は1GBまでです。書き起こし時間と精度を考慮すると、wav形式、モノラル、16kHzでの入力が推奨されます。
動画ファイルから書き起こしはできますか?
はい、動画ファイルからの書き起こしも可能です。
オフライン環境での書き起こしは可能ですか?
書き起こしリクエストと結果確認にはインターネット接続が必要です。ただし、リクエスト送信後、結果確認までの間はオフラインでも問題ありません。
辞書登録で登録可能な単語数の上限はありますか?
上限は1000単語です。(1000単語を超えてもエラーは発生しませんが、制限として設けています。)
辞書登録時に読み仮名の登録は必要ですか?
必須ではありません。ただし、読み仮名を登録することで精度が向上します。
辞書登録で、一単語に複数の読み仮名を登録できますか?
はい。「読み1|読み2|読み3」のように、複数の読み仮名を「|」で区切って登録できます。読み仮名の登録数に上限はありません。
音声入力時の認識率を上げるにはどうすれば良いですか?
明瞭で大きな声で発声し、背景雑音のない静かな環境で録音すると、認識率が向上します。
アカウント・その他
個人でも利用できますか?
はい、個人でもご利用いただけます。mocoVoice APIはチーム単位での利用となりますが、1人だけのチームを作成することで個人利用が可能です。
同じAPIキーを同時に複数で使用できますか?
はい、可能です。
パスワードをリセットしたいです。
mocoVoiceダッシュボードのログイン画面で、「パスワードを忘れた場合」ボタンからパスワードをリセットできます。
退会方法を教えてください。
お問い合わせフォームはこちら から、mocoVoice API退会希望の旨をお問い合わせください。
送信した音声データはどこで処理されますか?
原則として国内外のサーバーを使用しています。ただし、国内サーバーのみで処理を行う個別契約プランもご用意しています。ご希望の場合はお問い合わせフォームはこちらからお問い合わせください。
サービスの障害発生時はどのように確認できますか?
mocoVoiceサービスステータスページでご確認いただけます。
mocoVoiceのオンプレミス版はありますか?
はい、オンプレミス版を提供する個別契約プランもございます。ご希望の場合はお問い合わせフォームはこちらからお問い合わせください。