Last updated

mocoVoice よくある質問

このページでは、mocoVoiceに関するよくある質問をまとめています。

サービス全般について

他社の音声認識サービスとの違いは何ですか?

mocoVoiceは、以下の点で他社の音声認識サービスと差別化しています。

  • シンプルなAPI設計で容易に統合できます。
  • 音声ファイルに加え、動画ファイルからも書き起こしも可能です。
  • 高精度な書き起こし品質を実現しています。
  • 辞書登録時に読み仮名は必須ではありません。
  • 話者分離機能を搭載しています。
  • 日本語と英語の両方に対応し、高精度な書き起こしを提供します。
mocoVoiceの性能は継続的に改善されますか?

はい。mocoVoiceは継続的にデータ学習とアーキテクチャの改善を行っており、最新の用語にも対応できる高性能なモデルを提供し続けます。

どんな人の声でも認識しますか?

はい。どのような話者の声にも対応するように設計されています。

イントネーションや方言の違いに対応していますか?

はい、対応しています。さらに、辞書登録や専用モデルを利用することで、精度を向上させることも可能です。

単語ごとの発話でも認識精度は維持されますか?

はい。単語ごとの発話でも問題なく書き起こし可能です。

書き起こしの仕組みについて教えてください。

mocoVoiceは、音響情報と言語情報の両方を考慮したAIを用いて書き起こしを行います。また、LLM(大規模言語モデル)も活用することで、さらに精度を高めています。

料金・契約について

mocoVoiceを試しに使ってみたいです。どのように契約すればよいですか?

お問い合わせフォームはこちら から、mocoVoice試用希望の旨をお問い合わせください。担当者よりご連絡させていただきます。

定額プランや個別価格での提供はありますか?

はい、個別の契約プランをご用意しています。お問い合わせフォームはこちら から、個別契約希望の旨をお問い合わせください。

利用料金の小数点以下の計算方法を教えてください。

小数点以下は切り上げとなります。

「学習なしプラン」と「学習ありプラン」の違いは何ですか?
  • 学習ありプラン: お客様のデータは匿名化された上で、mocoVoiceのサービス改善や精度向上に利用させていただきます。

  • 学習なしプラン: お客様のデータはサービス改善に利用されません。プライバシー保護を重視されるお客様におすすめです。

プランNONEと表示されますこれは何ですか?

新しいチームを作成すると、そのチームのプランはNONEとなります。有料プラン契約後、新しいチームで書き起こしが可能となります。

技術的な質問

書き起こしの処理時間はどのくらいですか?

サーバーの負荷状況によりますが、1時間の音声ファイルであれば最短3分で書き起こしが完了します。

書き起こしの精度が悪い場合はどうすれば良いですか?

録音環境や音声ファイルのフォーマットは、書き起こしの精度に影響を与える可能性があります。以下の点をご確認ください。

  • 録音環境:ノイズが少ない、クリアな音声が録音されているか
  • ファイル形式:推奨形式(wav、モノラル、16kHz)であるか

また、辞書登録や専用モデルの利用も精度向上に有効です。

どの言語に対応していますか?

日本語と英語に加え、以下の言語に対応しています。

中国語、ドイツ語、スペイン語、ロシア語、韓国語、フランス語、ポルトガル語、トルコ語、ポーランド語、カタルーニャ語、オランダ語、アラビア語、スウェーデン語、イタリア語、インドネシア語、ヒンディー語、フィンランド語、ベトナム語、ヘブライ語、ウクライナ語、ギリシャ語、マレー語、チェコ語、ルーマニア語、デンマーク語、ハンガリー語、タミル語、ノルウェー語、タイ語、ウルドゥー語、クロアチア語、ブルガリア語、リトアニア語、ラテン語、マオリ語、マラヤーラム語、ウェールズ語、スロバキア語、テルグ語、ペルシア語、ラトビア語、ベンガル語、セルビア語、アゼルバイジャン語、スロベニア語、カンナダ語、エストニア語、マケドニア語、ブルトン語、バスク語、アイスランド語、アルメニア語、ネパール語、モンゴル語、ボスニア語、カザフ語、アルバニア語、スワヒリ語、ガリシア語、マラーティー語、パンジャブ語、シンハラ語、クメール語、ショナ語、ヨルバ語、ソマリ語、アフリカーンス語、オック語、ジョージア語、ベラルーシ語、タジク語、シンド語、グジャラート語、アムハラ語、イディッシュ語、ラオス語、ウズベク語、フェロー語、ハイチ・クレオール語、パシュトー語、トルクメン語、ニーノシュク、マルタ語、サンスクリット語、ルクセンブルク語、ミャンマー語、チベット語、タガログ語、マダガスカル語、アッサム語、タタール語、ハワイ語、リンガラ語、ハウサ語、バシキール語、ジャワ語、スンダ語、広東語

リアルタイム書き起こしは可能ですか?

現在開発中です。今後のアップデートにご期待ください。

APIレスポンスの形式について教えてください。

APIの詳細は、mocoVoice API リファレンスをご確認ください。

アップロード可能な音声データのサイズに制限はありますか?

最大1GBまでのファイルを処理可能です。ただし、登録単語数によっては、1GB未満でも処理できない場合があります。

アップロード可能なデータ形式に制限はありますか?

以下の音声・動画フォーマットに対応しています。

音声: wav, mp3, m4a, caf, aiff, wma, flac, ogg, aac

動画: avi, mp4, rmvb, flv, mov, wmv

その他、8kHz, 16kHz, 22.05kHz, 44.1kHz, 48kHz, 96kHz、モノラル/ステレオに対応しています。音声の長さは最大2時間、容量は1GBまでです。書き起こし時間と精度を考慮すると、wav形式、モノラル、16kHzでの入力が推奨されます。

動画ファイルから書き起こしはできますか?

はい、動画ファイルからの書き起こしも可能です。

オフライン環境での書き起こしは可能ですか?

書き起こしリクエストと結果確認にはインターネット接続が必要です。ただし、リクエスト送信後、結果確認までの間はオフラインでも問題ありません。

辞書登録で登録可能な単語数の上限はありますか?

上限は1000単語です。(1000単語を超えてもエラーは発生しませんが、制限として設けています。)

辞書登録時に読み仮名の登録は必要ですか?

必須ではありません。ただし、読み仮名を登録することで精度が向上します。

辞書登録で、一単語に複数の読み仮名を登録できますか?

はい。「読み1|読み2|読み3」のように、複数の読み仮名を「|」で区切って登録できます。読み仮名の登録数に上限はありません。

音声入力時の認識率を上げるにはどうすれば良いですか?

明瞭で大きな声で発声し、背景雑音のない静かな環境で録音すると、認識率が向上します。

アカウント・その他

個人でも利用できますか?

はい、個人でもご利用いただけます。mocoVoice APIはチーム単位での利用となりますが、1人だけのチームを作成することで個人利用が可能です。

同じAPIキーを同時に複数で使用できますか?

はい、可能です。

パスワードをリセットしたいです。

mocoVoiceダッシュボードのログイン画面で、「パスワードを忘れた場合」ボタンからパスワードをリセットできます。

退会方法を教えてください。

お問い合わせフォームはこちら から、mocoVoice API退会希望の旨をお問い合わせください。

送信した音声データはどこで処理されますか?

原則として国内外のサーバーを使用しています。ただし、国内サーバーのみで処理を行う個別契約プランもご用意しています。ご希望の場合はお問い合わせフォームはこちらからお問い合わせください。

サービスの障害発生時はどのように確認できますか?

mocoVoiceサービスステータスページでご確認いただけます。

mocoVoiceのオンプレミス版はありますか?

はい、オンプレミス版を提供する個別契約プランもございます。ご希望の場合はお問い合わせフォームはこちらからお問い合わせください。