mocoVoice よくある質問
LLM用にコピー
LLM用にページをMarkdownとしてコピー
Markdownで表示
このページをMarkdownで開く
ChatGPTで開く
ChatGPTから洞察を取得
Claudeで開く
Claudeから洞察を取得

このページでは、mocoVoiceに関するよくある質問をまとめています。

サービス全般について

他社の音声認識サービスとの違いは何ですか？

mocoVoiceは、以下の点で他社の音声認識サービスと差別化しています。

シンプルなAPI設計で容易に統合できます。
音声ファイルに加え、動画ファイルからも書き起こしも可能です。
高精度な書き起こし品質を実現しています。
辞書登録時に読み仮名は必須ではありません。
話者分離機能を搭載しています。
日本語と英語をはじめとする多言語に対応し、自動でコードスイッチが可能です。

mocoVoiceの性能は継続的に改善されますか？

はい。mocoVoiceは継続的にデータ学習とアーキテクチャの改善を行っており、最新の用語にも対応できる高性能なモデルを提供し続けます。

どんな人の声でも認識しますか？

はい。どのような話者の声にも対応するように設計されています。

イントネーションや方言の違いに対応していますか？

はい、対応しています。さらに、辞書登録や専用モデルを利用することで、精度を向上させることも可能です。

単語ごとの発話でも認識精度は維持されますか？

はい。単語ごとの発話でも問題なく書き起こし可能です。

書き起こしの仕組みについて教えてください。

mocoVoiceは、音響情報と言語情報の両方を考慮したAIを用いて書き起こしを行います。また、LLM（大規模言語モデル）も活用することで、さらに精度を高めています。

mocoVoiceのセキュリティについて教えてください

音声及び書き起こしデータは、暗号化されたストレージに保管されており、権限あるユーザのみがアクセスできるような仕組みになっております。なお、オンプレミスもご検討いただけます。

料金・契約について

mocoVoiceを試しに使ってみたいです。どのように契約すればよいですか？

mocoVoiceサポートフォームから、mocoVoice試用希望の旨をお問い合わせください。担当者よりご連絡させていただきます。

個別価格での提供はありますか？

はい、個別の契約プランをご用意しています。mocoVoiceサポートフォームから、個別契約希望の旨をお問い合わせください。

利用料金の小数点以下の計算方法を教えてください。

小数点以下は切り上げとなります。

Trialプラン終了後はどうなりますか？

Trialプラン終了後はチームのプランはNoneになります。このプランでは過去のデータは残りますが、すべての機能がご利用になれません。有料プラン契約後、書き起こしを始め、その他機能がご利用になれます。

プランNONEと表示されますこれは何ですか？

Trialプラン終了後、または新しいチームを作成すると、チームのプランはNoneになります。このプランでは過去のデータは残りますが、すべての機能がご利用になれません。有料プラン契約後、書き起こしを始め、その他機能がご利用になれます。

展示会等で個別の案内を受けました。どのようにしたら良いですか？

mocoVoiceプラン変更申請フォームのクーポン等入力欄に、展示会等の参加イベントおよび、希望する契約形態をご入力ください。展示会参加者との対応を確認後、プランを個別にご案内いたします。

技術的な質問

mocoVoice APIとmocoVoiceの性能は同じですか？

mocoVoice APIは速さと音に忠実な精度を優先した書き起こしを行います。mocoVoiceは読みやすさを優先した書き起こしを行っています。 mocoVoice APIでもmocoVoice同様の性能が欲しい場合は個別にお問い合わせください。

書き起こしの処理時間はどのくらいですか？

サーバーの負荷状況によりますが、 mocoVoice APIは1時間の音声ファイルであれば最短3分、mocoVoice最短10分程度で書き起こしが完了します。

書き起こしの精度が悪い場合はどうすれば良いですか？

録音環境や音声ファイルのフォーマットは、書き起こしの精度に影響を与える可能性があります。以下の点をご確認ください。

録音環境：ノイズが少ない、クリアな音声が録音されているか
ファイル形式：推奨形式（wav、モノラル、16kHz）であるか

また、辞書登録や専用モデルの利用も精度向上に有効です。

どの言語に対応していますか？

日本語(ja)と英語(en)に加え、以下の言語に対応しています。

言語コード	言語
`en`	English
`zh`	Chinese
`de`	German
`es`	Spanish
`ru`	Russian
`ko`	Korean
`fr`	French
`ja`	Japanese
`pt`	Portuguese
`tr`	Turkish
`pl`	Polish
`ca`	Catalan
`nl`	Dutch
`ar`	Arabic
`sv`	Swedish
`it`	Italian
`id`	Indonesian
`hi`	Hindi
`fi`	Finnish
`vi`	Vietnamese
`he`	Hebrew
`uk`	Ukrainian
`el`	Greek
`ms`	Malay
`cs`	Czech
`ro`	Romanian
`da`	Danish
`hu`	Hungarian
`ta`	Tamil
`no`	Norwegian
`th`	Thai
`ur`	Urdu
`hr`	Croatian
`bg`	Bulgarian
`lt`	Lithuanian
`la`	Latin
`mi`	Maori
`ml`	Malayalam
`cy`	Welsh
`sk`	Slovak
`te`	Telugu
`fa`	Persian
`lv`	Latvian
`bn`	Bengali
`sr`	Serbian
`az`	Azerbaijani
`sl`	Slovenian
`kn`	Kannada
`et`	Estonian
`mk`	Macedonian
`br`	Breton
`eu`	Basque
`is`	Icelandic
`hy`	Armenian
`ne`	Nepali
`mn`	Mongolian
`bs`	Bosnian
`kk`	Kazakh
`sq`	Albanian
`sw`	Swahili
`gl`	Galician
`mr`	Marathi
`pa`	Punjabi
`si`	Sinhala
`km`	Khmer
`sn`	Shona
`yo`	Yoruba
`so`	Somali
`af`	Afrikaans
`oc`	Occitan
`ka`	Georgian
`be`	Belarusian
`tg`	Tajik
`sd`	Sindhi
`gu`	Gujarati
`am`	Amharic
`yi`	Yiddish
`lo`	Lao
`uz`	Uzbek
`fo`	Faroese
`ht`	Haitian Creole
`ps`	Pashto
`tk`	Turkmen
`nn`	Nynorsk
`mt`	Maltese
`sa`	Sanskrit
`lb`	Luxembourgish
`my`	Myanmar
`bo`	Tibetan
`tl`	Tagalog
`mg`	Malagasy
`as`	Assamese
`tt`	Tatar
`haw`	Hawaiian
`ln`	Lingala
`ha`	Hausa
`ba`	Bashkir
`jw`	Javanese
`su`	Sundanese
`yue`	cantonese

リアルタイム書き起こしは可能ですか？

リアルタイムAPIは現在開発中です。今後のアップデートにご期待ください。

バッチでリクエストを送れますか？

バッチリクエストAPIは現在開発中です。今後のアップデートにご期待ください。

APIレスポンスの形式について教えてください。

APIの詳細は、mocoVoice API リファレンスをご確認ください。

アップロード可能な音声データのサイズに制限はありますか？

最大3GBまでのファイルを処理可能です。ただし、登録単語数によっては、3GB未満でも処理できない場合があります。

アップロード可能なデータ形式に制限はありますか？

以下の音声・動画フォーマットに対応しています。

音声: wav, mp3, m4a, caf, aiff, wma, flac, ogg, aac

動画: avi, mp4, rmvb, flv, mov, wm

その他、8kHz, 16kHz, 22.05kHz, 44.1kHz, 48kHz, 96kHz、モノラル/ステレオに対応しています。容量は3GBまでです。書き起こし時間と精度を考慮すると、wav形式、モノラル、16kHzでの入力が推奨されます。

話者分離が3時間を超えるとリセットされます。

mocoVoiceでは、内部の話者分離処理が3時間単位で行われます。そのため、3時間を超える音声ファイルを処理した場合、3時間を境にして話者IDの割り当てが変わる可能性があります。

例えば、0時間～3時間の間で「SPEAKER_00」と識別された話者が、3時間以降も発言した場合、「SPEAKER_02」のように新しいIDが付与されることがあります（同じ人物であっても）。

これは仕様上の挙動となります。書き起こし結果を確認し、必要に応じて話者名を編集する機能を使って、同じ人物に同じ名前を割り当てて整理してください。

詳細は書き起こしを開始するの注意書きもご参照ください。

動画ファイルから書き起こしはできますか？

はい、動画ファイルからの書き起こしも可能です。

オフライン環境での書き起こしは可能ですか？

書き起こしリクエストと結果確認にはインターネット接続が必要です。ただし、リクエスト送信後、結果確認までの間はオフラインでも問題ありません。

辞書登録で登録可能な単語数の上限はありますか？

上限は1000単語です。(1000単語を超えてもエラーは発生しませんが、制限として設けています。)

辞書登録時に読み仮名の登録は必要ですか？

必須ではありません。ただし、読み仮名を登録することで精度が向上します。

辞書登録で、一単語に複数の読み仮名を登録できますか？

はい。「読み1|読み2|読み3」のように、複数の読み仮名を「|」で区切って登録できます。読み仮名の登録数に上限はありません。

音声入力時の認識率を上げるにはどうすれば良いですか？

明瞭で大きな声で発声し、背景雑音のない静かな環境で録音すると、認識率が向上します。

アカウント・その他

アカウント作成時の確認メールが届きません。

no-reply@mocomoco.aiからの確認メールが、迷惑メールフォルダ等に振り分けられていないか一度ご確認お願いします。

上記で解決しない場合、mocoVoiceサポートフォームよりお問い合わせください。

パスワードをリセットしたいです。

mocoVoiceのログイン画面で、「パスワードを忘れた場合」ボタンからパスワードをリセットできます。

解約方法を教えてください。

mocoVoiceサポートフォームから、該当サービス解約希望の旨をお問い合わせください。

送信した音声データはどこで処理されますか？

原則として国内外のサーバーを使用しています。ただし、国内サーバーのみで処理を行う個別契約プランもご用意しています。ご希望の場合はmocoVoiceサポートフォームからお問い合わせください。

サービスの障害発生時はどのように確認できますか？

サービス稼働状況ページでご確認いただけます。

mocoVoiceのオンプレミス版はありますか？

はい、オンプレミス版を提供する個別契約プランもございます。ご希望の場合はmocoVoiceサポートフォームからお問い合わせください。

mocoVoice その他の質問

よくある質問に該当しない場合は、mocoVoiceサポートフォームよりお問い合わせください。

mocoVoice よくある質問コピーLLM用にコピーLLM用にページをMarkdownとしてコピーMarkdownで表示このページをMarkdownで開くChatGPTで開くChatGPTから洞察を取得Claudeで開くClaudeから洞察を取得