はじめに
mocoVoiceは、高速かつ高性能な書き起こしを実現する最新のAIサービスです。
書き起こしに加え、以下の機能があります。
辞書機能
独自の辞書を追加して専門用語や固有名詞に柔軟に対応できます。
話者分離機能
会話の中での誰が話したか分かる、話者分離機能を備えています。
多様な対応フォーマット
音声ファイル・動画ファイルどちらからの書き起こしも可能です。
使用例
mocoVoiceにこの動画ファイを使用すると、次のような結果が得られます。
mocoVoiceを使用した結果
mocoVoice API を使用した結果
[
{
"text": "おはようございます。本日はお越しいただき、ありがとうございます。",
"lang": "ja",
"start": 0.2359374999999999,
"end": 3.7959375,
"speaker": "SPEAKER_01"
},
{
"text": "おはようございます。こちらこそ、よろしくお願いします。",
"lang": "ja",
"start": 4.954062499999999,
"end": 8.1940625,
"speaker": "SPEAKER_00"
},
{
"text": "まずは簡単に自己紹介をお願いできますか?",
"lang": "ja",
"start": 8.4540625,
"end": 11.3140625,
"speaker": "SPEAKER_01"
},
{
"text": "はい、私は山田花子と申します。大学では経済学を専攻し、卒業後は記者でのキャリアを希望しております。",
"lang": "ja",
"start": 12.3278125,
"end": 19.247812500000002,
"speaker": "SPEAKER_00"
}
]
※書き起こし結果は2025/1/5時点のものであり、利用環境やバージョンにより異なる場合があります。
このように、mocoVoiceは、会議の記録作成、インタビューの書き起こし、動画コンテンツの字幕生成から、書き起こしAPI開発まで多様なシーンでご利用いただけます。
本ページでは、mocoVoiceの基本的な使い方から費用体系、APIの利用方法についてご説明します。