最終更新

はじめに

mocoVoiceは、高速かつ高性能な書き起こしを実現する最新のAIサービスです。

書き起こしに加え、以下の機能があります。

  • 辞書機能

    独自の辞書を追加して専門用語や固有名詞に柔軟に対応できます。

  • 話者分離機能

    会話の中での誰が話したか分かる、話者分離機能を備えています。

  • 多様な対応フォーマット

    音声ファイル・動画ファイルどちらからの書き起こしも可能です。

使用例

mocoVoiceにこの動画ファイを使用すると、次のような結果が得られます。

mocoVoiceを使用した結果

mocoVoice API を使用した結果

[
  {
    "text": "おはようございます。本日はお越しいただき、ありがとうございます。",
    "lang": "ja",
    "start": 0.2359374999999999,
    "end": 3.7959375,
    "speaker": "SPEAKER_01"
  },
  {
    "text": "おはようございます。こちらこそ、よろしくお願いします。",
    "lang": "ja",
    "start": 4.954062499999999,
    "end": 8.1940625,
    "speaker": "SPEAKER_00"
  },
  {
    "text": "まずは簡単に自己紹介をお願いできますか?",
    "lang": "ja",
    "start": 8.4540625,
    "end": 11.3140625,
    "speaker": "SPEAKER_01"
  },
  {
    "text": "はい、私は山田花子と申します。大学では経済学を専攻し、卒業後は記者でのキャリアを希望しております。",
    "lang": "ja",
    "start": 12.3278125,
    "end": 19.247812500000002,
    "speaker": "SPEAKER_00"
  }
]

※書き起こし結果は2025/1/5時点のものであり、利用環境やバージョンにより異なる場合があります。

このように、mocoVoiceは、会議の記録作成、インタビューの書き起こし、動画コンテンツの字幕生成から、書き起こしAPI開発まで多様なシーンでご利用いただけます。

本ページでは、mocoVoiceの基本的な使い方から費用体系、APIの利用方法についてご説明します。