話者認識、最大 8 音声
音声指紋認証は各話者を分離・ラベル付けします—「話者 1」「話者 2」は 1 クリックで実名に。インタビュー、ポッドキャスト、パネルディスカッションに最適。
Scribix は任意の動画を、話者ラベル付きの正確なテキストに秒単位で変換します。MP4、MOV、WebM、AVI ファイルをアップロード、または YouTube リンクを貼り付けるだけで、200以上の言語での完全な文字起こしが、単語レベルのタイムスタンプ付きで得られます。無料、Google サインインで利用可能、ファイルは最大 1GB まで。
動画または音声ファイルをドラッグ&ドロップ、またはクリックして参照してください。
最大 1GB · MP4 · MOV · WEBM · AVI · MKV · MP3 · WAV · M4A
音声のみの録音を扱っていますか? 音声テキスト変換専用ページを開く。
世界中の動画クリエイター、ジャーナリスト、ポッドキャスターに信頼されています
動画から文字起こしツールは、動画内の話された音声をテキストに文字起こしします。最新の AI スピーチモデルは、単語を認識し、話者を分離し、タイムスタンプを付与します。数時間ではなく数分で編集可能な文字起こしを作成します。Scribix は、プロフェッショナルな文字起こしスイートを支える同じレベルのスピーチモデルを実行します — Google でサインインして始めれば、発行可能なほど高品質な出力が得られます。
音声指紋認証は各話者を分離・ラベル付けします—「話者 1」「話者 2」は 1 クリックで実名に。インタビュー、ポッドキャスト、パネルディスカッションに最適。
北京官話からマルタ語まで、コード交換サポート付き。モデルは話者が言語を切り替える際に中途で適応します。
任意の単語をクリックしてその時点を再生できます。タイムスタンプは SRT および VTT 字幕とともにエクスポート、ビデオプレイヤーに対応。
TXT、DOCX、SRT、VTT、CSV — ドキュメント、字幕、スプレッドシート、レビュー作業に対応し、追加変換は不要です。
クリアな音声の主言語では 99.9%、TED トーク、ポッドキャスト、インタビューの 50 時間ベンチマークで測定。背景ノイズとアクセントに対応。
転送時は TLS 1.3、保存時は AES-256、処理は暗号化メモリで実行。SOC 2 準拠、GDPR 対応。お客様の音声でモデルをトレーニングすることはありません。
MP4、MOV、AVI、MKV、WebM ファイル(最大 1 GB)をドラッグ&ドロップ、または YouTube、TikTok、Instagram URL を貼り付けます。形式変換不要—Scribix はあらゆる一般的なコンテナに対応。
モデルは言語を自動検出(200以上対応)、最大 8 人の話者を分離、すべての単語にタイムスタンプを付与します。1 時間の動画は約 90 秒で文字起こし。
任意の単語をクリックしてその時点を再生できます。インラインで編集、TXT、DOCX、SRT、VTT、CSV としてダウンロード—またはエディターに文字起こしをコピー。
90 分のフッテージをショートフォーム動画に転用する YouTuber から、2 時間インタビューから正確に引用するジャーナリストまで、動画から文字起こしは、記録された会話を発行された作品に変えます。Scribix はその原動力です。
アクセシビリティのため字幕を生成、ロング動画をブログに転用、エピソードアーカイブを検索可能に。単語レベルのタイムスタンプにより、[12:04 – 12:38] の精度でバイラルクリップ抽出が簡単。
各エピソードをショーノート、ブログコンテンツ、SEO インデックス対象の文字起こしに変換—Google で見つかるかどうかの分岐点。話者ラベルは発行可能な状態で到着。
90 分インタビューを次の取材に向かう途中で文字起こし。話者ラベルはソースを再リスニングなしで正確に引用可能—引用可能なテキストが時間の分の一で。
人間による文字起こしに $1.50/分 を払うことなく、フォーカスグループ、講義、フィールド録音の定性コーディングを実行。テーマをタグ付け、あらゆる単語を検索、Dovetail や Notion にエクスポート。
2 時間の講義を検索可能なノートに変換。混乱した瞬間をマーク、単語をクリック、再度聞く。無料で試してから、Starter プラン 1 ヶ月分でセメスター全体の講義をカバーできます。
証言、役員会議、コンプライアンスインタビューの一次文字起こし—重要な部分を人間に検証させます。タイムコード付き文字起こしと監査可能な処理チェーン。SOC 2 準拠。
毎月、12 言語、48 話者、4 つのオーディオ環境(スタジオ、電話、会議、屋外)にまたがる 200 時間のテストセットで、主要な動画から文字起こしツールに対してベンチマークを実施します。
| 機能 | Scribix | Otter | Rev | Whisper.cpp |
|---|---|---|---|---|
| 無料トライアル | 45分(1回のみ) | 300 / 月 | 45 トライアル | Unlimited |
| ファイルサイズ上限 | 1 GB | 1.1 GB | 2 GB | Local |
| 対応言語 | 200+ | 30+ | 38 | 99 |
| 話者分離 | ||||
| 単語レベルタイムスタンプ | ||||
| YouTube URL サポート | ||||
| エクスポート形式 | 7 | 4 | 5 | 1 |
| ファイル削除期間 | 7 days | 30 days+ | 30 days+ | Self-host |
| 料金 — 100 時間 | $12 | $30 | $150 | Compute only |
“週 1 回 3 人のゲスト出演の動画ポッドキャストを制作します。Scribix は 3 時間の重なった音声を CMS に貼り付けられる形に変換します。話者ラベルだけで丸一日分の手間を削減。”
“14 時間の証言動画のタイムコード付き文字起こしが必要な裁判がありました。Scribix は、$4/分 で使っていた認定サービスより清潔な出力を提供。驚きです。”
“バハサ語でコード交換された英語ですべてのフィールドワークインタビューを動画記録。他のツールはつまずきます。Scribix は言語設定に触れることなく全体を文字起こし。”
お探しの情報が見つかりません。メール hello@scribix.app で送信すると、実際の人間が営業日以内に返信します。
はい。無料トライアルは Google サインインのみ必要—クレジットカード不要。決定する前に品質を試すために 45 分間の文字起こしを利用できます。有料プランではより長いファイル、優先キュー、チームライブラリ、より長いファイル保持期間がアンロックされます。
MP4、MOV、AVI、MKV、WebM(各最大 1 GB)。音声のみファイル(MP3、WAV、M4A)も対応。YouTube、TikTok、Instagram URL を貼り付け—ダウンロード不要。
主言語のクリアな音声では 99.9%(TED トーク、ポッドキャスト、インタビューの 50 時間ベンチマークで測定)。重いアクセント、背景音楽、低ビットレート音声では若干低下—ただし話者ラベルと単語レベルタイムスタンプで修正が素早い。
はい。ジェネレータに YouTube URL を貼り付けます。Scribix は YouTube の自動字幕(通常 70–80% の精度)を使う代わりに、モデルで音声を再取得します。よりクリーンな出力、話者ラベル、YouTube が公開していない単語レベルタイムスタンプが得られます。
200 以上、自動言語検出付き。モデルはコード交換(英語↔スペイン語、英語↔北京官話)を同一録音内で処理。主言語を事前選択する必要なし。
はい。音声指紋認証は最大 8 人の異なる話者を識別し、各行をラベル付けします。文字起こし後に「話者 1」「話者 2」を実名に変更でき、モデルは複数録音にわたって音声を記憶。
クリアな音声の MP4 の場合、動画 1 時間あたり約 1 分の計算時間。30 分会議は約 45 秒。YouTube 動画の取得ステップはダウンロードで 5–15 秒追加。
ファイルは TLS 1.3 でアップロード、暗号化メモリで処理、24 時間以内に削除。ユーザー音声でモデルをトレーニングしません。SOC 2 準拠インフラ、GDPR 対応データ処理、EU + US 地域処理オプション。
5 つの形式:TXT(プレーン)、DOCX(Word)、SRT(字幕)、VTT(ウェブ字幕)、CSV(スプレッドシート向け)。エクスポート前にインラインで編集可能。
はい—ただし音声優先ワークフローの場合、専用音声から文字への変換ツールが目的に特化。同じエンジン、同じ精度、音声チューニング UI。