タイムスタンプを使用してローカルで音声をテキストに書き写す方法

Q: 転写にはどのくらい時間がかかりますか?

処理速度は、デバイスの CPU/GPU ハードウェアとオーディオ ファイルの長さによって異なります。最新のデバイスの場合、5 分間のオーディオ クリップは 1 分以内に文字起こしされます。

Q: ツールを完全にオフラインで使用できますか?

はい。最初の実行でモデル ファイルがダウンロードされ、キャッシュされた後、インターネット接続をオフにして、完全にオフラインでトランスクリプションを実行できます。

タイムスタンプを使用してローカルで音声をテキストに書き写す方法

5 min read

•Verified Educational Resource

In this guide:

安全な音声文字起こしの必要性

インタビュー、会議の記録、講義、口述をテキストに書き起こすことは、アクセシビリティ、ドキュメント、コンテンツの作成にとって非常に重要です。ただし、標準のオンライン文字起こしサービスでは、音声ファイルをクラウドサーバーにアップロードする必要があります。これにより、社内での機密の議論、プライベートなインタビュー、機密の個人情報がサードパーティのデータベースに公開されます。

データを保護するには、デバイス上のローカル転写が理想的なソリューションです。ブラウザ内で音声をテキストに直接変換することで、オーディオファイルがデバイスから流出することはありません。これにより、絶対的なデータプライバシーが保証され、サーバーのキューが削除され、ファイルを即座に転写できるようになります。

音声をローカルで転写する方法

オーディオファイルをアップロード—MP3、WAV、M4A、OGG、または WEBM ファイルを選択するか、安全なドロップゾーンにドラッグアンドドロップします。
ウィスパー設定を構成する—速度を上げるために英語のみのモデルを選択するか、他の言語を書き起こすために多言語モデルを選択します。入力言語を指定したり、自動検出させることもできます。
WebAssembly 文字起こしを実行—「文字起こし」ボタンをクリックします。ブラウザはオーディオをデコードし、16kHz にリサンプリングして、ローカル Web ワーカー内で Whisper モデルを実行します。
トランスクリプトのレビューと編集—[段落] タブを調べてきれいに読むか、[タイムスタンプ] タブに切り替えてタイムスタンプのある時系列のセグメントをレビューします。ブラウザ内でテキストを直接編集できます。
トランスクリプトのエクスポート—テキストをクリップボードにコピーするか、ワンクリックでプレーンテキストファイル (.txt) としてダウンロードします。

オンデバイス WebAssembly 機械学習

ZeroWebTools は、WebAssembly にコンパイルされた高度な ONNX ランタイムエンジンと Hugging Face Transformers エンジンを利用して、オンデバイスの機械学習を実行します。トランスクライバーを初めて実行すると、量子化された Whisper Tiny モデルがダウンロードされます (約 75MB)。

ダウンロードされると、モデルはブラウザのキャッシュストレージにローカルにキャッシュされます。後続のすべての実行では、モデルがディスクから即座にロードされるため、ネットワーク接続なしで完全なオフライン転写が可能になります。すべての計算は CPU/GPU 上でローカルに行われるため、遅延やプライバシー漏洩がゼロになります。

正確なタイムスタンプと対話型編集

より長い録音を文字に起こす場合、コンテンツをナビゲートするにはセグメントのタイムスタンプが不可欠です。当社のトランスクライバーは各セグメントの正確な開始タイムスタンプを生成するため、特定の単語が話された場所をすばやく見つけることができます。

さらに、インタラクティブなトランスクリプトエディタを使用すると、段落リストビューとタイムスタンプリストビューの両方で、聞き間違えた単語や書式設定をその場で修正できます。これにより、エクスポートされた最終ドキュメントが洗練され、正確になり、すぐに公開できるようになります。

Frequently Asked Questions

私の音声データはサーバーにアップロードされていますか?

いいえ。転写は、WebAssembly を使用して、コンピューターの CPU/GPU 上で完全にローカルに実行されます。音声ファイルやテキストのトランスクリプトがアップロードされたり共有されたりすることはありません。

転写にはどのくらい時間がかかりますか?

処理速度は、デバイスの CPU/GPU ハードウェアとオーディオファイルの長さによって異なります。最新のデバイスの場合、5 分間のオーディオクリップは 1 分以内に文字起こしされます。

ツールを完全にオフラインで使用できますか?

はい。最初の実行でモデルファイルがダウンロードされ、キャッシュされた後、インターネット接続をオフにして、完全にオフラインでトランスクリプションを実行できます。

Was this utility tool helpful?

Your anonymous feedback helps us refine our tools and resources.

タイムスタンプを使用してローカルで音声をテキストに書き写す方法

タイムスタンプを使用してローカルで音声をテキストに書き写す方法

In this guide:

安全な音声文字起こしの必要性

音声をローカルで転写する方法

オンデバイス WebAssembly 機械学習

正確なタイムスタンプと対話型編集

Frequently Asked Questions

Was this utility tool helpful?

Ready to get started?