Ai2Done の Whisper スタイルの ASR オプションが多忙なチーム向けに構築されている理由
自動音声認識は不思議な贈り物であり、人間なら何時間もかかる下書きを数分で作成することができます。それを正しく使用する方法は、その後人間によるケアを 1 回行って、同音異義語を修正し、名前を修正し、部屋でお互いが話し合っている瞬間を修正することです。 Ai2Done の ASR パスは、プロジェクトを移行しようとするときに最初のトランスクリプトを迅速に作成するためのものであり、レビューなしで法的契約を移行しようとするときに完全性を主張するものではありません。痛みとは、長時間の録音、講義、現場でのインタビュー、まともに考える前にテキストが必要な会議、二度聞くのが贅沢な学生のスケジュール、見積書の引き出しが待ちきれないマーケティング週間の重さです。ブラウザファーストのワークフローでは、混乱したセクションを再実行する機会があり、サイド クエストなしで「オーディオがある」から「仕事ができる」まで進むことができます。関連する検索ニーズとしては、会議の文字起こし、ファイル名が異なる同じストーリー、音声からページへの穏やかな方法を求める同じニーズがあります。感情的な現実は多くのオフィスで同じです。下書きに対する恐怖、雑に見えることに対する恐怖、ニュアンスのあるマシンを信頼することに対する恐怖、これらはすべて当然の恐怖であり、修正は簡単な実践であり、ASR は時間の節約として扱われ、リスクが高い場合のレビューの代わりとして扱われません。重要な箇所で最初のパスが間違っている可能性があるため、機密データ、規制された設定、およびあたかも正確であるかのように公開されるデータについては特に注意する必要があります。勝利は、話された内容のより迅速な地図、意図を持って修正できる下書き、注意深い人間と協力することでアクセシビリティへの低コストの道、そして言葉の内容だけでなくその意味を判断するという人間にしかできない作業に少しだけ時間を費やすことができることです。
3 つの簡単なステップで、Ai2Done でアップロードからダウンロードまで行う方法
- Ai2Done でこのワークフローを開き、asr 用に準備されたファイルを追加します。
- この ASR パスを選択し、時間、サイズ、形式などの画面上のオプションをわかりやすく設定します。
- 結果をダウンロードして実際の ASR 宛先で検証し、保持されているロールバック コピーで古いファイルを置き換えます。