この記事の目次
音声の文字起こしや、会議の議事録の作成に無料で使えるアプリやソフトを紹介します。ボイスレコーダーなどで取得したmp3などの音声を、GoogleやMicrosoftなどで費用をかけずに、さっと無料で試すことができる文字起こしツールだけをリサーチしました。
Maki Higashi
株式会社Remedies CEO / UX Writerライターに役立つ情報をお届けするwordrabbit編集部です。業務を進めるうえで議事録作成にかかる負荷は非常に大きいものです。しかし、議事録アプリやソフトは多数あるため、どれを選んだらよいのか迷う人も多いのではないでしょうか。そこで、文字起こしを音声認識で自動化できるアプリやソフトの中でも無料で使えるものだけを集め、「精度」「対応デバイス」「発言者が認識できるか」「セキュリティ」の観点で検証しました。広告料などはどのサービスからも一切いただかず、第三者の立場でしっかり公平に検証し、本当に使える文字起こしソフトはどれなのか調査した結果をお伝えします。
この記事の目次
インタビュー記事の議事録作成や、会議の記録のためにたびたび必要になる音声の文字起こし。手作業で行う場合、非常に面倒で膨大な時間がかかってしまいます。例えば、1時間のインタビューの文字数を15000〜20000文字(平均17500文字)、1分で入力できる文字数:100〜200文字(平均150文字)とすると、単純計算でも1時間のインタビューの文字起こしを行うのに、約116分=約2時間かかることになります。
文字起こしを楽にするために検討したいのが、無料の文字起こしソフトです。
ただ、2023年11月現在、文字起こしサービスが乱立しており、違いが分かりにくい状況です。そこで「多くのソフトやアプリがあるので、試したいけれどどれが一番正確に音声が認識されるのか分からない」「忙しいのでいちいち試している余裕がない」という方に向けて、数ある無料文字起こしソフトの中でどれが一番良さそうなのか、5つのサービスの調査を行いました。
特に議事録などのビジネス利用では、一定のセキュリティ基準を満たすことも重要になってきます。そのため、運営者が小規模な企業なサービスや、開発がストップしていると見受けられるようなサービスは対象から除外し、使い続けられるようなサービスのみに絞って検証しています。
方法としては、夏目漱石の「我輩は猫である」の冒頭の文章を約30cmの距離から早口で読み上げて解析させました。
読み上げたのは、以下の文章です。
吾輩(わがはい)は猫である。名前はまだ無い。どこで生れたかとんと見当(けんとう)がつかぬ。何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。吾輩はここで始めて人間というものを見た。しかもあとで聞くとそれは書生という人間中で一番獰悪(どうあく)な種族であったそうだ。
サービス名 | 総合評価 | デバイス | 発言者認識 | セキュリティ |
---|---|---|---|---|
Microsoft Word | ★★★ | ◎ | スマホ / PC | × |
Google Docs | ★★☆ | ◎ | スマホ / PC | × |
CLOVA Note | ★★☆ | ◎ | スマホ / PC | ○ |
Notta | ★★☆ | ○ | スマホ / PC | ○ |
ChatGPTアプリ | ★☆☆ | ○ | スマホ | ○ |
「Microsoft Word」では、「ホーム」>「ディクテーション」からマイクボタンを押すだけで文字起こしをスタートすることができます。以前よりも大幅に機能が改善し、マイクでしっかりと音声を取得した音声であれば、かなり聞き取ってくれるようになりました。
※公式情報はWordで文書を音声入力するをご覧ください。
解析結果
吾輩は猫である名前はまだない。どこで生まれたかとんと見当がつかぬ。なんでも薄暗いじめじめとした所でニャーニャー泣いていたことだけは記憶している。吾輩はここで初めて人間というものを見た。しかもあとできくと、それは書生という人間で、中で一番どーわくな種族であったそうだ。
評価
総合評価
★★★
よい点
悪い点
Googleドキュメントはグーグルが提供する無料のソフトウェアです。ネットにつながっていればどこでも利用することができて、自動文字起こし機能の回数や容量などの制限もありません。解析した結果は、句読点がない以外は、Microsoft Wordとほとんど同様の結果でした。
解析結果
吾輩は猫である名前はまだない どこで生まれたかとんと見当がつかぬ 何でも 薄暗いじめじめしたところで ニャーニャー 泣いていたことだけは 記憶している 吾輩はここで初めて 人間というものを見た しかも 後で聞くとそれは 書生 という人間中で一番 同枠な種族であったそうだ
評価
総合評価
★★★
よい点
悪い点
nottaは毎月120分無料で利用できる文字起こしソフトです。フリープランではファイルの文字起こし(wav, mp3, m4a, caf, aiff, avi, rmvb, flv, mp4, mov, wmv, wma)と、音声の文字起こしができます。
解析結果
吾輩は猫である。名前はまだない。どこで生まれたかとんと見当がつかぬ。なんでも薄暗いジメジメとしたところには泣いていたことだけは記憶している。吾輩はここで初めて人間というものを見たしかも後で聞くとそれは書生という人間中で一番道悪な種族だったそうだ。
評価
総合評価
★★☆
よい点
悪い点
「CLOVA Note」は、ワークスモバイルジャパン株式会社というLINE WORKSを運営する企業が提供する文字起こしソフトです。オープンベータ期間中は毎月300分まで利用することができます(2023年11月現在の情報です)。発言者の認識も行うことができる点、アプリから利用できる点が他のサービスとは異なる点です。
解析結果
我輩は猫である。名前はまだない。どこで生まれたかとんと見当がつかな。なんでも薄暗いジメジメしたところでにゃあにゃあ鳴いていたことだけは記憶している。
我輩はここで初めて人間というものを見た。しかも後で聞くとそれは女性という人間中で1番同悪な種族であったそうだ。
評価
総合評価
★★☆
よい点
悪い点
OpenAIのWhisperを使いたいけれど、環境を作るのは面倒という方は、短時間であればChatGPTのアプリからの音声入力が利用できます。ChatGPTアプリの入力画面から音声入力のボタンをクリックして発言を始めると、無料で文字起こしをすることができます。Whisperが環境設定なしで利用できる方法があれば良いのですが、現状利用できる方法はありません。
解析結果
我輩は猫である。名前はまだない。どこで生まれたかとんと見当がつかぬ。何でも薄暗いジメジメとしたところでニャーニャー鳴いていたことだけは記憶している。我輩はここで初めて人間というものを見た。しかも後で聞くとそれは諸星という人間中で一番道悪な種族であったそうだ。
評価
総合評価
★☆☆
よい点
悪い点
今回全ての文字起こしソフト・アプリを試してみましたが、遠くの音声や複数人の音声を拾うことが苦手のようです。そのため、自分で声を吹き込む形でのセルフ文字起こしには十分使うことができましたが、対談やインタビューでの使用には不足があると感じました。ただし、以下の工夫を行うことで、音声の品質をあげることができましたのでご紹介します。
調査の結果、マイクを近づけることが何より重要であることがわかりました。
マイクと口との距離をできるだけ(5-15cm以内)に近づけるようにすることがポイントです。
マイクとの距離があると、どのソフトも全く使い物になりませんでした。
自分でマイクに向かって話すのであれば、マイクの質はそれほど重要ではなく、スマホやPCについているマイクで十分です。ただ、インタビューなどで使用する場合、マイクと話者の距離がかなり近いことが前提のため、自立型のマイクなどで距離を近くすることが必要となってきます。
AIの進化により、音声認識の分野は大きく進歩しました。今回ご紹介した、文字起こしツールを活用することによって、文字起こしや議事録の作成にかかる手間が少しでもなくなればと思います。まだ使ったことがない方は、自分の執筆スタイルに合うかどうか、ぜひお試しください。
株式会社Remedies CEO。欧米学問のテクニカルライティングに基づいた執筆技法で、プロダクトライティングや、専門性が高い記事の執筆を行う。PR会社、ソフトウェアメーカー、スタートアップの立ち上げを経て、Remediesを起業。wordrabbitで執筆した記事は累計1,000万PVを超える。