文字起こしのケバ取りとは?

日常会話やインタビューなどの音声を文字起こしをする際に含まれる「あのー」、「えー」など意味をなさない言葉を取り除くことを「ケバ取り」と言います。もともとはテープ起こしを担う企業などで使われてきた言葉ですが、AI文字起こしツールやAI議事録ツールの発達で、最近では、より多くの方が議事録上の不要な言葉を削除したいと考えるようになってきました。

文字起こしで不要なデータ(ケバ)の種類

ケバには、「えー」「あの」「えーと」などの種類があります。人が話す際の「言いよどみ」や「言い直し」のときに自然に発音される語で、フィラーと呼ばれることもあります。感動詞や間投詞の他、笑い声などもケバに含まれます。

ケバの例

  • えー
  • あの(あのー)
  • その
  • あら
  • えーと(ええと)
  • はあ
  • へえ
  • ええ
  • ああ
  • えっ
  • ええ
  • へえ
  • へええ
  • なんか
  • ていうか
  • まあ
  • も、もう
  • うんうん

[*出典:感動詞の言語学的位置づけ]

議事録の目的によって、不要なデータをそのままにしておく場合もある

議事録の中には、その目的によって「えー」や「あの」などをそのままにしておく種類のものもあります。

議事録の種類としては、素起こし・ケバ取り・整文の3種類があります。話した内容をそのまま文字にするのか、それとも読みやすく調整するのかなど、用途に応じて使い分けます。

素起こし(逐語起こし)。素起こしは、音声を忠実に文字に起こす方法です。「あのー」、「えっと」などの意味を持たない言葉も含めて、話された通りにすべての音声を文字にします。その場の臨場感や会話の雰囲気を正確に伝えることができるという特徴があるため、面談の議事録などで使用されます。

ケバ取り。ケバ取りは、話の内容とは関係ない文字を補正・削除する文字起こしの方法です。言いよどみ、言い直しは削除しつつ、必要に応じて助詞の補正なども行い読みやすくします。インタビューや、会議などの議事録で使用されます。

整文。整文は、ケバ取りをした上で、話し言葉を書き言葉に修正する文字起こしの方法です。その場にいない人間が文字で見ても意味が通るように、文体を統一したり、言葉を補ったりと、内容を変えないようにしつつ体裁を整えます。対談記事や、企業の保存用の議事録などで使用されます。

文章校正ツールを使った、議事録修正の効率化

wordrabbit

議事録の不要なデータを削除するには、目で見て取り除いたり、Wordなどの置換機能を利用して取り除いたりする方法があります。しかしどの方法も手がかかる上に、見逃してしまう場合もあります。ChatGPTなどの生成AIを使ってケバを除くこともできますが、生成AIの場合には、文章の意味が変わってしまう場合があるため、正確な議事録作成には不向きです。

そこでおすすめなのが、高精度の文章校正ツール「wordrabbit(ワードラビット)」です。wordrabbitを使えば、大量の文章でも、入力するだけで、ケバや誤字脱字を取り除くことができます。

まずは、以下のように「スタイルガイド」という用語集に取り除きたい用語を登録しておきます。

取り除きたい用語を登録

その後、AI文字起こしで作成した文章を貼り付けると、一瞬で修正候補が提示されます。

一瞬で修正候補が提示

文章を入力するだけで、ケバが発見できるため、手間をかけずに修正を作成することができます。2週間無料でお試しできるため、「手間をかけずに、議事録の不要な箇所を取り除きたい」という方はぜひお試しください。

機能が足りない場合にはリクエストしてください

これからもwordrabbitではニューラルエンジンを活用した独自のトランスフォーマー言語モデルを用いて、さらに役立つ製品をお届けしていきます。「えー」や「あの」などの検知は「スタイルガイド」に手作業で登録しなくても、自動的に検知してほしいなど、リクエストがある場合には、お問い合わせからお気軽にお送りください。

まとめ:ケバを簡単に取り除いて議事録作成を効率化する

文字起こしのケバとは何か、ケバの取り除き方について紹介しました。ビジネスシーンではAI議事録ツールを利用することが増え、不要な言葉が含まれた議事録を加工する機会も多いのではないでしょうか。

「より簡単に不要な語を取り除きたい」という方は、高精度の文章校正ツール「wordrabbit(ワードラビット)」を使えば、ケバを自動的に検知することができます。業務効率化のために、この記事がお役に立てば幸いです。