画像からテキストを抽出するためのトップ5のPythonライブラリ

画像からテキストを抽出するためのトップ5のPythonライブラリ

テキストのローカライゼーションと認識のためのOCRツールを理解し、マスターする

Anna Sullivanによる写真、Unsplash

Optical Character Recognition(OCR)は古いが、未だに難しい問題であり、画像やPDF文書を含む非構造化データからテキストを検出および認識することを目的としています。これには、銀行業務、電子商取引、ソーシャルメディアのコンテンツモデレーションなど、魅力的な応用があります。

しかし、データサイエンスの分野においては、OCRタスクの解決方法を学ぶための膨大なリソースが存在します。そのため、このチュートリアルを書いています。このチュートリアルは、初めの一歩を踏み出すのに役立つでしょう。

この記事では、苦労することなく画像からテキストを迅速に抽出することができるいくつかのPythonライブラリを紹介します。各ライブラリの説明に続いて、実際の例を示します。使用するデータセットはKaggleから取得されています。概念を簡略化するため、映画「Rush」の画像を使用しています。

さあ、はじめましょう!

textOCRデータセットからの画像。出典:

目次:

  1. pytesseract
  2. EasyOCR
  3. Keras-OCR
  4. TrOCR
  5. docTR

1. pytesseract

これは、最も人気のあるPythonライブラリの1つであり、光学文字認識に使用されます。GoogleのTesseract-OCRエンジンを使用して画像からテキストを抽出します。複数の言語がサポートされています。サポートされている言語を確認するには、こちらをご覧ください。画像をテキストに変換するために、わずかなコード行が必要です:

# インストール!sudo apt install tesseract-ocr!pip install pytesseractimport pytesseractfrom pytesseract import Outputfrom PIL import Imageimport cv2img_path1 = '00b5b88720f35a22.jpg'text = pytesseract.image_to_string(img_path1,lang='eng')print(text)

これが出力結果です:

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「ジャスティン・マクギル、Content at Scaleの創設者兼CEO - インタビューシリーズ」

ジャスティンは2008年以来、起業家、イノベーター、マーケターとして活動しています彼は15年以上にわたりSEOマーケティングを...

人工知能

「サティスファイラボのCEO兼共同創設者、ドニー・ホワイト- インタビューシリーズ」

2016年に設立されたSatisfi Labsは、会話型AI企業のリーディングカンパニーです早期の成功は、ニューヨーク・メッツ、メイシ...

AIニュース

Q&A:ブラジルの政治、アマゾンの人権、AIについてのGabriela Sá Pessoaの見解

ブラジルの社会正義のジャーナリストは、MIT国際研究センターのフェローです

人工知能

「アナコンダのCEO兼共同創業者、ピーターウォングによるインタビューシリーズ」

ピーター・ワンはAnacondaのCEO兼共同創設者ですAnaconda(以前はContinuum Analyticsとして知られる)を設立する前は、ピー...

機械学習

もし芸術が私たちの人間性を表現する方法であるなら、人工知能はどこに適合するのでしょうか?

MITのポストドクターであるジヴ・エプスタイン氏(SM '19、PhD '23)は、芸術やその他のメディアを作成するために生成的AIを...

AIテクノロジー

アンソニー・グーネティレケ氏は、Amdocsのグループ社長であり、テクノロジー部門および戦略部門の責任者です- インタビューシリーズ

アンソニー・グーネティレーケは、Amdocsでグループ社長、テクノロジーと戦略担当です彼と企業戦略チームは、会社の戦略を策...