pdfplumber для извлечения текста с .pdf
Утилита, считывающая текст с документов на нескольких языках, включая русский:
Репозиторий
#OCR #библиотека
Утилита, считывающая текст с документов на нескольких языках, включая русский:
import pdfplumberwith pdfplumber.open("path/to/file.pdf") as pdf: first_page = pdf.pages[0] print(first_page.chars[0])Репозиторий
#OCR #библиотека
👍11❤🔥3