ocr
Программное обеспечение
Вопрос или проблема На компьютере с Linux я смотрю много видео на YouTube, связанных с программированием/кодированием. Я хотел бы попробовать код, который демонстрируется в видео на YouTube. Полезным приложением для меня было бы возможность выделять текст
Data Science
Вопрос или проблема Я могу читать текст с изображения, используя OCR. Однако это работает построчно. Я хочу теперь группировать текст на основе сплошных линий, окружающих текст. Например, предположим, у меня есть следующие прямоугольные баннеры.
Data Science
Вопрос или проблема Я пытаюсь извлечь данные из резюме (PDF). Резюме всегда имеет определенную структуру, поэтому, если вы видите какие-то числа в резюме, то в зависимости от контекста можно понять, телефонный это номер, дата рождения или период.
Data Science
Вопрос или проблема Я много раз использовал набор данных MNIST для обучения моделей распознавания цифр на основе оптического распознавания символов (OCR). Теперь я пытаюсь сделать то же самое, но с набором данных svg-путей. Я пытаюсь найти эквивалент
Unix-подобные системы
Вопрос или проблема Мне нужны файлы PDF в текстовом формате, чтобы я мог искать в них массово из командной строки. Существует ли какой-нибудь конвертер для Ubuntu, OBSD или аналогичного дистрибутива? Возможно, связанный пост, OCR с Ubuntu здесь.
Программное обеспечение
Вопрос или проблема Моя компания поручила мне найти OCR-движок, который соответствовал бы нашим потребностям в разработке. Быстрый поиск в Google дает множество вариантов, но у нас нет времени на их полную проверку, и мы надеялись сократить список.
Убунту
Вопрос или проблема У меня возникли проблемы с Ubuntu 22.04 на моем ноутбуке Framework, и я полностью переустановил систему, используя Ubuntu 24.04.1. Я только что переустановил Tesseract с помощью snap. Ранее он работал нормально на Ubuntu 22.
Программное обеспечение
Вопрос или проблема Я ищу мобильный SDK, который может захватывать и обрабатывать документ с помощью зонального OCR и возвращать значение, которое является частью заранее определенной области в документе в оффлайн-режиме. Я посмотрел некоторые коммерческие
Data Science
Вопрос или проблема У меня есть пример сгенерированного изображения, содержащего слова, а также несколько красных стрелок, указывающих на определенные символы. Мне нужно получить эти символы от GPT, но когда я спрашиваю “
Программное обеспечение
Вопрос или проблема У меня есть тысяча рукописных ответов на следующую бумажную форму: Мне нужно их отсканировать (у меня есть сканер) и экспортировать все данные в таблицу, похожую на эту: Это возможно? С помощью OCR? С использованием LATEX?
Программное обеспечение
Вопрос или проблема Вопрос Существует ли решение для оптического распознавания текста (OCR), которое будет работать нативно на недавнем iPhone с большей точностью, чем Tesseract? Оно должно распознавать достаточно, чтобы восстановить суммы в долларах.
Программное обеспечение
Вопрос или проблема Я работаю над приложением, и мне нужен способ извлечения чисел из изображений, похожий на то, как банковские приложения извлекают номер кредитной карты из фотографии. У меня нет предпочтений по языку, но, вероятно, Python будет более полезен.
Вопросы и ответы
Вопрос или проблема import ocrmypdf from pdf2image import convert_from_path from PIL import Image, ImageEnhance, ImageFilter import numpy as np import img2pdf import io import cv2 def preprocess_image(img): """ Функция предобработки изображения (увеличение
Программное обеспечение
Вопрос или проблема Я работаю стажером в компании, где необходимо точное сканирование счетов, которые поступают в формате PDF. Программа или библиотека Java должны быть способны извлекать определенные части счета, чтобы пользователю не приходилось вручную
Программное обеспечение
Вопрос или проблема Я хочу собрать данные из долговременного медицинского исследования. Это означает несколько десятков тысяч физических документов, которые могут содержать напечатанный текст, рукописные аннотации, флажки, анатомические схемы и изображения
Программное обеспечение
Вопрос или проблема У меня есть задача разработать приложение, которое сможет сканировать документы и создавать поисковые PDF-файлы, которые можно просматривать из настольного приложения (например, WPF) или веб-браузера. Также требуется возможность сканирования
Вопросы и ответы
Вопрос или проблема Я работаю над проектом, в котором я успешно обнаружил ячейки на табличном изображении, и в каждой ячейке я пытаюсь обнаружить написанные числа и тексты, но я уже много раз терпел неудачу, пробуя множество вариантов.
Вопросы и ответы
Вопрос или проблема Я новичок в области компьютерного зрения и выбрал считывание с 7-сегментного дисплея LCD своей системы отопления в качестве первой задачи для изучения CNN. Я могу правильно считывать большинство чисел, но цифра 6 чаще всего распознается как 5.
Вопросы и ответы
Вопрос или проблема Когда я использую PyTesseract для распознавания текста на этом изображении, он возвращает ‘FORREST C. BLopGetTrT’ вместо FORREST C. BLODGETT Результат кода, который я получаю изображение, которое я использую и которое содержит много имен.
Вопросы и ответы
Вопрос или проблема Я создал модель CNN, используя набор данных MNIST. Я хочу делать предсказания для последовательности чисел, присутствующих на изображениях. Техника включает в себя сегментацию каждого изображения и подачу его в модель, но я сталкиваюсь