ocr
Программное обеспечение
Вопрос или проблема Я работаю над приложением, и мне нужен способ извлечения чисел из изображений, похожий на то, как банковские приложения извлекают номер кредитной карты из фотографии. У меня нет предпочтений по языку, но, вероятно, Python будет более полезен.
Вопросы и ответы
Вопрос или проблема import ocrmypdf from pdf2image import convert_from_path from PIL import Image, ImageEnhance, ImageFilter import numpy as np import img2pdf import io import cv2 def preprocess_image(img): """ Функция предобработки изображения (увеличение
Программное обеспечение
Вопрос или проблема Я работаю стажером в компании, где необходимо точное сканирование счетов, которые поступают в формате PDF. Программа или библиотека Java должны быть способны извлекать определенные части счета, чтобы пользователю не приходилось вручную
Программное обеспечение
Вопрос или проблема Я хочу собрать данные из долговременного медицинского исследования. Это означает несколько десятков тысяч физических документов, которые могут содержать напечатанный текст, рукописные аннотации, флажки, анатомические схемы и изображения
Программное обеспечение
Вопрос или проблема У меня есть задача разработать приложение, которое сможет сканировать документы и создавать поисковые PDF-файлы, которые можно просматривать из настольного приложения (например, WPF) или веб-браузера. Также требуется возможность сканирования
Вопросы и ответы
Вопрос или проблема Я работаю над проектом, в котором я успешно обнаружил ячейки на табличном изображении, и в каждой ячейке я пытаюсь обнаружить написанные числа и тексты, но я уже много раз терпел неудачу, пробуя множество вариантов.
Вопросы и ответы
Вопрос или проблема Я новичок в области компьютерного зрения и выбрал считывание с 7-сегментного дисплея LCD своей системы отопления в качестве первой задачи для изучения CNN. Я могу правильно считывать большинство чисел, но цифра 6 чаще всего распознается как 5.
Вопросы и ответы
Вопрос или проблема Когда я использую PyTesseract для распознавания текста на этом изображении, он возвращает ‘FORREST C. BLopGetTrT’ вместо FORREST C. BLODGETT Результат кода, который я получаю изображение, которое я использую и которое содержит много имен.
Вопросы и ответы
Вопрос или проблема Я создал модель CNN, используя набор данных MNIST. Я хочу делать предсказания для последовательности чисел, присутствующих на изображениях. Техника включает в себя сегментацию каждого изображения и подачу его в модель, но я сталкиваюсь
Вопросы и ответы
Вопрос или проблема Я использую VNRecognizeTextRequest на сервере OCR, который принимает изображения по TCP, выполняет OCR и возвращает извлеченный текст. Цель заключается в поддержке всех языков, но есть проблемы с китайским.
Вопросы и ответы
Вопрос или проблема изображение 1 изображение 2 по какой-то причине, когда я пытаюсь использовать pytesseract на изображении 1, я не получаю никакого выхода, но изображение 2 дает мне выход. оригинальное изображение искажено, я предварительно обработал
Вопросы и ответы
Вопрос или проблема У меня есть программа, которая ранее использовала ChatGPT для сканирования документов и уведомления, когда на странице содержалась схема, такая как таблица или график. Поскольку ChatGPT больше не принимает изображения через API, я
Компьютеры и программы
Вопрос или проблема Нужен ли для этого приложение/программное обеспечение? Текст на изображении означает, что текст написан на изображении и необходимо выполнить поиск с использованием этого “текстового” запроса, чтобы найти изображение в папке.
Программное обеспечение
Вопрос или проблема Я ищу библиотеку C#, которая позволяет мне добавить следующее в мое .net приложение: Сканирование изображения Загрузка изображения и выбор шаблона извлечения Использование OCR или машинного обучения для извлечения текста из изображения
Вопросы и ответы
Вопрос или проблема Я пытаюсь сделать изображения captcha более читабельными для tesseract с помощью обработки изображений. Изображения имеют белый фон, 4 черные цифры в центре, слегка повёрнутые, и случайную черную линию (тоньше, чем цифры), которая
Data Science
Вопрос или проблема Имея изображение плана этажа, существует ли известный алгоритм, который я могу использовать для определения размеров всех квартир? (например, это означает, что на приложенной картинке я должен понять, что есть 4 квартиры, и считать
Программное обеспечение
Вопрос или проблема Мы хотим сканировать отсканированные документы (PDF/изображения) и извлекать значимую информацию в виде пар ключ-значение или в любом другом формате. Например, когда поставщик отправляет нам счет-фактуру в виде отсканированного PDF
Программное обеспечение
Вопрос или проблема У меня есть куча скриншотов, изображений людей и документов. Я хочу их пометить, чтобы искать их, как это делает Google, распознавая текст из скриншотов. Поэтому я пытался найти приложение для Android. Оно должно соответствовать следующим
Data Science
Вопрос или проблема В последнее время меня вдохновляет этот https://rossum.ai/, который способен извлекать текст из счетов. У вас есть идеи, как это можно реализовать? Я понимаю, что они провели много исследований, чтобы достичь такого уровня производительности
Программное обеспечение
Вопрос или проблема Я пытаюсь оцифровать свои химические заметки (в форматы, подобные тем, которые мы видим в учебниках). Я пробовал Mathpix, и он работает великолепно, но у меня нет денег, чтобы за него платить. Кто-нибудь знает о других инструментах