ocr - ответы на вопросы

Программное обеспечение

Приложение для копирования текста из видео на YouTube и вставки в терминал

00

Вопрос или проблема На компьютере с Linux я смотрю много видео на YouTube, связанных с программированием/кодированием. Я хотел бы попробовать код, который демонстрируется в видео на YouTube. Полезным приложением для меня было бы возможность выделять текст

Data Science

OCR с группированным текстом на основе сплошных прямоугольников

00

Вопрос или проблема Я могу читать текст с изображения, используя OCR. Однако это работает построчно. Я хочу теперь группировать текст на основе сплошных линий, окружающих текст. Например, предположим, у меня есть следующие прямоугольные баннеры.

Data Science

Контекстный захват в структурированном PDF?

00

Вопрос или проблема Я пытаюсь извлечь данные из резюме (PDF). Резюме всегда имеет определенную структуру, поэтому, если вы видите какие-то числа в резюме, то в зависимости от контекста можно понять, телефонный это номер, дата рождения или период.

Data Science

Набор данных векторов SVG путей для цифр

00

Вопрос или проблема Я много раз использовал набор данных MNIST для обучения моделей распознавания цифр на основе оптического распознавания символов (OCR). Теперь я пытаюсь сделать то же самое, но с набором данных svg-путей. Я пытаюсь найти эквивалент

Unix-подобные системы

Существует ли какой-нибудь конвертер PDF в текст?

00

Вопрос или проблема Мне нужны файлы PDF в текстовом формате, чтобы я мог искать в них массово из командной строки. Существует ли какой-нибудь конвертер для Ubuntu, OBSD или аналогичного дистрибутива? Возможно, связанный пост, OCR с Ubuntu здесь.

Программное обеспечение

Рекомендации по движку .NET для OCR

00

Вопрос или проблема Моя компания поручила мне найти OCR-движок, который соответствовал бы нашим потребностям в разработке. Быстрый поиск в Google дает множество вариантов, но у нас нет времени на их полную проверку, и мы надеялись сократить список.

Убунту

Tesseract ocr – проблемы с поиском языков

02

Вопрос или проблема У меня возникли проблемы с Ubuntu 22.04 на моем ноутбуке Framework, и я полностью переустановил систему, используя Ubuntu 24.04.1. Я только что переустановил Tesseract с помощью snap. Ранее он работал нормально на Ubuntu 22.

Программное обеспечение

Мобильный зональный OCR сканер документов в офлайне

00

Вопрос или проблема Я ищу мобильный SDK, который может захватывать и обрабатывать документ с помощью зонального OCR и возвращать значение, которое является частью заранее определенной области в документе в оффлайн-режиме. Я посмотрел некоторые коммерческие

Data Science

Как правильно составить запрос для API видения “gpt-4o”, чтобы найти буквы на изображении?

00

Вопрос или проблема У меня есть пример сгенерированного изображения, содержащего слова, а также несколько красных стрелок, указывающих на определенные символы. Мне нужно получить эти символы от GPT, но когда я спрашиваю “

Программное обеспечение

Отсканируйте тысячи ответов на бумажных формах и экспортируйте всю информацию в таблицу.

00

Вопрос или проблема У меня есть тысяча рукописных ответов на следующую бумажную форму: Мне нужно их отсканировать (у меня есть сканер) и экспортировать все данные в таблицу, похожую на эту: Это возможно? С помощью OCR? С использованием LATEX?

Программное обеспечение

Высокоточная оптическая распознавание символов (OCR) цифр с мобильного скриншота

00

Вопрос или проблема Вопрос Существует ли решение для оптического распознавания текста (OCR), которое будет работать нативно на недавнем iPhone с большей точностью, чем Tesseract? Оно должно распознавать достаточно, чтобы восстановить суммы в долларах.

Программное обеспечение

API для извлечения чисел из изображений?

00

Вопрос или проблема Я работаю над приложением, и мне нужен способ извлечения чисел из изображений, похожий на то, как банковские приложения извлекают номер кредитной карты из фотографии. У меня нет предпочтений по языку, но, вероятно, Python будет более полезен.

Вопросы и ответы

Tesseract OCR пропускает целую строку текста

00

Вопрос или проблема import ocrmypdf from pdf2image import convert_from_path from PIL import Image, ImageEnhance, ImageFilter import numpy as np import img2pdf import io import cv2 def preprocess_image(img): """ Функция предобработки изображения (увеличение

Программное обеспечение

Какое программное обеспечение использовать для сканирования PDF, которое может извлекать информацию и отправлять в программу для выставления счетов?

00

Вопрос или проблема Я работаю стажером в компании, где необходимо точное сканирование счетов, которые поступают в формате PDF. Программа или библиотека Java должны быть способны извлекать определенные части счета, чтобы пользователю не приходилось вручную

Программное обеспечение

OCR медицинский отчет / программное обеспечение для сканирования электронной медицинской записи

00

Вопрос или проблема Я хочу собрать данные из долговременного медицинского исследования. Это означает несколько десятков тысяч физических документов, которые могут содержать напечатанный текст, рукописные аннотации, флажки, анатомические схемы и изображения

Программное обеспечение

Библиотека .NET для сканирования документов в поисковые PDF-файлы (с поддержкой штрих-кодов)

00

Вопрос или проблема У меня есть задача разработать приложение, которое сможет сканировать документы и создавать поисковые PDF-файлы, которые можно просматривать из настольного приложения (например, WPF) или веб-браузера. Также требуется возможность сканирования

Вопросы и ответы

Распознавание рукописных чисел и текста

00

Вопрос или проблема Я работаю над проектом, в котором я успешно обнаружил ячейки на табличном изображении, и в каждой ячейке я пытаюсь обнаружить написанные числа и тексты, но я уже много раз терпел неудачу, пробуя множество вариантов.

Вопросы и ответы

Цифры LCD 7-сегментов не распознаются правильно (CNN / MNIST)

00

Вопрос или проблема Я новичок в области компьютерного зрения и выбрал считывание с 7-сегментного дисплея LCD своей системы отопления в качестве первой задачи для изучения CNN. Я могу правильно считывать большинство чисел, но цифра 6 чаще всего распознается как 5.

Вопросы и ответы

Pytesseract неверное распознавание текста, когда слова близки друг к другу

00

Вопрос или проблема Когда я использую PyTesseract для распознавания текста на этом изображении, он возвращает ‘FORREST C. BLopGetTrT’ вместо FORREST C. BLODGETT Результат кода, который я получаю изображение, которое я использую и которое содержит много имен.

Вопросы и ответы

Необходимо сегментировать каждое число на изображении отдельно.

00

Вопрос или проблема Я создал модель CNN, используя набор данных MNIST. Я хочу делать предсказания для последовательности чисел, присутствующих на изображениях. Техника включает в себя сегментацию каждого изображения и подачу его в модель, но я сталкиваюсь