ocr
Вопросы и ответы
Вопрос или проблема Я использую VNRecognizeTextRequest на сервере OCR, который принимает изображения по TCP, выполняет OCR и возвращает извлеченный текст. Цель заключается в поддержке всех языков, но есть проблемы с китайским.
Вопросы и ответы
Вопрос или проблема изображение 1 изображение 2 по какой-то причине, когда я пытаюсь использовать pytesseract на изображении 1, я не получаю никакого выхода, но изображение 2 дает мне выход. оригинальное изображение искажено, я предварительно обработал
Вопросы и ответы
Вопрос или проблема У меня есть программа, которая ранее использовала ChatGPT для сканирования документов и уведомления, когда на странице содержалась схема, такая как таблица или график. Поскольку ChatGPT больше не принимает изображения через API, я
Компьютеры и программы
Вопрос или проблема Нужен ли для этого приложение/программное обеспечение? Текст на изображении означает, что текст написан на изображении и необходимо выполнить поиск с использованием этого “текстового” запроса, чтобы найти изображение в папке.
Программное обеспечение
Вопрос или проблема Я ищу библиотеку C#, которая позволяет мне добавить следующее в мое .net приложение: Сканирование изображения Загрузка изображения и выбор шаблона извлечения Использование OCR или машинного обучения для извлечения текста из изображения
Вопросы и ответы
Вопрос или проблема Я пытаюсь сделать изображения captcha более читабельными для tesseract с помощью обработки изображений. Изображения имеют белый фон, 4 черные цифры в центре, слегка повёрнутые, и случайную черную линию (тоньше, чем цифры), которая
Data Science
Вопрос или проблема Имея изображение плана этажа, существует ли известный алгоритм, который я могу использовать для определения размеров всех квартир? (например, это означает, что на приложенной картинке я должен понять, что есть 4 квартиры, и считать
Программное обеспечение
Вопрос или проблема Мы хотим сканировать отсканированные документы (PDF/изображения) и извлекать значимую информацию в виде пар ключ-значение или в любом другом формате. Например, когда поставщик отправляет нам счет-фактуру в виде отсканированного PDF
Программное обеспечение
Вопрос или проблема У меня есть куча скриншотов, изображений людей и документов. Я хочу их пометить, чтобы искать их, как это делает Google, распознавая текст из скриншотов. Поэтому я пытался найти приложение для Android. Оно должно соответствовать следующим
Data Science
Вопрос или проблема В последнее время меня вдохновляет этот https://rossum.ai/, который способен извлекать текст из счетов. У вас есть идеи, как это можно реализовать? Я понимаю, что они провели много исследований, чтобы достичь такого уровня производительности
Программное обеспечение
Вопрос или проблема Я пытаюсь оцифровать свои химические заметки (в форматы, подобные тем, которые мы видим в учебниках). Я пробовал Mathpix, и он работает великолепно, но у меня нет денег, чтобы за него платить. Кто-нибудь знает о других инструментах
Программное обеспечение
Вопрос или проблема Я не знаю, какой аппаратурой будет мое устройство, но я предполагаю, что это будет съемный 2-в-1 на Linux. Как указано в той ссылке, я планирую получить помощь в добавлении некоторых функций в приложение, поэтому предполагаю, что оно
Вопросы и ответы
Вопрос или проблема Итак, у меня есть взвешенный ориентированный граф. Каждая вершина представляет собой страницу на сайте, каждое ребро представляет действие пользователя по переходу с одной страницы на другую, а вес означает количество пользователей
Программное обеспечение
Вопрос или проблема Проблема: PDF-файлы и изображения от отсканированных бумажных документов содержат текст, который нельзя скопировать или отредактировать. Однако ручной ввод текста невозможен из-за размера документа и значительных временных затрат.
Программное обеспечение
Вопрос или проблема У меня есть коллега с нарушениями зрения. Если ему нужно читать текст, это нормально, у него есть программа для озвучивания текста. Но если он получает какой-либо график, распознавание текста не срабатывает.
Программное обеспечение
Вопрос или проблема У меня есть коллега с проблемами со зрением, который едва видит. Если ему нужно читать тексты, это нормально, у него есть программа для преобразования текста в речь. Но если он получает какой-либо график, например: https://www.google.com/search?q=graph&