Программное обеспечение
Существует ли достойный open-source или недорогой SDK для .NET с функциями извлечения текста из PDF?
00
Вопрос или проблема Я пытаюсь написать либо автономное приложение на Windows Forms, либо VSTO Excel Add-in с использованием C# или VB .net, которое может читать PDF-файл и извлекать из него данные. Файлы, которые я получаю, представляют собой списки записей
Программное обеспечение
Парсер для MIB-файлов на Java
00
Вопрос или проблема Я работаю над SNMP-менеджером на Java. У меня есть несколько файлов MIB, которые я хочу разобрать как объекты, чтобы использовать их данные в своем коде. Для этого мне нужен хороший парсер файлов MIB, который может конвертировать данные
Программное обеспечение
Рекомендации по инструментам для веб-скрейпинга, которые требуют минимальной установки.
00
Вопрос или проблема Моя работа использует собственную базу данных с адресами и другой личной информацией. В моей роли у меня есть доступ только к версии в формате HTML. Мне часто нужно составлять письма на основе этой информации, но в настоящее время
Программное обеспечение
Инструмент для разделения одного файла с (объединенным, путаным HTML, содержащим беспорядочные встроенные стили), и создания нового чистого HTML-файла и нового чистого CSS-файла?
00
Вопрос или проблема Давным-давно (1992?) я наивно использовал Dreamweaver для создания некоммерческого многостраничного сайта. Каждый элемент — это смущающий винегрет из HTML, переплетенного с встроенным стилем. Содержание на самом деле ценно и полезно
Программное обеспечение
Графический инструмент, который выделяет текстовые файлы на основе пользовательской семантики.
00
Вопрос или проблема Я часто загружаю и разбираю текстовые файлы. Отладка парсера иногда становится немного сложной. Я задумывался, есть ли какой-то GUI или часть редактора, которая делает подсветку. Например, если я загружу, Быть или не быть, вот в чем
Программное обеспечение
JavaScript или Java. Как извлечь текст и координаты текста из PDF-файла?
00
Вопрос или проблема Я ищу аналог pdfminer для js или java. Мне нужно разобрать pdf-файл в текст и получить координаты каждого предложения (x, y, ширина, высота). Было бы неплохо, если бы это могло работать не только с текстом, но и с изображениями.
Программное обеспечение
Библиотека парсинга строк Python поддерживает интеллектуальное разделение строки, учитывая одинарные и двойные кавычки.
00
Вопрос или проблема У нас есть программа, которая будет принимать большую строку, и мы хотим разбить её на составляющие по пробелам. Однако мы хотим интеллектуально поддерживать одинарные/двойные кавычки, чтобы позволить пользователям включать значение
Программное обеспечение
Java-библиотека для разбора комментариев Javadoc
00
Вопрос или проблема Я хотел бы иметь возможность программно преобразовывать Javadoc комментарии (такие как в сгенерированном коде LWJGL) в другие форматы (например, Markdown). Это позволило бы мне делать такие вещи, как автоматическая генерация идиоматического
Программное обеспечение
Парсер .wt файлов WiredTiger (MongoDB)
00
Вопрос или проблема Существует ли какой-либо инструмент, фрагмент кода или библиотека на каком-либо языке, которые могут помочь извлечь данные из .wt файла (WiredTiger) MongoDB? Этот проект с открытым исходным кодом для Ubuntu компилирует .
Программное обеспечение
Библиотека Python для разбора широкого диапазона потенциально неполных строк дат в диапазоны дат, которые они представляют.
00
Вопрос или проблема Я ищу библиотеку, которая поможет мне обрабатывать диапазоны дат, представленные разнообразными строками дат. Например, 2023Q1 должен быть обработан как daterange(start=date(2023,01,01),end=date(2023,04,01)) (конец не включен), тогда