parser
Программное обеспечение
Существует ли достойный open-source или недорогой SDK для .NET с функциями извлечения текста из PDF?
Вопрос или проблема Я пытаюсь написать либо автономное приложение на Windows Forms, либо VSTO Excel Add-in с использованием C# или VB .net, которое может читать PDF-файл и извлекать из него данные. Файлы, которые я получаю, представляют собой списки записей
Программное обеспечение
Вопрос или проблема Я работаю над SNMP-менеджером на Java. У меня есть несколько файлов MIB, которые я хочу разобрать как объекты, чтобы использовать их данные в своем коде. Для этого мне нужен хороший парсер файлов MIB, который может конвертировать данные
Программное обеспечение
Вопрос или проблема Моя работа использует собственную базу данных с адресами и другой личной информацией. В моей роли у меня есть доступ только к версии в формате HTML. Мне часто нужно составлять письма на основе этой информации, но в настоящее время
Программное обеспечение
Вопрос или проблема Давным-давно (1992?) я наивно использовал Dreamweaver для создания некоммерческого многостраничного сайта. Каждый элемент — это смущающий винегрет из HTML, переплетенного с встроенным стилем. Содержание на самом деле ценно и полезно
Программное обеспечение
Вопрос или проблема Я часто загружаю и разбираю текстовые файлы. Отладка парсера иногда становится немного сложной. Я задумывался, есть ли какой-то GUI или часть редактора, которая делает подсветку. Например, если я загружу, Быть или не быть, вот в чем
Программное обеспечение
Вопрос или проблема Я ищу аналог pdfminer для js или java. Мне нужно разобрать pdf-файл в текст и получить координаты каждого предложения (x, y, ширина, высота). Было бы неплохо, если бы это могло работать не только с текстом, но и с изображениями.
Программное обеспечение
Вопрос или проблема У нас есть программа, которая будет принимать большую строку, и мы хотим разбить её на составляющие по пробелам. Однако мы хотим интеллектуально поддерживать одинарные/двойные кавычки, чтобы позволить пользователям включать значение
Программное обеспечение
Вопрос или проблема Я хотел бы иметь возможность программно преобразовывать Javadoc комментарии (такие как в сгенерированном коде LWJGL) в другие форматы (например, Markdown). Это позволило бы мне делать такие вещи, как автоматическая генерация идиоматического
Программное обеспечение
Вопрос или проблема Существует ли какой-либо инструмент, фрагмент кода или библиотека на каком-либо языке, которые могут помочь извлечь данные из .wt файла (WiredTiger) MongoDB? Этот проект с открытым исходным кодом для Ubuntu компилирует .
Программное обеспечение
Вопрос или проблема Я ищу библиотеку, которая поможет мне обрабатывать диапазоны дат, представленные разнообразными строками дат. Например, 2023Q1 должен быть обработан как daterange(start=date(2023,01,01),end=date(2023,04,01)) (конец не включен), тогда