Вопрос или проблема
Какие библиотеки доступны для взаимодействия с Википедией, Викиданными или другими серверами MediaWiki на языке программирования Ruby?
Я могу выполнить поиск на GitHub для недавно обновленных репозиториев с этим запросом:
(mediawiki OR wikipedia OR wikimedia OR wikidata) language:ruby pushed:>2019-01-01
Однако, я был бы признателен за описание основных библиотек.
Клиенты API MediaWiki
- MediaWiktory, легкий оберток вокруг всех функций API MediaWiki
- MediaWiki API (Официальный)
- MediaWiki::Butt
Парсеры MediaWiki
- Wikitext parser Функции: Получение исходного текста вики для статьи по имени. Анализ инфобоксов.
- Infoboxer, клиент и парсер MediaWiki, ориентированный на извлечение информации
- WikiCloth, парсер MediaWiki и конвертер в HTML
Утилиты
- MediawikiEditorTool, интерфейс командной строки для редактирования статей Mediawiki
- MediaWiki ShortURL Builder
- OmniAuth Mediawiki, стратегия MediaWiki для OmniAuth
- Wikimedia::Commoner, обертка для API Викисклада с дополнительными функциями по правообладателям и лицензиям
Википедия
- Клиент API Википедии
- WP2TXT, извлечение текстового контента и данных категорий из файлов дампа Википедии
Викиданные
- Wikidatum, запросы к REST API Wikidata/Wikibase
- gimme_wikidata, поиск по Wikidata
- WikidataDiffAnalyzer, анализ различий между ревизиями Wikidata и извлечение статистики о изменениях
- Клиент API Wikidata, поиск страниц Wikidata и Википедии и чтение их контента
- Wikidata API Gem, расширяет MediaWiki API Gem функциями, специфичными для Wikidata
- Wikidata для Ruby, включает интерфейс командной строки
Запрос о реальных объектах
- WhatIs.this, быстрое исследование значения и метаданных концепций через Википедию
- Reality, унифицированный доступ к разнородным веб-API о реальных знаниях
Для нового программного обеспечения, разработанного после публикации этого поста, ищите на GitHub:
(mediawiki OR wikipedia OR mediawiki OR wikidata) language:ruby pushed:>2023-12-05
Ответ или решение
В мире Ruby существует множество библиотек для взаимодействия с Wikipedia, Wikidata и MediaWiki. Эти библиотеки предоставляют мощные инструменты для работы с API, парсинга и управления данными из этих ресурсов. Рассмотрим основные из них.
Клиенты для API MediaWiki
-
MediaWiktory: Это тонкая оболочка вокруг всех функций API MediaWiki. Она позволяет легко интегрироваться с API и выполнять различные задачи: от извлечения статей до редактирования контента.
-
MediaWiki API (Официальный): Это официальный клиент для работы с API MediaWiki. Он обеспечивает доступ ко всем функциям и может быть использован для выполнения широкого спектра задач.
-
MediaWiki::Butt: Еще один клиент для работы с API MediaWiki, подходящий для специфических задач.
Парсеры MediaWiki
-
Wikitext Parser: Позволяет получать исходный текст статей и парсить инфобоксы, что особенно полезно для аналитики данных.
-
Infoboxer: Не только клиент MediaWiki, но и парсер, ориентированный на извлечение информации. Он может использоваться для анализа и обработки данных статей.
-
WikiCloth: Парсер MediaWiki, который преобразует текст в HTML. Это полезно для случаев, когда требуется форматирование или отображение контента на веб-страницах.
Утилиты
-
MediawikiEditorTool: CLI-инструмент для редактирования статей MediaWiki, удобен для автоматизации задач редактирования.
-
MediaWiki ShortURL Builder: Утилита для создания коротких URL-ссылок на статьи MediaWiki.
-
OmniAuth MediaWiki: Стратегия для OmniAuth, обеспечивающая аутентификацию через MediaWiki.
-
Wikimedia::Commoner: Оболочка для API Wikimedia Commons с дополнительными функциями по правам и лицензиям.
Wikipedia
-
Wikipedia API Client: Библиотека для работы с API Wikipedia, предоставляющая удобный интерфейс для извлечения контента.
-
WP2TXT: Инструмент для извлечения текстового контента и данных о категориях из дампов Wikipedia.
Wikidata
-
Wikidatum: Позволяет выполнять запросы к REST API Wikidata/Wikibase.
-
gimme_wikidata: Обеспечивает возможность поиска по Wikidata.
-
WikidataDiffAnalyzer: Инструмент для анализа различий между версиями записей в Wikidata и извлечения статистики изменений.
-
Wikidata API Client: Позволяет искать страницы Wikidata и Wikipedia и читать их содержимое.
-
Wikidata API Gem: Расширяет возможности MediaWiki API Gem для работы с Wikidata.
-
Wikidata for Ruby: Содержит интерфейс командной строки для работы с данными Wikidata.
Вопросы о реальных объектах
-
WhatIs.this: Быстрый инструмент для получения значения и метаданных о концептах из Wikipedia.
-
Reality: Предоставляет унифицированный доступ к разнородным веб-API для получения знаний о реальном мире.
Для следования актуальным обновлениям и новейшему программному обеспечению, рекомендуется периодически проверять GitHub по этой теме.
Эти библиотеки помогут разработчикам на Ruby эффективно работать с данными Wikipedia, Wikidata и MediaWiki, интегрируя их в свои приложения и сервисы.