Вопрос или проблема
Я ищу набор данных о причинно-следственных связях, который выглядел бы так:
животное + машина -> авария
превышение скорости -> штраф за нарушение ПДД
помидоры + салат -> салат
вирус -> болезнь
кариес -> стоматолог
Такой набор данных уже существует?
Я сомневаюсь, что что-то настолько общее существует. Ближайшее, что я могу предложить, – это использовать ресурсы, которые существуют в медицинской сфере, в частности https://semrep.nlm.nih.gov/
Также попробуйте задать вопрос на https://opendata.stackexchange.com/
Ответ или решение
К сожалению, не существует единого обширного набора данных, который непосредственно соответствовал бы вашему запросу о причинно-следственных связях. Тем не менее, есть несколько ресурсов, которые могут быть полезны в контексте поиска данных о причинности и их последствиях.
-
Медицинские ресурсы: Вы правильно упомянули SemRep, который является сервисом для извлечения семантической информации из медицинского текста. SemRep использует концепции из UMLS (Unified Medical Language System) для извлечения информации о взаимоотношениях между терминами, что позволяет идентифицировать причинные связи в медицине. Вы можете извлечь полезные данные о заболеваниях, их причинах и последствиях, что соответствует вашим примерам.
-
Open Data и Ontology: Платформы, как Open Data Stack, могут предложить наборы данных, которые имеют отношение к вашей тематике. Вы можете искать наборы данных со специфическими связями, такими как "причина-результат", в открытых источниках данных, например, в проектах по открытым данным. Используйте ключевые слова вроде "causality dataset" или "cause-effect relationships" при поиске.
-
Базы знаний и графы знаний: Нужно также рассмотреть возможность использования баз знаний, таких как DBpedia, Wikidata или ConceptNet. Эти системы организуют информацию в виде связанных данных и могут помочь вам построить собственные примеры причинно-следственных связей. Например, вы можете запросить граф, чтобы получить информацию о том, как различные сущности связаны друг с другом.
-
Научные исследования и публикации: Для более глубокого анализа причинно-следственных связей существуют научные публикации и исследования, доступные в электронных библиотеках, таких как PubMed или Google Scholar. Многие из этих источников содержат данные о клинических исследованиях и их результатах, которые также обусловливаются конкретными причинами.
-
Проведение собственного исследования: Если вы не можете найти готовый набор данных, рассмотрите возможность создания собственного. Соберите информацию из разных источников, проанализируйте её и создайте уникальный набор причинно-следственных связей.
Таким образом, хотя готовый набор данных, который вы описали, может быть трудным для нахождения, вполне возможно извлечь данные из существующих ресурсов, либо создать их самостоятельно. Удачи в поисках и исследованиях!