Data Science
Существует ли способ ранжировать извлеченные именованные сущности на основе их важности/частоты в документе?
00
Вопрос или проблема Ищете способ ранжирования десятков и сотен именованных сущностей, присутствующих в любом документе, по их важности/релевантности в контексте. Есть какие-нибудь мысли? Заранее спасибо! Простой способ –
Data Science
Геуристики для предсказания модели NER
00
Вопрос или проблема Я пытаюсь создать модель NER, которая может называть сущности в “Описание работы”. Сущности: Обязательные навыки (Обязательные навыки, такие как java, python, c++ и т.д.) Желательные навыки (кандидат “
Data Science
обучить NER с использованием NLTK с пользовательскими корпусами (неанглийскими) необходимо использовать StanfordNER?
00
Вопрос или проблема Я искал информацию о настройке NER корпусов для обучения модели с использованием библиотеки NLTK из Python, но все ответы ссылаются на глава 7 книги NLTK и, честно говоря, это меня путает, как правильно обучить корпус с правильным
Data Science
NER (распознавание именованных сущностей) с использованием LLM, таких как tranF5 или LLAMA2
00
Вопрос или проблема Я пытаюсь выполнить NER (распознавание именованных объектов) с помощью крупных языковых моделей, таких как Trans-F5 или LLAMA2. До сих пор я нашел способы использования инженерии подсказок. Это означает, что нам нужно указать, что искать в тексте.
Data Science
Как обучать NER LSTM на уровне отдельного предложения
00
Вопрос или проблема Мои документы представляют собой всего лишь одно предложение, содержащее одну аннотацию. Предложения с одинаковой именованной сущностью, конечно, похожи, но не по контексту. Примеры обучения NER (насколько мне известно) всегда имеют
Вопросы и ответы
Обнаружение заболеваний с помощью НЛП
00
Вопрос или проблема Я работаю над проектом, цель которого – определить название болезни из разных предложений. Мне нужны некоторые советы. Я ищу библиотеки, из которых я могу получить список названий болезней, чтобы по крайней мере обнаружить болезнь в своем датафрейме.
Data Science
Обработка неизвестных слов при создании моделей NER
00
Вопрос или проблема Я работаю над своей моделью распознавания именованных сущностей, которую создаю с помощью библиотеки Keras на Python. Я прочитал, что мне нужно перечислить все слова, которые появляются, чтобы получить векторизованные последовательности.
Data Science
Распознавание сущностей с контекстом/отношением
00
Вопрос или проблема Есть ли способ получить конкретную сущность на основе контекста, в котором она находится? Например: Температура сегодня 35°C. Храните таблетку рисперидона при 20°C. Обе фразы говорят о температуре. В первом предложении я хотел бы
Data Science
Как извлечь и классифицировать данные из столбца в Excel?
00
Вопрос или проблема У меня есть столбец в Excel, который содержит много данных, разделенных разделителями ||. Данные можно классифицировать по некоторым классам, таким как сущности, коды IFSC, идентификаторы транзакций и т. д.
Data Science
Поиск связанных слов с именованной сущностью
00
Вопрос или проблема Существует ли способ найти список связанных слов с именованной сущностью? Например: пусть именованная сущность будет FIFA. FIFA — это футбольная организация, и, следовательно, она связана с термином “
Data Science
Извлечение ключевых слов из сообщений с помощью собственной модели NER
00
Вопрос или проблема Я начинаю проект, в котором хочу извлекать ключевые слова из заданных сообщений. Ключевые слова, например, такие как: “жесткий диск”, “часы” или другие технические компоненты. Я работаю с набором данных, в котором