sentiment-analysis - ответы на вопросы

Data Science

Мнения о практике удаления стоп-слов перед использованием VADER

00

Вопрос или проблема Я знаю, что по этой теме уже есть вопрос, но он не полностью решает мои проблемы. В настоящее время я пишу магистерскую диссертацию и буду использовать VADER для анализа настроений (пакет vader от Katherine Roehrick в RStudio).

Data Science

Почему (или как) модель Keras пропускает этапы стемминга или лемматизации?

00

Вопрос или проблема В этой статье / обучающем материале по Keras производится стандартизация текста, то есть удаление HTML-элементов, пунктуации и т. д. из текстового набора данных, однако явна нехватка лемматизации или стемминга перед этапом векторизации.

Data Science

Анализ текстовых данных в обзоре продукта Amazon с использованием R. Мне не удалось извлечь отзыв о конкретном продукте.

00

Вопрос или проблема Текстовый майнинг обзоров продуктов Amazon с использованием программы R. Я не смог извлечь отзывы конкретного продукта (например, если у iPhone 11 есть 6k отзывов, мне нужно извлечь все из них). Я получаю только один столбец с меткой x.

Data Science

Как извлечь подпредложения из предложения, упоминающие конкретный субъект?

00

Вопрос или проблема Я пытаюсь решить задачу обработки естественного языка (NLP). Для данного предложения, например: “Паста была вкусной, Пицца была средней” Я хочу извлечь настроение, связанное с продуктами питания.

Data Science

Бинарная + Нейтральная Классификация

00

Вопрос или проблема У меня есть набор данных постов для анализа настроений, которые помечены как -1 (негативные), 1 (позитивные) или 0 (нейтральные). Я задумываюсь над тем, как с этим работать. Вот мои идеи: создать мультиклассовый классификатор: я пробовал

Data Science

Как BERT работает для анализа настроений на основе аспектов?

00

Вопрос или проблема Я недавно использовал пакет для выполнения Aspect-Based Sentiment Analysis (ABSA) с помощью модели BERT. Коротко, модель принимает два ввода: слова, которые составляют аспекты предложение, на котором мы хотим выполнить ABSA Модель

Data Science

Обучение модели с рядом текстовых ответов в качестве входных данных.

00

Вопрос или проблема Я хочу обучить бинарный классификатор на текстах — что-то вроде анализа настроений, но мои входные векторы будут представлять собой серию ответов от пользователя, разделенных некоторым разделяющим символом.

Data Science

Оценка эмоционального напряжения в предложениях

00

Вопрос или проблема Я новичок в обработке естественного языка, и моя цель — найти способ оценивать предложения на основе их эмоционального напряжения. Более конкретно, я хотел бы знать, в какой степени предложение передает желание, ненависть или страх.

Data Science

Вопрос о балансировки обучающих данных для анализа тональности (машинное обучение)

00

Вопрос или проблема Мой вопрос касается того, когда балансировать тренировочные данные для анализа настроений. Оценив свой набор данных для обучения, который имеет 3 метки (хорошо, плохо, нейтрально), я заметил, что нейтральных меток в два раза больше

Data Science

Как классифицировать нейтральные чувства с использованием BERT

00

Вопрос или проблема Мы можем классифицировать текст на положительный и отрицательный, как указано в приведенном ниже ноутбуке. Но есть ли способ классифицировать нейтральные чувства тоже? https://colab.research.google.com/github/google-research/bert/blob/master/predicting_movie_reviews_with_bert_on_tf_hub.

Data Science

Данные для обучения в анализе настроений

00

Вопрос или проблема Я занимаюсь анализом настроений твитов, связанных с недавним приобретением Twitter Илоном Маском. У меня есть корпус из 10 000 твитов, и я хотел бы использовать методы машинного обучения с использованием таких моделей, как SVM и линейная регрессия.

Data Science

Работа с богатым словарным запасом и низкой средней частотой слов в NLP

00

Вопрос или проблема Какой лучший способ справиться с набором данных, который имеет богатый словарный запас и низкую среднюю частоту слов, показывающий низкую точность валидации? Читая online, я увидел, что многие люди рекомендуют удалить стоп-слова и

Data Science

Как правильно проводить анализ настроений?

00

Вопрос или проблема Как правильно проводить анализ настроений для текста объемом от 300 до 600 слов? Если я использую TextBlob и очищаю свои данные, удаляя стоп-слова (дополнительные слова и запятые, обратные слеши и т.д.), нужно ли мне токенизировать

Data Science

Взвешивание слов в анализе сентиментов на основе лексикона

00

Вопрос или проблема Я пытаюсь провести анализ сентимента на основе лексикона по своим данным, где я вычисляю оценку сентимента следующим образом: $$ Оценка = \frac{\sum_{i}{word_i}}{\mid words \mid} $$ Таким образом, в зависимости от оценки слово будет

Data Science

Проблема с сверточным слоем в Python: получение всех нулей на выходе и завершение на определенной итерации

00

Вопрос или проблема В настоящее время я работаю над реализацией свёрточного слоя на Python для модели обработки естественного языка. Однако я столкнулся с проблемой в свёрточном слое, которую не могу решить. Проблема состоит из двух частей: Получение

Data Science

Альтернативы Twitter для больших ежедневных илиweekly выборок для анализа настроений

00

Вопрос или проблема Twitter, с их API, включая бесплатный уровень, был основным источником для сбора больших выборок текстов, выражающих настроение по различным интересным темам. Я только что начал проект в декабре, чтобы в долгосрочной перспективе собирать

Data Science

Токенизация составных и сложносочинённых предложений

00

Вопрос или проблема Я пытаюсь разбить на токены предложения документа для анализа аспектов на основе тональности. Есть некоторые предложения, которые состоят из более чем одной темы. Вот несколько примеров: “Сенсорный экран хороший, но аккумулятор слабый”

Data Science

Неконтролируемый анализ настроений в R

00

Вопрос или проблема Как бы вы оценили несупервизированный сентиментальный анализ? Я читаю о том, как оценивать сентиментальный анализ, и узнаю, что во многих классификационных моделях, которые используются, у данных есть целевые/метки переменные.

Data Science

Анализ настроений на основе аспектов с использованием Bert и Pytorch

00

Вопрос или проблема У меня есть набор данных онлайн-отзывов (X) с соответствующими темами (тема1 до тема5), и каждая тема может иметь 5 значений (подробная оценка настроений от 1 до 5). Итак, у меня есть один X и 5 Y колонок. Я хотел бы узнать, как я

Data Science

Оптимизируйте F-оценку только для определенных классов, игнорируя другие классы.

00

Вопрос или проблема У меня есть размеченный набор данных с обзорами продуктов, где метка — это оценка от 1 до 5, а обзор — просто текст. Я использую простой наивный байесовский классификатор (sklearn), чтобы попытаться предсказать оценку, учитывая обзор