sentiment-analysis
Data Science
Вопрос или проблема Как бы вы оценили несупервизированный сентиментальный анализ? Я читаю о том, как оценивать сентиментальный анализ, и узнаю, что во многих классификационных моделях, которые используются, у данных есть целевые/метки переменные.
Data Science
Вопрос или проблема У меня есть набор данных онлайн-отзывов (X) с соответствующими темами (тема1 до тема5), и каждая тема может иметь 5 значений (подробная оценка настроений от 1 до 5). Итак, у меня есть один X и 5 Y колонок. Я хотел бы узнать, как я
Data Science
Вопрос или проблема У меня есть размеченный набор данных с обзорами продуктов, где метка — это оценка от 1 до 5, а обзор — просто текст. Я использую простой наивный байесовский классификатор (sklearn), чтобы попытаться предсказать оценку, учитывая обзор
Data Science
Вопрос или проблема Что мы имеем в виду в анализе настроений в НЛП, когда говорится, что предложение положительное или отрицательное? Думаю, мне нужно уточнить это в отношении любого другого параметра. Например, “iPhone хороший”
Data Science
Вопрос или проблема Я пытаюсь провести анализ настроений новостных заголовков о конкретной теме, упомянутой в них. Сначала я использовал библиотеку TextBlob для анализа настроений, чтобы сгенерировать оценку полярности. Но оценка полярности, генерируемая
Data Science
Вопрос или проблема Я следовал шагам, чтобы ввести в модель dev, test, train.tsv, обучил ее, затем попытался классифицировать тестовые данные, и у меня только 1 признак, классификация бинарная, 1 или 0. Я предположил, что в моем test_results.
Data Science
Вопрос или проблема Я написал этот код: tf = TfidfVectorizer() text_tf = tf.fit_transform(df_clean) text_tf from sklearn.model_selection import train_test_split x_train, x_test, y_train, y_test = train_test_split(text_tf,test_size=0.
Data Science
Вопрос или проблема У меня уже есть 2 набора данных. Один для обучения и один для тестирования. Оба набора данных несбалансированы (с похожими процентами), с около 90% метки 1. Будет ли полезно сбалансировать данные, если тестовый набор в любом случае очень несбалансирован?
Data Science
Вопрос или проблема Я обучил алгоритм классификации на модели анализа настроений, который классифицирует отзывы, собранные с Amazon, как Положительные или Отрицательные. Теперь для каждого класса я хочу получить ключевые слова из отзыва, т.
Data Science
Вопрос или проблема Я работаю над моделью Анализа настроений. Набор данных, который у меня есть, имеет три метки: положительная, отрицательная и нейтральная. Но проблема в том, что данные не равномерны для меток. Например, из 100K: 75K нейтральные, 15K
Data Science
Вопрос или проблема Я пытаюсь проанализировать поведение, называемое “сентиментальный переворот” пользователей в наборе данных, но не могу к этому прийти. Предположим, что у меня есть две группы пользователей: хороших и плохих пользователей.
Data Science
Вопрос или проблема X_train имеет только один столбец, который содержит все твиты. xlnet_model="xlnet-large-cased" xlnet_tokenizer = XLNetTokenizer.from_pretrained(xlnet_model) def get_inputs(tweets, tokenizer, max_len=120): """ Получает тензоры из текста
Data Science
Вопрос или проблема У меня есть файл JSON (tweets.json), который содержит твиты (предложения) вместе с именем автора. Цель 1: Извлечь самые частые сущности из твитов. Цель 2: Узнать настроение/полярность каждого автора по отношению к каждой из сущностей.