Data Science
Я получаю эту ошибку ValueError: недостаточно значений для распаковки (ожидалось 4, получено 2)
00
Вопрос или проблема Я написал этот код: tf = TfidfVectorizer() text_tf = tf.fit_transform(df_clean) text_tf from sklearn.model_selection import train_test_split x_train, x_test, y_train, y_test = train_test_split(text_tf,test_size=0.
Data Science
несбалансированные данные в обучающей и тестовой выборках
00
Вопрос или проблема У меня уже есть 2 набора данных. Один для обучения и один для тестирования. Оба набора данных несбалансированы (с похожими процентами), с около 90% метки 1. Будет ли полезно сбалансировать данные, если тестовый набор в любом случае очень несбалансирован?
Data Science
Получите ключевые слова из положительных и отрицательных отзывов.
00
Вопрос или проблема Я обучил алгоритм классификации на модели анализа настроений, который классифицирует отзывы, собранные с Amazon, как Положительные или Отрицательные. Теперь для каждого класса я хочу получить ключевые слова из отзыва, т.
Data Science
Распределение меток анализаSentiment
00
Вопрос или проблема Я работаю над моделью Анализа настроений. Набор данных, который у меня есть, имеет три метки: положительная, отрицательная и нейтральная. Но проблема в том, что данные не равномерны для меток. Например, из 100K: 75K нейтральные, 15K
Data Science
измерение поведения флippers по нескольким темам
00
Вопрос или проблема Я пытаюсь проанализировать поведение, называемое “сентиментальный переворот” пользователей в наборе данных, но не могу к этому прийти. Предположим, что у меня есть две группы пользователей: хороших и плохих пользователей.
Data Science
Как выполнить токенизацию для твитов в XLNet?
00
Вопрос или проблема X_train имеет только один столбец, который содержит все твиты. xlnet_model="xlnet-large-cased" xlnet_tokenizer = XLNetTokenizer.from_pretrained(xlnet_model) def get_inputs(tweets, tokenizer, max_len=120): """ Получает тензоры из текста
Data Science
Как предсказать настроение сущностей из твита?
00
Вопрос или проблема У меня есть файл JSON (tweets.json), который содержит твиты (предложения) вместе с именем автора. Цель 1: Извлечь самые частые сущности из твитов. Цель 2: Узнать настроение/полярность каждого автора по отношению к каждой из сущностей.