Data Science

Каков предпочтительный подход к этой проблеме?

00

Вопрос или проблема У меня есть данные о 10,000 пользователей и их временных сессиях на сайте/в приложении: время входа, время выхода и активность пользователя. Данные доступны в течение 60 дней (на пользователя). Используя эти 60-дневные данные для 10

Data Science

Мультиклассовый набор данных с множеством признаков, приводящий к плохой точности предсказаний.

00

Вопрос или проблема Я пытался это исправить в течение 2 месяцев, но без успеха. Я провожу медицинское исследование для своей учебы. У меня есть набор данных, в котором указаны диагнозы пациентов на основе медицинских отчетов (Features.

Data Science

Результат теста выше результата обучения

00

Вопрос или проблема Я реализовал классификатор наивного байесовского метода с гауссовским предположением, и у меня результат теста (99,99%) оказался выше, чем результат обучения (96,87%). Нормально это или это означает, что моя модель недостаточно обучена?

Data Science

Как вычислить метрики оценки (например, F1-мера) в кросс-валидации с оставлением одного объекта вне, когда объект принадлежит только одному классу.

00

Вопрос или проблема У меня есть набор данных из 10 субъектов. Набор данных имеет 4 класса: 0, 1, 2 и 3. Распределение классов не одинаково. Например, у субъекта 1 нет классов 1, 2 и 3. Он относится к классу нулей. В данный момент я оцениваю модель, используя метод “

Data Science

Почему нейронной сети нужна потеря в виде скаляра?

00

Вопрос или проблема У меня есть функция потерь, которая представляет собой взвешенную перекрестную энтропию для бинарной классификации def BinaryCrossEntropy_weighted( y_true, y_pred, class_weight ): y_true= y_true.astype(np.float) y_pred = K.

Data Science

Перетренировка модели

00

Вопрос или проблема Я обучил свою модель с помощью RandomForestRegressor(), но теперь мои данные для обучения обновляются постоянно. Так что мне нужно обучить свою модель на всем наборе данных для обучения, то есть на старых и новых данных, или я могу

Data Science

Удалите всех символов после определенного символа в столбце набора данных.

00

Вопрос или проблема У меня есть набор данных, подобный следующему, и в первом столбце содержатся группы. Однако некоторые из них имеют немного другие подписи. Мне нужно удалить все символы после знаков препинания (скобок, точки с запятой, запятой). groups <

Data Science

Что такое “SwarmPackagePy.cso.cso на 0x187cf21e340”

00

Вопрос или проблема def rosen(x): """Функция Розенброка""" return sum(100.0*(x[1:]-x[:-1]**2.0)**2.0 + (1-x[:-1])**2.0) from SwarmPackagePy import cso cso(1,rosen,10,1000,2,10000,pa=0.25,nest=100) Out[41]: <SwarmPackagePy.cso.cso at 0x187cf21e340>

Data Science

Альтернативы Twitter для больших ежедневных илиweekly выборок для анализа настроений

00

Вопрос или проблема Twitter, с их API, включая бесплатный уровень, был основным источником для сбора больших выборок текстов, выражающих настроение по различным интересным темам. Я только что начал проект в декабре, чтобы в долгосрочной перспективе собирать

Data Science

Можно ли решить кубик Рубика с помощью DQN?

00

Вопрос или проблема Я пытаюсь решить кубик Рубика с помощью глубокого обучения и наткнулся на DQN, поэтому решил попробовать. Я разработал весь код и начал обучение, но получил такие результаты: Убытки растут, а тесты никогда не показывают лучших результатов.

Data Science

Сравнение двух изображений и отображение разницы в новом изображении?

00

Вопрос или проблема Я хотел бы сравнить изображения двух веб-страниц, используя техники компьютерного зрения. Покажите, какие части не уникальны при сравнении обоих изображений. Какая часть изображения 1 отсутствует в изображении 2, и наоборот.

Data Science

Какой “двоичный выбор” существует в BM25?

00

Вопрос или проблема Я читал Главу 14 Ответы на вопросы, Поиск информации и RAG книги Юрафски, конкретно раздел о оценке документов, где упоминался Okapi BM25. Я понял предыдущее вычисление и объяснение tf-idf, но не понимаю эту фразу, выделенную магентовым цветом. …

Data Science

Кумулятивная сумма с начальным значением, отличным от 0, в Pandas

00

Вопрос или проблема У меня есть следующий датафрейм df атлетов (индексированный по Athlete_ID) и их рангу (индексированный по Rank), вот слайд датафрейма с конкретным атлетом: Rank Athlete_ID Date 13 143 25/4/2021 1 143 5/4/2021 6 143 24/2/2021 11 143

Data Science

Модели сервисного обслуживания на основе правил и предсказательного обслуживания

00

Вопрос или проблема У меня есть данные для насосов, которые имеют один или несколько датчиков для записи давления воздуха. Помимо sensor_id и timestamp, есть три числовых переменных: current_air_pressure, min_air_pressure и max_air_pressure, и показания

Data Science

Подход скользящего окна с использованием SVR и LightGBM

00

Вопрос или проблема Я работаю над прогнозированием многомерного временного ряда, используя несколько алгоритмов машинного обучения (нейронные сети, метод опорных векторов и алгоритмы градиентного бустинга). Мне нужно измерить производительность каждой модели.

Data Science

Как на самом деле рассчитываются обученные латентные массивы для перцептивного ресемплера в модели “Визуально-языковой модели Flamingo” DeepMind? Какая техника используется?

00

Вопрос или проблема В «Фламинго: визуальная языковая модель для обучения с небольшим количеством примеров» (Alayrac et al., 2022) https://arxiv.org/abs/2204.14198 DeepMind использует «обучаемые латентные запросы» в своем «Персевер ресемплере», чтобы гарантировать

Data Science

Как учитывается маскирование отступов в головах внимания трансформера?

00

Вопрос или проблема В чисто образовательных целях моя цель – реализовать базовую архитектуру Transformer с нуля. До сих пор я сосредоточился на энкодере для классификационных задач и предположил, что все образцы в пакете имеют одинаковую длину.

Data Science

corr() выдает ошибку. Пожалуйста, помогите разобраться с этой проблемой и скажите, в чем заключается эта ошибка.

00

Вопрос или проблема Когда я пытаюсь выполнить sns.heatmap(df.corr(),annot=True) этот код в своем Jupyter ноутбуке, возникает эта ошибка. Я не понимаю, в чем проблема. Пожалуйста, помогите мне. Для df.corr() вам нужно передать значения типа float/целое число вместо строки.

Data Science

1D ‘Кластеризация’

00

Вопрос или проблема Я работаю над исследовательской работой о надежной схеме агрегации федеративного обучения для защиты от атакующих. У меня есть 1D массив оценок доверия для клиентов, и мне нужно сгруппировать их, чтобы выявить честных клиентов (с наивысшими оценками).

Data Science

Моделирование инфляции цен на жилье

00

Вопрос или проблема У меня есть набор данных о ценах на дома и соответствующих характеристиках (комнаты, квадратные метры и т.д.). Дополнительной характеристикой является дата продажи дома. Цель состоит в том, чтобы создать модель, которая могла бы оценить