Data Science
Data Science
Вопрос или проблема У меня есть данные о 10,000 пользователей и их временных сессиях на сайте/в приложении: время входа, время выхода и активность пользователя. Данные доступны в течение 60 дней (на пользователя). Используя эти 60-дневные данные для 10
Data Science
Вопрос или проблема Я пытался это исправить в течение 2 месяцев, но без успеха. Я провожу медицинское исследование для своей учебы. У меня есть набор данных, в котором указаны диагнозы пациентов на основе медицинских отчетов (Features.
Data Science
Вопрос или проблема Я реализовал классификатор наивного байесовского метода с гауссовским предположением, и у меня результат теста (99,99%) оказался выше, чем результат обучения (96,87%). Нормально это или это означает, что моя модель недостаточно обучена?
Data Science
Вопрос или проблема У меня есть набор данных из 10 субъектов. Набор данных имеет 4 класса: 0, 1, 2 и 3. Распределение классов не одинаково. Например, у субъекта 1 нет классов 1, 2 и 3. Он относится к классу нулей. В данный момент я оцениваю модель, используя метод “
Data Science
Вопрос или проблема У меня есть функция потерь, которая представляет собой взвешенную перекрестную энтропию для бинарной классификации def BinaryCrossEntropy_weighted( y_true, y_pred, class_weight ): y_true= y_true.astype(np.float) y_pred = K.
Data Science
Вопрос или проблема Я обучил свою модель с помощью RandomForestRegressor(), но теперь мои данные для обучения обновляются постоянно. Так что мне нужно обучить свою модель на всем наборе данных для обучения, то есть на старых и новых данных, или я могу
Data Science
Вопрос или проблема У меня есть набор данных, подобный следующему, и в первом столбце содержатся группы. Однако некоторые из них имеют немного другие подписи. Мне нужно удалить все символы после знаков препинания (скобок, точки с запятой, запятой). groups <
Data Science
Вопрос или проблема def rosen(x): """Функция Розенброка""" return sum(100.0*(x[1:]-x[:-1]**2.0)**2.0 + (1-x[:-1])**2.0) from SwarmPackagePy import cso cso(1,rosen,10,1000,2,10000,pa=0.25,nest=100) Out[41]: <SwarmPackagePy.cso.cso at 0x187cf21e340>
Data Science
Вопрос или проблема Twitter, с их API, включая бесплатный уровень, был основным источником для сбора больших выборок текстов, выражающих настроение по различным интересным темам. Я только что начал проект в декабре, чтобы в долгосрочной перспективе собирать
Data Science
Вопрос или проблема Я пытаюсь решить кубик Рубика с помощью глубокого обучения и наткнулся на DQN, поэтому решил попробовать. Я разработал весь код и начал обучение, но получил такие результаты: Убытки растут, а тесты никогда не показывают лучших результатов.
Data Science
Вопрос или проблема Я хотел бы сравнить изображения двух веб-страниц, используя техники компьютерного зрения. Покажите, какие части не уникальны при сравнении обоих изображений. Какая часть изображения 1 отсутствует в изображении 2, и наоборот.
Data Science
Вопрос или проблема Я читал Главу 14 Ответы на вопросы, Поиск информации и RAG книги Юрафски, конкретно раздел о оценке документов, где упоминался Okapi BM25. Я понял предыдущее вычисление и объяснение tf-idf, но не понимаю эту фразу, выделенную магентовым цветом. …
Data Science
Вопрос или проблема У меня есть следующий датафрейм df атлетов (индексированный по Athlete_ID) и их рангу (индексированный по Rank), вот слайд датафрейма с конкретным атлетом: Rank Athlete_ID Date 13 143 25/4/2021 1 143 5/4/2021 6 143 24/2/2021 11 143
Data Science
Вопрос или проблема У меня есть данные для насосов, которые имеют один или несколько датчиков для записи давления воздуха. Помимо sensor_id и timestamp, есть три числовых переменных: current_air_pressure, min_air_pressure и max_air_pressure, и показания
Data Science
Вопрос или проблема Я работаю над прогнозированием многомерного временного ряда, используя несколько алгоритмов машинного обучения (нейронные сети, метод опорных векторов и алгоритмы градиентного бустинга). Мне нужно измерить производительность каждой модели.
Data Science
Вопрос или проблема В «Фламинго: визуальная языковая модель для обучения с небольшим количеством примеров» (Alayrac et al., 2022) https://arxiv.org/abs/2204.14198 DeepMind использует «обучаемые латентные запросы» в своем «Персевер ресемплере», чтобы гарантировать
Data Science
Вопрос или проблема В чисто образовательных целях моя цель – реализовать базовую архитектуру Transformer с нуля. До сих пор я сосредоточился на энкодере для классификационных задач и предположил, что все образцы в пакете имеют одинаковую длину.
Data Science
Вопрос или проблема Когда я пытаюсь выполнить sns.heatmap(df.corr(),annot=True) этот код в своем Jupyter ноутбуке, возникает эта ошибка. Я не понимаю, в чем проблема. Пожалуйста, помогите мне. Для df.corr() вам нужно передать значения типа float/целое число вместо строки.
Data Science
Вопрос или проблема Я работаю над исследовательской работой о надежной схеме агрегации федеративного обучения для защиты от атакующих. У меня есть 1D массив оценок доверия для клиентов, и мне нужно сгруппировать их, чтобы выявить честных клиентов (с наивысшими оценками).
Data Science
Вопрос или проблема У меня есть набор данных о ценах на дома и соответствующих характеристиках (комнаты, квадратные метры и т.д.). Дополнительной характеристикой является дата продажи дома. Цель состоит в том, чтобы создать модель, которая могла бы оценить