Data Science
Машинное обучение в TensorFlow
00
Вопрос или проблема Я выполняю работу, основанную на анализе различных библиотек Python для машинного обучения. Я выбрал для анализа Scikit-Learn, Keras, Tensorflow и Pytorch, так как они наиболее известны. Идея заключалась в обучении различных моделей
Data Science
пандас датафрейм ничего не показывает, когда просматривается как датафрейм в PyCharm
00
Вопрос или проблема import pandas as pd; dataSet = pd.read_csv("winequality-red.csv"); dataSet.describe(include="all"); Когда просматриваю набор данных в виде фрейма данных, он показывает пустую таблицу. Но при выводе dataSet я получаю следующий результат. <
Data Science
Уменьшение ложных срабатываний с помощью модели распознавания именованных сущностей с аннотацией.
00
Вопрос или проблема Я обучаю модель NER для обнаружения упомянутых фраз и сленговых слов в исследовании предвзятости, проведенном на судебных делах. По сути, у меня есть пакеты текста, которые я отсканировал, и это полные протоколы.
Data Science
Как обрабатывать неопределённые значения, которые имеют смысл?
00
Вопрос или проблема В настоящее время я пытаюсь создать несколько функций для улучшения производительности модели. Одна из этих функций, которую я хотел бы создать, соответствует разнице в днях между покупкой клиента и его последней покупкой.
Data Science
Форма сглаженного слоя в CNN
00
Вопрос или проблема Если у меня есть сверточный слой с размерностью (5,5,4), (т.е. 4 блока признаков размером 5x5x1), какой будет размер сглаженного слоя, если я применю сглаживание к сверточному слою? Для простой свертки (игнорируя padding и шаг), размерность
Data Science
лучший алгоритм или модель для кластеризации областей на карте?
00
Вопрос или проблема У меня есть база данных, которая содержит информацию, такую как широта, долгота, а также другую информацию, например, достопримечательности, рестораны и торговые центры, сельская местность это или пригород, …
Data Science
Классификация с использованием текстов в качестве признаков
00
Вопрос или проблема Я хочу создать модель классификации для сопоставления клиентов и продуктов. У меня есть описание каждого продукта и каждого клиента, а также метка: клиент *i* купил/не купил продукт *j*. Каждый пример/строка — это пара (клиент, продукт)
Data Science
Целевая функция в модели вознаграждения в Vanilla RLHF является для меня неоднозначной.
00
Вопрос или проблема Я пытаюсь изучить основу Vanilla RLHF. Мне сложно понять целевую функцию в модели награды. Она определяется Если разность логарифмов сигмоиды разности стремится к минимизации, мы всегда должны иметь r(x,y1) >
Data Science
Создание карты между N изображениями и N метками с использованием CNN
00
Вопрос или проблема Я видел классификационные CNN, которые обучаются на множестве изображений для подмножества меток (т.е. количество изображений >> количество меток), однако, возможно ли использовать CNN, когда количество изображений равно количеству меток?
Data Science
Почему моя ошибка на стадии валидации может перестать снижаться, в то время как ошибка на стадии обучения продолжает уменьшаться?
00
Вопрос или проблема В своем стремлении узнать немного больше о науке о данных, я извлек из интернета некоторые размеченные данные и пытаюсь классифицировать примеры на один из трех классов. Я сталкиваюсь с проблемой, что независимо от того, какую модель
Data Science
Мне нужно обучить многоклассовую модель, но у меня небольшой набор данных.
00
Вопрос или проблема У меня есть файл Excel, который содержит два столбца: один с текстовыми фразами и другой, который сообщает мне классификацию от ‘CS1’ до ‘CS8’. Текст выглядит так: "НЕ ПАГТО ПРОВЕНТОС АПОСЕНТАДОРИЯ ЭСПЕЦИАЛ
Data Science
Классификация, когда классификация предыдущих элементов имеет значение.
00
Вопрос или проблема У меня есть проблема классификации, которую кажется, часто встречают, но я не могу найти название этой задачи и лучший способ моделирования этой проблемы. Допустим, у меня есть серия событий, которые происходят последовательно во времени.
Data Science
Почему точность уменьшается с увеличением порога?
00
Вопрос или проблема Я обучил модель логистической регрессии, используя класс LogisticRegression из scikit-learn. Я работаю с данными о фондовом рынке, поэтому они довольно шумные и сложно что-то предсказать. При построении графика зависимости порога от
Data Science
Система рекомендаций, которая соединяет пользователей друг с другом, стоит ли выбрать контентный метод или коллаборативную фильтрацию?
00
Вопрос или проблема Я пытаюсь создать систему, где пользователь приходит на платформу, выбирает тему (несколько заранее определенных тем), и тогда мы соединяем его с любым случайным пользователем онлайн, который выбрал ту же тему.
Data Science
Как нормализовать данные с комплексными значениями?
00
Вопрос или проблема Я беру абсолютные значения всех элементов, вычисляю среднее, вычитаю его из исходных значений. Мне кажется, что это неверно и может изменить векторы. Я также делю на стандартное отклонение, но я довольно уверен в этом, зная, что это
Data Science
Можно ли использовать метод главных компонент (PCA) для уменьшения размерности данных, закодированных методом One-Hot-Encoding?
00
Вопрос или проблема Я читал пару раз, что метод PCA используется для сокращения размерности для данных, закодированных с помощью One-Hot-Encoding. Однако, также были комментарии, что использование PCA не является хорошей идеей, так как One-Hot-Encoded
Data Science
Вопрос о коллапсировании переменной и сверхвыборке меньшинств.
00
Вопрос или проблема У меня есть несбалансированные данные, состоящие из девяти классов, и я планирую объединить их в два класса. Я провел стратифицированную (пропорциональную) выборку между тестовыми, валидационными и обучающими наборами данных в соответствии с девятью классами.
Data Science
Градиенты CNN с разной величиной
00
Вопрос или проблема У меня есть архитектура CNN с двумя функциями кросс-энтропии потерь $\mathcal{L}_1$ и $\mathcal{L}_2$, которые суммируются в общую потерю $\mathcal{L} = \mathcal{L}_1 + \mathcal{L}_2$. Задача, которую я хочу решить, — это неконтролируемая адаптация домена.
Data Science
Можно ли вывести зависимость между переменными из данных? И если да, то как?
00
Вопрос или проблема У меня есть набор данных $X$, который состоит из $m$ векторов $\vec{x}$ с $n$ компонентами, имеющими действительные значения. Каждая компонента вектора лежит в соответствующем предопределенном интервале допустимых значений, который
Data Science
Как я могу изменить этот код для запуска сверточной нейронной сети, чтобы получить 2-мерный вывод?
00
Вопрос или проблема У меня есть модель движения, для которой я могу моделировать данные. Она имеет два параметра, а выходными данными являются широта и долгота в N равномерно распределенных временных точках. Моя цель – использовать сверточную нейронную