Data Science
Data Science
Вопрос или проблема У меня есть pred_targets = self.model(images) pred_boxes = pred_container.data pred_scores = pred_container.conf pred_labels = pred_container.cls gt = (boxes.to(self.device), classes.to(self.device)) pred = (pred_boxes[:, :4], pred_scores
Data Science
Вопрос или проблема Я работаю над алгоритмом MedSAM (Segment Anything in Medical Images). Это тонко настроенная версия модели Segment Anything от Meta AI для медицинских изображений. В статье его функция потерь задается как невзвешенная сумма бинарной
Data Science
Вопрос или проблема Я могу использовать shap для извлечения важных признаков для Dense NN. Однако для CNN я столкнулся с двумя проблемами: порядок признаков может быть изменен или объединен после фильтрации и пуллинга. Могу ли я все еще использовать shap
Data Science
Вопрос или проблема У меня есть корпус вручную аннотированных (так называемый “золотой стандарт”) документов и коллекция аннотаций систем обработки естественного языка (NLP) на тексте из корпуса. Я хочу провести выборку систем и золотого стандарта
Data Science
Вопрос или проблема Я хочу задать некоторую вероятностную модель кластеризации (например, смешанную модель или LDA) для слов, и вместо использования традиционного метода представления слов в виде вектора-индикатора я хочу использовать соответствующие
Data Science
Вопрос или проблема У меня есть данные гистограмм временных рядов от множества отдельных запусков машин (подробности см. в этом посте). Я работаю над обучением LSTM с целью предсказать финальную гистограмму в запуске машины, основываясь на прошлых данных гистограммы.
Data Science
Вопрос или проблема Создайте тензор Y формы (2,3) содержащий последовательность чисел 12,15,18,…, 150 Я попробовал использовать следующий код tf.constant(np.arange(12,153,3),dtype=tf.dtypes.float32,shape=[2,3]) Я получил ошибку о том, что тензор
Data Science
Вопрос или проблема Я хотел бы донастроить предварительно обученную модель типа BERT для задачи анализа семантического сходства в манере задачи SNLI/MNLI (т.е. классифицировать пары предложений на «заключение» или «противоречие»).
Data Science
Вопрос или проблема У меня есть набор данных постов для анализа настроений, которые помечены как -1 (негативные), 1 (позитивные) или 0 (нейтральные). Я задумываюсь над тем, как с этим работать. Вот мои идеи: создать мультиклассовый классификатор: я пробовал
Data Science
Вопрос или проблема Контекст Я занимаюсь задачей кластеризации 1500 временных рядов из 500 наблюдений в несколько кластеров. Временные ряды обладают одинаковыми наблюдаемыми свойствами в разных пространственных положениях, но реагируют на одни и те же экзогенные переменные.
Data Science
Вопрос или проблема Определение: Я проводил исследование по классификации сигналов ЭЭГ, сосредотачиваясь на различении двух разных классов с использованием сырых сигналов ЭЭГ. Недостаточная доступность данных представляет собой значительную проблему в
Data Science
Вопрос или проблема Я выполняю обнаружение аномалий на различных наборах данных и подумал сначала кластеризовать набор данных и отправить каждый кластер в разные модели обнаружения аномалий. Я использую HDBSCAN, и в моем тестовом наборе данных я получаю
Data Science
Вопрос или проблема У меня возникла следующая проблема: когда я обучал свою модель, я создал фиктивные переменные (до разделения на тренировочную и тестовую выборки) следующим образом: dummy <- dummyVars(formula = CLASS_INV ~ .
Data Science
Вопрос или проблема Я нашел этот вопрос, но мне нужен ответ в другом направлении. Пример: Предположим, мы хотим предсказать, захочет ли человек с определенным профилем купить продукт A и/или B. Итак, у нас есть 2 бинарных класса A и B, которые не исключают
Data Science
Вопрос или проблема У меня есть набор данных (IoT носимый набор данных), состоящий из временных рядов и целочисленных данных; цель моей задачи — использовать набор данных для классификации. Хотя текущие библиотеки в sktime принимают многомерные временные
Data Science
Вопрос или проблема Я уже некоторое время пытаюсь запустить линейную регрессию с помощью SGD, которая находится в Spark mllib, и испытываю огромные проблемы с производительностью. Все примеры, которые я рассматривал, имеют число итераций, равное 100
Data Science
Вопрос или проблема У меня есть набор из 100k графов G, каждый граф имеет связанный результат y (вещественное число). Каждый граф содержит от 10 до 10000 узлов. Каждый узел имеет от 2 до 20 направленных ребер и 6 категориальных атрибутов.
Data Science
Вопрос или проблема Может ли кто-нибудь объяснить, следует ли строить кривые обучения, используя весь набор данных (все X и все y) или только учебный набор данных (X_train и y_train)? Предположим, это регрессионная задача: что вы отображаете, так это
Data Science
Вопрос или проблема Я использую API keras для загрузки датасета MNIST. Моя проблема в том, что мне нужно использовать AlexNet в качестве алгоритма. Понимая модель AlexNet, мне необходимо начинать с изображений размером 227×
Data Science
Вопрос или проблема Если я обучаюсь онлайн в условиях, где у меня есть ОГРОМНОЕ количество данных, будет ли это быстрее, чем минибатчевое обучение (даже если я оптимизирую размер батча для использования GPU, то есть использую кратное 32 количество примеров на минибатч)?