Data Science
Когда это можно назвать трансферным обучением?
00
Вопрос или проблема Общее определение передачи обучения звучит так: «Передача обучения — это улучшение обучения в новой задаче посредством передачи знаний из связанной задачи, которая уже была изучена.» — Глава 11: Передача обучения, Справочник по исследованиям
Data Science
Модель глубокого обучения для прогнозирования суммы последовательностей на основе значения флага
00
Вопрос или проблема Я пытаюсь предсказать сумму последовательности на основе флага, но моя модель не может сойтись. Для каждого временного штампа включите первый элемент в сумму, если второе число равно 1 в последовательности.
Data Science
Почему модель регрессии, созданная XGBoost, зависит от порядка обучающих данных, когда используется более 8194 точки данных?
00
Вопрос или проблема Когда я использую XGBRegressor для построения модели бустированного дерева на основе 8194 или меньшего числа точек данных (т.е. n_train $\leq$ 8194, где n_train определен в коде ниже) и случайно перемешиваю точки данных перед обучением
Data Science
Анализ проблем с производительностью алгоритма Random Forest
00
Вопрос или проблема Моя задача — выявить потенциальные ситуации для торговли и определить, сможет ли кандидат добиться успеха или нет. У меня есть система для идентификации кандидатов, но уровень ложных срабатываний очень высок.
Data Science
Обнаружение размытия изображения с использованием ssdmobilenet и tensorflowlite
00
Вопрос или проблема У меня есть четкие изображения карт и размытые изображения карт. Моя задача — сделать фотографию, когда изображение не размыто, как вы можете видеть из описания, мне нужно, чтобы этот код работал в реальном времени на устройстве Android.
Data Science
Как нарисовать диаграммы архитектуры нейронных сетей глубокого обучения?
00
Вопрос или проблема Я построил свою модель. Теперь я хочу нарисовать диаграмму архитектуры сети для своей исследовательской работы. Пример показан ниже: Недавно я нашел этот онлайн инструмент, который создает схемы архитектуры нейронных сетей, готовые к публикации.
Data Science
Понимание размерностей целевой переменной Keras LSTM
00
Вопрос или проблема Я изучаю Keras и LSTM и наткнулся на этот учебник, но не понимаю размерности целевой переменной. Цитируя статью ниже: Данные y для обучения в данном случае – это слова ввода x, смещенные на один временной шаг, –
Data Science
Плохая работа CNN для базовой задачи классификации изображений
00
Вопрос или проблема Как дела? Я экспериментирую с CNN в FastAI. Моя модель с 2 миллионами параметров дает всего около 80% точности. Я также пробовал нормализацию данных, нормализацию пакетов, сглаживание меток, Mixup, но результаты все равно остаются
Data Science
Парсер резюме и система оценки на основе глубокого обучения
00
Вопрос или проблема Я хочу узнать, можно ли использовать глубокое обучение для разбора резюме и его оценки. В данный момент я извлекаю текст из PDF или изображения с помощью OCR/tesseract и нахожу такие характеристики, как электронная почта, номер мобильного
Data Science
Проблема косинусного сходства
00
Вопрос или проблема Я новичок в машинном обучении и пытаюсь реализовать несколько небольших проектов. У меня есть этот фрагмент кода. import pandas as pd import json import logging import numpy as np import matplotlib.pyplot as plt from utils.
Data Science
Автоматическое резюмирование данных с помощью текста.
00
Вопрос или проблема Я хотел бы автоматизировать написание периодических отчетов на основе данных. Учитывая одну или несколько таблиц данных, машина должна выдавать тексты, такие как Акции A выросли на 10% в этом году и достигли пятилетнего максимума 2019-12-01
Data Science
Конвертация из серого в BGR
00
Вопрос или проблема Я хочу преобразовать свои серые изображения из mnist в цветные. Я придумал следующий код, но вывод по-прежнему серый. # Импорт (train_images0, train_labels0), (test_images, test_labels) = tensorflow.keras.datasets.
Data Science
Агломеративная кластеризация с ограничениями на минимальный и максимальный размер кластеров
00
Вопрос или проблема Существуют ли пакеты Python, которые содержат алгоритмы агломеративной кластеризации с встроенными ограничениями на минимальный и максимальный размер кластеров? Я нашёл отличный пакет под названием KMeansConstrained, но, к сожалению
Data Science
Прогнозирование временных рядов с использованием не темпоральной информации (экзогенные признаки)
01
Вопрос или проблема Я рассматриваю множество алгоритмов и библиотек для временных рядов, таких как Prophet, darts, auto_ts и т.д. Все библиотеки обсуждают унивариантные временные ряды (где задача заключается в прогнозировании на основе одного временного
Data Science
ValueError: Ожидался 2D массив, вместо этого получен 1D массив.
00
Вопрос или проблема Я хотел бы извлечь 20 самых информативных признаков из очень большого набора признаков $X$, который поступает из набора данных, содержащего клинические данные, с помощью функции RFE из библиотеки scikit-learn в Python.
Data Science
Как создать текстовый файл с помощью Python?
00
Вопрос или проблема У меня простой вопрос. Но я не знаю, как это сделать. У меня есть проект, в котором мне нужно записать числа от 1 до 100 в txt файл, но на 100 различных строках. Например, на 6-й строке будет 6. Я знаю, что есть код: with open('file.
Data Science
Как определить самые эффективные группы в серии
00
Вопрос или проблема Не уверена, что это правильное место для данного вопроса, но на примере следующей тенденции, как я могу определить, что группы A и B являются областями, где результат был наилучшим? Я уже пробовала делать среднее значение и находить все, что выше среднего.
Data Science
Сравнение значений кросс-валидации Бернулли NB и Мультиномиального NB
00
Вопрос или проблема Я тестирую многомерный наивный байесовский классификатор и бернуллиевский наивный байесовский классификатор на своем наборе данных и использую оценку кросс-валидации, чтобы лучше понять, какой из двух алгоритмов работает лучше.
Data Science
Как реализовать пользовательский DataLoader, унаследованный от DataLoader PyTorch?
00
Вопрос или проблема Мне нужно реализовать кастомный DataLoader, который наследуется от torch.data.utils.DataLoader. Я искал полчаса, но не нашел ни примеров, ни документации об этом. Какие методы мне нужно реализовать? И какие типы данных мне следует
Data Science
Считывание корпуса из csv-файла в Orange3
00
Вопрос или проблема У меня есть текст твитов в файле Excel: каждая строка — это один твит. Как мне посмотреть этот корпус в Orange3? Я не понимаю, почему я не могу просто увидеть этот корпус. Как видно на изображении ниже, канал красный, и в Просмотре