Data Science
Data Science
Вопрос или проблема У меня есть сомнение. В данный момент я использую интегрированные градиенты для модели DNN для объяснимости. В этом случае мы можем задать базовое значение в качестве параметра функции. Я использую все нули для этого.
Data Science
Вопрос или проблема Я изучаю KNN и машинное обучение в целом. Я знаю, что KNN обычно использует расстояние Минковского второго порядка (евклидово расстояние), но я предполагаю, что он также может использовать и другие порядки.
Data Science
Вопрос или проблема Предположим, у меня есть классификатор, который сегментирует мои векторные характеристики (например, представляющие соискателей) на 3 разных сегмента A, B, C, присваивая каждому соискателю оценку от 0 (хуже) до 1 (лучше) с помощью
Data Science
Вопрос или проблема В настоящее время я работаю над ранжированием важности признаков без учителя с использованием методов кластеризации графов, сосредоточив внимание на лапласиановском счете в качестве метрики. Тем не менее, я испытываю трудности с интерпретацией
Data Science
Вопрос или проблема В настоящее время я работаю над проектом, в рамках которого мне нужно разработать модель для прогнозирования, сколько денег другие компании смогут заработать, используя услуги, предоставляемые моей компанией. Заработанные деньги –
Data Science
Вопрос или проблема Существует слишком много параметров при построении искусственной нейронной сети. Некоторые из них, которые приходят мне на ум, это: Количество слоев Типы слоев Количество узлов на каждом уровне слоя Активационные функции в каждом слое
Data Science
Вопрос или проблема Я пытаюсь создать модель для подписи изображения на основе набора данных flickr8k dataset с использованием TensorFlow lite в приложении для Android. Я новичок в разработке приложений для Android и застрял на следующем коде, где мне
Data Science
Вопрос или проблема Я новичок в области ML/DL и ищу хороший способ сгенерировать файл с подписями (симулированный), учитывая 2 входных данных: Набор образцов рукописных записок (для обучения). Все записи будут от одного и того же человека.
Data Science
Влияние нескольких неправильно масштабированных значений признаков на модель логистической регрессии
Вопрос или проблема Мне была предложена ситуация, чтобы предсказать действительность модели логистической регрессии, когда было обнаружено, что определенные значения высоко взвешенной переменной были ошибочно умножены на 1000.
Data Science
Вопрос или проблема Я работаю над задачей верификации подписей, где мне нужно создать модель, которая даст среднюю достаточно хорошую точность валидации, чтобы получить полезную модель для тестирования (цель – выше 80%).
Data Science
Вопрос или проблема Привет, я аспирант в области компьютерных наук. У меня есть вопрос для экспертов по ИИ или данным. Я пишу статью. Мой набор данных – это временные ряды сенсорных данных, и соотношение аномалий (положительный класс) составляет от 5% до 6%.
Data Science
Вопрос или проблема У меня есть набор данных в формате CSV, который состоит из обучающего набора с около 300 экземплярами и тестового набора с около 100 экземплярами. Проблема в том, что целевая переменная (столбец, который мы хотим предсказать) полностью
Data Science
Вопрос или проблема У меня есть задача классификации, но она отличается от обычной. Я должен предоставить 3 вывода (каждый из которых равен 0 или 1) для каждого входа из 3 временных шагов и 10 признаков. Какую архитектуру модели или подход использовать в таком типе задачи?
Data Science
Вопрос или проблема У меня есть набор задач вида $\text{min} \|Ax-y\|_1$ с некоторыми ограничениями на $x_i$. Быстрый поиск показывает пакеты cvxpy, scipy.optimize и pyomo.environ. Какой из них имеет наилучший баланс между лаконичным определением проблемы и скоростью выполнения?
Data Science
Вопрос или проблема Я хотел бы создать тематическую модель содержимого поля “Заметки” в CRM. Таких записей несколько сотен. Чаще всего это не целые предложения, а просто комбинации слов (например, “клиент с конференции 2024 года в Цюрихе”
Data Science
Вопрос или проблема Я хотел бы разместить длинный текст с правой стороны этого приложения Shiny, как показано на скриншоте ниже. library(quanteda) library(shiny) library(tm) library(tidytext) library(tidyverse) library(shinydashboard) library(shinythemes) war <
Data Science
Вопрос или проблема Я понимаю, что в случае трансферного обучения целевые и исходные данные могут иметь разные распределения по доменам. В таких случаях авторам во многих статьях предлагают сблизить маргинальные и условные распределения целевых и исходных данных, т.
Data Science
Вопрос или проблема Я ищу корпус компьютерных наук, специфичный для домена, содержащий не менее 20 миллионов слов (предпочтительно больше 50 миллионов слов), для обучения языковой модели. Есть ли что-то готовое, что я мог бы использовать?
Data Science
Вопрос или проблема У меня есть несколько последовательностей произвольных одномерных временных рядов (не относящихся к одной конкретной области, с неограниченным диапазоном). Последовательности имеют разную длину, и сейчас я не могу объединить их в батчи и передать в сеть.
Data Science
Вопрос или проблема У меня есть набор данных, состоящий из тысяч индивидуальных зависимостей y ~ x, которые могут иметь разные формы. Например, они могут следовать экспоненциальному, асимптотическому, логистическому или формы с горбом (с различной ассиметрией) паттерну.