Data Science
Можно ли добавить базовый уровень к SHAP?
00
Вопрос или проблема У меня есть сомнение. В данный момент я использую интегрированные градиенты для модели DNN для объяснимости. В этом случае мы можем задать базовое значение в качестве параметра функции. Я использую все нули для этого.
Data Science
При использовании KNN как узнать, какой порядок расстояния Минковского использовать?
00
Вопрос или проблема Я изучаю KNN и машинное обучение в целом. Я знаю, что KNN обычно использует расстояние Минковского второго порядка (евклидово расстояние), но я предполагаю, что он также может использовать и другие порядки.
Data Science
Могу ли я использовать кластеризацию после классификации для улучшения производительности моего классификатора?
00
Вопрос или проблема Предположим, у меня есть классификатор, который сегментирует мои векторные характеристики (например, представляющие соискателей) на 3 разных сегмента A, B, C, присваивая каждому соискателю оценку от 0 (хуже) до 1 (лучше) с помощью
Data Science
Как интерпретировать бScores Лапласа для ранжирования важности признаков в неконтролируемой кластеризации признаков?
00
Вопрос или проблема В настоящее время я работаю над ранжированием важности признаков без учителя с использованием методов кластеризации графов, сосредоточив внимание на лапласиановском счете в качестве метрики. Тем не менее, я испытываю трудности с интерпретацией
Data Science
Лучший способ предсказать диапазоны денег?
00
Вопрос или проблема В настоящее время я работаю над проектом, в рамках которого мне нужно разработать модель для прогнозирования, сколько денег другие компании смогут заработать, используя услуги, предоставляемые моей компанией. Заработанные деньги –
Data Science
Как получить оптимальную модель с использованием Keras? Глубокое обучение
00
Вопрос или проблема Существует слишком много параметров при построении искусственной нейронной сети. Некоторые из них, которые приходят мне на ум, это: Количество слоев Типы слоев Количество узлов на каждом уровне слоя Активационные функции в каждом слое
Data Science
Как обслуживать модель глубокого обучения с использованием TensorFlow Lite
00
Вопрос или проблема Я пытаюсь создать модель для подписи изображения на основе набора данных flickr8k dataset с использованием TensorFlow lite в приложении для Android. Я новичок в разработке приложений для Android и застрял на следующем коде, где мне
Data Science
Как я могу генерировать рукописные заметки, исходя из любого образца почерка и текстового файла?
00
Вопрос или проблема Я новичок в области ML/DL и ищу хороший способ сгенерировать файл с подписями (симулированный), учитывая 2 входных данных: Набор образцов рукописных записок (для обучения). Все записи будут от одного и того же человека.
Data Science
Влияние нескольких неправильно масштабированных значений признаков на модель логистической регрессии
00
Вопрос или проблема Мне была предложена ситуация, чтобы предсказать действительность модели логистической регрессии, когда было обнаружено, что определенные значения высоко взвешенной переменной были ошибочно умножены на 1000.
Data Science
Переобучение в сиамской нейронной сети, связанное с проверкой подписей
00
Вопрос или проблема Я работаю над задачей верификации подписей, где мне нужно создать модель, которая даст среднюю достаточно хорошую точность валидации, чтобы получить полезную модель для тестирования (цель – выше 80%).
Data Science
Метрика оценки для несбалансированных данных
00
Вопрос или проблема Привет, я аспирант в области компьютерных наук. У меня есть вопрос для экспертов по ИИ или данным. Я пишу статью. Мой набор данных – это временные ряды сенсорных данных, и соотношение аномалий (положительный класс) составляет от 5% до 6%.
Data Science
Разделение CSV-данных с отсутствующей целевой переменной с помощью train_test_split в Python
00
Вопрос или проблема У меня есть набор данных в формате CSV, который состоит из обучающего набора с около 300 экземплярами и тестового набора с около 100 экземплярами. Проблема в том, что целевая переменная (столбец, который мы хотим предсказать) полностью
Data Science
Как мне предсказать класс для каждого временного шага, используя информацию из предыдущих временных шагов?
00
Вопрос или проблема У меня есть задача классификации, но она отличается от обычной. Я должен предоставить 3 вывода (каждый из которых равен 0 или 1) для каждого входа из 3 временных шагов и 10 признаков. Какую архитектуру модели или подход использовать в таком типе задачи?
Data Science
Какой лучший пакет для выпуклой оптимизации?
00
Вопрос или проблема У меня есть набор задач вида $\text{min} \|Ax-y\|_1$ с некоторыми ограничениями на $x_i$. Быстрый поиск показывает пакеты cvxpy, scipy.optimize и pyomo.environ. Какой из них имеет наилучший баланс между лаконичным определением проблемы и скоростью выполнения?
Data Science
Возможно ли использовать BERTopic на данных, не основанных на предложениях?
00
Вопрос или проблема Я хотел бы создать тематическую модель содержимого поля “Заметки” в CRM. Таких записей несколько сотен. Чаще всего это не целые предложения, а просто комбинации слов (например, “клиент с конференции 2024 года в Цюрихе”
Data Science
Как вывести загруженный текст в Shiny в R в позиции скриншота?
00
Вопрос или проблема Я хотел бы разместить длинный текст с правой стороны этого приложения Shiny, как показано на скриншоте ниже. library(quanteda) library(shiny) library(tm) library(tidytext) library(tidyverse) library(shinydashboard) library(shinythemes) war <
Data Science
корректировка условного и маргинального распределения в трансферном обучении
00
Вопрос или проблема Я понимаю, что в случае трансферного обучения целевые и исходные данные могут иметь разные распределения по доменам. В таких случаях авторам во многих статьях предлагают сблизить маргинальные и условные распределения целевых и исходных данных, т.
Data Science
Корпус компьютерных наук для обучения языковой модели
00
Вопрос или проблема Я ищу корпус компьютерных наук, специфичный для домена, содержащий не менее 20 миллионов слов (предпочтительно больше 50 миллионов слов), для обучения языковой модели. Есть ли что-то готовое, что я мог бы использовать?
Data Science
Как дополнить последовательности с действительными значениями
00
Вопрос или проблема У меня есть несколько последовательностей произвольных одномерных временных рядов (не относящихся к одной конкретной области, с неограниченным диапазоном). Последовательности имеют разную длину, и сейчас я не могу объединить их в батчи и передать в сеть.
Data Science
Классификация нелинейных регрессий по их формам
00
Вопрос или проблема У меня есть набор данных, состоящий из тысяч индивидуальных зависимостей y ~ x, которые могут иметь разные формы. Например, они могут следовать экспоненциальному, асимптотическому, логистическому или формы с горбом (с различной ассиметрией) паттерну.