Data Science
Есть ли реализация алгоритма Расширенного изолированного леса в R/Python?
00
Вопрос или проблема Я использую пакет isofor для обычного Isolation Forest, но наткнулся на статью о Расширенном Isolation Forest и мне нужен ваш совет, какой пакет имеет эту функцию, реализованную в R/Python. Есть пакет на Github под названием “
Data Science
Интерпретация кривой обучения – нейронная сеть
00
Вопрос или проблема Когда я запускаю свои три разные нейронные сети, я получаю следующие кривые обучения, используя MSE. Я считаю, что моя базовая модель в порядке и не переобучается и не недообучается. Более того, я считаю, что моя маленькая модель недообучается
Data Science
Вопрос о тренировочных данных в word2vec – skip-gram
00
Вопрос или проблема У меня есть очень простой вопрос относительно обучающей выборки в word2vec. В реализации skip-gram, обучающая выборка (если я правильно понимаю) генерируется в виде пар слов, как показано на этом изображении: Это, по сути, просто пары векторов one-hot.
Data Science
Что такое дисперсия распределения?
00
Вопрос или проблема У меня есть два набора данных: один набор set1=[2,2,2,4.5] и другой набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, то set1 будет: set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому ожидал
Data Science
Keras очень низкая точность, насыщается после нескольких эпох во время обучения.
00
Вопрос или проблема Я совсем новичок в области науки о данных и сразу же начал работать с моделями TensorFlow. Ранее я работал с примерами, представленными на сайте. Это моя первая попытка реализовать проект с его использованием.
Data Science
LLM не дает одинаковых результатов на CPU, но хорошо работает на GPU.
00
Вопрос или проблема Когда я пытался попросить Mistral вернуть результаты в формате JSON, результаты были очень хорошими на Bedrock. Когда я использовал Mistral на Ubuntu, но на CPU, результаты были действительно плохими. Также на сервере GPU работал stableLM
Data Science
Есть ли термин для моделей кодировщик-декодировщик с кодировщиком в 0 слоев?
00
Вопрос или проблема Как мы называем кодировщик-декодер с 0 слоями кодировщика и поперечной внимательностью слоев декодера, направленной на выходы слоя встраивания кодировщика? 0-N Кодировщик-декодер Только декодер с поперечной внимательностью Prefix-LM
Data Science
Какую модель векторного представления слов (без контекста) выбрать в 2024 году?
00
Вопрос или проблема Мне нужны векторные представления слов, чтобы построить латентное пространство слов (английский). У меня есть около 2500 слов для встраивания и затем около 9000, чтобы вывести, основываясь на некоторой модели, которую я создам.
Data Science
Как подделать данные на основе условия и веса
00
Вопрос или проблема Я пытаюсь создать поддельные данные для кафе. У меня есть две характеристики: возраст и меню. Меню включает в себя различные типы напитков, таких как кофе [латте, эспрессо, мокко и т.д.], чай [молочный чай, лимонный чай], молоко [свежие
Data Science
Классификация продукции по иерархическим категориям на основе множества параметров и нестандартных описаний.
00
Вопрос или проблема Я хочу начать проект по машинному обучению в своей компании, и для аналитиков затрат большая проблема заключается в классификации продуктов, которые покупатели заказывают для обслуживания, инструментов, сырья и тому подобного, так
Data Science
Рабочее поведение BERT по сравнению с Transformers, Self-Attention+LSTM и Attention+LSTM на задаче классификации научных STEM данных?
00
Вопрос или проблема Я использовал предобученный BERT с Focal Loss для классификации физики, химии, биологии и математики и получил хороший макрос F-1 0.91. Это неплохо, учитывая, что ему нужно было искать токены, такие как triangle, reaction, mitochondria и newton и т.
Data Science
Необходима: библиотека Java для расчета читаемости/сложности текста.
00
Вопрос или проблема В принципе, это то же самое, что это, но для Java (и желательно для нескольких языков) (например, индекс читаемости Флеша, индекс SMOG, уровень Флеша-Кинкейда, индекс Коулмана-Лиу, автоматический индекс читаемости, оценка читаемости
Data Science
Плохая форма ввода — как интерпретировать и диагностировать; Также вопрос по машинному обучению.
00
Вопрос или проблема Извините, я новичок в машинном обучении, но я пытаюсь научиться. Я создаю классификатор на основе этого набора данных, чтобы предсказать психические расстройства на основе признаков. Я хотел запустить очень простую модель классификатора
Data Science
Расчет стоимости модели Gemini 1.0 Pro
00
Вопрос или проблема Представьте, что вы готовитесь к тонкой настройке модели Gemini. Пока вы планируете, вы начинаете задумываться о различных расходах, которые вам нужно будет учесть. Вы знаете, что ценообразование Gemini часто подчеркивает расходы
Data Science
Методы опорных векторов в R: Поиск уравнения гиперплоскости (в 6 измерениях) и демонстрация его корректности
00
Вопрос или проблема lin.6d<-read.csv("D:/Documents/Linear-6d.csv", header=TRUE) View(lin.6d) plot(lin.6d,col = ifelse(lin.6d$Class == 1, "red","blue")) library(e1071) # Пакет для поддержки векторных машин svm.lin.6d <- svm(Class ~ .
Data Science
LTSM плохо предсказывает колонку закрытия акций Apple.
00
Вопрос или проблема Я использую LSTM (долгая краткосрочная память) для прогнозирования цен закрытия акций Apple, используя данные о трех предыдущих днях. Моя проблема заключается в том, что модель недооценивает цены закрытия. Фотография конечного результата
Data Science
Автокодировщик не обучается на трансформации изображений в режиме walk forward.
00
Вопрос или проблема У меня есть серия из 15 кадров (60 строк x 50 столбцов). На протяжении этих 15 кадров луна движется от верхнего левого угла к нижнему правому углу. Данные = https://github.com/aiqc/AIQC/tree/main/remote_datum/image/liberty_moon Я пытаюсь
Data Science
Как избежать утечки данных в задачах машинного обучения, связанных с временными рядами, последовательностями или любыми упорядоченными задачами?
00
Вопрос или проблема В частности, приведет ли линейная интерполяция к утечке данных при ее применении к перекрывающимся последовательностям? Ответ или решение Избежать утечки данных в задачах машинного обучения, связанных с временными рядами, последовательностями
Data Science
Какие решения существуют для RL-агентов, когда не все действия всегда доступны?
00
Вопрос или проблема Я работаю в среде RL, где не все действия всегда доступны. В этом случае, в зависимости от состояния, в котором находится среда, некоторые действия недоступны для выбора агентом. Я нашел работу, которая касается этой ситуации: https://ojs.
Data Science
Изменения в стандартном графике тепловой карты – симметричные цвета столбцов, показывать только диагональные значения и имена столбцов на отметках осей x, y.
00
Вопрос или проблема У меня есть изображение тепловой карты (корреляция между всеми столбцами матрицы), и я не могу выполнить все изменения, указанные ниже, в одном и том же изображении: Цвета столбцов должны быть симметричны относительно нуля (например