Data Science
Альтернативы Prompt Ops
00
Вопрос или проблема Каковы основные альтернативы для управления промтами в настоящее время? Под управлением промтами я подразумеваю комплексное решение для отслеживания экспериментов по созданию промтов, а также регистрацию промтов на различных стадиях
Data Science
Почему LLM обучаются только в одну эпоху?
00
Вопрос или проблема Почему так важно НИКОГДА не позволять модели видеть одни и те же тексты несколько раз, как мы делаем, например, в компьютерном зрении? Или на самом деле все должно быть наоборот, и из-за того, что у нас маленькие наборы данных изображений
Data Science
Проектирование системы RAG: контекстно-осведомленная поддержка клиентов для управления недвижимостью с использованием смешанной информации, специфичной для объектов, и глобальной информации.
00
Вопрос или проблема Контекст Я управляю портфелем объектов недвижимости на таких платформах, как Airbnb, осуществляя поддержку клиентов на протяжении всего пребывания гостей (от предварительного бронирования до завершения проживания).
Data Science
Как эффективно запускать крупную языковую модель с контекстным окном более 60 000 токенов на нескольких графических процессорах?
00
Вопрос или проблема Я работаю с большой языковой моделью (LLM), которая требует большого контекстного окна в 60 000–70 000 токенов для моего приложения. Моя конфигурация включает пять графических процессоров (GPU): три с 16 ГБ и два с 8 ГБ.
Data Science
Ollama с llama3.2-3b – требуется 3.5 минуты, чтобы завершить запрос.
00
Вопрос или проблема Я строю решение RAG на локальном компьютере. Я использую 2 модели, загруженные с Ollama nomic-embed-text (модель встраивания) llama3.2:3b (модель llm) Для тестирования у меня есть только один pdf-документ объемом около 100 страниц
Data Science
Хорошая производительность во время оценки, но плохая производительность во время вывода.
00
Вопрос или проблема Я новичок. Я попытался предварительно обучить и внедрить JPEG-LM с нуля с использованием Llama-2. Код можно найти здесь. Во время оценки и обучения он возвращает высокую точность, что может указывать на переобучение.
Data Science
NER (распознавание именованных сущностей) с использованием LLM, таких как tranF5 или LLAMA2
00
Вопрос или проблема Я пытаюсь выполнить NER (распознавание именованных объектов) с помощью крупных языковых моделей, таких как Trans-F5 или LLAMA2. До сих пор я нашел способы использования инженерии подсказок. Это означает, что нам нужно указать, что искать в тексте.
Data Science
Понимание настройки параметра альфа в статье LORA
00
Вопрос или проблема Я читал статью о LORA https://arxiv.org/pdf/2106.09685.pdf, и одна вещь, которую я не понимаю, это раздел 4.1, где обновления изменяются с помощью альфа, где альфа – это константа в r. Говорится, что альфа устанавливается на
Data Science
Что происходит с операторами (matmul и т.д.), когда модель квантизируется?
00
Вопрос или проблема Квантование параметров модели касается того, как снизить точность весов модели, таких как в Квантовании или Введении в квантование, приготовленном в 🤗 с 💗🧑‍🍳. Но что насчет операторных функций, таких как Matmul или Softmax или Cross Entropy Loss?
Data Science
Существует ли языковая модель, которая может принимать большие объемы табличных данных и отвечать на вопросы об этом?
00
Вопрос или проблема Я исследовал языковые модели, которые могут работать с табличными данными. Моя основная цель – иметь модель, которая сможет отвечать на простые вопросы о моих данных. Примером может быть наличие данных о продажах домашних хозяйств
Data Science
Обучающие метки в классификационных моделях в контексте больших языковых моделей.
00
Вопрос или проблема Я прохожу курс по LLM, и наш преподаватель сказал нечто, что привело меня к идее и вопросу. На тему дообучения с использованием инструкций он сказал: Обучающая выборка должна содержать множество пар «подсказка-ответ», каждая из которых
Data Science
LLM не дает одинаковых результатов на CPU, но хорошо работает на GPU.
00
Вопрос или проблема Когда я пытался попросить Mistral вернуть результаты в формате JSON, результаты были очень хорошими на Bedrock. Когда я использовал Mistral на Ubuntu, но на CPU, результаты были действительно плохими. Также на сервере GPU работал stableLM
Data Science
Есть ли термин для моделей кодировщик-декодировщик с кодировщиком в 0 слоев?
00
Вопрос или проблема Как мы называем кодировщик-декодер с 0 слоями кодировщика и поперечной внимательностью слоев декодера, направленной на выходы слоя встраивания кодировщика? 0-N Кодировщик-декодер Только декодер с поперечной внимательностью Prefix-LM
Data Science
Какую модель векторного представления слов (без контекста) выбрать в 2024 году?
00
Вопрос или проблема Мне нужны векторные представления слов, чтобы построить латентное пространство слов (английский). У меня есть около 2500 слов для встраивания и затем около 9000, чтобы вывести, основываясь на некоторой модели, которую я создам.
Data Science
Расчет стоимости модели Gemini 1.0 Pro
00
Вопрос или проблема Представьте, что вы готовитесь к тонкой настройке модели Gemini. Пока вы планируете, вы начинаете задумываться о различных расходах, которые вам нужно будет учесть. Вы знаете, что ценообразование Gemini часто подчеркивает расходы
Data Science
Вопрос о тренировочных метках в моделях классификации в контексте больших языковых моделей.
00
Вопрос или проблема В настоящее время я прохожу курс по LLM, и наш преподаватель сказал что-то, что привело меня к идее и вопросу. На тему тонкой настройки инструкций он сказал: “Учебный набор данных должен содержать множество пар запросов и завершений
Data Science
Использование активаций на определенном слое в качестве входных данных для LLM, таких как OPT-350m
00
Вопрос или проблема Я работаю с моделью OPT-350m и стремлюсь использовать вложения из разных слоев в качестве входных данных для генерации. Я столкнулся с проблемами при попытке вернуть эти вложения в модель, используя предоставленные методы.
Программное обеспечение
Плагин Frontend для AI системы (LLM) для преобразования длинных текстовых фрагментов в простой современный язык.
00
Вопрос или проблема Как перевести/переформулировать стихотворный эпос на нечитабельном языке (с плохой вёрсткой) на современные разговорные языки? Я собираюсь купить электронную книгу “Илиада” Гомера. Это перевод с древнегреческого на немецкий