llm
Data Science
Вопрос или проблема Каковы основные альтернативы для управления промтами в настоящее время? Под управлением промтами я подразумеваю комплексное решение для отслеживания экспериментов по созданию промтов, а также регистрацию промтов на различных стадиях
Data Science
Вопрос или проблема Почему так важно НИКОГДА не позволять модели видеть одни и те же тексты несколько раз, как мы делаем, например, в компьютерном зрении? Или на самом деле все должно быть наоборот, и из-за того, что у нас маленькие наборы данных изображений
Data Science
Вопрос или проблема Контекст Я управляю портфелем объектов недвижимости на таких платформах, как Airbnb, осуществляя поддержку клиентов на протяжении всего пребывания гостей (от предварительного бронирования до завершения проживания).
Data Science
Вопрос или проблема Я работаю с большой языковой моделью (LLM), которая требует большого контекстного окна в 60 000–70 000 токенов для моего приложения. Моя конфигурация включает пять графических процессоров (GPU): три с 16 ГБ и два с 8 ГБ.
Data Science
Вопрос или проблема Я строю решение RAG на локальном компьютере. Я использую 2 модели, загруженные с Ollama nomic-embed-text (модель встраивания) llama3.2:3b (модель llm) Для тестирования у меня есть только один pdf-документ объемом около 100 страниц
Data Science
Вопрос или проблема Я новичок. Я попытался предварительно обучить и внедрить JPEG-LM с нуля с использованием Llama-2. Код можно найти здесь. Во время оценки и обучения он возвращает высокую точность, что может указывать на переобучение.
Data Science
Вопрос или проблема Я пытаюсь выполнить NER (распознавание именованных объектов) с помощью крупных языковых моделей, таких как Trans-F5 или LLAMA2. До сих пор я нашел способы использования инженерии подсказок. Это означает, что нам нужно указать, что искать в тексте.
Data Science
Вопрос или проблема Я читал статью о LORA https://arxiv.org/pdf/2106.09685.pdf, и одна вещь, которую я не понимаю, это раздел 4.1, где обновления изменяются с помощью альфа, где альфа – это константа в r. Говорится, что альфа устанавливается на
Data Science
Вопрос или проблема Квантование параметров модели касается того, как снизить точность весов модели, таких как в Квантовании или Введении в квантование, приготовленном в 🤗 с 💗🧑🍳. Но что насчет операторных функций, таких как Matmul или Softmax или Cross Entropy Loss?
Data Science
Вопрос или проблема Я исследовал языковые модели, которые могут работать с табличными данными. Моя основная цель – иметь модель, которая сможет отвечать на простые вопросы о моих данных. Примером может быть наличие данных о продажах домашних хозяйств
Data Science
Вопрос или проблема Я прохожу курс по LLM, и наш преподаватель сказал нечто, что привело меня к идее и вопросу. На тему дообучения с использованием инструкций он сказал: Обучающая выборка должна содержать множество пар «подсказка-ответ», каждая из которых
Data Science
Вопрос или проблема Когда я пытался попросить Mistral вернуть результаты в формате JSON, результаты были очень хорошими на Bedrock. Когда я использовал Mistral на Ubuntu, но на CPU, результаты были действительно плохими. Также на сервере GPU работал stableLM
Data Science
Вопрос или проблема Как мы называем кодировщик-декодер с 0 слоями кодировщика и поперечной внимательностью слоев декодера, направленной на выходы слоя встраивания кодировщика? 0-N Кодировщик-декодер Только декодер с поперечной внимательностью Prefix-LM
Data Science
Вопрос или проблема Мне нужны векторные представления слов, чтобы построить латентное пространство слов (английский). У меня есть около 2500 слов для встраивания и затем около 9000, чтобы вывести, основываясь на некоторой модели, которую я создам.
Data Science
Вопрос или проблема Представьте, что вы готовитесь к тонкой настройке модели Gemini. Пока вы планируете, вы начинаете задумываться о различных расходах, которые вам нужно будет учесть. Вы знаете, что ценообразование Gemini часто подчеркивает расходы
Data Science
Вопрос или проблема В настоящее время я прохожу курс по LLM, и наш преподаватель сказал что-то, что привело меня к идее и вопросу. На тему тонкой настройки инструкций он сказал: “Учебный набор данных должен содержать множество пар запросов и завершений
Data Science
Вопрос или проблема Я работаю с моделью OPT-350m и стремлюсь использовать вложения из разных слоев в качестве входных данных для генерации. Я столкнулся с проблемами при попытке вернуть эти вложения в модель, используя предоставленные методы.
Программное обеспечение
Вопрос или проблема Как перевести/переформулировать стихотворный эпос на нечитабельном языке (с плохой вёрсткой) на современные разговорные языки? Я собираюсь купить электронную книгу “Илиада” Гомера. Это перевод с древнегреческого на немецкий