Data Science
Модель кодирования LLM цитируется в статье ACM, но не хватает деталей.
01
Вопрос или проблема В этой статье An Exploration of Large Language Models in Malicious Source Code Detection упоминается “code-mutl-model”, но они не предоставляют информацию о происхождении этой модели (аналогично code-llama).
Программное обеспечение
Как использовать краудсорсинг для получения ответов AICore LLM на различных устройствах Android
00
Вопрос или проблема Контекст Дорогие телефоны, такие как последние премиальные устройства Pixel/Samsung/Motorola/Xiaomi/Realme, имеют встроенные LLM, доступные для приложений через Google AI Edge SDK / AICore для Android, они могут отвечать на запросы
Data Science
Обнаружение ссылок и цитат в документах
00
Вопрос или проблема Я ищу решение для обнаружения ссылок и цитат в документах. Например, ссылка выглядит как “[..] относится к разделу 3.1 документа XY“. Насколько я знаю, есть два подхода к решению этой задачи: –
Программное обеспечение
Тестирование LLM E2E
00
Вопрос или проблема Какие бесплатные и платные инструменты можно использовать для тестирования приложений LLM – Тестирование интерфейса пользователя LLM Тестирование API LLM Тестирование производительности LLM Какие факторы следует учитывать при
Программное обеспечение
Какие существуют альтернативы для langchain в Python?
00
Вопрос или проблема Какие есть альтернативы для Langchain на Python? Библиотека, являющаяся абстракцией для взаимодействия с другими библиотеками, такими как OpenAI’s. https://github.com/deepset-ai/haystack — это довольно популярная альтернатива Langchain.
Data Science
Тонкая настройка LLM с ограниченным количеством документов и иерархией
00
Вопрос или проблема Привет, энтузиасты LLM. Интересно, есть ли современные подходы к тонкой настройке модели в соседнем проекте, если: область документов ограничена (но больше, чем просто несколько), эти документы регулярно имеют взаимосвязи.
Data Science
Как направить приложение для работы с текстом на следование правилам из файла и извлечение данных из другого файла?
00
Вопрос или проблема Как обрабатывать сложные файлы RAG локально? Сложные файлы RAG Привет, я работаю над проектом, связанным с созданием чат-приложения на Streamlit, которое позволяет пользователям (владельцам проектов) продвигать свои проекты на различных
Data Science
Научите LLM генерировать код с использованием конкретной библиотеки.
00
Вопрос или проблема Мне интересно узнать, после того как я увидел хорошие примеры кода, созданные Github copilot. Я задаюсь вопросом, могу ли я создать агента, который в основном принимает команды на обычном английском и генерирует код на основе одной конкретной библиотеки.
Программное обеспечение
Есть ли альтернативы langchain?
00
Вопрос или проблема Существуют ли альтернативы для langchain на Python? Библиотека, которая является абстракцией для взаимодействия с другими библиотеками, такими как OpenAI. Ответ или решение Альтернативы Langchain для Python: Подробный Анализ Вопрос
Программное обеспечение
Конвертация данных экспорта ChatGPT из формата JSON в разговоры Markdown
00
Вопрос или проблема В OpenAI ChatGPT можно скачать дамп данных. Перейдите в правый верхний угол, чтобы открыть параметры, нажмите “Настройки”, затем “Управление данными” и затем “экспорт”. Вы получите ссылку для скачивания.
Программное обеспечение
Плагин Visual Studio для сохранения ответов Github Copilot
00
Вопрос или проблема По сути, это идентично этому браузерному расширению для ChatGPT, за исключением того, что это плагин/дополнение для Visual Studio, который обрабатывает вывод Github Copilot. Одним из недостатков Copilot является то, что вы не можете
Программное обеспечение
Расширение для браузера для сохранения разговора с ChatGPT в формате Markdown
00
Вопрос или проблема В образовательных целях мне нужно отслеживать разговоры с ChatGPT, поэтому я хочу сохранять их в виде файлов Markdown. Он должен интегрироваться в браузер, будь то Firefox, Chrome или Opera. Он сохраняет один чат как один файл Markdown.
Программное обеспечение
Какова была бы лучшая рекомендация для инструмента, который суммирует книги, используя оглавление?
00
Вопрос или проблема Это всё, я ищу инструмент, который поможет мне кратко изложить каждую главу/раздел книги независимо (с некоторым контекстом предыдущих глав, как если бы вы её читали). Сначала я хотел бы начать с чтения pdf-файлов.
Data Science
Как начать работать с генерацией с использованием извлечения (RAG) для исследований
00
Вопрос или проблема Здравствуйте, StackExchanger’s, я программный инженер, интересующийся изучением Retrieval-Augmented Generation (RAG) для моего исследования. Однако я новичок в этой области и не имею практического опыта в NLP, NLU или Deep Learning.
Data Science
Как выбрать идеальную предварительно обученную модель для тонкой настройки?
00
Вопрос или проблема Я начал работать с LLM в последнее время и хочу узнать, как люди выбирают свои предобученные модели для задач дообучения? Каковы критерии выбора базовой модели и какие факторы на это влияют? Их слишком много!
Data Science
Почему LoRA подходит для дообучения, но не для обучения?
00
Вопрос или проблема Wfinetuned = Wpretrained + ΔW, так что мы делаем ΔW = A @ B и |ΔW| >> |A| + |B|, мы счастливы. Но почему мы не используем тот же метод во время обучения? Итак, Wtrained = Winitialized + ΔW, и все еще |ΔW| >> |A| + |B|? И далее мы можем сделать […
Data Science
Альтернативы Prompt Ops
00
Вопрос или проблема Каковы основные альтернативы для управления промтами в настоящее время? Под управлением промтами я подразумеваю комплексное решение для отслеживания экспериментов по созданию промтов, а также регистрацию промтов на различных стадиях
Data Science
Почему LLM обучаются только в одну эпоху?
00
Вопрос или проблема Почему так важно НИКОГДА не позволять модели видеть одни и те же тексты несколько раз, как мы делаем, например, в компьютерном зрении? Или на самом деле все должно быть наоборот, и из-за того, что у нас маленькие наборы данных изображений
Data Science
Проектирование системы RAG: контекстно-осведомленная поддержка клиентов для управления недвижимостью с использованием смешанной информации, специфичной для объектов, и глобальной информации.
00
Вопрос или проблема Контекст Я управляю портфелем объектов недвижимости на таких платформах, как Airbnb, осуществляя поддержку клиентов на протяжении всего пребывания гостей (от предварительного бронирования до завершения проживания).
Data Science
Как эффективно запускать крупную языковую модель с контекстным окном более 60 000 токенов на нескольких графических процессорах?
01
Вопрос или проблема Я работаю с большой языковой моделью (LLM), которая требует большого контекстного окна в 60 000–70 000 токенов для моего приложения. Моя конфигурация включает пять графических процессоров (GPU): три с 16 ГБ и два с 8 ГБ.