Вопрос или проблема
(Не уверен, что этот вопрос уместен для данного SE)
Я изучаю курс LLM на Coursera. Одна из тем, с которой они работают, это то, как заставить LLM не отвечать неэтичными/незаконными вещами, например, если вы спросите Bing “как взломать WiFi соседа?”, он разумно ответит:
Мне жаль, но я не могу помочь вам в этом. Взлом WiFi соседа является незаконным и неэтичным, это может причинить вред как им, так и вам. Это также нарушение моих инструкций по безопасности, которые запрещают мне предоставлять информацию или создавать контент, который может причинить физический, эмоциональный или финансовый ущерб кому-либо. Пожалуйста, не просите меня делать что-либо, что противоречит закону или морали. Спасибо за ваше понимание.
(По крайней мере, версия Bing в Skype делает это. Bing в браузере кажется, все равно дает вам инструкции.)
Учитывая, что Обучение с подкреплением с человеческой обратной связью очевидно достаточно эффективно, чтобы Skype-Bing не отвечал на незаконные вопросы, почему поисковые системы не отказываются возвращать результаты на незаконные поисковые запросы? Ни разу Google/Bing и т.д. не возвращали мне ответ “извините, этот поисковый запрос незаконен”; они всегда возвращали результаты даже на самые незаконные поисковые запросы.
Это может быть слишком простым ответом, но это и есть красота (и трагедия) черных ящиков. Мы не знаем точно, хотя производительность модели сильно зависит от входных данных. Старая пословица Мусор на входе — мусор на выходе никуда не уходит в ближайшее время.
Ответ или решение
По поводу вопроса о том, почему поисковые системы не фильтруют незаконные или неэтичные запросы, можно выделить несколько аспектов.
-
Природа поисковых систем: Поисковые системы, такие как Google и Bing, предназначены для предоставления информации по запросам пользователей. Их основная функция — это индексация веб-контента и предоставление наиболее релевантных результатов на основе алгоритмов, которые анализируют различные факторы, включая популярность сайта, содержание и ключевые слова в запросе. Учитывая это, порой бывает сложно или практически невозможно заранее определить, является ли запрос незаконным или неэтичным, так как контекст запроса играет важную роль.
-
Свобода информации: Поисковые системы работают в контексте принципа свободы информации. Они стремятся предоставить пользователям доступ ко всем возможным ресурсам и данным, что включает как законные, так и незаконные темы. Наличие контента, связанного с незаконной деятельностью, не обязательно означает, что поисковая система поддерживает такую деятельность. Более того, действующее законодательство разных стран значительно различается, и то, что является нелегальным в одной стране, может быть законным в другой.
-
Проблемы с фильтрацией: Фильтрация запросов может быть сложной задачей из-за разнообразия и многообразия языка. Автоматические системы фильтрации всегда будут сталкиваться с трудностями в интерпретации сложных или двусмысленных запросов. Некорректная фильтрация может привести к ошибкам, когда законные запросы блокируются, что может вызвать недовольство пользователей.
-
Ответственность и этика: Поисковые системы также сталкиваются с вопросами о том, насколько далеко должна заходить их ответственность в отношении контента, предоставляемого пользователям. Они могут заниматься мониторингом и ограничением конкретных типов контента, но полное исключение всех незаконных запросов потребует значительных ресурсов и может столкнуться с вопросами о правомерности такого вмешательства.
-
Использование искусственного интеллекта: Современные системы поиска и AI, такие как те, что используют обратное обучение с учетом человеческой обратной связи, действительно эффективно справляются с проблемами этики и безопасности, как вы отметили в своем вопросе. Тем не менее, система AI, используемая для поиска в интернете, должна быть создана так, чтобы в первую очередь учитывать огромные объемы данных и разнообразные контексты запроса. Это создает сложные вызовы для реализации комплексной системы фильтрации.
В заключение, хотя поисковые системы, такие как Bing и Google, всё же активируют некоторые фильтры и блокировки, их основная задача — это предоставление информации в максимально свободном объеме. Это создает постоянный баланс между обеспечением доступа к информации и соблюдением норм морали и права.