Всего курсов: 18023
Валют: 138
Обменников: 46/51
Отзывов: 1616
Обновление: 17:02:56
CAP: $26
settings
Светлая или темная тема?
Выберите удобное отображение сайта
Dominance BTC: 51.7%
ETH: 18.2%
Выберите валюты для обмена

Компания DeepMind представили новую разработку — SAFE. Это ИИ-модель, проверяющая факты в ответах LLM лучше, чем люди.

Общая проблема всех крупных языковых моделей — достоверность сгенерированной информации. Из-за того, что чат-боты подвержены галлюцинациям, это мешает им отвечать на вопросы правильно. В связи с этой проблемой, каждый результат нужно проверять вручную. Это, в свою очередь, увеличивает время решения задачи.

Специалисты DeepMind разработали ИИ-бота, который автоматически указывает на неточности результатов. Название этой системы Search-Augmented Factuality Evaluator. Что в переводе означает «Оценщик фактов с расширенным поиском».

Ученые создали LLM, что сначала разделяет утверждения или факты в ответе ИИ-моделей. После этого, система использует Search от Google для поиска сайтов, которые верифицируют утверждения. Только после удачного поиска делает сравнение с чат-ботами.

Специалисты делятся, что использование ИИ будет в 20 раз дешевле, по сравнению с человеческой проверкой. Учитывая то, что объем сгенерированной информации ИИ-ботами быстро растет, наличие более дешевого способа проверки будет необходимым.

Чтобы научить LLM проверять информацию DeepMind использовали ИИ для проверки 16 тысяч фактов, которые содержатся в ответах 13 основных языковых моделей, включая Gemini, GPT, Claude и PaLM-2. Компания также сравнила результаты с выводами других фактчекеров и пришли к выводу, что SAFE предоставляет в 72 % случаях идентичный результат.

Наличие расхождений в ответах людей и SAFE — 76 %, у которых ИИ оказался прав.

Профессор Гэри Маркус сказал, что не стоит утверждать наверняка, что чат-бот справляется с поставленной задачей на «сверхчеловеческом уровне». Потому что нет точных данных о квалификации людей, участвовавших в эксперименте.

Команда DeepMind поделилась на GitHub кодом SAFE.

Похожие материалы
art_image
Джером Пауэлл поддержал регулирование стейблкоинов в США – KursoFF
Читать далее
art_image
Неизвестный трейдер продал новый токен SORA и получил 1280-кратную прибыль — KursoFF
Читать далее
art_image
Виталик Бутерин рассказал о применении искусственного интеллекта для Ethereum — KursoFF
Читать далее
Настройки
Вверх