Поддержать команду Зеркала
Беларусы на войне
  1. «Ни на террориста, ни на разжигателя Андрей похож не был». Федута — о политзаключенном, который был найден повешенным в колонии
  2. Топ-чиновника, который, по словам Лукашенко, должен был «не на ногах ходить», а «на руках или голове», отправили в отставку
  3. В Беларуси объявили внезапную масштабную проверку Вооруженных сил
  4. Беларусам до 27 лет для получения паспорта потребуется справка из военкомата
  5. Пресс-служба Лукашенко заметила на совещании у политика топ-чиновника, который в это время был совсем в другом месте
  6. «Win-win». Спросили у аналитика, какие последствия будет иметь для Беларуси назначение экс-руководителя ГУР главой Офиса президента Украины
  7. Путин открыто заявил, что соглашение по Украине невозможно без реструктуризации НАТО, которая фактически означает разрушение альянса — ISW
  8. Экс-журналистка и сторонница Лукашенко, просившая донаты на еду, оказалась дочерью сотрудника КГБ. У него даже есть паспорт прикрытия
  9. Прилетел с «ссобойкой» и братался с минчанами на площади Победы. Как проходил единственный визит президента США в независимую Беларусь
  10. Врача-невролога Руслана Бадамшина приговорили к 2,5 года лишения свободы — «Белые халаты»
  11. «Можно было понять, где едет кортеж». Протасевич рассказал о раскрытии «крупной сети радиошпионов»
  12. На рынке недвижимости в Минске — перемены: нетипичная ситуация с однушками и квартирами большой площади
  13. Езда на велосипеде опасна для мужского здоровья или это устаревший миф? Доля правды тут имеется — разбираемся (есть нюансы и для женщин)
  14. Крупный телеграм-канал и все его страницы в соцсетях признали «экстремистскими»


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.