Распространённые нейросети, в том числе Gemini, DeepSeek, ChatGPT и Grok, регулярно дают неверные ответы на медицинские запросы, выяснили аналитики BMJ Open.
В рамках исследования каждой нейросети задали как минимум 10 вопросов об онкологии, вакцинации, стволовых клетках, питании и физической активности. Позже ответы передали учёным.
Читайте так же: Мифы об искусственном интеллекте: копирование или оригинальность?
Почти половина всех ответов (49,6%) содержали искажения фактов. 30% из них содержали незначительные ошибки, 19% были полностью неверными. Ни одна из систем не смогла предоставить полностью корректный список ссылок. Вместо этого они часто сами их придумывали.
Grok выделился худшими показателями, выдавая значительно больше ответов с грубыми ошибками. Наиболее достоверно ИИ отвечали на вопросы, связанные с вакцинацией и раком; хуже всего — на вопросы о питании. Вместе с тем нейросети были полностью уверены в своих ответах.

