Компании, работающие над развитием искусственного интеллекта, исчерпали все доступные данные для обучения своих моделей, заявил Илон Маск. Теперь, по его словам, им приходится переходить к использованию синтетических данных – материалов, созданных самим ИИ, сообщает The Guardian.

В интервью, которое транслировалось на его платформе X, Маск объяснил, что процесс обучения ИИ на огромных объёмах информации из интернета достиг своего предела.

"Человеческие знания были исчерпаны почти год назад", – отметил он.

Модели, такие как GPT-4, на которых работает ChatGPT, учат ИИ выявлять закономерности в данных, что позволяет ему, например, предсказывать следующее слово в предложении.

Маск также добавил, что теперь технологические компании будут использовать синтетические данные для обучения новых моделей. Он подчеркнул, что этот процесс уже активно идёт: такие компании, как Meta, Microsoft и OpenAI, используют искусственно созданные материалы для настройки своих ИИ-систем.

"Единственный способ компенсировать нехватку данных – это создавать синтетические материалы, которые позволят моделям учиться", – сказал Маск.

Однако, по его мнению, с этим процессом связаны риски. ИИ может генерировать "галлюцинации" – неточные или бессмысленные ответы, что делает использование синтетических данных более сложным. Кроме того, этот вопрос касается и юридических аспектов.

В прошлом году OpenAI признала, что для создания таких инструментов, как ChatGPT, она использовала данные, защищённые авторским правом. Это привело к требованиям компенсации от представителей творческой индустрии, чьи материалы использовались для обучения моделей.