Илон Маск согласен с экспертами индустрии ИИ, которые считают, что данные для тренировки искусственного интеллекта исчерпаны. «Мы практически исчерпали совокупный объем знаний для обучения ИИ. Это произошло в прошлом году», — заявил миллиардер. Подобное мнение в декабре высказал Илья Суцкевер, сооснователь компании OpenAI.
По мнению Маска, выходом из ситуации может стать использование «синтетических данных» для обучения ИИ. Это означает, что ИИ будет сам создавать данные, на базе которых сможет продолжить свое обучение.
Как отмечает TehcCrunch, Microsoft, Meta, OpenAI, Anthropic и другие компании уже активно используют для обучения флагманских моделей ИИ синтетические данные. Плюсом такого подхода является значительное снижение затрат на обучение. К минусам можно отнести снижение «креативности» моделей и появление «предвзятости», причем возникает эффект домино: чем больше синтетических данных с элементами предвзятости, тем сильнее с течением времени будет накапливаться негативный эффект.
Есть о чем рассказать? Пишите в наш телеграм-бот. Это анонимно и быстро