快科技 1 月 13 日音书,马斯克在 CES 技巧承袭采访时指出,履行寰球能用来检会 AI 模子的贵寓亚洲桃色网,一经消费的差未几了。
马斯克清晰,基本上,AI 检会一经将东说念主类累计的学问全数耗尽,而这个时刻点即是客岁(2024 年)。
马斯克的这一不雅点呼应了 OpenAI 前科学长 Ilya Sutskever 在客岁 12 月机器学习会议" NeurIPS "上的说法,Sutskever 其时清晰,AI 产业大概消费的数据一经达到了顶峰。
面临履行寰球数据的障碍亚洲桃色网,马斯克示意合成数据(synthetic data)将是改日的发展标的。
他指出,补充履行寰球数据的独一形态即是合成数据,由 AI 自行生成用于检会的数据,通过合成数据,AI 将大概为我方打分,并伸开自我学习的经过。
事实上,很多科技巨头一经初始使用合成数据来检会 AI 模子,微软、Meta、OpenAI 及 Anthropic 等企业一经在其 AI 模子检会中粗俗应用合成数据。
卡通色图科技市集筹商机构 Gartner 预计,2024 年 AI 及分析花式使用的数据中,约 60% 是合成数据。
举例,微软在 1 月 8 日开源的 AI 模子" Phi-4 "即是通过合成数据聚合履行寰球数据进行检会的,谷歌的" Gemma "模子也经受了一样的形态。
Anthropic 使用部分合成数据建造了证据最好的系统之一" Claude 3.5 Sonnet ",而 Meta 则诈欺 AI 生成数据来微调其最新推出的 Llama 系列模子。