新闻首页 / “2024年06月24日”的新闻
6
0
240万亿巨量数据被洗出,足够训出18个GPT-4!全球23所机构联手,清洗秘籍公开
新智元报道 编辑:编辑部 是时候把数据 Scale Down 了!Llama 3 揭示了这个可怕的事实:数据量从 2T 增加到 15T,就能大力出奇迹,所以要想要有 GPT-3 到 GPT-4 的提升,下一代模型至少还要 150T 的数据。好在,最近有团队从 CommonCrawl 里洗出了 240




























