思维链提出者 Jason Wei 称赞:「这是一篇非常聪明的论文,可以预测预训练模型的下游性能,非常有价值。因为可以使用它来预测和证明对下一个大模型训练运行的资本投资的合理性。」 LLM 规模扩展的一个根本性挑战是缺乏对涌现能力的理解。特别是,语言模型 ...