The Surprising Effectiveness of Test-Time Training for Abstract Reasoning 论文复现报告(二):实验报告States 论文阅读报告
前言第一部分的实验还是挺多的,也是一个熟悉微调大模型的好机会,总之先开始吧 正文第一个实验:用无TTT结构的微调模型跑实验具体参数:模型:llama3-8B(微调版本)数据:419个问题(来自ARC和增强数据)设备:A100-pcie-40gb操作步骤 首先用作者给出的微调模型跑一下实验 记录实验结果 实验结果 第一次: 第二次:这里贴一下对于400和419的理解: 关于 419 来源及含义: