reddit_machinelearning_2026-03-15

Reddit ML - 2026-03-15

_{作者: /u/Benlus | 发布于: 2026-03-14 13:32}

实验表明，COCONUT模型的高性能主要源于其多阶段课程训练，而非隐藏状态循环机制。该机制对性能提升无显著贡献，甚至可能损害模型在分布外数据上的泛化能力。

_{作者: /u/bmarti644 | 发布于: 2026-03-14 00:19}

探讨注意力探针通过提前退出思维链来降低计算成本的用例，并询问该技术是否已应用于模型训练阶段。

_{作者: /u/InfinityZeroFive | 发布于: 2026-03-14 03:30}

为Karpathy的autoresearch项目集成了进化数据库，取代了原有的简单日志系统，以利用进化算法在广阔搜索空间中自主寻找最优解。

_{作者: /u/hgarud | 发布于: 2026-03-14 19:23}

作者提交关于反叙事生成的论文，收到关于伦理和开源代码的批评。修改后，仍有审稿人批评旧版本并质疑研究动机，另一人误以为代码未开源且认为评估者太少。作者寻求处理建议。

_{作者: /u/Aloo_Ka_Pakoda | 发布于: 2026-03-14 14:51}

作者在截止日期前举报了元评审员，但未获回应。现临近ACL投稿截止，询问ARR的回应时间、是否保证回复，以及是否应继续提交。

_{作者: /u/getsugaboy | 发布于: 2026-03-14 11:40}

作者询问在将ARR论文提交至ACL时，能否更改投稿方向，以及更改可能带来的影响。

_{作者: /u/Distinct_Relation129 | 发布于: 2026-03-14 14:06}

作者认为强化学习与神经科学的关系是螺旋式互动，而非平行发展，并计划撰写系列文章探讨两者间的思想交流。

_{作者: /u/Kooky_Ad2771 | 发布于: 2026-03-14 17:09}