Reddit ML - 2026-03-15
1. arXiv将脱离康奈尔大学独立运营,并招聘年薪约30万美元的CEO。“在与康奈尔大学保持数十年卓有成效的合作后,arXiv在西蒙斯基金会的支持下,将成立独立的非营利组织”
作者: /u/Benlus | 发布于: 2026-03-14 13:32
2. 对Meta的COCONUT进行对照实验发现,”潜在推理”主要源于良好训练,重复使用的隐藏状态反而损害泛化能力
实验表明,COCONUT模型的高性能主要源于其多阶段课程训练,而非隐藏状态循环机制。该机制对性能提升无显著贡献,甚至可能损害模型在分布外数据上的泛化能力。
作者: /u/bmarti644 | 发布于: 2026-03-14 00:19
3. [讨论] 可解释性研究是否已应用于模型训练?
探讨注意力探针通过提前退出思维链来降低计算成本的用例,并询问该技术是否已应用于模型训练阶段。
作者: /u/InfinityZeroFive | 发布于: 2026-03-14 03:30
4. [P] Karpathy 的进化数据库自动研究项目。
为Karpathy的autoresearch项目集成了进化数据库,取代了原有的简单日志系统,以利用进化算法在广阔搜索空间中自主寻找最优解。
作者: /u/hgarud | 发布于: 2026-03-14 19:23
5. [D] 求助:如何处理棘手的ACL ARR投稿困境
作者提交关于反叙事生成的论文,收到关于伦理和开源代码的批评。修改后,仍有审稿人批评旧版本并质疑研究动机,另一人误以为代码未开源且认为评估者太少。作者寻求处理建议。
作者: /u/Aloo_Ka_Pakoda | 发布于: 2026-03-14 14:51
6. [讨论] 已举报本轮ARR的元评审员——至今无回应。我们该提交给ACL,还是参加2026年3月的评审周期并在修改说明中解释元评审的问题?
作者在截止日期前举报了元评审员,但未获回应。现临近ACL投稿截止,询问ARR的回应时间、是否保证回复,以及是否应继续提交。
作者: /u/getsugaboy | 发布于: 2026-03-14 11:40
7. [讨论] ACL ARR 2026年1月审稿周期——承诺的投稿方向必须与ARR提交时选择的方向一致吗?
作者询问在将ARR论文提交至ACL时,能否更改投稿方向,以及更改可能带来的影响。
作者: /u/Distinct_Relation129 | 发布于: 2026-03-14 14:06
8. 【讨论】有人对强化学习与神经科学的“螺旋式”关联感兴趣吗?考虑写个深度解析系列
作者认为强化学习与神经科学的关系是螺旋式互动,而非平行发展,并计划撰写系列文章探讨两者间的思想交流。
作者: /u/Kooky_Ad2771 | 发布于: 2026-03-14 17:09