Reddit ML - 2026-04-29
1. 可视化神经网络的损失景观 [P]
一个交互式浏览器工具,用于可视化神经网络损失景观,支持不同优化器和架构,帮助理解高维空间几何。
作者: /u/Hackerstreak | 发布于: 2026-04-28 17:04
2. 当训练数据几乎肯定被污染的情况下,对LLM进行标准罗夏测试有什么科学价值?(R) + [D]
研究质疑用标准罗夏墨迹测试LLM的方法论:数据污染严重,模型可能只是检索训练数据而非真正感知视觉模糊性。
作者: /u/Impossible_Echo4029 | 发布于: 2026-04-28 19:50
3. ACL ARR 2026年3月周期 [D]
发起讨论帖,关于今日发布的ACL ARR 2026年3月周期审稿结果。
作者: /u/Pure-Ad9079 | 发布于: 2026-04-28 15:01
4. 编码器-解码器机器翻译训练或生成中,当长序列限制批量大小时的动态批处理 [P]
作者开发了dynabatch,一种针对编码器-解码器模型的动态批处理工具,通过按序列长度排序和预测内存压力,实现约3.3倍吞吐量提升。
作者: /u/Leather_Loan5314 | 发布于: 2026-04-28 12:31
5. 结构化输出基准测试(SOB)——同时验证JSON解析与数值准确性 [R]
新基准SOB评估结构化输出,聚焦值准确性而非仅JSON格式,发现多数模型值准确率远低于格式通过率。
作者: /u/404llm | 发布于: 2026-04-28 21:22
6. T4 GPU快速实验:暗六边形自对弈训练(Colab笔记本)[P]
在Dark Hex上进行了自我对弈实验,展示了1800与1900代智能体对战的视觉化结果,并分享了Colab笔记本。
作者: /u/asmonix | 发布于: 2026-04-28 14:40
7. IJCAI-ECAI’26: 主席工具论文状态先变为“被拒”,现在又变回“已提交”。[D]
用户询问论文评审状态变化,之前只看到被拒,现在出现新状态,不理解含义。
作者: /u/AddendumNo5533 | 发布于: 2026-04-28 12:54
8. 拓扑数据分析友好的CAD/3D点云数据集 [P]
用户寻找适合拓扑数据分析的3D点云数据集,要求类别间有拓扑结构差异(如孔洞数量),用于比较TDA与标准预处理方法。
作者: /u/generalbrain_damage | 发布于: 2026-04-28 18:17