reddit_machinelearning_2026-05-01

Reddit ML - 2026-05-01

1. [R] 联合嵌入变分贝叶斯 (TMLR ‘26)

该论文提出三种耦合选择,为联合嵌入架构添加操作变分语义,实现非对比表示学习中的各向异性不确定性建模。

作者: /u/ISwallow5Gum | 发布于: 2026-04-30 15:00


2. A*会议中的中国关系网/网络拒绝非中国论文 [讨论]

用户反映中国学者在学术会议中通过手机应用形成关系网,互相支持,导致评审不公,如因未引用中国作者论文而被拒。

作者: /u/AppropriatePush6262 | 发布于: 2026-04-30 19:21


3. 看来ICML拒掉了大量一致好评的论文 [D]

ICML评审机制扭曲:审稿人为避免争论而抬高分数,导致分数膨胀,许多高分论文仍被拒。

作者: /u/AffectionateLife5693 | 发布于: 2026-04-30 18:35


4. 没有位置编码,注意力下沉是否不可避免?[D]

移除位置编码后,注意力机制出现垂直热线,表示所有查询关注相同键。提问者寻求无需位置编码的动态注意力方法。

作者: /u/PreetamSing | 发布于: 2026-04-30 09:20


5. 向量数据库与ANN同PHE的冲突,是否有实用的变通方案?[D]

用户探讨向量数据库与同态加密结合时的性能矛盾,提出用元数据过滤缩小搜索范围,并询问混合方案可行性。

作者: /u/XPERT_GAMING | 发布于: 2026-04-30 11:04


6. 我用免费LLM API通过工具调用构建了能自主玩Pokemon Showdown的AI智能体 [P]

开发者用免费LLM API构建了能自主玩宝可梦对战的AI代理,支持人机对战和AI对战,已集成15+免费模型。

作者: /u/ReplacementMoney2484 | 发布于: 2026-04-30 20:47


7. 一个用5000行Python代码构建的可破解ML编译器栈 [P]

作者用5000行Python构建了一个可破解的ML编译器,通过6个IR将模型降级为CUDA内核,旨在提供易于理解的编译器设计教程。

作者: /u/NoVibeCoding | 发布于: 2026-04-30 20:26


8. 关于MLOps的建议 [讨论]

用户询问Vikash Das的MLOps课程是否值得学习,已有ML/DL/LLM基础,寻求课程推荐。

作者: /u/Albatross__56 | 发布于: 2026-04-30 14:41


9. U-Net用于农业田地分割 [P]

学生用U-Net加注意力机制做农业田地分割,训练数据与真实Sentinel-2数据差异大,导致模型置信度低,寻求提升鲁棒性的建议。

作者: /u/niki88851 | 发布于: 2026-04-30 22:51


10. 使用AST派生图+BM25进行代码库级检索——将LLM上下文从100K减少到5K tokens [D]

一种用AST提取代码结构图,结合BM25检索的RAG方法,比传统分块嵌入更高效,适合大型代码库。

作者: /u/Altruistic_Night_327 | 发布于: 2026-04-30 19:04


11. 将Karpathy的自动研究方法应用于3300万token的公共交通数据集(提升14%,复现笔记)[P]

作者将Karpathy的autoresearch框架应用于3300万token的交通数据集,从零训练80M参数模型,通过减少批次大小实现14%的困惑度改进,并发现部分准确率提升实为噪声。

作者: /u/MarsPassenger | 发布于: 2026-04-30 18:31