Reddit ML - 2026-03-13
1. CVPR研讨会刷引用——这合乎学术道德吗?[讨论]
用户举报CVPR 2026某研讨会要求参赛者强制引用组织者13篇无关论文并上传论文至arXiv,质疑这是操纵引用行为。
作者: /u/ade17_in | 发布于: 2026-03-12 22:19
2. [R] LEVI:以极低成本超越GEPA/OpenEvolve/AlphaEvolve
LEVI框架通过分层模型分配和指纹多样性机制,用更小的30B模型实现优于主流进化优化框架的性能,成本降低数倍。
作者: /u/Longjumping-Music638 | 发布于: 2026-03-12 13:57
3. [D] 现代工作流中如何跨多个机器学习项目管理CUDA版本和软件包?
一位机器学习工程师分享其依赖管理困境:Conda管理CUDA等系统包虽好,但存在安装慢、意外更新等问题。他考虑结合Docker处理系统级依赖,用uv管理Python包,以构建隔离可复现的环境,并征求更优工作流建议。
作者: /u/sounthan1 | 发布于: 2026-03-12 14:40
4. [D] 模型训练时如何提升/优化GPU利用率?
用户在训练Zipformer模型时,尽管系统显示GPU利用率已达100%,但Wandb工具显示的数据不一致。他询问如何找出并优化潜在的瓶颈问题。
作者: /u/Ok_Construction_3021 | 发布于: 2026-03-12 09:31
5. 超越预测:面向社会科学的文本表征(arxiv 2603.10130)
本文指出机器学习中预测与测量的差异,强调在社会科学中应将文本表征视为科学工具,而非仅用于预测,并比较了静态与上下文表征。
作者: /u/Hub_Pli | 发布于: 2026-03-12 08:24
6. [D] 医疗AI模型安全与可信度审计工具
作者为医疗ML模型开发了一个审计平台,可记录和回放模型决策的条件,以提高透明度和可追溯性。
作者: /u/hypergraphr | 发布于: 2026-03-12 01:23
7. [P] 视觉验证作为LLM代码生成的反馈循环
作者开发了一个从文本提示生成可玩Godot游戏的AI管道,重点解决了LLM在训练数据不足的GDScript语言中生成正确代码,以及通过编译、代理截图和独立视觉代理三层验证确保游戏可玩性的问题。
作者: /u/crush-name | 发布于: 2026-03-12 19:06
8. [R] 论基于权重的神经适应结构局限与可逆行为学习的作用
作者提出“可逆行为学习”概念,探讨神经网络权重中心化学习结构可能存在的固有限制,并寻求反馈。
作者: /u/Sad_State_431 | 发布于: 2026-03-12 08:02