reddit_machinelearning_2026-03-14

Reddit ML - 2026-03-14

作者质疑当前大量LLM基准测试论文的价值，认为其评估的专有模型更新过快，论文发表时模型已过时。

_{作者: /u/casualcreak | 发布于: 2026-03-13 04:21}

作者询问ICLR 2026会议海报的常用格式，官方指南为横向1.90m×0.90m，想了解实践中多数人采用的标准尺寸和便于阅读打印的建议。

_{作者: /u/Antobarbunz | 发布于: 2026-03-13 10:40}

作者分享在老旧电信系统部署机器学习的经验，数据提取是最大挑战，并总结了有效与无效的数据获取方法。

_{作者: /u/Davijons | 发布于: 2026-03-13 15:08}

ColQwen3.5-v2是一个4.5B参数的视觉文档检索模型，在多个基准测试中取得领先成绩。相比v1版本，其训练方案更简化，效果更好。模型已开源。

_{作者: /u/madkimchi | 发布于: 2026-03-13 19:46}

提出HoloPASWIN模型，使用Swin Transformer捕获衍射全局特征，并引入物理感知损失函数，在含噪数据上训练，相比传统方法显著提升重建质量。

_{作者: /u/electricalgorithm | 发布于: 2026-03-13 12:37}

介绍zer0dex双层级记忆架构，解决本地AI代理记忆难题。结合压缩语义索引与向量数据库，在97个测试中召回率达91.2%，优于传统RAG，且完全离线运行。

_{作者: /u/galigirii | 发布于: 2026-03-13 22:51}

研究者寻求机器学习专家帮助分析结核病质谱数据，以识别生物标志物峰，并承诺共同署名论文。

_{作者: /u/Big-Shopping2444 | 发布于: 2026-03-13 19:51}

开源工具JudgeGPT，可在本地通过Ollama运行LLM模型评估。它采用带行为锚点的评分标准、可配置的评委模型、思维链推理和人工评分混合机制，以提高评估的可靠性和可审计性。

_{作者: /u/1T_Geek | 发布于: 2026-03-13 19:36}