Reddit ML - 2026-03-14
1. 这些LLM基准测试论文到底有什么意义?
作者质疑当前大量LLM基准测试论文的价值,认为其评估的专有模型更新过快,论文发表时模型已过时。
作者: /u/casualcreak | 发布于: 2026-03-13 04:21
2. ICLR 2026主会议海报的展示格式是什么?
作者询问ICLR 2026会议海报的常用格式,官方指南为横向1.90m×0.90m,想了解实践中多数人采用的标准尺寸和便于阅读打印的建议。
作者: /u/Antobarbunz | 发布于: 2026-03-13 10:40
3. [讨论] 传统运营支撑系统电信现代化:机器学习数据提取的有效实践
作者分享在老旧电信系统部署机器学习的经验,数据提取是最大挑战,并总结了有效与无效的数据获取方法。
作者: /u/Davijons | 发布于: 2026-03-13 15:08
4. [P] ColQwen3.5-v2 4.5B 版本发布!
ColQwen3.5-v2是一个4.5B参数的视觉文档检索模型,在多个基准测试中取得领先成绩。相比v1版本,其训练方案更简化,效果更好。模型已开源。
作者: /u/madkimchi | 发布于: 2026-03-13 19:46
5. [R] HoloPASWIN:将物理模型融入Swin Transformer实现全息重建(代码/数据集/论文)
提出HoloPASWIN模型,使用Swin Transformer捕获衍射全局特征,并引入物理感知损失函数,在含噪数据上训练,相比传统方法显著提升重建质量。
作者: /u/electricalgorithm | 发布于: 2026-03-13 12:37
6. [项目] zer0dex - 本地大语言模型智能体的双层记忆系统:在97项基准测试中,召回率达91.2%,优于R.A.G.的80.3%
介绍zer0dex双层级记忆架构,解决本地AI代理记忆难题。结合压缩语义索引与向量数据库,在97个测试中召回率达91.2%,优于传统RAG,且完全离线运行。
作者: /u/galigirii | 发布于: 2026-03-13 22:51
7. 【求助】用机器学习进行生物标志物峰值检测——想合作吗?
研究者寻求机器学习专家帮助分析结核病质谱数据,以识别生物标志物峰,并承诺共同署名论文。
作者: /u/Big-Shopping2444 | 发布于: 2026-03-13 19:51
8. [项目] JudgeGPT —— 开源LLM评分工具,支持自定义评分标准、思维链推理和实时GPU监控
开源工具JudgeGPT,可在本地通过Ollama运行LLM模型评估。它采用带行为锚点的评分标准、可配置的评委模型、思维链推理和人工评分混合机制,以提高评估的可靠性和可审计性。
作者: /u/1T_Geek | 发布于: 2026-03-13 19:36