newsletter

今日要闻

_{生成时间：2026-03-18 08:18:55}

AI 推荐要点

**Together AI发布长上下文训练新方法，声称可减少87%注意力内存**（来源：AINews）

提出分块注意力方法，可在单节点8个H100上训练500万上下文窗口的80亿参数模型，为长文本模型训练提供新思路。
**业界反思AI智能体评估：现有基准与“真实工作”脱节**（来源：AINews）

指出当前智能体基准过度偏重数学/编码，LMArena推出“文档竞技场”专注于PDF文档推理评估，Claude Opus 4.6领先。
**TrainTrackLabs：用于实时训练监控的LLM-as-a-Judge可观测性工具**（来源：AINews）

可插入PyTorch训练流程的可观测性层，使用LLM实时评估模型幻觉和推理能力，旨在尽早发现性能回归。
**langchain-ai/deepagents**（来源：GitHub）

基于LangChain和LangGraph的“开箱即用”智能体框架，内置任务规划、文件系统访问等核心工具，快速构建复杂任务代理。
**p-e-w/heretic**（来源：GitHub）

全自动移除大语言模型安全对齐的工具，基于方向性消融和Optuna优化，无需后训练即可高效解除模型限制。
**volcengine/OpenViking**（来源：GitHub）

专为AI Agent设计的开源上下文数据库，采用文件系统范式统一管理记忆、资源和技能，解决传统RAG碎片化问题。
**为什么AI系统无法自主学习——从认知科学看自主学习的局限**（来源：Hacker News）

从认知科学角度探讨AI自主学习的根本性局限，引发对当前智能体能力边界和未来方向的深度思考。
**Get Shit Done：一个元提示、上下文工程与规范驱动的开发系统**（来源：Hacker News）

分享一套系统化的AI辅助开发方法论，通过元提示和规范驱动来提升AI编程的可靠性和产出质量。
**Ask HN：如何应对代码助手带来的代码审查疲劳？**（来源：Hacker News）

社区讨论AI编码助手大幅提升代码产量后，如何高效审查海量AI生成代码，确保架构和逻辑正确性的实践挑战。
**Show HN：CodeLedger——为AI提供确定性上下文与防护栏**（来源：Hacker News）

解决AI编程代理在大型代码库中上下文选择不当、执行越界等问题，通过本地化精准提供相关文件并验证输出。

newsletter

今日要闻

AI 推荐要点

各渠道精选摘要

渠道精选

Hacker News 精选

Reddit 精选频道

每周一看