newsletter

今日要闻

_{生成时间：2026-04-29 08:24:53}

好的，这是为您筛选和整理后的每日技术 Newsletter。

为后端与AI工程师精选的10条高价值内容，助您快速掌握行业动态与实践要点。

OpenAI 与微软更新合作，不再独占 Azure，模型将登陆 AWS Bedrock。这标志着 OpenAI 分销策略的重大转变，对多云部署和模型采购策略有直接影响。

小米开源 MiMo-V2.5 系列，采用 MIT 许可，支持 1M token 上下文。Pro 版约 1T 总参数/42B 活跃参数，为开发者提供了强大的长上下文开源模型选择。

Sakana AI 推出 7B Conductor，通过强化学习训练，用自然语言动态编排和调用多个前沿模型，代表了“AI 管理 AI”和递归自选择作为测试时扩展的新方向。

vLLM 0.20.0 版本亮点：支持 DeepSeek V4 基础模型、FA4 作为默认 MLA 预填充、TurboQuant 2-bit KV 缓存，以及 Blackwell 上的 DeepSeek 专用 MegaMoE 路径，是推理部署的关键更新。

vLLM 与 Red Hat/AWS 联合发布 FP8 KV 缓存深度分析，修复了 FA3 两级累积问题，将 128k 上下文的大海捞针测试准确率从 13% 提升至 89%，同时保留速度优势。

微软开源 VibeVoice，包含 ASR 和 TTS 模型。核心创新在于 7.5Hz 超低帧率连续语音分词器，支持 60 分钟长音频单次转录和 90 分钟多说话人语音合成，是构建语音应用的重要开源资源。

Cognition 推出 Devin for Terminal，一个本地 shell 代理，可以稍后“移交”到云端。这扩展了 Devin 的使用场景，使其能在本地环境中工作，同时保留云端的扩展能力。

Google Gemma 团队演示了一个 100% 本地运行的浏览器代理，使用 Gemma 4 和 WebGPU，支持原生工具调用。这标志着本地 AI 代理在浏览器端的重要进展。

DeepSeek 宣布永久性降价，缓存命中输入 token 价格降至原价的 1/10。这对需要 1M 上下文长度的应用尤其有利，显著增强了 DeepSeek 的市场竞争力。

Hermes Agent 的 GitHub 仓库星数已超越 Claude Code。同时，当支持时，原生视觉已成为默认模式，表明 Hermes 生态系统在代理框架领域持续获得关注。