今日要闻
生成时间:2026-04-29 08:24:53
AI 推荐要点
好的,这是为您筛选和整理后的每日技术 Newsletter。
每日技术简报 - 2026-04-30
为后端与AI工程师精选的10条高价值内容,助您快速掌握行业动态与实践要点。
1. OpenAI 打破 Azure 独家协议,模型将登陆 AWS Bedrock(来源:X / Sam Altman)
OpenAI 与微软更新合作,不再独占 Azure,模型将登陆 AWS Bedrock。这标志着 OpenAI 分销策略的重大转变,对多云部署和模型采购策略有直接影响。
2. 小米开源 MiMo-V2.5 系列模型,MIT 许可+1M 上下文(来源:X / 小米)
小米开源 MiMo-V2.5 系列,采用 MIT 许可,支持 1M token 上下文。Pro 版约 1T 总参数/42B 活跃参数,为开发者提供了强大的长上下文开源模型选择。
3. Sakana 发布 7B Conductor:用 RL 训练模型来编排其他 AI 模型(来源:X / Sakana AI)
Sakana AI 推出 7B Conductor,通过强化学习训练,用自然语言动态编排和调用多个前沿模型,代表了“AI 管理 AI”和递归自选择作为测试时扩展的新方向。
4. vLLM 0.20.0 发布,支持 DeepSeek V4 和 2-bit KV 缓存(来源:X / vLLM)
vLLM 0.20.0 版本亮点:支持 DeepSeek V4 基础模型、FA4 作为默认 MLA 预填充、TurboQuant 2-bit KV 缓存,以及 Blackwell 上的 DeepSeek 专用 MegaMoE 路径,是推理部署的关键更新。
5. FP8 KV 缓存修复将 128k 大海捞针准确率从 13% 提升至 89%(来源:X / vLLM)
vLLM 与 Red Hat/AWS 联合发布 FP8 KV 缓存深度分析,修复了 FA3 两级累积问题,将 128k 上下文的大海捞针测试准确率从 13% 提升至 89%,同时保留速度优势。
6. 微软开源 VibeVoice:前沿语音 AI 模型家族(来源:GitHub / Microsoft)
微软开源 VibeVoice,包含 ASR 和 TTS 模型。核心创新在于 7.5Hz 超低帧率连续语音分词器,支持 60 分钟长音频单次转录和 90 分钟多说话人语音合成,是构建语音应用的重要开源资源。
7. Cognition 发布 Devin for Terminal:本地 Shell 代理(来源:X / Cognition)
Cognition 推出 Devin for Terminal,一个本地 shell 代理,可以稍后“移交”到云端。这扩展了 Devin 的使用场景,使其能在本地环境中工作,同时保留云端的扩展能力。
8. Google 展示基于 Gemma 4 + WebGPU 的完全本地浏览器代理(来源:X / Google Gemma)
Google Gemma 团队演示了一个 100% 本地运行的浏览器代理,使用 Gemma 4 和 WebGPU,支持原生工具调用。这标志着本地 AI 代理在浏览器端的重要进展。
9. DeepSeek 再次降价:缓存命中输入 token 降至原价的 1/10(来源:Reddit)
DeepSeek 宣布永久性降价,缓存命中输入 token 价格降至原价的 1/10。这对需要 1M 上下文长度的应用尤其有利,显著增强了 DeepSeek 的市场竞争力。
10. Hermes Agent 仓库超越 Claude Code,原生视觉成为默认模式(来源:X / Teknium)
Hermes Agent 的 GitHub 仓库星数已超越 Claude Code。同时,当支持时,原生视觉已成为默认模式,表明 Hermes 生态系统在代理框架领域持续获得关注。
各渠道精选摘要
渠道精选
Hacker News 精选
Reddit 精选频道
- Reddit AMA
- Reddit AskReddit
- Reddit Showerthoughts
- Reddit TIL
- Reddit DevOps
- Reddit Programming
- Reddit ELI5
- Reddit Golang
- Reddit Rust
- Reddit ML