v2ex_hot_2026-03-17

V2EX 热门帖子

1. Claude 账号又喜提封号了,刚创建了一个 claude 封号病友交流群,有想交流被封经验的病友可以加入啊。

我都连着好几个账号都被封了, 这两天刚创建的 Claude 账号又喜提封号了,为了防止再创建的 claude 账号继续被封,所以创建了一个 claude 封号病友交流群,大家一起交流一下病情,防止以后继续被封,有想交流被封经验的病友可以加入啊。

作者: haohello | 发布时间: 2026-03-16 23:37


2. 你认为的最强编程 AI 工具?

反重力,cc ,cursor ,trae ,codex ,Gemini cli ?

作者: junwind | 发布时间: 2026-03-15 08:37


3. 各位认为 AI 时代还需要深入学习算法么

起因是最近两天出了个 bug ,一个拓扑排序出了问题,可能因为业务相关较深,整段丢给 AI 让 review 没看出来,最终还是人排出问题后再丢给 AI 修的。

然后就突然发现有了 AI 之后,我已经好久没去加强自身的算法能力了,好在这次的内容还在知识框架内,能解决。

但有点担心,后面万一碰到更高级的问题了,自身能力停留在原地的话,可能都认知不到问题在哪。

作者: magicfield | 发布时间: 2026-03-16 03:20


4. Antigravity 清空了我的 .zshrc

我没让它改… 查资料发现可能是谷歌程序员写错了 把 >> 写成 >

作者: 383394544 | 发布时间: 2026-03-16 08:13


5. 关于各大清凉云大带宽限速的一个猜想

今天刷某论坛的时候,看到有个人提到一句

“慢慢用,养一养,上来买完嘎嘎一顿测速,不限你限谁……”

然后我想了一下,貌似真有道理。我有一台腾讯云,放置了比较久,然后突然高流量跑了好一段时间才触发限速。
但是如果立刻买一台然后立刻开始跑,确实是没多久就开始限速了。
然后我就想到了阿里云的 ECS 突发性能实例的积分
https://help.aliyun.com/zh/ecs/user-guide/burst-performance-instance-overview

官网描述是

突发性能实例是一种通过 CPU 积分来保证计算性能的实例规格,适用于平时 CPU 使用率低,但偶尔有突发高 CPU 使用率的场景。突发性能实例在创建后可以持续获得 CPU 积分,在性能无法满足负载要求时,通过消耗更多 CPU 积分来无缝提高计算性能,不会影响部署在实例上的环境和应用。较之其他实例规格,突发性能实例的 CPU 使用更加灵活且成本较低。

通过 CPU 积分,您可以从整体业务角度分配计算资源,将业务平峰期的计算能力转移到高峰期使用,以节约使用成本。如果偶尔会出现计划外的高性能需求,您还可以选择为突发性能实例打开无性能约束模式。

轻量不正是这种“平时流量使用率低,但偶尔有突发高流量使用率的场景”一类的场景吗?

所以我推测,例如流出多少流量就是一个积分,然后当“带宽积分”耗尽后,就限制到 1Mbps ,然后就陆续回到之前的状态。

轻量的网络可能是原“突发性能实例积分机制”的一个为高带宽流量专门定制的版本,可能增加了一些诸如时段阶梯调节积分消耗等算法,更加适应“高带宽”以及高峰期的使用场景。

以上只是我的一个想法,欢迎讨论(

作者: yulihao | 发布时间: 2026-03-16 13:05


6. claude code 供应-

供应 claude code 自家号池,包稳 24 小时技术在线维护,欢迎对接测试,免费提供测试额度,不稳体验不好可直接退款。留言+v:Zhongzhuanzhan188

作者: abc0001 | 发布时间: 2026-03-16 13:42


7. 请教一个 unraid 的 docker 网络问题

unraid 系统网关指向旁路由,但是 docker 里的 qb 和 tr 用什么方法可以不走旁路由吗? docker 的网关可以指向主路由吗?只有一个网口并没有 vlan 交换机

作者: 52pojie | 发布时间: 2026-03-16 08:40


8. 请问大家同步工程目录事后 网盘怎么处理.venv .git 之类文件

光 .venv 就有好几个 G ,包含海量小文件 经常同步噎住
现在只能做就是手动排除
但 macOS 没有 dropbox exclude 命令,只能用 xattr 而且经常忘
大家是怎么办的?

作者: pathetique | 发布时间: 2026-03-16 06:47


9. 还是到了这一步,开发 APP 最难的是 Apple Developer Program ID

两个最常用设备、最常用 ID 注册都被拦了😂

完全不清楚原因,邮件过去了,看看明天客服怎么说😂

作者: lc4t | 发布时间: 2026-03-16 11:54


10. 想试试 openclaw 多 agent 协作,用哪家国产模型比较好

希望性价比高,能真正完成生产级别的任务。 能支撑多 agent 高频率的操作,不限制或者说限制少 代码能力的模型足够强,推理模型也足够完成项目开发的前期设计统筹

作者: chunhai | 发布时间: 2026-03-16 11:18


11. 为什么 Cursor 使用 Chrome MCP devtools 可以直接控制正在使用的浏览器, 相同配置下, CC 不行?

问题如上图,我这两天在尝试 cc 通过 MCP 操作「我正在使用的浏览器」, 发现不行,永远打开的都是无痕浏览器,但是 cursor 是可以的,想问下如何解决?

作者: feeeff | 发布时间: 2026-03-16 03:48


12. Linux 格式化 fat32/exfat 分区避坑

在 linux 下把 U 盘/tf 卡格式化为 fat32 或 exfat 格式,插入手机或 windows 不能识别。
因为这是 Linux 下的 fat 格式,要转换为 windows 的。

!!!更改前先保存数据!!!
!!!更改前先保存数据!!!
!!!更改前先保存数据!!!

查看原来的
fdisk /dev/sdc
按 p, 看到 Type 显示为 Linux
Device Boot Start End Sectors Size Id Type
/dev/sdc1 2048 31293439 31291392 14.9G 83 Linux

更改为”通用”格式
按 t ,按 c 改为 W95 FAT32 (LBA), 或者按 7 改为 HPFS/NTFS/exFAT
按 p ,确认 Type 显示为更改后的。
Device Boot Start End Sectors Size Id Type
/dev/sdc1 2048 31293439 31291392 14.9G c W95 FAT32 (LBA)

作者: basncy | 发布时间: 2026-03-16 05:58


13. 做了一个 apikey 本地管理页面,可一键测试是否可用

因为有好多白嫖的 api key,太多了,然后时不时有些就不能用了,顺手让 ai 做了个工具,有需要的可以直接打开网页就能使用啦,都是本地存储,放心食用

网址: https://key.ncurator.com
github 仓库: https://github.com/Yoan98/ai-key-manage

作者: doujiangjiyaozha | 发布时间: 2026-03-16 10:48


14. 我用 cc 和 codex 用到现在,写前端感觉都是一坨啊

复杂一点的,在美感设计上,交互上。全是一坨。点也能点,看也能看,但是就是毫无美感的各种元素大大小小的不合时宜的堆在一起。

这个得物怎么敢解散前端团队的。

还是说我使用上有问题。

作者: YanSeven | 发布时间: 2026-03-15 08:02


15. 有人用过 mksaas 吗,值得入手吗

mksaas 主题看着挺不错的,但是程序员总有个坏习惯,现在有 ai 加持,总想着自己实现一个。 159 美金还是有点肉疼,如果能花 159 美金 ai token 自己实现一套,你会怎么选择

作者: jsiwa123 | 发布时间: 2026-03-16 03:54


16. 极客湾恢复更新:小米笔记本 Pro 上手体验:性能表现优秀的超轻薄本!

视频链接:
[小米笔记本 Pro 上手体验:性能表现优秀的超轻薄本!] https://www.bilibili.com/video/BV1hrcUzkELd/?share_source=copy_web&vd_source=835fa75e6a281bbf9bb9df438719f586

作者: Chicagoake | 发布时间: 2026-03-13 07:15


17. qoder 补全不是无限量了

文档还没有改,首页 pricing 页面改了
虽然现在大部分都是用 cli 写代码了,偶尔手写没有补全还真不习惯了.
现在还有无限补全+AI 生成 Git message 的 ide 吗

作者: Aprdec | 发布时间: 2026-03-16 01:44


18. AI 编程进化史

网页问答模式: chatgpt 问世,网页问答模式开始,向大模型直接提问,大模型给出答案,程序员收到把结果总结为可以嵌入 项目中的代码。 问答 -> 调试 -> 问答

IDE 插件模式: 类似通义灵码的 IDE 插件,使程序员更加专注在 IDE 中完成功能,避免时不时切换到网页中问答。但是,这个时候的插件的 AI ,基本都是比网页中的 AI 差不少。可用,但用处也不大。

AI 原生 IDE: cursor 问世,当时很火,当然现在用的人也很多。目前依旧是 AI 原生 IDE 的大哥。 这类的产品非常多。目前占主流的是 cursor ,trae ,反重力。次之有阿里 Qoder 和腾讯 workBuddy 。 这类 IDE ,基本都是基于 vscode 二开的。对用惯了 vscode 的人非常友好。它依赖完整的 IDE 。对于没有 GUI 桌面环境的 Linux 系统上,或者用不习惯 vscode 的人并不是很友好。

cli 模式: claude code 问世,目前依旧是编程最好的选择。脱离了 IDE ,脱离了桌面环境。还有 codex ,gemini cli 。这种方式,对于不想使用 vscode 的人,对于只有黑窗口的人来说,非常友好。并且很多 IDE 都有其对应的插件可选。

openclaw ,噱头?割韭菜?新一代 AI 交互方式? 对于 openclaw ,目前我持保留态度,它对于 AI 大模型的应用来说,是进步的,但是未来一定有更加好的产品出来替代它。毕竟它的缺点太致命了,不是普通人能用的。建议大家再等等。不要盲目用这个,除非公司硬性要求。

作者: junwind | 发布时间: 2026-03-16 07:38


19. 终端里有文本滚动顺滑的方法么?

macOS 下经常使用 lazygit/yazi 这种终端工具,预览一个 diff/文件时候,不像浏览器内那样鼠标滚动顺滑。使用 iterm2/ghostty 都一样。

作者: ethusdt | 发布时间: 2026-03-16 01:44


20. 现在购买 ssl 证书最具性价比的方案是什么?

给微信小程序后端域名用的

网上搜了一下,阿里云提供的都要一千多一年了,在别的地方能搜到便宜一点的都要大几百,到处都是推广和广告,我感觉这个价格有水分,咸鱼上面很多几十块一年的,不知道是否靠谱?感觉这玩意好不透明,水太深了,希望有经验的兄弟能解惑

作者: uni | 发布时间: 2026-03-15 06:18


21. nas 备份了照片,手机上直接删除吗

你们是怎么处理的,如果删除了,我又要使用怎么办,比如我微信又要发 大佬们是怎么搞的

作者: miusmile | 发布时间: 2026-03-15 04:34


22. [边缘计算开源] 基于 go 写了个独立运行的工业数据采集网关 后续阶段应该如何调整

做了套边缘计算数据采集方案,想和你聊聊后续方向, 请指教一下

https://github.com/anviod/edgex

在工厂和工业现场待久了,总能遇到一些让人头疼的事:车间里设备种类多,协议又杂,数据采集常常不稳定,要么延迟高,要么经常断。我做边缘计算的,每天跟着现场工程师跑,看他们调设备、查故障,慢慢就想:能不能做套更靠谱的采集方案?

于是我们花了一些时间,搞出了这套南向采集优化方案。它没什么花里胡哨的概念,就是想解决实际问题:

  • 不管是 Modbus 、BACnet 还是 OPC UA 、S7 ,一套系统就能管起来,不用再为不同设备单独配方案。
  • 设备状态好的时候多采点数据,网络不稳定时就少发点请求,让系统自己适应现场情况。
  • 哪个点位老出问题,系统会自动放缓采集频率,等它恢复了再正常采,省得一直发无效请求占资源。
  • 同一总线上的设备一起不间断轮询采集,减少来回通信的等待次数,效率更高。
  • 数据在边缘侧先处理一下,不用全往云端发,响应更快,流量也省。

没搞什么复杂的技术名词,就是把现场遇到的问题一个个解决:网络抖动了,就根据响应时间自动调超时;传大数据慢了,就自动找最合适的传输单元;设备坏了要换,新设备接上配置相同的 IP 就能自动同步配置,不用人手动搞。

现在这套方案已经在几个工厂试过了,工程师反馈说延迟降了,稳定性高了,维护起来也省心。做这个的初衷,就是想让搞工业物联网的朋友们少点麻烦,多点踏实。

如果你也在为设备数据采集发愁,欢迎聊聊,说不定能帮上忙。也想听听你的场景,一起把这套方案做得更实用。

作者: anviod | 发布时间: 2026-03-16 02:36


23. 如何成为 Claude Code 高阶玩家

有关使用 claudecode,目前互联网大概有两种主要内容:

  1. 完全面向没有基础的小白教学内容:

教你如何初步在本地跑通 claudeclode,做一个纯玩具版本的的小网页/自动化小工具 教你如何给自己的玩具加装脚手架(skill/subagent 的各种概念以及最基础的运用),让他变成更华丽的玩具

  1. 高阶大佬炼化十年功法,创造出 xxx 供大家使用的项目

这类内容可以类比为开源了某种特异功能,但问题也接踵而至,我真的需要如此高大尚但是不贴合我实际工作需求的功法吗?xxx 的归属大概率是躺在文件夹吃灰


我们应该如何从初学者过渡到 Claude Code 高阶玩家?

了解 claudecode 各种机理,能自己动手修改.claude,能自己添加.删减 claude.md 等各类文件 根据自己的需求,动手封装合适的 subagent,hook 知道何时应该 compact,何时应该调用以及自己规划调用多个子 agent 如何根据自己的工作流,真正提高自己的生产力

这些内容并非没有,而是十分孤立,并不成体系,所以请问大家有没有这方面成体系的相关资料,最好是自己的工作流实操,分享一些捣腾的完整分享

感谢大家

作者: cryptogems | 发布时间: 2026-03-15 15:34


24. [分享] 零成本撸了一套 A 股量化流水线:基于微软 Qlib + GitHub Actions + Pages

前两天发在 股票 板块, 但是板块比较冷清 没什么人关注,

这两天把复盘统计功能做出来了, 于是来热门的程序员 板块再发一次, 我第一次搞开源项目, 欢迎大家来交流

核心思路:

既然 Qlib 已经把框架做好了,我辈打工人最该解决的就是工程化问题——如何让它在不花钱、不费神的情况下,每天自动给我出信号。

特点:

白嫖极致化: 全程白嫖 GitHub Actions 算力和流量进行模型训练( Alpha158 因子预处理 + 模型推理)。

全自动 CI/CD: 每日收盘后自动拉取数据,更新信号,无需人工干预。

前端可视化: 自动更新 GitHub Pages 静态页面,移动端随手复盘。

复盘统计: 刚肝出来的“马后炮”复盘功能,定期 直接对历史预测进行止盈胜率矩阵分析

链接

仓库: https://github.com/touhoufan2024/qlibAssistant.git

在线预览: https://touhoufan2024.github.io/qlibAssistant/

复盘: https://touhoufan2024.github.io/qlibAssistant/pages/mahoupao/review_result.html

最近的几次复盘结果看起来还可以,

作者: Chippy | 发布时间: 2026-03-15 06:42


25. 从一个小功能的实现来看免费 Gemini 和 ChatGPT 的表现

前几天有个 a4 pdf 的 iOS 限免,正巧作为小学生的小朋友有把长截图转成 pdf 然后打印的这个需求,下载后发现那个 app 就是接近于垃圾,不光把长截图放在一页 pdf 上,并不能切割成多页,而且因为人为缩小,清晰的图片成了毛玻璃。
今天周末小朋友来我这里玩,我于是建议小朋友自己通过 ai 来实现这个功能。
小朋友自己的 iPhone 上有梯子且熟练使用,寒假也注册并登录了 Gemini 、ChatGPT 等,听我建议不错,于是没有我任何指导,完全不懂编程的小朋友自个儿开干。
首先打开的 Gemini ,用 fast 模式,小朋友记录下 iPhone 相册里其中一张长截图的宽✖️长的数值,和 ai 说自己 iPhone 上有这么个宽长的图片,希望能根据自己输入的宽长,分割成几张图片,并且把图片转成 pdf 好打印。
Gemini 建议 html5j+js 方案,并且吧啦吧啦生成了源码,还贴心地告诉小朋友怎么拷贝源码保存在 iPhone“文件“app 中,最后浏览器打开并通过共享变成 iPhone 主屏的一个应用。
gemini 一气呵成的果然能一次运行并达到了小朋友的需求,接下来小朋友添加了一些需求和修改意见,也基本正常实现。
然后,小朋友把 Gemini 生成的源码打开 ChatGPT 并输入让 ai 检查代码是不是完全正确,如果正确请在代码后添加解说()注释。
ChatGPT 表示程序很不错,但是它能提高好几倍的效率,还有其它优化,牛吹得小朋友期望很高,然后四五个回合,正确的代码不能正确运行,而且已有的功能和界面也被 ChatGPT 缺失或者错位,不得已小朋友请我帮忙,才总算在免费额度用完之前 ChatGPT 出来了一个正常运行的版本。
仅就这个经历的个人感觉,同样免费版的 Gemini 看起来要比 ChatGPT 强大且准确度高。另外也感叹,完全没有编程基础的个位数小孩,也能凭自己的聊天,得到完美符合自己需求的小工具了,大把普通的 iOS (安卓) app 估计越来越没多少生存空间了。
btw ,总结下小朋友自己迭代聊天后满足的需求:
1️⃣从 iPhone 的“文件”、相册、拍照三种方式导入图片
2️⃣导入后,界面显示照片的如分辨率、拍摄时间等某些拍摄信息(小朋友不知道 exif 这个词)
3️⃣界面给出宽、长数值的手工输入,同时旁边有长宽比锁定下拉框(不锁定、2:3 、3:2……A4 幅面),根据长宽比选项,输入一个数值,另一个联动
4️⃣界面给出自定义图片名称,旁边有下拉框供选择分割后的几种图片格式,分割后图片名为自定义图片名称➕序号
5️⃣点“处理”按钮后,出现一个按钮为“图片压缩成一个文件”( Gemini 建议做的),另一个按钮是“转成 PDF”,旁边下拉框可以选择每页一张,每页两张,每页 2✖️2 四张,每页六张。
这两种方式都可以把 zip 和 pdf 保存到“文件”app 里。
6️⃣界面在点了“处理”按钮后,还同时会显示所有分割后形成的图片文件,图片下面显示带序号的文件名,Gemini 教小朋友长按具体图片来保存单张图片到“相册”

作者: gigishy | 发布时间: 2026-03-15 20:04


26. 为什么放弃了 RAG? RAG 的六大难题

RAG 本身并不算是个坏主意。我们认真实践过,也确实在某些场景下跑通了。

去年,我们花了几个月搭过几套完整的 RAG 管线:三阶段处理( Extract 、Chunk 、Embed ),三种搜索策略( Vector 、BM25 、Hybrid + Reranking )。从文本提取,粗排,到 Rerank 精排,每一个环节都认真做了一遍。工程量不小,技术上看着很漂亮。

但最终不得不承认一个事实:效果不好

这篇文章不是要批判 RAG ,而是诚实地分享下我们具体遇到了哪些问题,以及我们后来怎么想的。以及,小广告。。。

问题一:Embedding 模型两难

做本地桌面应用,Embedding 模型的选择是一个没有好答案的问题。

小模型(参数量 < 500M )在设备上跑得动,但语义理解质量不稳定——碰到专业文档、跨语言搜索、长文档时,召回率明显下降。大模型( 1B+)质量好,但在普通用户的笔记本上内存和计算开销太大,后台常驻时对系统资源的占用让人无法接受。

桌面应用没有服务器可以依赖,只能在”跑得动”和”效果好”之间妥协。选了一个,另一个就要让步。这个困境在服务端应用里不存在,在本地优先应用里却是无解的。

问题二:领域词汇不敏感

向量语义搜索有一个根本性的弱点:它对专业术语的理解很差。

原因并不复杂。Embedding 模型是在通用语料上训练的,而代码函数名、医学缩写、法律条款、产品专名这些词在训练语料里出现频率低,在向量空间里的位置偏僻且不稳定。

实际表现是什么样的?用户搜 “RLHF”,不一定能找到写着 “Reinforcement Learning from Human Feedback” 的文档。搜”LTV”,可能匹配不到写着”用户生命周期价值”的分析报告。搜某个产品的型号,向量搜索根本抓不住这个词的准确语义。

这不是配置问题,不是参数调优能解决的,业内常见做法是做 embedding 模型的微调,但一般都是针对特定领域,只能在 ToB 场景中 work 。

Embedding 优势是模糊语义匹配,它的劣势恰好就是精确词汇匹配。而用户的真实需求往往是两者都要。

问题三:Rerank 的代价

召回率低和准确性差,是 RAG 管线的两个经典问题。针对准确性问题,业界的标准解法是引入 Rerank 模型做最后一步的精排。

我们也做了这一步,然后发现问题并没有被解决,只是被转移了。

Rerank 模型比 Embedding 模型更重、更慢。引入它之后,整个检索链路的延迟大幅上升,对本地应用来说尤其明显。更关键的是,Rerank 模型同样是在通用语料上训练的,同样存在专业词汇不敏感的问题——它只是在你已经召回的候选里重新排序,而不能召回那些一开始就没被捞到的文档。

最终结果:链路变慢了,架构变复杂了,根本问题还在。引入 Rerank 后,排序质量的提升非常有限,反而让 BM25 的作用几乎被掩盖了。

问题四:碎片化的上下文

分块( Chunking )是 RAG 最无法绕开的问题。

文档被切成固定大小的片段之后,每个片段都与它的前后文脱节了。AI 拿到的是一段从报告中间截取的内容,不知道这段话在哪个章节,不知道前一段在讲什么,也不知道后续有没有结论。

最糟糕的情况是:一个关键段落恰好横跨两个 Chunk 的边界,两个 Chunk 都能匹配到,但又各自不完整。AI 拿到的两份碎片都沾了边,却都缺少关键信息,最终给出一个似是而非的回答。

这个问题业内有很多补丁办法,比如:加大 Chunk 重叠,加入父 Chunk 检索,引入 Small-to-Big 策略……每个补丁都能在某个维度上改善问题,但也都会带来新的代价——更多 Token 、更复杂的管线、更难调试的行为、更加无法通用。

我们把这些补丁叠在一起,得到了一个复杂、易出错,但仍然不够好的系统。

问题五:不同文档类型需要特殊处理

通用分块策略对不同文档类型的效果差异极大,这是我们当初没有充分预判到的。

论文有 Abstract + 正文 + References 的结构;书籍有章节层级和页眉页脚;合同有条款编号和交叉引用;代码文档有 API 列表和示例代码;表格类文档的”内容”是列名和数据类型,而不是单元格里的文字……

固定窗口切块的策略不理解这些结构,分块点往往切在语义中间,把标题和它的正文分开,把条款编号和条款内容切断,把表头和数据分离。

每种文档类型其实需要完全不同的处理逻辑。但针对每种类型都写特化的解析器和分块策略,工作量巨大,维护成本也高——而且即使都做完了,效果也只是”比通用策略好一些”,仍然是碎片化的。

问题六:Agent 使用体验极差

以上五个问题单独看,每个都还在可接受的范围内,但当 RAG 被实际接入 AI Agent 使用的时候,所有问题叠加在一起,效果非常糟糕。

一个真实的场景:AI 在帮用户分析一份合同,调用 search() 检索相关条款,拿到了 10 个 Chunk 。有几个 Chunk 沾了边,但信息不完整。AI 无法判断该怎么继续,只好调整关键词重新搜索。再拿到 10 个 Chunk ,还是不够。再换关键词,再搜一次。

每次搜索都是黑盒:AI 不知道换哪个关键词才能找到它需要的内容,不知道文档里到底有没有这个信息,不知道自己距离答案有多远。这种低效不是 Agent 能力不够,而是工具本身的设计不支持它做出合理的决策。

RAG 在设计上是为”用户直接提问”场景优化的,不是为”Agent 自主探索”场景设计的。

行业也在转移

这些问题不是我们独有的,业内已经有明显的应对趋势:

微软的 GraphRAG 引入知识图谱来缓解上下文碎片化问题,把相关实体和关系显式地存储下来,而不是靠碎片拼凑。

PageIndex 不按固定大小切 Chunk ,而是以页面为单位建立索引,保留文档的自然边界。

Agentic RAG 尝试让 AI 自主决定检索策略,而不是走固定管线——方向是对的,但在 RAG 架构上叠加 Agent 逻辑,复杂度随之翻倍。

最彻底的转向来自 Claude Code 和 Manus 。它们干脆放弃了 RAG ,回到最原始的方式:Glob + Grep + Read 。找文件、搜关键词、读内容。没有向量数据库,没有 Embedding 模型,没有 Chunk 管线。效果反而更好。

这让我们想明白了一件事:RAG 的设计假设是”LLM 不够聪明,需要我们帮它把信息预处理好”。这在 GPT-3.5 时代是合理的。但现在的 LLM 已经有能力自主使用工具完成多步检索任务——它们不需要预切碎片,它们需要的是线索 :文件在哪,结构是什么,然后它自己能决定读什么、读多少。

我们的解法:Outline Index

Glob + Grep + Read 对代码库很有效,但对用户文档行不通。代码库里 src/services/auth.ts 这个路径本身就在告诉你这是认证服务;但 2024 年度总结(修改版)(最终版).docx,路径告诉你的信息约等于零。更别提 PDF 和 Word 是二进制格式,grep 根本读不了。

所以我们的问题变成了:能不能给文档也建立一套等价的”目录索引”,让 AI 用 search → outline → read 的方式渐进式地翻阅你的文件?

我们把这套方案叫做 Outline Index

核心思想一句话:不替 AI 预切信息,而是给它一张地图。

为每个文档建立一份结构化”名片”,包含文档的元数据(标题、作者、关键词、摘要)和结构大纲(章节标题、层级关系、行号范围)。AI 按三层路径访问文档:

  • search :搜索相关文档,返回文件列表和 Metadata ,约 50 tokens/文件
  • outline :查看文档的结构地图,约 200-500 tokens/文件
  • read :精准读取指定章节的原文,按需加载

这与人类阅读的方式完全一致:先找书,看目录,翻到对应章节精读。AI 在这个过程中有完整的上下文,知道自己在文档的什么位置,可以决定”再多看一点”,也可以跨文档对比。

对比传统 RAG:同样的场景下,Outline Index 方式的 Token 消耗约 800-3400 ,AI 拿到有完整上下文的精确信息。传统 RAG 返回 10 个预切碎片,消耗 4000-6000 tokens ,AI 对文档结构一无所知。

另一个副产品:Embedding 的对象从原文 Chunk 变成了 Outline Index 本身。一个文档只需要一个向量。10000 个文档 ≈ 10000 个向量 ≈ 30MB 存储,检索速度也快得多。

关于领域词汇不敏感的问题,BM25 全文检索补上了这块短板。双路检索( BM25 精确匹配 + 向量语义理解),通过 RRF 融合,不再需要 Rerank 模型。

最后,是广告时间:

作者: blueeon | 发布时间: 2026-03-13 06:17


27. 很奇怪和诡异的一个传统 UDP 53 的 DNS 调度解析 和 HTTPDNS 的调度解析域名的问题?

比如某一个域名 或 某一个 HTTPDNS 或 HTTPSDNS 域名解析或者说映射了多个 IP 地址,这些多个 IP 地址可能是不同省份同一个运营商 或 不同省份的不同运营商 或 同一个省份的不同运营商,那么假设用户 A 在 A 省使用 传统 UDP 53 的的 A 省运营商 DNS 或 第三方公共 DNS 去调度解析某一个域名,有时候明明有 A 省的 IP ,但实际调度解析后返回的解决确实 B 省同一个运营商,更有甚者或者极端情况下 A 生用户可能会获取返回的是 B 省的 B 运营商的 IP 。

HTTPDNS 的调度也有上述类似的问题,请问这是为什么?难道仍是归咎于调度细粒度不精准 或 不完整支持 ECS 造成的嘛?

作者: bclerdx | 发布时间: 2026-03-15 14:42


28. 利用 AI 像洗黑钱那样洗代码版权会不会产业化?(可能属于灰产、黑产)

最近有个行为叫做 License Laundering (洗许可证)引起了不少人的警觉。顾名思义,类似于 Money Laundering (洗黑钱),就是把利用 AI 重写代码,使得新代码的重合度与原版相差甚远,“洗”到与原作品无关,然后更换许可证。

前段时间,Python 社区的 chardet 引发了争议。现任维护者 Dan Blanchard 利用 AI 把 chardet 的代码重写了一遍,重写后的版本使用 MIT 许可证。原作者 Mark Pilgrim 已经现身反对更改许可证,因为 chardet 原先的许可证是 LGPL 。

具体分析:License Laundering and the Death of Clean Room

与此同时,还有公司更进一步,利用 License Laundering 搞恶意竞争,克隆客户的软件然后低价转卖。
很快就有人同样把“License Laundering”打包成一站式服务,嘲讽这种公司的恶意竞争行为。 “洗代码即服务!”火了!“开源代码洗白”奇葩网站上线,反讽白嫖企业:开源合规太昂贵了! CC 逆向复刻客户软件,十分之一的价格转卖!

说到底,这类 Laundering 做法算不算侵权?毕竟 AI 的训练过程中的语料就有开源代码,没人能保证 AI 从未“看”过 GPL 系列代码吧。

作者: cnbatch | 发布时间: 2026-03-15 14:32


29. Windows 开发真的太难了!所以自己用 Rust 搓了个 win 版 tmux,开源免费

如果你是 MacOS 或者 Linux 的开发者,你们应该感受不到这个痛点,但是 Windows 的开发环境对现在的并行开发工作流实在太不友好了!!

平常我都开好几个终端机跑好几个 Claude Code 、Codex ,光是 cd path 就得老半天,终端机不能复制粘贴图片,每次开机又得重新调整排版,更别说没有通知,有时候都不知道哪个会话需要我的回应。

另外 VSCode 现在对我来说就是单纯的阅读器而已,用它跑终端机实在太重了,所以我就自己搓了个 IDE 来用!

功能大概有:
- 自定义排版,支持窗口分页
- 支持图片复制粘贴到 CLI (我的最爱!!!)
- 自动恢复上次会话和权限
- 当 CLI 需要输入的时候,系统消息通知
- 文件树双击文件直接在默认 IDE 中打开
- 右键点击文件可以直接插入到输入框,不需要再手动打文件名
- Git 状态追踪,看到所有的 worktree 、branch 和文件变动
- 支持预设开启路径(我自己默认在 github/,这样每次能少打几个字)
- 支持预设 IDE
- 新增终端机可以选择你要的 Shell 类型,像我有时候需要跑 bash ,有时候需要 PowerShell
- 还有更多!

开源免费,现在已经有超过 100 位开发者在使用了,正在快速迭代中,欢迎大家提需求!👉

https://github.com/oso95/Codirigent

目前还没有 Windows 签名(申请中),安装时点继续就好,或者照 README 跑本地版。

作者: oso95 | 发布时间: 2026-03-15 07:32


30. 想直接购买 CC 的 api key,不想通过中转,没有大美丽信用卡做不到?

如何合法途径通过国内支付,有经验的进来聊聊啊

作者: mrsbryant | 发布时间: 2026-03-12 00:55


31. Antigravity 这还能用吗?额度哐哐扣,事情一件没做成

我用 Opus 4.6 (先了解代码情况,再按需求)写一个文档,每次都到最后关头,就报错。。。

连续试了三次,现在 Claude 模型的额度还剩 2 格,额度是扣了,但事情是一件没给我干啊,才上年费 Pro 的车,感觉像吃了苍蝇

作者: willxiang | 发布时间: 2026-03-14 13:36


32. 通过 vibe coding 能对 ruoyi ai 二次开发吗,做点自己的应用, Java 能力只限于本科学的那点

现在是有想法,直接纯对话 ai 从零开始完成,并且可以得到想要的结果,但是没用过专业的框架,想试试

作者: 2757809858 | 发布时间: 2026-03-15 12:12


33. 安卓假如放弃 root 的话,建议买哪家?

首先说一下,不买苹果。苹果没法用 mihon 、iceraven 、ublock origin 等软件,而且就算有上架的 app 相比安卓版本也会屏蔽 r18 ,比如 TG 。此外我没有 mac 也会导致很多麻烦。

安卓现在 root 是真的太难太难了,一解锁就导致特别特别多问题。我目前解锁 root 的需求其实主要就两个:

  1. 国产特色系统的大量广告、各种云控、安全中心、“贴心”的拦截 apk 安装、杀后台( VPN 容易挂)。这个解决办法其实除了 root ,还可以选择本身就更纯净的系统。
  2. 备份 app 数据(/data/data )。这个是最难以完全替代的需求,安卓这边好像国产是没有对标苹果的 e2ee 备份的吧,我对那些云很不放心。那另一个选择就是放弃手机数据,尽可能不往手机上放重要数据,都往 NAS 之类的地方塞。

:没有关国产流氓的需求,国产直接物理隔离。

我网上搜了下资料,好像满足 1 的国行手机,就只能在三星(可以不解锁刷港版)、摩托罗拉、努比亚/红魔里选了?有没有用过的朋友说下体验呢?三星和摩托罗拉国内的评测非常少,而且大部分面向大众的评测,基本都没有提到云控、安全中心、杀后台、GMS 完整性之类的东西,国内可能很多普通用户根本不在意广告快应用啥的。比如这个帖子 https://v2ex.com/t/1196721 ,V 友 tyzrj766 的回复:

你朋友没用酷安,酷安信息流里的广告,在 ColorOS 上调用快应用,能实现不碰不晃,刷到就一键打开,如果是小游戏直接读取你的 OPPO 账号给你实名过验证,瞬间完成。我用 X9 那会都惊了,以前用小米和 vivo ,系统里的快应用广告都没这么丧心病狂。

加上这个 B 系统,字体不统一,界面不统一,屏幕也差,月月更新只会水 AI ,目前是被我拉黑了,一加和 OPPO 手机再好,系统再德芙,这些问题不改我是不会用了。前后买了三四个黑厂手机,没一个能坚持用的下去。

这个对我是绝对无法接受的,但是 B 站大众向评测里都觉得 ColorOS 很好用,所以只能来 V2EX 这种更偏极客的论坛来请教一下了,国行安卓里哪个系统对于极客来说体验更好?三星刷港版、摩托罗拉、努比亚/红魔的体验怎么样?

作者: LaTero | 发布时间: 2026-03-13 08:36


34. 有什么网站提供人工智能学习且能够有老师答疑的

愿意知识付费 但是也别太贵了

作者: hiboshi | 发布时间: 2026-03-15 05:36


35. 做了一个自认为很有潜力的 AI 项目,大家看看有没有前途

最近做了个开源项目: https://github.com/golutra/golutra

简单说就是一个 多 Agent 的 AI 工作空间,可以组建一个 蜂群 Agent Team ,让不同 AI 协作工作,有点像搭一个 一人公司的 AI 团队,可以长期运行。自定义工作流(不同行业场景都能搭),工作流模板一键导入导出,适合长期运行的 AI 自动化系统。

后面准备做的:

实现真正的「 CEO Agent 」,一个月不用人监管,支持手机端远程操控,自动构建 Agent ,接入永久记忆层

还在早期阶段,想听听大家的评价: 这个方向有没有前途?有没有什么建议?

欢迎评论 🙏

作者: seeksky | 发布时间: 2026-03-14 18:24


36. 初学 k8s,如何解决网络下载慢的问题?

目前小弟主要是通过 ssh 到 ubuntu 物理机上,有翻墙设备,在 ubuntu 上下载了 flcalsh,但是下载 k8s 的链接就很慢,没走代理。 如:curl -LO “https://dl.k8s.io/release/$(curl -L -s https://dl.k8s.io/release/stable.txt)/bin/linux/amd64/kubectl-convert" 下载就很慢。

作者: Debug1998 | 发布时间: 2026-03-15 07:03


37. 随机播放到艾薇儿和后街男孩的歌曲,突然发现上一次听还是 10 多年前读初高中的时候了

突然有点唏嘘,当时听他们的音乐还是用的好记星学习机,由于家离学校比较远,所以平时是住读,周五回家和周末归校的时候,就喜欢用学习机听他们的音乐,岁月不饶人啊。

作者: zzz22333 | 发布时间: 2026-03-15 00:45


38. 从智谱 agent 发现了个 skills 文件夹,不知道是不是内部的 skills,大家来看看

扒下来的整个流程很简单:智谱的 Agent 模式本身运行在云主机上,我们可以让它输出当前的文件结构。通过查看结构,你会发现一个名为 skills 的文件夹。只需让 Agent 将该文件夹打包,然后下载即可。贴一段 skills 描述
┌─────────────────────────────────────────────┐
│ 硬件配置详情 │
├─────────────────────────────────────────────┤
│ CPU: Intel Xeon Processor (4 核) │
│ 内存: 8 GB │
│ 磁盘: ~10 GB │
│ 系统: Linux (Alibaba Cloud Linux) │
│ 运行时: Bun │
│ 端口: 3000 │
└─────────────────────────────────────────────┘


作者: qaq13037 | 发布时间: 2026-03-13 02:59


39. Linux 服务器上有多个 ip,程序本身不能指定接口,有第三方程序可以强制让程序使用指定接口吗?

像 libbind 、proxychains 、部分 tsocks 这类基于 LD_PRELOAD 劫持 libc 的办法,不适合 golang 编写的程序

有比较便捷的解决方案吗?

作者: pc10201 | 发布时间: 2026-03-13 02:30


40. AI 时代下 AI 工具熟练度能代替技术深度吗?

近几次面试发现一个问题用人单位似乎更看重 AI 工具的熟练度,你说突破了某个技术难点会被认为“AI 就能做到何必自己去探索”,各种问题都能扯到 AI 上,这样很容易忽视技术深度和背后自主探索和创造所付出的努力。

我用 AI 确实能大幅提高效率,写 API 接口几分钟就搞定了,CRUD 任务描述一下需求即可快速实现,丢一份文档即可生成 MVP ,但之前做了个探索性的微服务项目的确遇到深水区,尤其是基础设施层。大致存在以下几种问题:

  • 组件和框架集成存在隐形契约,官方文档没有,GitHub 无人提及,网上无人讨论。
  • 框架功能设计缺陷和框架的 BUG 导致无法满足需求必须改源码还不能破坏原有的函数。
  • 官方文档缺失部分内容,无参考答案,无已知解决方案。
  • 官方文档仅有简单示例但没有完整落地的案例,同时需要修改底层源码。
  • 框架已存在的特性,无注释,没有提及该特性的相关文档和资料。

面试官认为提示词写好加上几个 Skills 就行,实际上烧了一堆 token 还是没用,除了最后一个 AI 勉强有解其他的几乎不行,最后还是自主探索用更优雅的方式解决掉。

所以这就存在争议,技术的学习成本降低以后 AI 工具熟练度能代替技术深度吗?如果自主探索攻破难题被认为“人做得到的 AI 同样可以”,那所有的技术研究,开源项目不就没有意义?

作者: zhanshen1614 | 发布时间: 2026-03-14 09:59


41. [分享] Codex + GPT 5.4 火力全开配置调优

自从 OpenAI 出来 gpt-5.4 模型后 Codex 的使用确实有了极大的提升,我个人调整配置后开发同一个需求对比使用 Claude Code + Claude Opus 4.6 还更快一点完成。

本来从 gpt-5.3-codex 的默认配置直接使用,但发现上下文一下就不够了,对于大一点的工程来说 特别难受。

后来查了下网上的资料,说 gpt-5.4 的 1M 上下文的能力要自己主动配置开启,晕。

下面放出我自己使用 Codex 的一些配置,算是抛砖引玉,不一定是最佳实践,有不同的欢迎指正。

打开 ~/.codex/config.toml 文件

project_doc_fallback_filenames = ["CLAUDE.md"] # agents.md 找不到,则找 claude.md ,和 Claude Code 使用同一份约束

model = "gpt-5.4"
review_model = "gpt-5.4" # 默认 "gpt-5.2-codex"

model_provider = "apibox" # 改成你自己的中转站名
model_reasoning_effort = "xhigh" # 思考强度超高

model_context_window = 1000000 # 模型上下文窗口大小,默认 1000000 ( 1M ) for gpt-5.4
model_auto_compact_token_limit = 500000 # for gpt-5.4 虽然是 1M ,但是有效注意力不够,不建议开的太高


[model_providers.apibox]
name = "OpenAI" # 如果用的是中转站,建议把名字改成 OpenAI (注意大小写)命中缓存,省 token
base_url = "apibox.cc/v1" # 改成你自己的中转站 API 地址哦
wire_api = "responses" 
requires_openai_auth = true

[features]
shell_tool = true # 启用 shell 工具。默认: true
apply_patch_freeform = true # 通过自由格式编辑路径包含 apply_patch (影响默认工具集)。默认: false
shell_snapshot = true # 启用 shell 快照功能。默认: false
undo = true # 启用 undo 功能。默认: true
unified_exec = true # 使用统一 PTY 执行工具
multi_agent = true
steer = true
prevent_idle_sleep = true
child_agents_md = true

memories = true # 开启记忆
sqlite = true # 可配可不配,随意
fast_mode = true # 必开,完全不同的体验,当然也会让 gpt-5.4 用量变 2 倍

[memories] # 强烈建议用新模型来总结 memories
consolidation_model = "gpt-5.4"
extract_model = "gpt-5.4"
# generate_memories = true # 默认 true
# use_memories = true # 默认 true ,表示把 memory_summary.md 注入 developer instructions
max_raw_memories_for_consolidation = 512
max_unused_days = 30 # 默认 30
max_rollout_age_days = 45 # 默认 30
# max_rollouts_per_startup = 16 # 默认 16
# min_rollout_idle_hours = 6 # 默认 6

小技巧:

model_auto_compact_token_limit 这个配置可以动态调整 当你的工程的会话上下文特别大的时候,你有不想开新的会话时。你可以先把这个配置改大,然后重新开启 VS Code 或者 cli ,这样就不会触发压缩了,可以继续聊下去。

作者: apibox | 发布时间: 2026-03-14 08:28


42. 大家公司怎么使用 ai 的?

  • 在哪些场景,怎么使用的?
    • 不仅仅是编程,据了解编程领域是 ai 提效最高的。

作者: siaronwang | 发布时间: 2026-03-14 02:28


43. 自从用了 Claude Code, Intellij 家族的 ide 很少打开了

自从用了 Claude Code ,Intellij 家族的 ide 很少打开了

你们用什么工具配合 ai 工具呀?

作者: gefangshuai | 发布时间: 2026-03-13 09:48


44. 有新闻抓取的 skills 吗?

在 clawhub 上找了几个(find-skills 以及手动找),都不太符合需求,我的需求是:

1. 抓国内新闻热点
2. 抓到的内容可以缓存,下次抓到重复内容不处理
3. 内容是:标题/链接/总结/日期等

不需要支持很多平台,因为热点新闻会在大部分平台出现。

自己部署 rsshub + 让🦞自己实现比较麻烦,因为总要调试,会浪费很多 tokens 。

所以做一回伸手党,有没有已经实现好的新闻 skills ?

作者: ethusdt | 发布时间: 2026-03-13 14:27


45. Google one AI Pro 使用额度限制,这个量感觉不够

代理模式和 Gemini CLI 的配额

Gemini Code Assist 代理模式和 Gemini CLI 的请求配额会合并计算

每个用户每分钟的请求数 120 每个用户每天的请求数 1500 https://developers.google.com/gemini-code-assist/resources/quotas?hl=zh-cn

作者: Hyvi | 发布时间: 2026-03-14 03:43


46. 请问在阿里云中怎样管理少量的密码、API KEY 之类的凭据?

以前使用 AWS 的时候用 Secrets Manager 管理、使用少量凭据,
现在需要使用阿里云做国内项目(后续建议公司评估 AWS 中国服务)。
阿里云客服告知凭据的最低购买量是 1000 个,
实际项目中一个环境也不超过 10 个凭据,
请问阿里云有什么性价比更高的凭据管理方式吗?

作者: sungnix | 发布时间: 2026-03-14 03:38


47. 用人翻阅资料的行为模式来设计知识库怎么样?

我们人是怎么查资料的,假如去图书馆 1.找到对应的书架 2.找到对应的书 3.翻阅目录,定位到页码 4.读取内容

以上模式其实很简单,把最上一级的目录通过 System Prompt 传给 ai ,然后写几个 function call 就行了,ai 自己调方法去查。

请问一下这种方式有什么缺点吗?

作者: huanggan | 发布时间: 2026-03-14 04:36


48. 喜欢 ROOT 的用户有福了,小米开了三八解锁节,点击就给解锁()

搬运:此次解锁基本原理是骁龙 8E GEN5 的底层漏洞,导致米系的全系 8E GEN5 手机,包含小米 17 全系、K90PM ,只要系统安全补丁在 2 月以前,均可解 BL ,无需答题,无需拆机,无需进阶操作,理论上会 ADB 就能解。 小米解锁相比一加的优势:更稀有能装 X ,且不会炸 TEE 模块。 参考链接: https://www.bilibili.com/video/BV1jVNMz5E5d https://www.bilibili.com/video/BV1YxPBz9E3B

叠甲:楼主自己未购买小米系手机,仅吃瓜心态搬运,消息真实度需自行判断。(不过看完还是有点想现场下单一台了,虽然不知道 ROOT 能实现什么人无我有的独特功能)

作者: doctorzry | 发布时间: 2026-03-08 14:02


49. Claude 上线了 1m context,为什么我这用不了啊?

https://code.claude.com/docs/en/model-config#extended-context-with-1m

已经升级最新版 v2.1.76 ,用的时候还提示: Opus 4.6 with 1M context is not available for your account. Learn more:https://code.claude.com/docs/en/model-config#extended-context-with-1m

作者: gefangshuai | 发布时间: 2026-03-14 10:52


50. 手搓了最喜欢的 Android 软件, GestureExplode

Android 最喜欢的软件,Google 的 gesturesearch ,效率 No.1 ,2015 年停更后一直没有合适的替代。
而且基于 32 位,后续 64 位 cpu 无法兼容。
基于 AI 自己手搓了一个,可以通过手势输入字母来搜索手机联系人,应用,设置,无需联网权限。
欢迎大家食用:github.com/colorbeta/GestureExplode

作者: colorbeta | 发布时间: 2026-03-14 14:13