hacker_news_top_comments_2025-10-21

Hacker News 高赞评论 - 2025-10-21

1. tantalor 在”我收到过最惊悚的’用户支持’邮件”中的新评论

就像我让ChatGPT分析时它确认的那样

笑死，我们彻底完蛋了

_{作者: tantalor | 发布于: 2025-10-20 21:36}

2. seanhunter 在《摩根大通的 OpenAI 贷款令人费解》中的新评论

这分析真够奇怪的。

一家有营收且资金极其充裕的公司获得债务融资，这根本不算新闻，完全是常态。”难道他们所有资金都应该来自投资者吗？”当然不是。任何阶段的公司通常都会混合使用债务和股权融资。

他的企业价值计算也完全错误。在破产清算时，债务融资的清偿顺序通常优先于股权，所以当摩根大通做分析时（相信我他们绝对做过），他们假设的回收率绝不是0%，而是预计在破产情况下很可能获得某个大于零的回收比例。

最后，银行看待与数十亿美元级别公司的关系时，不会纠结于单笔循环信贷的投资回报率（尽管这笔交易对摩根大通来说很可能非常赚钱）。他们考虑的是：提供这笔循环信贷能如何增加未来获得债券发行顾问业务的机会，当OpenAI进行收购时拿到投行业务，以及在IPO时抢占先机等等。

_{作者: seanhunter | 发布于: 2025-10-20 20:06}

3. 0x5345414e在《AWS美国东部1区多项服务中断》中的新评论

这直接影响了我的生活质量。我在纽约哈德逊广场的Whole Foods超市，因为系统故障没法用会员折扣买巧克力棒，最后干脆没买。现在我的巧克力摄入量严重不足。

_{作者: 0x5345414e | 发布于: 2025-10-20 18:04}

4. 用户 indoordin0saur 在《AWS 美国东部 1 区多服务中断》中的新评论

看起来主要问题仍在持续。情况似乎比4小时前还要糟糕。我是数据工程师，目前Redshift和Airflow（AWS托管版）对我来说已经完全瘫痪了。

_{作者: indoordin0saur | 发布于: 2025-10-20 16:31}

5. time0ut在”AWS us-east-1区域多服务中断”中的新评论

真是难忘的一天。从凌晨三点开始我就一直在事故处理桥上待命。现在我们的系统大部分已经恢复，只剩下少数后台系统还在争夺计算资源。

我们最大的失误在于：虽然设计的是支持多区域部署的应用程序，却无法执行故障转移流程——因为安全团队把我们迁移到了Identity Center，而且只部署在us-east-1区域。这导致整个公司被硬性锁定在AWS控制平面之外。等我们从保险库取出根凭证时，系统都已经开始自行恢复了。

这件事再次提醒我们：系统的健壮性取决于最薄弱的环节。

_{作者: time0ut | 发布于: 2025-10-20 13:44}

6. JCM9 在《AWS 美东一区多服务中断》中的最新评论

美东一区不仅仅是普通区域。它还为其他服务提供骨干支持，包括其他区域的服务。因此仅仅将业务部署在其他区域并不能避免美东一区频繁出问题带来的影响。

AWS很少公开讨论这一点，但如果你追问，他们会私下承认AWS架构中存在一些严重的单点故障隐患，一旦美东一区出现问题就会暴露。多数人会认为这意味着AWS在某些领域并未实现真正的多区域架构。

目前尚不清楚本次故障是否涉及这些单点故障，但风险规避并非简单”不使用美东一区”或”在多区域部署负载均衡故障转移”就能解决。

_{作者: JCM9 | 发布于: 2025-10-20 12:45}

7. 用户 miki123211 在”DeepSeek OCR”中的新评论

文本标记经过量化处理并代表子词单元，而视觉标记仅存在于嵌入空间中。

大型语言模型中的文本标记化工作原理是：存在一个从（小型）标记ID到（大型）向量嵌入的”查找表”。要向LLM输入文本，需在标记边界处进行分割，将字符串转换为标记ID，然后构建”上下文矩阵”——其中每一行都是来自该查找表的向量。

传输文本标记序列相对高效，只需传输标记ID本身[1]。这些标记是小型整数（大型模型通常有约10万个可能的标记ID）。若直接传输实际的嵌入矩阵则效率极低，因为嵌入通常包含数千个浮点数。

图像编码方式则不同。经过基础预处理后，图像数据直接输入基于神经网络的图像编码器。该编码器将图像编码为向量，随后附加到上下文中。这里不存在标记ID，没有查找表，直接从图像数据生成标记嵌入。

这意味着图像标记的传输无法实现同等效率，因为必须传输嵌入本身。尽管图像用更少的标记编码，但这些标记的最高效表示形式仍需要更多字节。

可将文本标记视为0到n之间的整数，我们知道如何将其映射为向量。这意味着存在n种可能的标记选择。相比之下，图像标记是由m个浮点数（即向量本身）组成的数组，每个浮点数可取值范围极大。这意味着视觉标记的”标记空间”实际上要庞大得多。

还存在模式差异问题。文本标记直接对应连续的UTF-8字节段，大多数分词器不会创建跨越单词边界的标记。这意味着它们无法高效编码全局模式，不可能存在”哈姆雷特独白”或”后续文本为西班牙语”这类标记。

_{作者: miki123211 | 发布于: 2025-10-20 11:13}

8. padjo在”AWS美国东部1区多项服务中断”中的新评论

对大多数公司来说，为AWS中断制定应急预案完全是浪费时间和精力。虽然故障确实会发生，但概率极低——大概每5到10年才会出现几小时。我几乎可以保证，你制定的任何预案都不可能比坐等AWS自行修复更快让业务全面恢复运转。

_{作者: padjo | 发布于: 2025-10-20 10:13}

9. JCM9在《AWS us-east-1区域多服务中断》中的新评论

今天要和我们的AWS客户团队开会，讨论我们为何不再“全面押注AWS”——因为正在将工作负载分散到其他平台。主要原因在于核心服务的创新速度放缓，而且AWS在AI服务方面落后太多，我们不得不从别处采购这些服务。

AWS团队一直鼓吹其坚如磐石的可靠性，试图以此劝阻我们实施多云策略。这会是个有趣的会议！

_{作者: JCM9 | 发布于: 2025-10-20 10:09}

10. jacquesm 在《AWS 美东一区多服务中断》中的新评论

大约每周我们都会访谈一家公司，问他们是否制定了备用方案来应对AWS宕机或云账户消失的情况。他们总是露出一副措手不及的表情：”这不可能发生吧？”

现在请设想这些服务永远无法恢复。看看这会导致什么后果。互联网最初的核心优势正是源于其完全去中心化的特性。而我们正在系统性地侵蚀这种优势。

_{作者: jacquesm | 发布于: 2025-10-20 10:05}

11. 用户 jpalomaki 在《AWS 发生大规模服务中断》中的最新评论

AWS一宕机，全世界都知道。这时候根本没人会质疑你的主机选择——它就是云计算时代的IBM。

_{作者: jpalomaki | 发布于: 2025-10-20 09:13}

12. stepri 在《AWS 美东一区多服务中断》中的新评论

根据我们的调查，该问题似乎与US-EAST-1区域DynamoDB API端点的DNS解析有关。我们正在通过多种并行方案加速服务恢复。

果然又是DNS的问题。

_{作者: stepri | 发布于: 2025-10-20 09:07}

13. littlecranky67在《AWS美国东部1区多服务中断》中的新评论

就在几天前的这个HN讨论串0里，还有不少用户声称Hetzner不可选，因为其正常运行时间不如AWS，所以AWS更高的定价值得投资。真是讽刺啊。

_{作者: littlecranky67 | 发布于: 2025-10-20 09:07}

14. 用户amadeoeoeo在《AWS us-east-1区域多服务中断》中的新评论

哦不…该不会是西甲联盟发现有人在AWS上架设盗版网站了吧？

_{作者: amadeoeoeo | 发布于: 2025-10-20 08:20}

15. nikolay 在《AWS 多个服务在 us-east-1 区域出现故障》中的新评论

选择us-east-1作为主区域有个好处：当服务宕机时，所有人都会一起宕机。这种”有难同当”的待遇在其他美国区域可享受不到！

_{作者: nikolay | 发布于: 2025-10-20 07:57}

16. 用户 krackers 在《DeepSeek OCR》中的新评论

这篇论文比普通的OCR视觉语言模型更有意思，他们开始讨论压缩相关的内容了。比如引用了这段：

我们的工作是对视觉-文本压缩边界的初步探索，研究需要多少视觉标记才能解码文本标记。初步结果令人鼓舞：DeepSeek-OCR在约10倍压缩率下实现近乎无损的OCR压缩，而20倍压缩仍能保持60%的准确率。

（或许可以说一个图像标记抵得上10个文本标记…）

能否请哪位给新手解释下这里的信息论直觉？为什么这种方法有效？是因为文本标记仍然过于”颗粒化”/重复，未能接近理想熵编码吗？还是说切换到视觉标记能够突破”逐词处理”的限制，从而更接近熵极限（类似算术编码相比霍夫曼编码的优势）？

接着他们开始讨论通过直接（？）缩小图像来处理长文本，建立了文本域和图像域信息损失之间的对应关系。

_{作者: krackers | 发布于: 2025-10-20 06:57}

17. jddj在”美联航MAX客机在36000英尺高空被坠落物体击中”中的新评论

向上滚动查看 https://neal.fun/space-elevator/

_{作者: jddj | 发布于: 2025-10-19 22:20}

18. bawolff 在”诺和诺德的加拿大失误”中的新评论

通常当人们因为这类事情被解雇时，他们不过是替罪羊。

这样的失误绝不只是某个人疏忽造成的，而是政策与核查机制失效的系统性故障。如果仅靠单人来承担责任，这本身就是管理体系的失败。

_{作者: bawolff | 发布于: 2025-10-19 21:52}

19. rahimnathwani 在”诺和诺德的加拿大失误”中的新评论

据我理解，由于他们让专利过期，这种药物就不受政府的价格管制。因此他们可以随意定价。

在大部分时间里，这些药物仍受到”数据独占权”的保护——这意味着在8年期限届满前，任何仿制药生产商都必须自行完成临床试验才能获得批准。

所以他们放弃了部分独占期，以换取在垄断地位尚存时能够制定更高价格的权利。

_{作者: rahimnathwani | 发布于: 2025-10-19 21:34}

20. jzebedee 在《诺和诺德的加拿大失误》中的新评论

多伦多的Michael Hoffman教授让我关注加拿大专利数据库，我在里面发现诺和诺德确实在加拿大为司美格鲁肽提交过专利……但他们最后一次缴纳专利年费是在2018年！

你甚至能找到他们律师发的一封退款申请函，要求退还2017年的250加元年费，因为诺和诺德当时显然想多些时间考虑是否要继续维持这项专利。

到了2019年同一天，专利局发函声明：”上述专利维持权利所需的费用未在规定截止日前收到……”此时连滞纳金合计需缴纳450加元，但诺和诺德显然不愿支付。他们有一年宽限期来补缴，但最终并未履行，导致该专利在加拿大失效。正如加拿大官方提醒的那样：”专利一旦失效即不可恢复”。

这对”全球第二大司美格鲁肽市场”而言堪称重大失误。

_{作者: jzebedee | 发布于: 2025-10-19 21:24}