HN 每日深度阅读 · 2026-06-20
本期议题横跨技术与社会的多重断面:AI 既在向医疗影像、研究方法等新领域延伸,也在小学课堂遭遇禁令,部分讨论涉及内存紧缺是否会改变软件膨胀。基础设施层面,Valhalla、DuckDB、ClickHouse、MCP 等项目展现工程长期主义。
共 20 篇 · 约 14,284 字 · 约 36 分钟读完
1. Midjourney 跨界医疗:用超声水池打造”60秒全身扫描”
- 原文: https://www.midjourney.com/medical/blogpost
- HN: https://news.ycombinator.com/item?id=48579650
- 得分: 1344
- 评论: 869
AI图像生成公司Midjourney宣布进入医疗影像领域,计划开发一种基于超声技术的全身扫描设备,并配套建设线下”水疗馆”(Spa)。其设备工作原理是让使用者站在一个充满金色光线的浅水池平台上,以每秒约5厘米的速度缓慢下降,穿过一个由约50万个微型方块组成的环形结构。这些方块同时充当微型扬声器和麦克风,发射超声波并接收反射信号,每秒产生数TB数据。通过分析声波穿过不同密度组织(皮肤、脂肪、肌肉、骨骼)时形态的变化,重建出亚毫米级精度的人体3D图像,整个扫描过程目标控制在60秒内完成,速度接近MRI的100倍。
公司计划2027年底在旧金山开设首家Spa,将扫描融入桑拿、冷水池等休闲体验中。其雄心目标是到2031年部署全球5万台扫描仪,月扫描量达10亿次。在监管方面,Midjourney表示先从提供身体成分图谱起步,再向FDA逐步申请扩展诊断能力。
HN讨论呈现明显分化。一位执业放射科医生指出,超声波存在根本性物理限制:无法穿透充气的肺部、无法穿透骨皮质识别骨病灶、胃肠道气体会遮挡腹部结构、颅骨也会严重阻碍脑部成像,因此所谓”全身扫描”存在大量盲区。多名医疗从业者警告”过度筛查”问题——对无症状人群频繁扫描会发现大量临床意义不明的”偶然发现”,导致焦虑、不必要的后续检查和医疗资源浪费。有从业者直言,Midjourney对FDA审批流程的描述完全脱离实际,医疗器械审批需要严格的设计控制、合规团队和大量资本投入,远非”提交测试结果”那么简单。
也有评论者从技术角度给予肯定,认为相控阵波束成形原理可行,毫米级分辨率确实可达成,但指出心脏跳动等运动伪影可能成为问题。在品牌策略上,多位评论者认为AI图像公司突然转向医疗硬件和实体Spa显得方向混乱,“像是在墙上扔意大利面”。还有人质疑其健康理念——将健康简化为”每秒每美元获取最多MB数据”,与真正的预防性医疗逻辑相去甚远。
2. AirPods 效应:耳机如何重塑公共空间的社交边界
作者在从德国回到美国底特律郊区探亲期间,注意到无线耳机在公共场所的普及程度令人震惊。据市场估算,约44%的美国人使用蓝牙或无线耳机,另有24%使用有线耳机。文章引用了一项2026年发表的研究,指出2005年至2019年间,美国人日均说出的词汇量下降了28%,且这一趋势在疫情后可能进一步加剧。亚利桑那大学社会心理学家Matthias Mehl认为,自助结账、扫码点餐等”效率化”改变,使日常社交互动变得稀薄。
文章引用了多项研究和大学生评论文章,指出重度耳机使用与孤独感、社交回避存在相关性。多位大学生在校报中撰文反思:公交车上无人交谈,咖啡师得不到问候,课堂上学生宁愿听音乐也不听教授讲课。耳机已成为一种”社交拐杖”和事实上的”请勿打扰”标志——即便佩戴者实际并未在听任何内容,旁人也会默认不应打扰。作者讲述了自己在密歇根高尔夫球场遇到一位全程戴AirPods的球友,九洞下来几乎没有交流,反而比独自打球更孤独。
HN评论呈现强烈的反对声音。多位评论者指出,地铁、繁忙商业区等高密度陌生人环境本身就不”自然”,戴耳机隔离噪音反而是将环境拉回更舒适的状态。一位评论者反驳作者:德国本身就是公共交通上极少与陌生人交谈的国家,将美国的”耳机文化”问题归咎于技术似乎有失公允——许多文化中陌生人交流本就罕见,与耳机无关。也有人提到”默认模式网络”(DMN)的概念——持续的音频输入剥夺了大脑放空、整理思绪的时间,戒掉散步时听播客的习惯后,反而涌现更多创意。一位休斯顿用户称使用骨传导耳机后,既能听音乐又能感知环境,反而更愿意与陌生人交谈。还有评论者认为,相比让人在地铁上用手机外放抖音视频,戴耳机至少是一种公共礼仪。整体来看,社区对”耳机导致疏离”的因果关系普遍存疑,更倾向于将其视为社会原子化的结果而非原因。
3. 挪威几乎全面禁止小学使用AI
挪威政府宣布对小学阶段的AI使用实施近乎全面的禁令。根据新规,1至7年级(6至13岁)的学生原则上不应使用AI工具;初中阶段(14至16岁)学生可在教师监督下谨慎采用。这一政策延续了挪威2024年禁止智能手机进校园、并赋予教师更多课堂管理权力的方向,背景是该国教育测评分数普遍下滑。
HN社区对此政策表现出罕见的高度一致认同。多位评论者用类比来支持禁令:在孩子掌握算术之前不会给他们计算器,LLM版本更隐蔽,因为跳过思考过程依然能产出”看起来完成了”的作业。一位家长分享,6岁孩子已经发现智能音箱不仅能播放歌曲,还能直接回答课后作业问题,例如”哪种动物会随季节改变毛色”。多位教师和家长反映,AI在教育中的滥用已造成严重后果:教师用AI出题、学生用AI做题、教师再用AI批改,校长用AI监督教师,形成一个荒诞的AI回音室。
来自教师社区的评论尤为犀利。有人引用r/teachers和r/professors论坛的普遍反馈,称AI对学生学习成效和教师工作质量的影响是灾难性的。一位家长讲述了自己女儿的数学老师布置AI生成的错误习题,当被指出后,老师居然以”AI不会出错”为由质疑家长的知识水平。还有评论担忧”失落的一代”——许多五十多岁的成年人已经无法独立思考问题,凡事都要”问AI”,其中包括教师本人。
也有一些更细致的声音:有人区分了”用AI替代作业”(应禁止)和”AI作为一对一辅导工具”(潜力巨大),认为后者配合恰当的硬件和监管反而可能极大提升教育成果。另有评论者认为问题的根源是学习动机的缺失而非AI本身,主张取消校外作业评分、回归课堂内的即时小测验和小组学习模式。少数评论者对美国立法机构无法做出类似决策表示遗憾。
4. 现代汽车完成对波士顿动力的全资收购
现代汽车集团预计于6月22日批准以3.25亿美元从软银手中收购波士顿动力剩余的9.65%股份,使其成为现代旗下的全资子公司。这笔交易源于2021年现代以约8.8亿美元收购80%股份时,软银保留的看跌期权(put option)。波士顿动力的股权流转颇为曲折:2013年被谷歌收购,2017年由Alphabet卖给软银,2021年现代获得控股权。
收购完成的实质意义在于部署路线图。2026年1月在拉斯维加斯CES展上,现代和波士顿动力公开展示了电动版Atlas人形机器人,其量产版本预计将于2028年开始在现代位于佐治亚州萨凡纳附近的电动车工厂工作。波士顿动力CEO Robert Playter表示,Atlas需要能在一两天内学会新的工厂任务,并达到99.9%的可靠性才能真正在车间发挥作用。现代Mobis已承担Atlas执行器的生产,意味着关键硬件供应链被纳入现代的工业体系。Atlas将从佐治亚Metaplant的零件序列任务起步,到2030年逐步承担更重、更复杂的操作。
软银退出波士顿动力是其更大AI基础设施战略的一部分。孙正义正在筹组Roze AI新公司,目标估值1000亿美元,专注于将AI和机器人应用于数据中心等物理基础设施建设。
HN讨论焦点之一是”为何选择人形机器人”。多位评论者质疑,专用机器人在工厂任务上几乎总是优于人形——人形并非完成大多数任务的最优形态。但反驳观点指出,南韩面临严重的人口结构挑战,预计到2040年劳动适龄人口将比2020年下降25%,到2065年累计下降约50%,这可能是现代集团乃至国家层面将通用人形机器人视为战略优先的原因。韩国本身已是全球制造业机器人密度最高的国家,2024年每万名员工对应1220台机器人,年增长率7%。
也有评论者指出,软银退出波士顿动力意味着这家公司的人形机器人将基本退出对外B2B/B2C市场,专供现代自用。还有人对当前人形机器人热潮表示怀疑——四轮机器人在受限环境中的导航问题尚未解决,让人形机器人进入家庭显然为时尚早。一些声音半开玩笑地认为,谷歌当年放弃波士顿动力可能是Sundar职业生涯最大的失误之一。
5. 研究者发现GitHub上1万个木马传播仓库
一位开发者偶然发现自己的GitHub项目被完整克隆——名称、描述、提交记录完全一致,自己被列为贡献者,但readme中被添加了一个指向zip压缩包的链接。zip包通过VirusTotal检测显示为木马,但链接本身能通过检测。这些恶意仓库每隔几小时就删除上一次提交并重新推送相同提交,仅修改readme中的链接。zip包通常包含四个文件:一个cmd启动脚本、一个exe加载器、一个伪装数据文件和lua51.dll。
作者向GitHub支持团队提交了删除请求,等待了两周毫无回应。直到一个多月后,GitHub才邮件通知已删除这两个仓库。意识到这可能不是孤例,作者编写了脚本利用gharchive服务(提供每日GitHub事件归档)分析最近5天的1600万次提交推送,筛选出每10小时被更新2到10次的约3000个仓库。经过多轮过滤参数调整,最终发现40000个频繁更新仓库中有1万个完全符合恶意模式,占比25%。这些仓库存在已达数月甚至超过一年,GitHub的自动检测系统未能识别。所有最后一次提交都以”Update README.md”命名。作者已在GitHub公开完整列表和探测脚本。
作者提出了几个开放问题:为何只克隆新仓库而非热门仓库?为何要每隔几小时删除并重推提交?GitHub为何无法自动检测此类模式?这场行动的真实规模是多少?
HN讨论中最具洞察力的观点是:这些恶意仓库并非针对人类开发者,而是针对AI编码代理。代理在为项目添加依赖时进行搜索,恶意仓库只需出现在一小部分搜索结果中,就有机会进入感染链。频繁的提交推送可能是为了在”最近更新”排序中占据靠前位置。另有评论者推测,2026年的选举周期(美国中期选举、巴西大选)可能是时间节点——窃取的可能是社交媒体账号(Facebook、Instagram、TikTok、WhatsApp),用于操纵舆论的僵尸账号。
多位开发者反映自己也遇到过类似情况:名下出现陌生仓库,或原仓库被注入恶意URL。有人讲述了《纽约杂志》报道的迪士尼工程师案例——下载GitHub上的AI工具时审查过代码看似合法,但其中暗藏木马,最终导致1Password凭证泄露。还有人提到2024年2月就向GitHub报告了一个明显的WHMCS破解版仓库,两年多过去仍未被处理,对GitHub的内容审核能力普遍持负面态度。
6. Valhalla项目:十年磨一剑,值类型终将登陆JDK 28
Oracle工程师Lois Foltan在6月15日确认,JEP 401(Value Classes and Objects)将合并入OpenJDK主仓库,目标在JDK 28中作为预览特性发布。该PR新增超过19.7万行代码,涉及1816个文件,规模之大以至于其他committer被要求暂缓大型提交。Brian Goetz提醒,这只是Valhalla的第一部分,“项目永远不会发布”的批评者将转向”他们没发布最关键部分”的新质疑。
Valhalla的口号是”像类一样编码,像int一样工作”。问题根源在于Java除8种原始类型外,所有都是引用类型。一个简单的Point对象,变量p实际是指针,对象本身在堆上散落,每次字段访问都需要指针间接寻址。每个对象有十多字节的头部元数据(Project Lilliput正在试图缩小这部分),加上分配、垃圾回收开销,百万级Point数组在实践中就是百万张指向百万个分散箱子的票据。Brian Goetz将这种内存布局称为”蓬松的”(fluffy)。
关键瓶颈是硬件演进:1995年内存访问成本与CPU运算相当,如今CPU比主存快两个数量级,靠缓存填补差距。CPU以64字节的缓存行读取内存,密集顺序排列的数据能一次性带来大量有用值;指针跳转则容易引发缓存未命中,慢上百倍。这就是引用局部性问题的核心。
虽然JVM的逃逸分析(escape analysis)能在某些条件下避免对象分配,但这种优化不可预测且脆弱——一旦对象进入数组或被存入其他类的字段,优化即失效。文章详述了Valhalla过去十年的演进:从最初激进的双重值/引用类型设计,到为了”简化用户心智模型”放弃二元对立,最终形成统一的value class概念,每个值类型对象可附带一个空标志位,但只有适合原子写入的小对象(如两个int或一个double)才能真正享受堆扁平化优化,更大的对象仍然以普通堆对象形式存在。
HN评论呈现明显分歧。批评者认为Java团队”为了简化用户心智模型”的妥协实际上削弱了类型系统能提供的可选保证——可空与非空的区分根本不复杂,反而是消除二元性后让性能上限受限。也有人指出文章中存在前后矛盾:“Point的8字节加上空标志位”的描述与之前”大于64位的对象无法堆扁平化”的限制冲突。
支持声音占据多数。多位评论者强调,2026年的Java/JVM平台已是”非常优秀的捕食者”,许多HN评论者对Java的认知停留在很多年前。有人将Java拟人化——前几年(Sun时期)被慈爱抚养,Oracle接手后被冷落,JDK 8之后才真正复苏,目前虽然在追赶C++、Rust的零成本抽象,但”一次编写到处运行”的核心承诺保留下来了。也有评论者期待看到C#、Swift、Java、Rust在追赶硬件特性方面的横向对比研究——它们之间显然存在交叉影响。
7. VocabOwl:一个测试英语词汇量的玩具,但科学性存疑
- 原文: https://vocabowl-870366514258.us-west1.run.app/
- HN: https://news.ycombinator.com/item?id=48598586
- 得分: 378
- 评论: 463
VocabOwl是一个号称基于”科学分层抽样”的英语词汇量测试工具,受The Rest Is Science播客(主持人Hannah Fry教授和Michael Stevens)启发,使用Gemini 3 Flash AI生成题目。测试声称英语共有171,476个常用词(来自牛津英语词典第二版),将其划分为5个难度等级:核心基础约3000词、中级约7000词、高级约10000词、专家级约25000词、生僻词40000+。用户通过100道四选一选择题,系统根据各等级正确率估算总词汇量。
HN讨论几乎一边倒地对其方法论提出质疑。一位语言学习领域的从业者指出,所有此类测试本质上依赖于词频列表,而词频列表又取决于语料库的选择。目前找不到一个能真正代表现代口语英语的语料库——大多数语料库严重偏向新闻文章和书籍,因此词频排名偏向学术、犯罪、地缘政治领域,而非日常口语。即便有合适的语料库,词汇使用也因年龄段和亚文化差异巨大,每隔几年就会变化。
另一位评论者指出该测试的数学有结构性错误——他100道题全对,结果只估算出他知道85000个词(约一半总数)。问题在于:网站将”分层抽样”理解为”在每个分层中答对的百分比 × 该分层总词数”。但如果用户在最高难度档(40000生僻词)中也全部答对,按其逻辑也只能估算为40000词,无法超出该档上限。
评论者还指出多个题目设计问题:100题太多,前面简单词过于乏味,未到有趣的难词就已感到疲倦;用户反馈应支持”我不知道”选项,否则4选1意味着至少25%的瞎猜准确率,对真不会的词不公平;提交按钮需要点击两次,严重打断节奏。
题目本身的难度分级也被广泛批评:“metamorphosis”和”kinetic”被标为专家级(小学生学蝴蝶变态发育、高中生学动能时就接触过),而”Hippopotomonstrosesquippedaliophobia”(恐长词症)这种字典里随手翻到的玩笑词被作为正式测试词。还有用户发现题目模式可以”刷题策略”破解——四个选项中通常一个是正确答案、一个是其反义词、另两个是无关词,只需排除有反义关系的对立项即可大大提高命中率。
8. Ubiquiti 推出基于 ZFS 的企业级 NAS
- 原文: https://blog.ui.com/article/introducing-enterprise-nas
- HN: https://news.ycombinator.com/item?id=48585866
- 得分: 409
- 评论: 345
Ubiquiti 发布了名为 ENAS 的企业级网络存储产品,售价 3999 美元,定位为不依赖授权费用的本地存储平台。硬件配置包括 8 核 ARM Neoverse N2 处理器、64GB ECC 内存、16 个硬盘位(可扩展至 1PB 以上原始容量)、双 25Gbps SFP28 端口和冗余电源。软件层面采用 ZFS 作为底层存储架构,支持可选的 M.2 NVMe L2ARC 缓存,并集成在 UniFi 平台中进行集中管理。
产品宣称无许可费用、无固件层面的硬盘型号限制,强调”无厂商锁定”。功能涵盖与现有身份提供商集成的基于角色的访问控制、多站点备份编排(可备份到另一台 ENAS、rsync 服务器或云端,也支持 Microsoft 365 数据备份),以及通过 UniFi Drive 提供的原生 iSCSI 共享块存储,兼容 Proxmox、VMware 和 Hyper-V 集群环境。
HN 评论呈现明显分化。支持者赞赏 Ubiquiti 不采用月度订阅模式(MRR),并称其对 15 年前的 EdgeRouter 仍提供安全更新;ZFS 的引入也获得肯定,因为它具备容错与高效增量备份能力。但批评声音同样强烈:多位评论者质疑 Ubiquiti 的软件质量与安全记录,列举了其历史上的多起事故,包括员工访问 AWS 根密钥、“端到端加密”宣传与实际仅为 TLS 传输不符、配置错误导致用户可访问他人摄像头画面等问题。
价格方面也存在争议。有评论者指出,二手 Supermicro CSE-846 机箱加 X10 时代主板组合的成本约为 ENAS 的四分之一,且能提供更多硬盘位,配合 TrueNAS 即可获得良好体验。另有用户分享了 ZFS 在机械硬盘下难以跑满高速网络链路的经验,最终改用 NVMe 才解决性能瓶颈,质疑 ENAS 用旋转盘是否真能饱和双 25Gbps 接口。还有评论者关注产品控制器是否冗余、是基于 BSD 还是 Debian 加 ZFSoL,以及 8 核 64GB 配置在启用去重等 ZFS 高级功能时是否够用。
9. ATProto 中不存在”实例”概念
React 核心开发者 Dan Abramov 撰文解释 ATProto(Bluesky 底层协议)与 Mastodon/ActivityPub 在去中心化架构上的根本差异。每次 ATProto 相关帖子出现在 HN 时,总有人问”Bluesky 的实例在哪里”,作者认为这是范畴错误——ATProto 中根本不存在实例。
文章用三个阶段的演进图解释。RSS 时代,博客是自主托管的内容源,Google Reader、Feedly 等聚合器只是博客圈的”投影”,托管与聚合是分离的。传统社交媒体(如 Facebook)则将托管与应用捆绑进一个封闭盒子。Mastodon 的去中心化方案是制造许多”小 Facebook”实例,每个实例既托管数据又提供应用界面,实例之间通过联邦协议互相转发内容。这种架构带来若干限制:用户身份与实例绑定(如 alice@instance1.com)、实例管理员之间的争端可能导致”取消联邦”、实例下线意味着用户身份消失,且实例间通信复杂度为 O(n²)。
ATProto 则回归 RSS 模式:托管(Personal Data Server)与聚合(AppView)在网络层就被分离。任何应用都是整个”Atmosphere”的投影,用户可以自由更换托管服务(作者本人将数据迁移到了 Eurosky),也可以构建全新应用。去中心化的方式不再是”多份相同应用的副本”,而是托管与应用各自独立演化。
HN 讨论中出现大量反驳声音。有人认为作者刻意曲解”实例”概念以贬低 ActivityPub,回避了 ATProto 自身的关键技术问题,比如 Relay 运行成本高昂、AppView 严重依赖 Relay 才能可用。有评论者指出 PDS 在功能上与”实例”差异不大——账户绑定单一 PDS,DID 指向 PDS,写入流向 PDS,这更接近客户端/服务器架构而非真正的 P2P。另有观点认为 ATProto 牺牲了真正的去中心化以换取一致性,而 ActivityPub 走的是相反路线——运行 AP 节点对普通自托管者比运行 ATProto 的内容 Relay 容易得多。还有评论者警告将 Google Reader 作为类比并不吉利——它一度统一了 RSS 社区并构建了社交图谱,但因高管决策关停而几乎摧毁了整个生态。也有人质疑 Bluesky 公司目前实际上托管了绝大部分用户数据和运行主应用,协议层面的去中心化与实践中的中心化之间存在落差。
10. Google Workspace 警告 Firefox 用户必须切换到 Chrome
2026 年 6 月 18 日,一位 Google Workspace Business Plus 账户的管理员发现,使用最新版 Firefox 访问时弹出警告页面,提示”为保护数据安全,请确保设备满足组织的安全要求”,并要求下载 Chrome 浏览器以”安全访问应用”。警告页面来自 access.workspace.google.com/remediate 域名。
作者向 Google 客服求助,得到的反馈反复转接且毫无实质内容。客服后续致电声称该警告”仅针对访问 admin.google.com 的管理员,并非阻断访问,只是建议”,并表示不会公开记录此行为。Google 后续邮件回复罗列了 Workspace 支持的浏览器(Chrome、Firefox、Safari、Edge),但未解释为何要在 Firefox 上显示该警告,也未回答管理员在电话中提出的任何具体问题。作者明确表示自己作为管理员,没有启用过 IAP(Identity Aware Proxy),也未配置仅限企业版的”上下文感知访问”功能。
HN 讨论中,最高赞评论指出这其实是 Google 的 Context-Aware Access 产品的功能,由 Workspace 管理员自行配置,矛头应指向作者自己公司的 IT 或信息安全团队。但作者在评论区澄清:他本人就是管理员,没有配置 IAP,且 Context-Aware Access 是仅企业版功能,而他用的是 Business Plus 版本。
其他评论关注更宏观的议题。有人批评这是网站开发者重回浏览器嗅探时代的恶习——应当采用特性检测而非 UA 检测;Firefox 至今仍维护着 UA 覆盖列表以应对部分网站的过时检测逻辑。也有用户分享了在 GCP “Agent Studio - Build” 中遇到神秘错误,工程师和客服均无法解决,最终绝望中切换到 Chrome 才正常工作的经历。一些人将此视为垄断信号,认为 Alphabet 历来通过缓慢、看似”专业”的步骤推进改变以避免引发反弹。还有评论者主张彻底摆脱 Google 生态,列出了 Proton/iCloud 邮件、DuckDuckGo 搜索、Firefox + uBlock Origin 的替代方案。
11. DuckDB 内部原理(第一部分):为什么如此之快
- 原文: https://www.greybeam.ai/blog/duckdb-internals-part-1
- HN: https://news.ycombinator.com/item?id=48553388
- 得分: 452
- 评论: 139
Greybeam 团队发布了 DuckDB 内部原理三部曲的第一篇,深入剖析这个 2019 年从阿姆斯特丹 CWI 研究项目起步、现已成为过去十年应用最广分析数据库之一的引擎。DuckDB 出现在 Notebook、ETL 管道、CI 测试、SaaS 内嵌分析等场景中,甚至有人在装满干冰的盒子里用 iPhone 跑出了 TPC-H SF100 的成绩。MotherDuck、Hex、Omni、Evidence、Fivetran 的 Managed Data Lake、Rill 等多个商业产品都基于 DuckDB 构建。
文章列出 DuckDB 速度优势的几个关键设计:进程内执行、列式压缩存储配合 zonemap、向量化执行、morsel 驱动的并行、基于乐观 MVCC 的快照隔离等。本篇重点讲解前两项。
进程内执行避开了传统数据库客户端协议的两大瓶颈。2017 年 Mark Raasveldt 与 Hannes Mühleisen 的论文《Don’t Hold My Data Hostage》指出,ODBC/JDBC 等逐行逐值的客户端协议往往是整个查询中最慢的环节——千兆以太网约 125 MB/s 的带宽上限会让大结果集的传输时间超过计算时间;ODBC/JDBC 按字段调用函数,1 亿行结果意味着上亿次函数调用,每次都涉及内存拷贝、类型检查、字符串分配。DuckDB 作为库直接加载进客户端进程后,可通过”replacement scan”机制让 SQL 直接读取 Pandas DataFrame 的底层缓冲区,理想情况下实现零拷贝(实际是否真零拷贝取决于列类型与内存布局是否对齐)。Apache Arrow 因其本身就是为系统间共享而设计的列式内存格式,是这种方案最干净的表达。
HN 评论中 DuckDB 收获大量赞誉。有用户在工作中每天处理 TB 级数据,称其为”游戏改变者”;产品经理用它在浏览器 Playground 中查询 2 亿行表,复杂查询通常 5 秒内返回结果;有团队用 DuckDB 分析公司所有工程师的 Claude Code 会话以发现开发体验缺口。也有冷静声音:有评论者指出 HN 上每隔几周就出现 DuckDB 帖子,评论几乎都在重复”快”——但 DuckDB 仅在特定工作负载下快,其他场景下比 SQLite 慢一个数量级以上,且 SQL 支持仍有限制(如递归查询)。另有用户提醒,DuckDB 难以静态链接扩展,在 App Store 等不允许动态链接的场景下不是好选择,而 Arrow CPP 构建可移植性更好。还有人推荐其在数据迁移、PostgreSQL/MySQL 表互转中的便利性。
12. W Social 与欧洲数字主权的”剧场化”表演
Elena Rossini 持续关注 W Social——一个声称是欧洲版 X 替代品的 Bluesky 分支平台,由瑞典创业者运营,主打身份验证打击机器人和虚假信息、数据托管于欧洲。本文聚焦该平台公测前的若干争议性发展。
2026 年 6 月 12 日,作者发现欧盟委员会、其主席 Ursula von der Leyen、欧洲央行及其行长 Christine Lagarde 的 ATProto 账户从 Bluesky PBC 迁移到了 W Social 的服务器。作者对此感到震惊,因为 W Social 是一家私营营利公司,启动过程混乱,且对其技术栈不透明。而欧洲已存在另一个 ATProto 社交网络 Eurosky——由非营利基金会 Modal 运营,完全开放透明地构建,并已实现 did:plc 目录镜像、欧洲基础设施上的 firehose,甚至推出了完整替代 Bluesky 应用的 mu.social。
紧接着另一条线索揭示,W Social 撤下了原本公开的 GitHub 仓库(archive.org 仍可看到 2026 年 3 月初的状态)。这意味着欧盟委员会的数据从开源平台(Bluesky)迁移到了闭源平台。这一举动恰好发生在欧盟委员会宣布”科技主权一揽子计划”一周之后,加深了”主权表演”的讽刺意味。
文章解释了 ATProto 真正的主权要求:需要自营 PDS(个人数据服务器,相对容易)、Relay(聚合消息流,资源密集)、AppView(索引与搜索)、moderation 服务、PLC(公钥基础设施)。自营 PDS 容易,其余组件则需要大量资源与技术积累。W Social 在路线图与是否仍依赖 Bluesky PBC 基础设施方面缺乏沟通。
HN 评论中,许多人质疑 W Social 自首次广告以来就显得可疑,有用户已轻松创建 6 个不同身份账户,证伪了其”身份验证防机器人”的核心卖点。多条评论将 W Social 类比为”欧洲版 Truth Social”——主要吸引的是不愿依赖政治对手平台的欧盟政客。一篇被推荐的博文标题即为”W Social 是带欧洲口音的 Truth Social”。还有人质疑欧洲在公司命名上能力堪忧、运营方主要是金融背景而非长期社交平台经验、未来必然走向广告+付费功能的盈利模式。也有评论批评”主权”在这类项目中常沦为保护主义遮羞布或承包公共资金的话术。
13. EFF 呼吁法院记录应免费开放
电子前沿基金会发文呼吁联邦法院电子记录公共访问系统 PACER 应免费开放。当前 PACER 对法院文档的检索和查看收取高额费用,每页约 1 美元,成为公众尤其是低收入群体了解法院工作、新闻调查、学术研究的障碍。EFF 强调法院记录属于公众,公众不应为阅读法律本身付费。
PACER 长期受到批评,其老化的系统也屡遭抱怨。已有立法提案试图用现代化、统一的平台替代 PACER 和 CM/ECF 系统,承诺改善公众访问、增强网络安全并降低长期成本。
HN 评论提供了多个相关补充信息。一条高赞评论指出,虽然访问 PACER 需付费,但联邦法院记录并不受版权保护,一旦获取即可自由再分发——这正是 RECAP 等项目能够存在的法律基础。RECAP 程序会自动将用户从 PACER 购买的任何文档加入 CourtListener 数据库,供他人免费查阅,弥补了制度缺陷。
另一种视角将此议题与公共政策中的”无免费午餐”困境相提并论。一位评论者以自己城市强制更换含铅自来水管为例:市政府承担主干管而房主需自费更换户内最后一段,居民普遍反对——但若由市政统一承担,资金最终来自房产税,反而构成对房主的累退性补贴。
实践层面也有案例。有评论者透露在爱达荷州被起诉时,州法院每页查阅费高达 10 美元,远超联邦 PACER 的标准。CourtListener 和 RECAP 项目在当下填补了关键的访问缺口。一些评论上溯到《汉谟拉比法典》的传统:既然民众被法律约束,就必须能够阅读法律;这些判决就是法律本身。也有评论者从更宏观角度指出,金钱成本是政府限制公民行使权利的众多手段之一。
14. 美参议院提出 JAWBONE 法案:限制政府向平台施压审查言论
参议员 Ted Cruz(共和党)与 Ron Wyden(民主党)联合提出《针对武器化官僚机构干预网络表达的司法救济法》(JAWBONE Act)。这项两党合作的法案将赋予公民在联邦法院对政府官员提起诉讼的权利,针对那些胁迫或试图胁迫广播机构、互联网服务、AI 提供商对受第一修正案保护的合法言论采取行动的官员;同时建立政府与上述中介机构关于用户言论沟通的透明度制度。
“Jawboning”指政府向私营公司施压删除受宪法保护的言论。EFF 表示赞赏立法者关注此议题,并强调其严重性——这与代表政府秘密监视公民通讯一样构成对言论自由的威胁。EFF 援引自身正在代理的 ICEBlock 案:2025 年 6 月起,高级联邦官员威胁调查 ICEBlock(一款让公众报告移民执法活动的应用)的创建者 Joshua Aaron;2025 年 10 月,美国司法部长要求 Apple 从 App Store 下架该应用,Apple 照办。EFF 已就此提起诉讼,并通过 FOIA 诉讼要求公开政府与 Apple、Google、Meta 的相关通讯记录。
文章同时指出该议题的复杂性。并非所有政府与平台之间的沟通都构成违宪胁迫——将所有此类通讯一概视为违宪会扼杀有助于维护更健康、安全互联网的善意合作。EFF 重申一项重要立场:社交媒体平台等中介本身享有第一修正案权利,可自主决定如何审核用户言论,它们并非”国家行为者”,无义务允许所有用户言论。最高法院在 NetChoice 案中已再次确认这点。
HN 评论态度复杂。有评论者赞赏法案名缩写设计(JAWBONE 既是法案缩写也是政府施压的俗称)。有人指出 EFF 与 ACLU 均支持该法案,提醒读者注意法案系两党合作而非单纯党派议题。但也有评论质疑动机——Ted Cruz 曾推动德州法律要求政府承包商承诺不抵制以色列(全美已有 35 个州有类似法律),这本身即对言论自由构成限制,让人怀疑其立场一致性。
另一组评论触及更深层张力。一位评论者列举六点矛盾:大型社交媒体公司不得不就言论作出决策;传统言论自由理念形成于出版控制刚起步的年代;作为企业其义务是服务股东、驱动用户参与;人类对某些刺激反应更强烈;2026 年内容审核仍由价值观驱动;平台按激励机制必然营造尽可能成瘾的环境。还有评论者以疫苗虚假信息为例,质疑”政府施压”如何精确定义——若政府敦促社交媒体控制致命疾病相关虚假信息的传播,是否也应被定为非法。Bill Gates 在 Oprah 节目中承认当初对互联网”让人更接近事实”的想法过于天真,人们会主动寻找符合阴谋论倾向的信息。
15. Doom、德军总部和毁灭公爵作曲家 Bobby Prince 辞世
讣告宣布,Robert “Bobby” Caskin Prince III 于 2026 年 6 月 16 日离世,享年 81 岁。Prince 1945 年生于印第安纳州麦迪逊,在乔治亚州雅典长大,曾在越战期间作为美军排长服役,退役后先后从事过咨询和法律工作,最终成为电子游戏行业的先驱作曲家和音效设计师。
Prince 为多款标志性 FPS 游戏创作了配乐和音效,包括 Doom、Doom II、Wolfenstein 3D、Rise of the Triad 和 Duke Nukem 3D。他的作品帮助确立了电子游戏音乐作为受人尊敬的艺术形式的地位。2006 年,电子游戏行业授予他终身成就奖;2026 年,初代 Doom 的原声带被美国国会图书馆选入国家录音登记处保存,成为美国文化遗产的一部分。
讣告还提及他 2005 年与 Connie Freeman 结婚,两人在田纳西州 Pigeon Forge 共同生活了 21 年,并合作创作音乐。除了职业成就外,亲友更看重的是他的善良、幽默、谦逊和创造力。
HN 评论区充满了对这位传奇人物的追忆。多位用户表示 Doom 的音乐在游戏沉浸感中扮演了与画面和音效同等重要的角色,营造了独特的氛围。有评论者回忆,由于 Macintosh 版 Doom 附带了 .mid 文件,他们童年时会反复聆听这些音乐;后来接触到 Pantera、Slayer、Judas Priest 等金属乐队时,才恍然发现 Prince 的创作中对这些乐队作品的致敬与变奏。一位用户指出,Doom 中标志性曲目 “At Doom’s Gate” 在他脑海中萦绕了数十年。还有评论者特别提到 Duke Nukem 3D 中 Prince 的作品比 Lee Jackson 的更为阴郁,为游戏增添了独特的氛围感。一位音乐教师表示,多年来一直在课堂上向学生介绍 Prince 的作品作为游戏音效设计的典范。社区普遍对这位塑造了一代游戏听觉记忆的作曲家表达了深切悼念。
16. ClickHouse 开源十周年:从 Yandex 内部工具到主流分析数据库
- 原文: https://clickhouse.com/blog/open-source-10
- HN: https://news.ycombinator.com/item?id=48546890
- 得分: 306
- 评论: 88
2026 年 6 月 15 日是 ClickHouse 开源十周年。作者 Alexey Milovidov 撰文回顾了这一项目的发展历程,目前 ClickHouse 已成为最受欢迎的开源分析数据库,拥有超过 2000 名贡献者。
文章首先定义了”开源”的不同层级:仅公开代码(如 Doom、MS-DOS 的存档式发布)、公开仓库但不接受贡献(如 SQLite、Ladybird)、接受贡献但开发过程不透明,以及最高级别——拥有公开贡献指南、任务追踪、代码评审系统、路线图、CI 测试系统、发布周期、用户支持和文档。作者表示 ClickHouse 始终瞄准最高层级,希望它成为构建优秀数据库、学习 C++ 开发和进行数据结构与性能实验的最佳范例。
ClickHouse 的起源可追溯至 2009 年。当时作者在为类似 Google Analytics 的网页分析系统处理数据,面对数据量持续增长的压力,他在 MySQL、Hadoop、TokuDB、LMDB 等方案之间不断尝试。在探索列式数据库时,他测试了 Infobright、InfiniDB、Vertica、MonetDB、LucidDB 等方案,但都无法满足每天加载 1000 亿行、500 列的需求。于是他自行实现了一个名为 OLAPServer 的简单原型——按列、按天、按网站存储二进制文件,配合轻量级压缩,并通过 XML 查询接口提供聚合能力。这个原型在 2009 年 1 月部署后取得了成功,最终演化为 ClickHouse。
HN 讨论中,多位开发者分享了迁移到 ClickHouse 的经历。一位评论者在 2017-18 年用 ClickHouse 替代 Elasticsearch 的 PoC 中获得了 5 倍的存储和 QPS 提升,但管理层以”俄罗斯人做的不知名数据库”为由拒绝采用,让他错失了早期机会。Cloud 66 的工程师讲述了他们的指标和自动扩缩容引擎从 Redis、Cassandra、自研 Ruby+RabbitMQ、Go+RabbitMQ 一路演进,最终在 ClickHouse 上稳定运行四年的故事。另有用户将其数据仓库从 Druid+Postgres+Trino 简化为单个 ClickHouse 节点,并对其内置的 S3、Postgres 连接器赞不绝口。也有评论者好奇文章未提及主要竞争对手 DuckDB,以及对作者刻意回避提及该项目源自 Yandex 表示遗憾。
17. MCP 推出企业级零接触 OAuth 授权扩展
模型上下文协议(MCP)官方博客宣布企业管理授权(Enterprise-Managed Authorization, EMA)扩展正式稳定。该扩展允许企业通过受信任的身份提供商集中管理 MCP 服务器访问权限,终端用户只需一次登录即可访问所有已连接的 MCP 服务器,无需逐个进行 OAuth 配置。Anthropic、Microsoft、Okta 以及不断增加的 MCP 服务器正在采用此扩展。
文章指出,标准 MCP 授权模型最初为面向消费者的场景设计,每个用户需要单独授权每台服务器。这种模式在企业环境中存在三个主要痛点:员工入职时需要手动连接一个个服务、安全团队无法强制执行统一策略和审计、个人账户与工作账户容易混淆。
EMA 的核心机制是将组织的身份提供商(IdP)作为 MCP 服务器访问的权威决策者。在 SSO 过程中,客户端从 IdP 获取 Identity Assertion JWT Authorization Grant(ID-JAG),并用它向 MCP 服务器的授权服务器交换访问令牌,用户无需经过任何按服务器的同意界面。这带来三个特性:管理员一次授权所有用户自动继承(按用户所属组和角色限定范围)、所有连接器的访问决策在 IdP 管理控制台中集中管理和审计、通过消除交互式账户选择步骤防止个人和企业账户数据意外混合。
早期采用者方面,Okta 是首个支持的身份提供商,采用其 Cross App Access(XAA)协议;Anthropic 已在 Claude、Claude Code 和 Cowork 共享的 MCP 层中实现该扩展;VS Code 也已支持。Asana、Atlassian、Canva、Figma、Granola、Linear 和 Supabase 等服务器已支持 EMA,Slack 等正在添加支持。
HN 讨论焦点多样。一位评论者认为,相较于 Skills/CLI,MCP 的真正价值正在于将授权流程隔离在 Agent 上下文窗口之外,理想形态可能就是一个 API 的授权网关。另有评论者指出 ID-JAG 是一种新型令牌格式,并非 MCP 专属,可用于任何 SSO 共享应用之间的数据共享。一位开发者抱怨在为 MCP 服务器集成 Microsoft Entra ID 认证时遇到困难:因 Entra 不支持动态客户端注册,难以处理客户端自动生成的 client_id 与 Entra 应用注册之间的匹配问题。也有评论者表示该方案在企业环境中合理,但对 IdP 代表用户委托访问权限而用户感知较弱的设计感到不太适应。Atlassian 和 Anthropic 的工程师也在评论区现身,介绍了实施经验和未来迭代方向。
18. 禅与机器学习研究之道
作者撰文探讨了如何成为 AI 研究者,将研究过程类比为禅修。文章核心观点是:成为研究者需要结合阅读学习与动手构建两个方面,缺一不可。
作者引用一句禅语”找到洞见的日子,我们静坐;找不到洞见的日子,我们也静坐”,指出科研洞见看似随机出现,大多数日子都不会到来,成功的关键是持续投入时间和努力。作者还引用 Noam Shazeer 在 SwiGLU 论文中”将其成功归于神之眷顾”的幽默说法。一个相关观点是”读论文也可能过量”——解决问题的可靠路径是先尝试自己的方案,遇到瓶颈再去查阅文献。
关于选题,作者建议初学者不必过分纠结具体方向,但要警惕流行不到六个月的话题。AI 领域基础概念四十年未变,与其追逐 2026 年的 harness、agent、context engineering 等概念,不如回归基础:理解交叉熵、SVD、策略梯度等。作者还强调,如果研究项目的最佳结果只是在现有基准上得分更高,则深度不够。
文章引用铃木俊隆”初心之中蕴含诸多可能,老成之心则少有”,指出在 AI 领域经验有时反而是负担。OpenAI 技术决策者大多在 35 岁以下,许多 ChatGPT 关键决策者不到 30 岁,这说明在新兴领域没人拥有巨大优势。作者还强调灵感来自意外时刻——苯环结构来自梦境、Ozempic 源自希拉毒蜥的毒液——做研究必须做研究以外的事,许多顿悟时刻发生在散步途中。
对待实验结果,作者主张”实验平等心”:实验成功是好的,失败也是好的,两者提供同等信息量;事实上从一连串负面结果中往往能学到更多。同时要对过于美好的结果保持极度怀疑,因为大多数好结果都源于 bug。最后引用”开悟前砍柴挑水,开悟后砍柴挑水”,指出成功项目背后都有数百小时的繁重劳作,如 Karpathy 手工标注 ImageNet、SWEBench 创建者的细致工作。
HN 讨论颇为丰富。一位东亚读者指出西方语境中的”禅”(受《禅与摩托车维修艺术》影响)强调平等心和初心,更接近自我训练;而东亚禅宗实际更强调无目的性、放下自我、与自然同流,反而古罗马斯多葛主义更接近东亚禅意。另一位评论者分享了管理后端和 ML 工程师的观察:不同人需要看到成功信号的频率不同,ML 项目反馈周期长达两个月,这决定了谁适合做 ML。也有评论者认为文章过度强调”深入基础”——过去十年深度学习的进展大多来自渐进的实验性实践而非根本性思想突破,AlexNet 和 Transformer 都是对既有思想的提炼。还有评论者借淘金热类比指出,许多 AI 英雄不过是恰好早期靠近 TPU/GPU 资源的人。
19. Ask HN:内存短缺会让程序员写出更高效的代码吗
- 原文: https://news.ycombinator.com/item?id=48604232
- HN: https://news.ycombinator.com/item?id=48604232
- 得分: 113
- 评论: 190
一位 HN 用户发起讨论:在当前内存供应紧张的背景下,程序员是否会写出更节省资源的代码?这个问题引发了关于软件膨胀根源和开发者激励机制的广泛讨论。
多数评论者持悲观看法。一位评论者指出两个核心原因:开发者通常假设自己的程序是机器上唯一运行的东西,且开发机器总比用户机器更强大;软件膨胀往往不是因为缺乏高级数据结构和算法,而是因为程序由大型团队交付,多个子模块即使不需要也会被加载,“做对”在架构上代价高昂——保持现状反而能降低复杂度并减少跨团队修改引入的脆弱性。
不过也有正面案例。一位开发者讲述了将加密网状网络库移植到仅有 520 KiB RAM 的 ESP32 的经历——最初看似不可能,但去除不必要的大缓冲区后顺利完成,还为应用留下了充足空间。他建议想优化代码的开发者实际找一台资源受限的计算机测试代码。另一位在大型科技公司工作的评论者透露,他们公司明年的主要目标之一就是优化服务器代码以减少 RAM 需求,这正是对内存紧张的直接回应——但预计大多数优化来自”别再做蠢事”而非”使用高级算法”。
游戏行业评论者提供了独特视角:3A 游戏开发者表示,主机平台的硬件限制实际上推动了优化,让 PC 玩家也受益;电商领域也有”每 100ms 延迟损失 10% 转化率”的明确指标驱动优化。这说明只要有明确的硬件目标和性能指标,开发者就有能力优化。
一位老牌开发者感叹,过去如果代码不够高效就根本跑不起来,年轻开发者从未经历过这种约束,且我们仍处在 GB 时代,不会回到字节和周期计数的年代。
也有评论者用 Rust、Zig、Haskell 实现相同工具对比体积(Rust 450KB vs Haskell 30MB),指出今天的技术完全能让 99.8% 应用控制在 50MB 内(4K 帧未压缩约 40MB,再加 8 万行文本),但没人在乎——除非每 1MB 都要付费,否则内存价格上涨 100% 也不会改变什么。
讨论的核心结论是:是否写高效代码本质上是产品负责人的商业决策——以前是用硬件成本换上市时间,现在可能反过来。但只有在有明确财务激励和硬件目标时,才会真正发生改变。
20. 阿尔伯塔省如何根除老鼠:一场持续 75 年的边境防御战
- 原文: https://worksinprogress.co/issue/albertas-war-on-rats/
- HN: https://news.ycombinator.com/item?id=48584709
- 得分: 195
- 评论: 132
文章讲述了加拿大阿尔伯塔省如何成为全球罕见的无鼠地区。在全球老鼠分布地图上,阿尔伯塔是一片空白——这个拥有近 500 万人口、两座百万级城市的省份,已经保持无鼠状态超过 70 年,是除南极洲外地球上最大的无鼠区域。
挪威鼠(Rattus norvegicus)并非美洲原生物种,而是约 1775 年随欧洲船只抵达。它体型更大、更适应寒冷气候,迅速取代了早先到达的黑鼠。从 1920 年代起,挪威鼠以每年约 24 公里的速度沿萨斯喀彻温省向西推进,搭载汽车、卡车、火车等人类交通工具传播。1950 年,阿尔伯塔卫生部门在调查啮齿动物鼠疫时,在东部边境一处农场发现了挪威鼠,省政府随即宣布紧急状态。
农业部作物保护主管 William Lobay 提出了”鼠害控制区”的关键策略:与其试图在全省范围管理老鼠,不如集中力量在最可能被入侵的边境地带。由于蒙大拿州人口过少、西北地区过冷、不列颠哥伦比亚边境多山,老鼠只能从萨斯喀彻温进入。1950 年底,约 600 公里长、29 公里宽的鼠害控制区沿东部边境设立。1951 年秋,180 公里边境上发现 30 处鼠患;1952 年扩展到 270 公里。但由于阿尔伯塔-萨斯喀彻温边境上农场、粮仓、城镇间距足够大,中间的开阔草原对小群老鼠生存不利,自然扩散被有效遏制。
文章还提到一个令人印象深刻的细节:为证明华法林(warfarin)灭鼠剂的安全性,一位害虫防治官员在地方会议上现场食用涂有华法林的燕麦片。
HN 讨论亮点纷呈。许多评论者推荐了喜剧演员 Joe Pera 关于此事的视频片段,甚至有一个关于此事的音乐剧。也有人提到电影《料理鼠王》的特别花絮里有相关游戏序列。一位评论者纠正了原文的一个时间错误:文中提到”一位市长拒绝合作,认为该项目是统一保守党的烟雾弹”——但统一保守党 2017 年才成立,与当年控制阿尔伯塔议会的社会信用党无关。还有评论者将其与新西兰”Predator Free 2050”计划(目标消灭老鼠、负鼠和白鼬)进行对比。一位本地居民补充说,阿尔伯塔地鼠(gophers)数量仍然很多,虽然外表可爱但同样携带疾病。一位评论者俏皮地说:“但愿我们停止根除郊狼,也许处理老鼠会更容易——我宁愿见郊狼也不愿见老鼠。“另一位调侃作者姓 Mousa(音同 mouse),怀疑这是”大老鼠”赞助的文章。
文章的深层启示在于强调日常维护的重要性:阿尔伯塔的鼠害控制项目是一场永无止境的对新入侵的反击,一旦松懈,无鼠状态将永远失去。