制造之巅——光刻机:人类工业皇冠上的终极明珠

如果说芯片是信息时代的钻石,那么能雕刻这颗钻石的“刻刀”——极紫外光刻机,则是人类工程学巅峰的产物。它价值数亿美元,重达180吨,包含超过10万个零件,需要40个集装箱运输,其内部是比外太空还要真空的环境。

 

 

光刻的原理,如同用光来“冲印照片”。但到了7纳米、5纳米乃至更先进的工艺,所用的“光”是波长仅13.5纳米的极紫外光。产生这种光,需要用激光以每秒5万次的频率轰击下落的高速锡滴,将其变成等离子体发光。而引导这种光的镜头和反射镜,其表面平整度误差需小于一个原子的大小。

全球仅有荷兰ASML一家公司能够生产最先进的EUV光刻机。它不仅是荷兰的骄傲,更是全球化的终极产物:其光源来自美国,光学系统来自德国,轴承来自瑞典,软件来自全球……它证明了没有任何一个国家能完全独立掌握芯片制造的全链条。

光刻机的故事,揭示了尖端芯片制造的极高壁垒:它融合了顶尖的光学、精密机械、材料科学、软件和控制技术,需要天文数字的研发投入和长期的生态协作。一台光刻机,就是一座移动的、浓缩的人类尖端科技博物馆。它守护着半导体产业最核心的圣殿,也划定了技术主权竞争的疆界。

小米AI智能眼镜可以期待点什么?

据某行业媒体报道,小米可能会在6月26日正式发布AI智能眼镜,和Redmi K80至尊版以及小米Yu7一起发布。

AI 眼镜这个品类在去年(2024 年)在国内根本没有多少人知道,全球也就是一款Ray-Ban Meta,国内目前雷声大雨点小,还没有真正能撬动大众市场的产品。但是跟其他品类相比,AI 眼镜无疑是今年最值得关注的消费电子新品类,正因为目前的市场规模小,因此大家才觉得增长潜力巨大。业内认可的预测,2025年全球AI眼镜销量可能达到350万副。

 

 

RayBanMeta 是 Meta(科技巨头)与雷朋(隶属全球眼镜巨头EssilorLuxottica)合作推出的智能眼镜,融合时尚设计与科技,涵盖拍摄、通话、音频娱乐及AI 交互等功能;在 AI 智能眼镜领域地位领先,2024 年全球销量占比超 96%,主导市场,随智能眼镜市场规模增长持续扩张;技术上集成Meta Llama 大模型,实现物体识别、实时翻译等AI 应用,配备 1200 万像素摄像头、五麦克风阵列等硬件,还规划 HUD技术及AR功能拓展,推动行业向AI深度赋能方向发展。

这次CES2025 科技春晚上,全球多家消费电子厂商发布自有 AI 眼镜产品,推动 AI眼镜的市场关注度持续提升,有所耳闻的包括且不止于:雷鸟V3、联想Lecoo斗战者G1、雷神AI智能眼镜、Rokid Glasses等,接下来预计将会发布智能眼镜的还有字节跳动(预计 2025 年 8 月)、Meta(预计 2025 年 9 月)、三星(预计 2025年 9 月)、魅族(预计 2025 年 9 月)。

以往的米家眼镜,其核心是“音频”。即使可以连接手机使用各种AI应用,本质上也就是个“眼镜形态的蓝牙耳机”。这次的小米AI眼镜就完全不同,将是一款集摄影录像、AI语音交互、音频播放等核心功能的“全功能AI眼镜”。

AI 大模型给眼镜这个品类注入了全新的「卖点」,无论是第一人称拍摄、AI 翻译,还是基于大模型的 AI 语音助手,AI 眼镜至少在功能认知上要比之前智能眼镜好讲故事,也更容易让消费者理解其价值。

按照目前的爆料,小米 AI 智能眼镜将采用高通骁龙 AR1 Gen 1 + 恒玄 2700 的双芯组合,前者支撑影像,后者(本身是耳机芯片)支撑音频。简单来说,小米的思路是用恒玄 2700 实现日常基础运行,从而降低功耗,同时基于骁龙 AR1 实现更好的影像能力,保证 AI 视觉和影像方面的表现。

AI眼镜在使用体验和技术上要能够真正赢得市场,需要有几个核心的“东风”支持:

1.技术拐点:4nm制程芯片量产(如高通AR1Gen2)、光波导显示技术成熟(FOV提升至70度)、MicroLED成本下降,推动产品轻量化(50g以下)与功能集成(语音交互、物体识别、AR导航)、续航能力提升至8小时以上;

2.场景渗透:从听力辅助、工业巡检向消费级场景扩张,覆盖智能助理、即时翻译、运动健康等领域,成为“第一视角”交互终端;

3.价格下探:Meta产品降至299美元,国内厂商闪极、雷鸟定价进入1500元区间,小米新品有望进一步拉低门槛,推动渗透率提升。

我个人一直是小米眼镜的客户,我大概买了不下三幅小米的防蓝光眼镜,和米家的音频眼镜,就是那个“眼镜形态的蓝牙耳机”,对我来说用于工作生活确实带来了很大的便利:

1、听音乐,音频眼镜不入耳,就不太伤听力,外界声音也可以听到,这个比耳机好;

2、在公共场所接电话听语音看视频的时候,尽量不影响别人;

3、工作中经常需要电话会议,我就不需要用手一直拿着手机,并且可以边开会边查找手机上的资料;

 

 

眼镜行业的发展不断迭代,从一开始的传统眼镜→音/视频眼镜→A1+音/视频眼镜→AI+AR/MR 眼镜。AI眼镜提供了新的渐进式发展思路,即放弃大而全的设计理念,先解决轻便美观的问题来提升用户体验,同时也给行业更多的时间逐步攻克微显示的成本、重量与性能问题,助力 AR 行业跨越初期的发展障碍,实现加速放量。

二级市场估计届时肯定会扫描智能眼镜的上游产业链,主要为AI智能眼镜硬件结构供应商。如主控Soc芯片、光学模组、显示模组,音频模组,传感器模组、交互模组、电源、结构件等。除了高通骁龙 AR1 Gen 1 + 恒玄BES 2700外,歌尔代工也已经是明牌了。其他的上游供应链还包括:

1.光学与显示:光波导模组、MicroLED为核心增量。

-舜宇光学:全球摄像头模组龙头,为多款AI眼镜提供光学解决方案;

-水晶光电:AR光波导技术领先,已切入雷鸟、Rokid供应链;

-利亚德:MicroLED显示技术布局深厚,合作Meta等海外客户。

2.芯片与传感器:端侧算力决定用户体验。

-瑞芯微:RV系列视觉芯片适配AI眼镜,低功耗优势显著;

-恒玄科技:智能音频芯片龙头,小米AI眼镜核心供应商;

-韦尔股份:CIS传感器龙头,受益于AI眼镜多摄像头需求。

3.声学与结构件:轻量化与交互刚需。

-歌尔股份:声学组件+整机代工双轮驱动,Meta、华为核心供应商;

-佳禾智能:小米AI眼镜声学模组主力供应商,募投450万副产能即将释放;

-蓝思科技:纳米微晶玻璃材料突破,解决镜片轻量化与耐磨损痛点。

4.生态与终端:品牌卡位与内容生态构建者。

-创维数字:与Meta合作开发智能眼镜,布局AR内容平台;

-博士眼镜:线下渠道龙头,切入AI眼镜验光配镜服务赛道。

以上仅做供应链参与方列举,不代表推荐投资,交易还是需要自己了解企业具体信息,责任自负。

如果小米智能AI眼镜能一炮打响,并且带动AI眼镜行业一起爆发,那么可能会创造出一个新的消费电子热点,我个人感觉这个市场的量,比蓝牙耳机小很多,但是会比VR头盔和手环要大很多,毕竟存在大量真实用户需求,只要解决了佩戴舒适度、续航时间、价格、大模型和手机功能集成,很多操作可以解放双手操作来进行,那么还是有很大希望的。

本文来源于微信公众号:土人观芯

7M 参数的Tiny模型是怎么在ARC-AGI任务上击败OpenAI O3-mini的?

三星AI实验室上周发表了一篇文章。作者用了一个7M参数的模型,在 ARC-AGI-1 和 ARC-AGI-2 分别实现 45% 和 8% 的准确率,高于大部分商业LLM模型(Deepseek R1, o3-mini, Gemini 2.5 Pro) ,但是参数只有这些模型的0.01%。我们一起来看一下是怎么实现的。

 

 

先说一下什么是ARC-AGI-1 和 ARC-AGI-2。

2019 年,Keras 的创造者 François Chollet(就是在pytorch一统江山之前让Tensorflow变得好用的那个Keras)发表了一篇具有深远影响的论文《On the Measure of Intelligence》(《论智能的度量》),他在其中提出了用于人工通用智能(AGI)基准测试的“抽象与推理语料库”(Abstract and Reasoning Corpus,简称 ARC-AGI),以衡量流动智能。

“流动智能”(fluid intelligence)是心理学里的一个概念。它指的是:

在陌生情境下解决问题的能力

不依赖已有知识或经验,而是依靠 推理、逻辑、模式识别来找到答案

包括 抽象思维、类比、归纳、发现规律等能力

简单来说:

流动智能=学新东西、解决新问题的“脑力灵活度”

如果你解一个从未见过的谜题,靠的是流动智能。

如果你背诵乘法口诀表来算题,那靠的就是固定智能(crystallized intelligence),即通过学习和经验积累下来的知识。

“一个系统的智能,是衡量它在一系列任务上的技能学习效率,这种效率取决于它的先验知识、经验以及任务的泛化难度。” – François Chollet, “On the Measure of Intelligence”

ARC-AGI-1

训练和测试各400个任务,类似于下图那种,从左边的图上找出规律,然后完成右边的图。

ARC-AGI-2

ARC-AGI-2 是用来替代ARC-AGI-1,但是更难。其中训练集1000个任务,测试集120个任务。

Kaggle 上还有ARC的奖金不菲的竞赛,今年的比赛还有不到20天截止。

https://www.kaggle.com/competitions/arc-prize-2025/

回到主题,我们来看一下这篇论文。

首先它是对Hierarchical Reasoning Model(HRM)的一种改进。HRM 是一种递归推理模型,它采用两个协作的子网络来解决逻辑难题:一个高频更新、一个低频更新,灵感来自于“大脑”中组成部分的多层次不同频率的工作 。

HRM 虽然用了两个网络相互协作、高频低频交替更新,还有深度监督 (deep supervision)、停止机制等复杂设计,文章作者认为这其中有不少冗余。比如 HRM 在 Sudoku-Extreme 上准确率只在 ~ 55% 左右。TRM 的出发点就是“少即是多”:它剔除了 HRM 的许多复杂机制,只保留递归推理这个核心,然后用一个轻量网络来做。

TRM寻求一种更简洁的架构。只需要一个递归网络。文章中的伪代码解释的比第一页的架构图更清楚。

训练一个batch,需要更新参数16次

每一次更新y和z需要**无梯度**运行T-1次,最后再带梯度更新一次,这个梯度就用于学习

更新y和z的时候,先更新z,运行n次,然后用最新的z和原来的x, y, 更新y。

固定点假设的问题

HRM 的设计里有个关键假设:递归过程会收敛到一个固定点(fixed-point)。这样他们就可以用一种“1-step 梯度近似”的技巧:只需要对最后一步的函数更新(一次 fL 和一次 fH)做反传,就能近似整个递归过程的梯度。这在数学上听起来很优雅,训练也更省内存。

但 TRM 的作者觉得这个假设 太理想化了。现实中,递归过程并不一定真的收敛到稳定点;即便收敛,1 步梯度近似也无法严格代表整个推理链条的学习信号。换句话说,这个理论在工程上勉强能跑,但在数学上其实没有坚实的保障。

于是,TRM 干脆抛弃了“固定点 + 近似梯度”这一整套思路,转而采用显式的深度监督:每一步递归的输出都拿来对照真值进行训练。这样既不用依赖收敛假设,也不用担心梯度近似不准,整个方法更直接、更稳健。

从实际效果来看,HRM 在 Sudoku-Extreme 上准确率只有 55% 左右,而 TRM 用同样的数据集能达到 87.4%;在 Maze-Hard 上,TRM 也有 85% 的准确率。而且,TRM 也只用了 7M参数。

换句话说,TRM 抛弃“固定点 + 近似梯度”的复杂设计,不但理论上更稳健,实际效果也更好。

结果证明,少即是多。

实验测试数据

总的来说,TRM 的设计确实给我们提供了一个新鲜的视角:用极简的递归结构,也能在抽象推理任务上取得很强的表现。这是值得肯定的创新。

不过我个人觉得,在某个特定任务上比大模型性能好很多,并不能说明大模型就不能胜任这样的任务。TRM 毕竟是为特定任务量身定制的,而 LLM 本身是面向通用任务的。未来,大模型也未必只能依赖 CoT 来解题。比如数独问题,大模型完全可以通过编程实现退火算法,甚至调用 Knuth 的 Algorithm X 来解决。

换句话说,我们或许不必急着把 TRM 看成“大模型的替代方案”。它更像是一种启发:提醒我们 智能并不一定依赖于更大的参数量,也可能来自更合适的结构和方法。而随着大模型编程和调用外部工具的能力越来越强,它们也许能自己创造、甚至调用类似 TRM 的机制来应对这些任务。

本文来源于微信公众号:土人观芯

紫光帝国,天空之上才是你的极限

作者按:

紫光为什么这么牛?我也想膜拜一下。欢迎转载,荆轲刺秦王。

上期土人简单评论了一下紫光集团收购华三的事件,老实说,土人对这次收购没有看太懂,但我相信这个大手笔收购将奠定紫光未来在中国IT硬件领域的老大地位,而这个位置,目前还属于联想,诸位可能会质疑,开什么玩笑,这怎么可能呢?其实此紫光已非彼紫光,当今中国IT行业里紫光已经变身为一个“超级帝国”,前天紫光股份在A股市场复牌,不出意外的话我推测将收获10-20个涨停版。此中缘由容我慢慢道来。

前世今生

在中国IT行业,清华紫光沉睡已久,记得在笔者读大学的90年代,紫光以其核心的OCR技术和生产销售扫描仪立足于北京中关村,与联想的PC电脑、方正的激光照排、四通利方的中文输入并称为“中关村四杰”,与当时通信行业的“巨大中华”相映成趣。

可是后来,紫光很快在消费者眼中突然沉寂了,也许是因为扫描行业在消费者IT领域很快萎缩,所以紫光转向了政府采购项目,将OCR技术应用到了海关、高速公路、公安等政府客户中。因为体制的束缚,紫光看着联想一步步成为全球PC老大,也看着四通利方变身新浪成为互联网大鳄,唯有北大方正和清华紫光成为两个难兄难弟,很长一段时间,这两家中国最高学府的控股公司只能在非竞争领域靠政府的项目生存。

由于涉及到国有资产流失的争议,摆脱束缚的过程很漫长,很艰难。据清华紫光官方网站介绍:

  • 19934, 清华大学科技开发总公司改组成立清华紫光(集团)总公司。
  • 20056月,由全民所有制企业改制为有限责任公司,即紫光集团有限公司,清华持股80%
  • 20096月,增资扩股并引进新的管理团队,成为由清华控股有限公司控股,建立了市场化机制的国有控股企业。
  • 2010年,正式确立混合所有制模式,清华控股持股51%,民营企业健坤集团持股49%

自此,健坤成功入主帮助紫光集团脱胎换骨,走上了复兴的康庄大道,此后的故事就堪称天外飞仙了。

 

天外飞仙

话说在当今中国IT领域,拥有核心高技术门槛的又有几家呢?就拿联想所在的PC服务器领域,CPU来自Intel,网络设备芯片来自博通、Marvell,操作系统来自微软,在手机领域,核心芯片大多来自高通、MTKARM,操作系统是谷歌的Android系统。小米和联想实际上除了外壳以外,其余的东西几乎都是舶来品。

早在十几年前,国家就开展了所谓“核高基”的项目计划,但是项目多被高校、研究所、国企瓜分,真正有科研效率的民营企业却被拒之门外。很多国营机构拿到巨额的科研经费,盖了不少漂亮的科研大楼,很多经费用来发福利,需要项目验收的时候就拿一些论文和无法产品化的原型交差,于是就出现了汉芯的用MOTO芯片磨掉Logo交差的闹剧。

随着中国IT制造业向高端转型,核心技术成为了中国的一大痛点。紫光看到了这一点,决定走与联想“贸工技”截然相反的路径,即从核心技术入手,进军产业链上游,应该说,这个策略是极其有前瞻性的。

什么是硬件的核心技术?答案就是芯片。一切的CPU、图像处理、指纹识别、通信、存储最终都落实在芯片领域。而芯片领域,堪称高端制造业的明珠,想象空间近乎无限。

据媒体报道,全球半导体市场规模达3200亿美元,全球54%的芯片都出口到中国,但国产芯片的市场份额只占10%。全球77%的手机是中国制造,但其中不到3%的手机芯片是国产的。芯片被喻为国家的工业粮食,是所有整机设备的心脏,普遍应用于计算机、消费类电子、网络通信、汽车电子等几大领域,几乎起着生死攸关的作用。但我国芯片产业长期被国外厂商控制,不仅每年进口需要消耗2000多亿美元外汇,超过了石油和大宗商品,是第一大进口商品。而且,受制于人的技术设备直接制约了我国信息产业的发展。

紫光选择芯片作为突破口,确实是一个完美的策略。下面的事件时间点联系起来看就很有意思了:

  • 201279日,国务院以国发〔201228号印发《十二五国家战略性新兴产业发展规划》,其中在电子核心基础产业方面,明确了:围绕重点整机和战略领域需求,大力提升高性能集成电路产品自主开发能力,突破先进和特色芯片制造工艺技术,先进封装、测试技术以及关键设备、仪器、材料核心技术,加强新一代半导体材料和器件工艺技术研发,培育集成电路产业竞争新优势。
  • 201312月,紫光集团收购美国纳斯达克上市公司展讯通信,强势进军集成电路芯片产业。
  • 20147月,紫光集团收购美国纳斯达克上市公司锐迪科微电子,加强在集成电路产业领域的整合与协同,全力打造中国芯片企业巨头。
  • 20149月,英特尔公司决定向紫光集团集成电路产业板块投资人民币90亿元,双方将联合开发基于英特尔架构和通信技术的手机解决方案。
  • 20141014日,工信部办公厅宣布国家集成电路产业投资基金已经于924日正式设立,规模达到1500亿元。
  • 20152月,紫光集团与国家集成电路产业投资基金和国家开发银行达成总额300亿元的战略合作意向,以产融结合的方式共同打造中国集成电路产业航母。
  • 2015213日,国家集成电路产业投资基金将向紫光集团旗下的芯片业务投资100亿元。这是该基金成立以来进行的首个大规模投资。

此外:

  • 201410月,紫光集团又通过出资10亿元认购TCL股份,成为TCL第四大股东。TCL旗下的华星光电是国内主要的液晶面板制造商,TCL本身已经跻身全球第4大手机出货商。
  • 20154月,紫光集团又出资30亿元,认购沈阳机床的增发,成为后者第二大股东。沈阳机床是中国乃至世界的机床龙头,是中国制造2025战略的核心企业。
  • 20155月,紫光股份出资23亿美元收购惠普旗下新华三51%股份。

包括本次收购新华三在内,紫光集团用两年时间、五次资本布局、投资超过360亿元,完成其消费电子、智能制造、信息战略的生态布局,年收入已超过500亿元,帝国雏形已成。

结语

看到这里,土人不禁感叹是什么样的牛人能踩准这样的节拍,将资本运作和国家战略糅合得天衣无缝,拿出几百亿买买买如同信手拈来,并让IntelHP这样的巨头俯首称臣,紫光简直就是国家队中的战斗机,神一样的存在。再过几年,如果紫光真能买下Intel或者AMD,也许我们能见证一个世界级巨头的诞生。

侠之大者,为国花钱,为国解忧。

来自:土人观芯