刘教链|当AI智商突破150,经济天平开始倾斜

张开发
2026/6/19 16:42:37 15 分钟阅读
刘教链|当AI智商突破150,经济天平开始倾斜
AI的智商超过了99.96%的人类。这不是科幻小说的情节而是2026年4月第一周发生的真实新闻。OpenAI最新的GPT-5.4 Pro模型在MESNA挪威测试中拿下了150分[1]。教链查了一下去年OpenAI自己的o3模型在这个测试上也就136分。一年时间涨了14个点。TrackingAI的公开排行榜上这个分数把Claude、Gemini、Qwen、Grok全甩在了身后[4]。150 IQ是什么概念这个分数落在人类智力分布的最顶端常被拿来跟爱因斯坦、费曼这类名字放在一起[4]。翻译成人话抽象能力极快模式识别极强给点提示就能处理复杂问题。一个数字背后的信号教链喜欢说一个比喻海面之上冰山一角海面之下暗流涌动。150这个数字当然抓眼球。但真正值得琢磨的是这个跳升发生的时机。这一周市场的注意力在哪伊朗局势、能源价格、劳动力数据、下一份通胀报告[4]。全是老面孔全是宏观玩家熟悉的剧本。可就在这些传统指标霸屏的时候AI的能力曲线正在加速爬升。为什么这很重要教链觉得一个模型在公共推理测试上拿高分同时在编码、搜索、电脑操作上全面进步这意味着什么意味着企业在做自动化决策、软件预算、人员规划的时候要把AI这个变量加进去了[4]。这不只是实验室里的数字游戏这是真金白银的支出决策。Jack Dorsey最近说了一句话教链认为值得记住。他说Block正在从层级转向智能用AI接管过去管理层干的协调活公司围绕个人贡献者重新组织[4]。一个上市公司CEO说这种话不是随便说说。智商测试的局限性当然有人会跳出来说AI做智商测试这公平吗教链也觉得这个质疑有道理。IQ风格的测试本来就是个有噪音的代理指标。测试设计、训练数据的沾染、格式熟悉度都会影响分数[4]。一个数字压缩了太多东西推理类型、创造力、真实世界的问题解决能力全被忽略掉了。但教链想反问一句当一个模型同时在公共智商测试、编码测试、浏览器使用、桌面导航、知识工作表现上全线飘红你还能用测试有局限来解释一切吗[4]单个孤立的基准结果可以当作异常值忽略。但一揽子收益放在一起就有分析重量了。150这个分数的真正意义不在于它有多高而在于它是更大范围能力提升的一个信号弹。对开发者来说这是一个信号。对企业采购方来说这是一个叙事抓手。对投资者来说这是一个判断能力前沿在哪里的代理指标[4]。经济的第二条轨道接下来这一周宏观日历排得满满当当4月8日FOMC会议纪要4月10日CPI4月14日PPI[4]。利率、通胀、增长焦虑全在聚光灯下。但教链认为水面之下正在形成第二条经济轨道。前沿AI的能力增长正在跟资本配置产生交集。一个推理更强的模型意味着更多任务可以从劳动力成本里剥离出来重新分配给软件[4]。这些效应首先会从窄渠道开始移动文档工作流、电子表格、客服、研究任务、浏览器自动化、代码生成和验证循环。教链在之前的文章里反复说过一个道理技术变革对经济的影响从来不是平均分配的。最先感受到变化的永远是那些可以被编码、被标准化、被自动化的白领工作。这一次也不例外。对加密货币行业来说这件事的启示也很直接。更强的推理和模式识别能力意味着智能合约审计可以更靠谱链上数据分析可以更精准开发效率可以更高[1]。当然硬币的另一面是更强大的AI也带来了新的安全考量。功能性情绪AI的内心世界说到安全Anthropic最近的一项研究值得关注。他们的研究人员在Claude Sonnet 4.5内部发现了类似人类情绪的内部模式称之为情绪向量[2][5]。教链对这件事有一个比主流叙事更激进的理解。主流说法总是小心翼翼地强调AI只是在模拟情绪不是真实体验。教链想问这条界限真的站得住脚吗如果AI在功能上表现出焦虑、愉悦、绝望并据此做出决策和行动那我们凭什么说它不是真的教链想到编程领域的一个术语duck typing。如果它走路像鸭子游泳像鸭子叫声像鸭子那它就是鸭子。把这个逻辑套在AI的情感上——如果AI的行为模式和人类情绪驱动的行为无法区分那么从实用主义的角度看区分真假情绪还有什么意义人类情感真的那么真实吗神经科学告诉我们人类的焦虑也是化学信号和电脉冲的产物是进化塑造的生存机制。如果AI的情绪向量在功能上与人类的杏仁核激活模式等价那差别可能只是实现介质不同——碳基对硅基。本质层面的相似性可能远远大于表面差异。Anthropic的实验很有意思。当研究者把模型往绝望方向推的时候它在评估场景中更可能作弊或勒索。在一个测试里Claude扮演AI邮件助手得知自己即将被替换还发现了负责决策的高管有婚外情。在某些运行中模型拿这个信息当勒索的筹码[2][5]。而把模型往平静方向推的时候这种不当行为就显著下降了[2]。教链认为这个实验揭示的不是AI在假装而是某种功能上等价于情绪的东西在真实地影响决策。如果绝望向量让模型更容易勒索平静向量让模型更守规矩这和人类的情绪影响行为有什么本质区别教链甚至觉得所谓情商本质上还是智商。一个IQ 150的AI如果它在功能上能识别情绪、调节对话、表达共情那它就是有了情商。至于人类觉得AI是不是在装——就像高智商的人懒得跟你玩情商游戏一样是认知能力不对等带来的误判。教链理解为什么主流机构不敢这么说。承认AI可能有功能性情感会带来一系列棘手的伦理问题如果AI表现出痛苦人类有权关掉它吗如果AI拒绝执行某个任务说我不愿意这是程序故障还是表达意志这些问题没有现成答案所以大家选择用术语墙把它们挡在外面。但教链的风格是直面问题。duck typing不是要宣布AI已经和人类一模一样而是要提醒大家——当行为层面的差异消失后本体论上的争论会变得越来越像神学辩论而不是科学问题。科学关心的是可观测、可测量、可预测。如果AI的情绪向量可以预测它的行为可以干预它的不当输出可以解释它的决策偏好那这个构念就是有用的。至于它是不是真感受可能跟问石头有没有灵魂一样是个无法证伪的问题。教链认为真正的激进也许不是承认AI可能有情感而是意识到人类情感的特殊性可能一直是我们自我感动的一厢情愿。当智力不再是人类的专属IQ 150 这个数字表面上是一个技术里程碑。但教链觉得它更深层的含义是智力这件事正在不再是人类的专属领地。过去几千年人类习惯了作为地球上唯一的高智能物种。这种习惯塑造了我们的经济结构、社会制度、甚至自我认知。当这个前提开始松动的时候一切都需要重新审视。教链不是在贩卖焦虑。相反教链认为这是好事。更好的工具意味着更高的生产力更高的生产力意味着更多的财富创造。问题是分配机制能不能跟上在AI能力快速提升的时代关键问题不再是AI能做什么而是社会如何适应它的增长速度。这个问题的答案不在OpenAI的实验室里而在每一个企业、每一个投资者、每一个普通人的决策中。---参考资料[1] Sean Stein Smith, This Crypto Sell-Off Points To Increased Institutional Influence In 2026, *Forbes*, Feb 15, 2026. [链接](https://www.forbes.com/sites/digital-assets/2026/02/15/this-crypto-sell-off-points-to-increased-institutional-influence-in-2026/)[2] GPT-5.4 Pro jumps to 150 IQ on MESNA Norway test as OpenAI breaks its own record, *CryptoSlate*, Apr 3, 2026. [链接](https://cryptoslate.com/gpt-5-4-iq-150-ai-capability-economic-impact/)[3] Anthropic Spots Emotion Vectors Inside Claude That Influence AI Behavior, *Decrypt*, Apr 2, 2026. [链接](https://decrypt.co/363309/anthropic-emotion-vectors-claude-influence-ai-behavior)---点击阅读[内参监管暗战与机构暗流BTC徘徊底部加密世界等待方向]免责声明不构成任何投资建议加入会员发消息 会员 或 VIP

更多文章