菲尔兹奖得主高尔斯教授使用未公开的ChatGPT 5.5 Pro,在一小时内解决了一个长期悬而未决的组合数学难题。这一突破挑战了学界对大模型只能“背书”而非真正理解高深数学的传统认知,引发对AI数学能力的重新审视。
2026-05-09
国内大模型领域迎来资本风暴,DeepSeek(深度求索)启动首轮大规模融资,目标金额高达500亿元,若成功将刷新行业纪录。最引人注目的是,领投方并非风投或互联网巨头,而是创始人梁文锋本人,其个人出资额最高,彰显对公司的坚定信心。
MiniMax M2系列模型在输出“马嘉祺”时出现异常,原因是后训练阶段导致低频Token退化。排查发现,分词器将“马嘉祺”切分为[马,嘉祺],“嘉祺”因预训练高频被合并为独立Token(编号190467),但在后续训练中该Token被“挤压”,引发输出错误。官方已发布技术报告,揭示了这一机制。
百度发布新一代文心大模型5.1,采用“多维弹性预训练”技术,主打高性价比和强大搜索整合能力。该模型已上线百度千帆模型广场和文心一言官网,面向企业用户和开发者开放体验,在AI竞争中展现国产大模型新突破。
苹果公司正研发三款创新产品:全息显示的“空间 iPhone”、AI 挂件和配备AI摄像头的AirPods Pro。AI挂件和新款AirPods Pro已进入高级测试阶段,预计明年发布;全息iPhone则可能等到2030年上市。信息源自爆料者Schrodinger的匿名消息。
Anthropic与云服务商Akamai签署18亿美元计算协议,推动Akamai股价一度大涨28%。合作旨在满足Anthropic对算力的持续需求,体现生成式AI领域头部企业的战略扩张,获资本市场高度认可。