谷歌发布Chrome 148版本,新增AI功能,用户可在地址栏或新标签页直接向AI智能体提问,获取自然语言回答并支持追问。同时,AI自动填充工具获改进,可在用户同意下协助填写信用卡和地址信息。
2026-05-07
月之暗面科技提交“KimiClaw”商标申请,涵盖科学仪器、网站服务、通讯服务等领域,目前处于“等待实质审查”阶段。此举引发业界对其未来产品形态的猜想,特别是科学仪器分类可能预示新方向。
谷歌近日为开源模型Gemma4推出多Token预测(MTP)起草器,利用推测解码架构将推理速度提升最高3倍,同时保持输出质量和逻辑能力。该模型发布后下载量迅速增长,成为全球最受关注的开源模型之一。
5月7日,千问在PC端推出AI语音输入功能,用户可通过快捷键在桌面应用中使用。该功能支持口语去语气词、纠错、格式化整理,并能基于上下文智能回复,直接执行创作、问答、翻译等指令。例如,处理口误口语“会议定在两点……不对三点”时,能准确解析语义,展现出强大的语义理解能力。
腾讯混元联合UCLA、港中文等机构,针对多模态大语言模型(MLLMs)从“被动理解”向“主动推理”进化的需求,开源了多模态搜索智能体。此前,高质量数据、自动化轨迹合成路径及训练配方的缺失,导致顶尖智能体难以复现。此次开源旨在打破僵局,推动社区发展。
字节跳动旗下火山引擎发布豆包大模型家族首款全模态理解模型Doubao-Seed-2.0-lite,实现视频、图像、音频与文本的原生统一理解,突破单一模态限制。该模型在视觉与逻辑推理能力上表现突出,尤其在物理、医疗等高阶学科复杂推理测试中性能大幅超越现有水平,标志着多模态交互领域的关键进展。