阿里开源Qwen-Agent 3.0:开源模型首次在Agent任务上超越GPT-5
阿里云开源Qwen-Agent 3.0,在WebArena和AgentBench等基准测试中首次超越GPT-5,开源模型在AI Agent领域实现关键突破。
本站内容为虚构演示,与真实新闻及机构无关;请勿当作事实或专业意见。
往期存档
ARCHIVE
阿里云开源Qwen-Agent 3.0,在WebArena和AgentBench等基准测试中首次超越GPT-5,开源模型在AI Agent领域实现关键突破。
OpenAI发布GPT-5,在数学推理、代码生成和科学推理三项关键指标上超越人类顶尖专家水平。AIME数学竞赛正确率达98%,IMO金牌题正确率87%,引发AI安全与职业替代的双重讨论。
OpenAI与知名律所合作推出AI法律顾问Agent,中小企业无需专职法务,AI即可完成合同审查、劳动纠纷咨询与知识产权注册,法律服务正式进入普惠时代。
华为发布Mate 70 Pro,搭载第二代双向卫星通讯功能,不仅能发文字还能收发图片,在无基站信号环境下仍可保持通讯。
Neuralink公布第二位植入者的最新进展,患有渐冻症的Mark通过脑机接口思维控制机械臂成功喝到咖啡,这是脑机接口在临床上的重大突破。
图森未来宣布其L4级无人卡车获得中国和美国双认证,成为全球首个获准在两国高速公路商业运营的无人货运企业。
NEURAL · MULTIMODAL · REASONING
HARDWARE · EDGE · FAB
NETWORK · TRUST · ROUTING
CLINICAL · BIOSIGNAL · TRIAL
GRID · STORAGE · HYDROGEN
AUTOMATION · MOBILITY · ORBIT
IMPACT · ETHICS · CULTURE