t55p1336

标签: 通义千问

国内知道的人不多,但海外已经传开了,美国在AI领域最担心的事还是发生了!阿联酋

国内知道的人不多,但海外已经传开了,美国在AI领域最担心的事还是发生了!阿联酋

国内知道的人不多,但海外已经传开了,美国在AI领域最担心的事还是发生了!阿联酋的穆罕默德·本·扎耶德人工智能大学和G42公司合作,从2025年初开始搞这个项目,用阿里巴巴的Qwen2.5-32B作为基础模型。Qwen2.5是开源的,有320亿参数,支持29种语言,包括阿拉伯语,预训练数据达18万亿令牌。他们优化了长链思维和投机解码算法,让模型在数学、科学和编码任务上表现突出。在MMLU基准上得分超过85,在HumanEval上高于85,在MATH上达80,超过Llama-3.1-70B这些竞争者。团队用Cerebras的晶圆级芯片跑模型,速度达到每秒2000令牌,比GPU快20倍,成本低很多。这让中小机构也能用上高级AI,不用花大钱买闭源服务。9月9日他们在阿布扎比正式放出K2Think,作为开源模型,代码和权重全公开,上HuggingFace平台。大学说这是他们AI主权的体现,避免靠单一供应商。K2Think专注高级推理,能处理复杂问题,像物理模拟或逻辑谜题,输出结构化JSON格式。相比OpenAI的闭源,它更高效,参数少但性能匹敌DeepSeek-V3.1。阿联酋选择Qwen2.5是因为测试中发现它多语言支持好,社区活跃,文档齐全,便于本地改。G42的专家参与优化,集成vLLM和Ollama工具,确保兼容性强。发布后下载量很快就上去了,用户反馈说速度快,适合工业应用。这个事直接戳到美国AI的痛点,他们靠闭源控制市场,但开源模式让技术扩散快。中国Qwen系列衍生模型超14万个,全球开发者用脚投票。阿联酋的举动说明客户看重实用性,不是光听名气。辛顿在2025年上海会议上说过,中国对AI认真,美国管制反而帮对手加速。K2Think证明小型模型也能挑战巨头,标志开源在领跑。阿联酋政府把这当国家战略,融入经济计划,推动本土计算能力。模型的六大支柱包括高效参数利用和工具调用兼容,让开发者建AI代理。相比美国企业,阿联酋开源吸引全球贡献,形成创新循环。美国观察家注意到,中国技术在中东落地,担心市场主导弱化。Qwen2.5-Max用混合专家架构,能处理文本、图像、视频,扩展范围广。K2Think的发布象征合作模式变,让更多国家进智能时代。团队计划融入Qwen2.5-Omni-7B的多模态功能,未来迭代更多。MBZUAI的研究所继续推动,吸引投资,阿联酋想成AI中心。开源策略降低门槛,汇聚资源,这事在海外传开,国内还安静,但格局变化已开始。
阿里巴巴这次新出的Qwen3-Next模型,可以说是又猛又省,新架构做了几个关

阿里巴巴这次新出的Qwen3-Next模型,可以说是又猛又省,新架构做了几个关

阿里巴巴这次新出的Qwen3-Next模型,可以说是又猛又省,新架构做了几个关键升级,注意力机制更聪明、MoE结构更稀疏、训练更稳,还用了多token预测来提速!​最厉害的是,它虽然参数量高达800亿,但每次推理只激活30亿,结果性能居然媲美,甚至略超之前的32B全量模型,而训练成本不到十分之一,长文本推理速度还快了十倍以上!​这简直就是,用小电驴的耗电,跑出了超跑的速度,性价比直接拉满!股票

阿里旗下通义千问推出更高效的QWEN3-NEXT人工智能模型

观点网讯:9月12日消息,阿里巴巴旗下通义千问发布了下一代基础模型架构Qwen3-Next,并开源了基于该架构的Qwen3-Next-80B-A3B系列模型。据了解,新的Qwen3-Next模型架构旨在更好地处理大量信息,同时减少训练过程中和训练后的...
有网友说阿里市值不到腾讯一半,感觉阿里所有的东西都有对手产品可以替代,腾讯的游戏

有网友说阿里市值不到腾讯一半,感觉阿里所有的东西都有对手产品可以替代,腾讯的游戏

有网友说阿里市值不到腾讯一半,感觉阿里所有的东西都有对手产品可以替代,腾讯的游戏和微信不可替代。​​​
近日,AI圈惊爆一则重大消息:Anthropic发表声明,明确规定但凡由中国

近日,AI圈惊爆一则重大消息:Anthropic发表声明,明确规定但凡由中国

近日,AI圈惊爆一则重大消息:Anthropic发表声明,明确规定但凡由中国资本或中国人控股比例超过50%的公司,不管其注册地是在新加坡、美国,亦或是欧洲,都禁止使用Claude模型。这就好比给这类企业上了一道“紧箍咒”,即便企业表面是海外壳公司,只要资本构成里“带有中国控股背景”,也会被无情地拒之门外。更让人惊掉下巴的是,Anthropic联合创始人DarioAmodei在内部表述中,居然直接用了“adversarialnations”(敌对国家)这样火药味十足的字眼。这可把网友们逗乐了,纷纷调侃:这哥们儿当年在百度实习的时候,到底经历了啥呀?难道是被2015年的“九三大阅兵”给吓得留下心理阴影了?说好的全球化呢,结果Anthropic这波操作直接来了个“一刀切”,把不少科技圈人士都给整懵圈了。表面上打着“合规”与“国家安全”的旗号,实际上却让AI技术朝着“脱钩化”的方向越走越远。对于很多初创公司而言,这无异于一场灭顶之灾,资金和技术链条就像被一把锋利的剪刀同时剪断。不过呢,换个角度看,这事儿对国产大模型来说,说不定还是个“意外之喜”。当Claude、GPT这类模型的使用门槛越来越高时,本土模型却在马不停蹄地快速迭代。尤其是在代码生成、长文本处理等领域,国产大模型已经展现出了不俗的国际竞争力:Qwen3Coder480B/A35B:在代码生成方面那叫一个厉害,能覆盖多种语言和不同场景。DeepSeekV3.1:在逻辑推理和对话之间找到了完美的平衡,而且算力利用率超高。GLM4.5Air:既轻量化又能高效训练,特别适合企业级的部署。KimiK20905:处理长文本和复杂任务的表现相当出色,十分贴近实际应用场景。由此可见,“禁用Claude”在短期内或许会给相关企业带来不小的冲击,但从长远来看,说不定正能倒逼国产模型加快突围的步伐呢。deepseek通义千问我国要如何推进智能大模型的研发?美国AI产业当前的发展现状如何

赛道Hyper|通义千问万亿模型的战略突围解析

9月6日凌晨,阿里巴巴旗下通义千问(Qwen)在其官网发布Qwen3-Max-Preview(Instruct)—一款参数量超过1万亿的预览版超大型模型。阿里对外称,该模型在中英文理解、复杂指令遵循、工具调用(RAG/Tool-calling)等维度有明显...
阿里巴巴:追加寒武纪GPU至15万片​​​

阿里巴巴:追加寒武纪GPU至15万片​​​

阿里巴巴:追加寒武纪GPU至15万片​​​

上证早知道|事关商业航天,广东最新部署!“川超”来了,拟9月20日开幕!阿里通义千问,再上新

8月19日,阿里巴巴集团旗下的通义千问宣布推出Qwen-Image-Edit—Qwen-Image的图像编辑版本。上证精选 国务院新闻办公室于19日举行“高质量完成‘十四五’规划”系列主题新闻发布会,介绍“十四五”时期体育强国建设成就。会上...

阿里通义千问再放大招 多模态大模型迭代 加速改写AGI时间表

阿里通义千问更新,再为多模态大模型赛道添了一把火。8月19日,通义团队推出qwen-image-edit,基于20b参数的qwen-image,专注于语义和外观编辑,支持双语文本修改、风格迁移及物体旋转,进一步拓展了生成式ai在专业内容创作中...

通义千问宣布推出Qwen-Image-Edit,Qwen-Image的图像编辑版本

观点网讯:8月19日,阿里巴巴集团旗下的通义千问宣布推出Qwen-Image-Edit—Qwen-Image的图像编辑版本。用户可以访问QwenChat(chat.qwen.ai)并选择“图像编辑”功能进行体验。据介绍,Qwen-Image-Edit基于20B的Qwen-Image模型...