通义千问 - t55p1336

国内知道的人不多，但海外已经传开了，美国在AI领域最担心的事还是发生了！阿联酋

2025-09-13 19:42 小胖胖说科技

国内知道的人不多，但海外已经传开了，美国在AI领域最担心的事还是发生了！阿联酋的穆罕默德·本·扎耶德人工智能大学和G42公司合作，从2025年初开始搞这个项目，用阿里巴巴的Qwen2.5-32B作为基础模型。Qwen2.5是开源的，有320亿参数，支持29种语言，包括阿拉伯语，预训练数据达18万亿令牌。他们优化了长链思维和投机解码算法，让模型在数学、科学和编码任务上表现突出。在MMLU基准上得分超过85，在HumanEval上高于85，在MATH上达80，超过Llama-3.1-70B这些竞争者。团队用Cerebras的晶圆级芯片跑模型，速度达到每秒2000令牌，比GPU快20倍，成本低很多。这让中小机构也能用上高级AI，不用花大钱买闭源服务。9月9日他们在阿布扎比正式放出K2Think，作为开源模型，代码和权重全公开，上HuggingFace平台。大学说这是他们AI主权的体现，避免靠单一供应商。K2Think专注高级推理，能处理复杂问题，像物理模拟或逻辑谜题，输出结构化JSON格式。相比OpenAI的闭源，它更高效，参数少但性能匹敌DeepSeek-V3.1。阿联酋选择Qwen2.5是因为测试中发现它多语言支持好，社区活跃，文档齐全，便于本地改。G42的专家参与优化，集成vLLM和Ollama工具，确保兼容性强。发布后下载量很快就上去了，用户反馈说速度快，适合工业应用。这个事直接戳到美国AI的痛点，他们靠闭源控制市场，但开源模式让技术扩散快。中国Qwen系列衍生模型超14万个，全球开发者用脚投票。阿联酋的举动说明客户看重实用性，不是光听名气。辛顿在2025年上海会议上说过，中国对AI认真，美国管制反而帮对手加速。K2Think证明小型模型也能挑战巨头，标志开源在领跑。阿联酋政府把这当国家战略，融入经济计划，推动本土计算能力。模型的六大支柱包括高效参数利用和工具调用兼容，让开发者建AI代理。相比美国企业，阿联酋开源吸引全球贡献，形成创新循环。美国观察家注意到，中国技术在中东落地，担心市场主导弱化。Qwen2.5-Max用混合专家架构，能处理文本、图像、视频，扩展范围广。K2Think的发布象征合作模式变，让更多国家进智能时代。团队计划融入Qwen2.5-Omni-7B的多模态功能，未来迭代更多。MBZUAI的研究所继续推动，吸引投资，阿联酋想成AI中心。开源策略降低门槛，汇聚资源，这事在海外传开，国内还安静，但格局变化已开始。

阿里巴巴这次新出的Qwen3-Next模型，可以说是又猛又省，新架构做了几个关

2025-09-12 08:13 凡梦说娱乐

阿里巴巴这次新出的Qwen3-Next模型，可以说是又猛又省，新架构做了几个关键升级，注意力机制更聪明、MoE结构更稀疏、训练更稳，还用了多token预测来提速！最厉害的是，它虽然参数量高达800亿，但每次推理只激活30亿，结果性能居然媲美，甚至略超之前的32B全量模型，而训练成本不到十分之一，长文本推理速度还快了十倍以上！这简直就是，用小电驴的耗电，跑出了超跑的速度，性价比直接拉满！股票

阿里旗下通义千问推出更高效的QWEN3-NEXT人工智能模型

2025-09-12 07:04 观点机构

观点网讯：9月12日消息，阿里巴巴旗下通义千问发布了下一代基础模型架构Qwen3-Next，并开源了基于该架构的Qwen3-Next-80B-A3B系列模型。据了解，新的Qwen3-Next模型架构旨在更好地处理大量信息，同时减少训练过程中和训练后的...

有网友说阿里市值不到腾讯一半，感觉阿里所有的东西都有对手产品可以替代，腾讯的游戏

2025-09-09 20:38 清凌聊科技

有网友说阿里市值不到腾讯一半，感觉阿里所有的东西都有对手产品可以替代，腾讯的游戏和微信不可替代。

近日，AI圈惊爆一则重大消息：Anthropic发表声明，明确规定但凡由中国

2025-09-06 16:26 大神魄魄特课堂

近日，AI圈惊爆一则重大消息：Anthropic发表声明，明确规定但凡由中国资本或中国人控股比例超过50%的公司，不管其注册地是在新加坡、美国，亦或是欧洲，都禁止使用Claude模型。这就好比给这类企业上了一道“紧箍咒”，即便企业表面是海外壳公司，只要资本构成里“带有中国控股背景”，也会被无情地拒之门外。更让人惊掉下巴的是，Anthropic联合创始人DarioAmodei在内部表述中，居然直接用了“adversarialnations”（敌对国家）这样火药味十足的字眼。这可把网友们逗乐了，纷纷调侃：这哥们儿当年在百度实习的时候，到底经历了啥呀？难道是被2015年的“九三大阅兵”给吓得留下心理阴影了？说好的全球化呢，结果Anthropic这波操作直接来了个“一刀切”，把不少科技圈人士都给整懵圈了。表面上打着“合规”与“国家安全”的旗号，实际上却让AI技术朝着“脱钩化”的方向越走越远。对于很多初创公司而言，这无异于一场灭顶之灾，资金和技术链条就像被一把锋利的剪刀同时剪断。不过呢，换个角度看，这事儿对国产大模型来说，说不定还是个“意外之喜”。当Claude、GPT这类模型的使用门槛越来越高时，本土模型却在马不停蹄地快速迭代。尤其是在代码生成、长文本处理等领域，国产大模型已经展现出了不俗的国际竞争力：Qwen3Coder480B/A35B：在代码生成方面那叫一个厉害，能覆盖多种语言和不同场景。DeepSeekV3.1：在逻辑推理和对话之间找到了完美的平衡，而且算力利用率超高。GLM4.5Air：既轻量化又能高效训练，特别适合企业级的部署。KimiK20905：处理长文本和复杂任务的表现相当出色，十分贴近实际应用场景。由此可见，“禁用Claude”在短期内或许会给相关企业带来不小的冲击，但从长远来看，说不定正能倒逼国产模型加快突围的步伐呢。deepseek通义千问我国要如何推进智能大模型的研发?美国AI产业当前的发展现状如何