找找AI 原创出品 技术

高通AI250:近存计算架构对“内存墙”瓶颈的系统性破解

原创标识

高通AI250是2026年至2027年AI推理芯片赛道最受关注的架构创新之一。该芯片首次在数据中心级AI推理场景中引入近存计算(Near-Memory Computing)创新内存架构,通过提供超过10倍的有效内存带宽提升并显著降低功耗,为AI推理工作负载带来跨世代的性能与能效突破。VuK找找AI - 专业AI导航网站,一站式AI导航,找找AI官网
VuK找找AI - 专业AI导航网站,一站式AI导航,找找AI官网
“内存墙”问题的工程本质。 传统冯·诺依曼架构下,计算单元与存储单元物理分离,AI推理任务需要在高带宽内存(HBM)与计算核心之间频繁搬运数据。随着模型参数规模的指数级增长(从GPT-3的1750亿到万亿级参数),数据搬运的功耗和延迟已成为制约推理性能的最主要瓶颈——即“内存墙”问题。高通的解决方案是将计算逻辑向内存更紧密地迁移:AI250的近存计算架构将部分数据处理操作直接在内存附近完成,大幅减少了核心与内存间的数据移动,从而实现了10倍以上的有效内存带宽提升。这一架构还支持解耦式AI推理,使硬件资源的利用率大幅提升,有效解决了传统架构中“内存墙”导致的性能瓶颈。VuK找找AI - 专业AI导航网站,一站式AI导航,找找AI官网
VuK找找AI - 专业AI导航网站,一站式AI导航,找找AI官网
多线竞争格局中的差异化卡位。 高通AI200系列整体策略展现了清晰的差异化路径:AI200加速卡采用768GB LPDDR内存而非行业主流的HBM,通过降低内存成本实现低总拥有成本(TCO)目标,精准命中云服务提供商“每美元tokens数”的核心诉求。AI250则定位于更高端市场,预计2027年商用。两家芯片均采用直接液冷散热技术,单机架功耗控制在160千瓦,支持PCIe纵向扩展与以太网横向扩展,构建了完整的机架级方案体系。高通已与沙特AI公司HUMAIN达成合作,计划部署200兆瓦的高通推理解决方案,构建全球首个边缘到云端的混合AI系统。在高通之外,华为通过UCM推理记忆数据管理器构建三级存储架构避免重复计算,与高通形成不同技术路径的探索。

AI问答

国内AI最近犯过什么事儿吗?
说出来你可能不信,已经有人因为AI亏钱而在法院起诉了。
听说AI又在安全上捅娄子了?
这几天的安全新闻一个比一个惊悚。
有没有什么牛X的新模型发布?
看几个硬指标:编程测试SWE-Bench Pro,它直接干到了69.2% ,比GPT-5.5的58.6%高出10个百分点;金融分析测试也是53.9% ,同样领先所有对手。更狠的是,不但性能上去了,快速模式的速度快了一倍多,成本直接砍到原来的三分之一。
不听不听,我就想知道OpenAI权斗和马斯克互撕的大结局是啥?
前CTO Mira Murati出庭作证,对着奥特曼就是一顿锤。她直接在法庭上说,奥特曼在模型安全审批上误导过她,还说此人有个“大招”——给不同高管传递不同版本的事实,让大家谁都没法掌握全貌,决策权永远回到他自己手里。这不是外人瞎编,是亲信在法庭上当着全世界说的。
AI安全最近又出新问题了?听说有人用AI换脸直接盗号了?
对,而且是真事儿,5月30号央视刚曝出来的。一家国内公司好好的账号突然自己发了一篇“即将停更”的公告,后台密码也改了,连法人信息都被人篡改了。最后查出来,是有人伪造了以假乱真的动态“AI人脸”视频,直接骗过了平台的身份验证系统,顺利登陆进去了。
嵌入向量:AI把文字转换成数字的秘密
AI不认识文字,它只认识数字。为了让AI处理语言,第一步必须把每个字或词转换成一串数字,这串数字叫嵌入向量。
微调是怎样让通用模型变成专家模型的
一个通用大模型什么都能聊几句,但让它在某个专业领域表现得像专家,就需要做微调。微调的原理是:在已经训练好的模型基础上,用少量专业数据继续训练一小段时间。
为什么模型越大效果越好?
AI圈有一个经验规律:模型参数量每增加10倍,性能会稳定提升。这被称为规模定律。但为什么大模型就一定更聪明呢?
Transformer中的注意力机制是怎么“注意”的
大模型的核心技术叫注意力机制。简单说,模型在读一段文字时,会给每个词分配不同的“关注程度”。
查看更多问答 →