公众号记得加星标,第一时间看推送不会错过。
随着人工智能推理市场的扩张,全球大型科技公司正在减少对 GPU的依赖。他们正在寻找价格昂贵、发热高的 GPU 的下一代替代方案。神经处理单元 (NPU) 就是一个新兴的替代方案,它是一款专门用于人工智能推理的芯片。这种专为人工智能计算而设计的架构能够实现低功耗下的高效率。
据业内人士28日透露,全球AI推理市场预计将快速增长。市场调查公司Markets and Markets预测,今年推理市场规模将达到约106亿美元,到2030年将增长至约255亿美元(约合35.598万亿韩元),年均增长率约为19%。
因此,推理NPU市场预计也将增长。这是因为多样化的AI应用需要更高的推理吞吐量、更低的延迟和更高的能效,而推理NPU最适合满足这些需求。
Samil PwC管理研究所在报告中分析称,“在AI使用的半导体中,CPU和GPU市场已经进入技术成熟阶段,以优化的低功耗、高效率ASIC为中心的推理型AI半导体(NPU)市场正在增长。”
NPU 市场中尤为突出的公司是 Sambanova 和 Grok,两家都是美国初创公司。
首先,Sambanova 将其基于数据流架构的 NPU 与专有软件集成,涵盖超大型语言模型 的训练和推理。通过将硬件与模型和平台捆绑在一起,Sambanova 获得了包括美国政府和金融机构在内的主要客户。无论在行业内外,该公司都以构建自己的生态系统而闻名。
Grok 量产专为推理设计的芯片。它使用专有芯片和软件,实现了数百万个令牌的实时推理速度,其商业模式是基于云的“LLM 服务”。它被认为适用于大型数据中心的高速搜索和 RAG服务。它的收入来自云推理服务,而非硬件销售。
业内外人士认为,AI半导体企业要参与全球竞争,必须聚焦两大战略。
首先,必须确保在能效方面取得明显优势。数据中心的功耗和运营成本正日益成为人工智能应用的最大障碍,因此,效率直接转化为竞争力。
第二,瞄准定制化市场。像英伟达这样的通用GPU想要统治所有领域,现实难度很大。更现实的策略是,通过针对电信、公共机构、金融和国防等特定行业定制“推理型NPU”,拓展到特定行业。
今天是《半导体行业观察》为您分享的第4139期内容,欢迎关注。
加星标第一时间看推送,小号防走丢
求推荐
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
上一篇:解锁鸿蒙5控制中心的宝藏功能让效率与优雅兼得...
下一篇:返回列表
随着9月开学季来临,为应对大学装机的需求大增,尤其是针对预算有限但追求性能平...
2025-08-27 23:29:30
人工智能正加速推动国民经济三大产业向智能化跃迁。26日中国国务院印发的《关于...
2025-08-27 22:23:25
8月27日,知乎公布2025年第二季度业绩报告。财报显示,知乎第二季度营收7...
2025-08-27 22:20:31
8月27日,美团发布2025年二季报,当期实现营收918亿元,同比增长11....
2025-08-27 21:13:47
“用了这么久的空调,刷抖音才知道还能放歌?”最近,一位网友分享家中空调播放音...
2025-08-27 20:50:00
8月27日凌晨,苹果官方发布主题为“前方超燃”的Apple特别活动邀请函。据...
2025-08-27 19:19:37
冯秀语编|李亦辉 8月26日,世运电路公告,公司计划投资15.00亿元人民...
2025-08-27 18:32:47
2025年8月21日,在武汉汉口喜来登大酒店举行的发布会上,流浪泡泡在发布会...
2025-08-27 18:16:51
站在崛头山巅远眺,陇西菜子镇尽收眼底,远山含翠,溪水绕村,白墙黛瓦的房屋错落...
2025-08-27 17:32:27
北京时间8月27日,FaradayFuture(FF)宣布公司创始人兼全球联...
2025-08-27 15:50:30