高峰:2019—2022H2 全球基板短缺严重、供不应求,尤其是 FC-BGA 基板其样品 交期达半年以上,部分终端公司甚至无法拿到基板样品;主要系服...
2026-06-28 3 电子行业报告
LLM 推理的解码阶段本质是memory-bound,核心存储负载包括:模型权重、KV Cache、激活值、RAG 向量库等。 相较于模型权重等静态张量 数据,KV Cache是随上下文长度和并发数动态膨胀的张量数据,推理性能(TTFT / TPS)高度依赖对KV Cache的保存和对KV Cache的管理效率。 在传统冯·诺依曼架构下,大模型推理时的大量高维张量数据、Transfomer的自注意力机制均加剧了内存墙问题,数据量巨大、搬运成本高,严 重拖慢推理效率,存储使访存带宽与延迟逐步成为制约系统吞吐与响应性能的核心瓶颈,因此黄仁勋一直在说:“GPU 大部分时间都在等数据, 而不是在计算”,“计算能力增长远快于内存带宽,GPU 经常处于饥饿状态(starving for data)。”而提升存储带宽和容量可以显著增强推理性 能、降低推理成本,“以存代算”是必然趋势。

标签: 电子行业报告
相关文章
高峰:2019—2022H2 全球基板短缺严重、供不应求,尤其是 FC-BGA 基板其样品 交期达半年以上,部分终端公司甚至无法拿到基板样品;主要系服...
2026-06-28 3 电子行业报告
TSV 基板凭借其成熟的工艺和先进的半导体制造技术,可实现极小的 I/O 节距与业界领 先的互连密度,是目前高性能互连的主流方案。然而,硅基板固有的介...
2026-06-27 12 电子行业报告
2026 年 AI Glasses 将进入快速发展期。AI Glasses(人工智能眼镜)是集成人工智能技术 的智能穿戴设备,通过传感器、摄像头、语音...
2026-06-26 21 电子行业报告
2026-28 年先进制程需求主要仍由 HPC 拉动,26 年传统手机和消费需求偏弱。在 2026 年 3 月 16 日举行的 GTC 2026 上,...
2026-06-26 21 电子行业报告
当前 AI 推理瓶颈迭代与架构演进,正推动 PCB 价值定位实现根本性跃升。Transformer 架构下大模型推理存 在算力与带宽极端错配,英伟达解...
2026-06-25 26 电子行业报告
阵列光波导又称几何光波导,它采用光学镀膜、玻璃研磨、抛光与多层贴合工艺,基于几何 光学的全反射原理,精密加工多个半反镜面构成导光路径,通过阵列反射镜堆...
2026-06-24 29 电子行业报告
最新留言