中昊芯英发布了其新一代 TPU 芯片「须臾」,该芯片的单芯片混合精度浮点算力达到了 896 TFLOPS,相较于上一代「刹那」芯片,性能提升了三倍。在 8-bit 推理方面,其算力可达 1792TOPS,能够满足大规模词元高并发推理的需求。
「须臾」芯片在显存容量和内部互联速度方面均有显著改进,并支持超长上下文处理。单卡额定功耗为 600W,与传统算力芯片相比,功耗降低了 50%,有助于绿色数据中心的建设。
该芯片的 IP 核、指令集、底层算子加速库以及整机系统软件均由中昊芯英自主研发,不依赖任何海外核心技术,能够满足政务、金融、电网等行业的安全合规要求。
此外,中昊芯英还推出了高性能智算平台「泰则 2.0」。该平台以最小计算单元的形式出现,集成了两颗高性能 CPU 处理器和八颗高性能 TPU 处理单元。从物理形态上看,它是一个通用的 CPU 服务器连接一台高性能 TPU 算力加速设备,总算力可达 7.168P(混合精度)。在执行相同任务时,「泰则 2.0」的整体能耗仅为传统 GPU 服务器的 80%。
在软件层面,「泰则 2.0」平台兼容所有主流 AI 框架,并原生支持 PyTorch、vLLM、SGLang 等开发工具。在训练方面,它适配了 DeepSpeed 和 Megatron-LM 分布式套件。该平台已经完成了对 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言和多模态模型的深度适配,方便开发者快速迁移模型。
| 主队 | 比分 | 客队 | 联赛 | 时间(北京) |
|---|---|---|---|---|
| 近期暂无比赛,请稍后再来查看。 | ||||