Share - WeChat

  BI具备高性能、通用性、灵活性,支持主流GPGPU生态和多种主流深度学习框架,并通过标准化的软硬件生态接口为应用行业解决产品使用难、开发平台迁移成本大等操作层面的实际痛点,帮助客户在算力系统生命周期内不断优化,持续提升计算能力、降低运营成本。同时,针对中国的应用环境,天数智芯携手重要行业合作伙伴,从源头对设计进行定义和本土优化,为未来中国市场的大规模商业化应用奠定了坚实的基础。

  提名项目名称:云端7纳米GPGPU芯片产品BI

  提名项目单位:上海天数智芯半导体有限公司

  凭借优异的性能、能效及性价比,天数智芯BI芯片及产品卡量产后能够为AI训练和推理、认知型AI、高性能数据分析、基因组研究、金融预测分析等各种高负载工作提供理想的算力支持,服务于教育、互联网、金融、自动驾驶、医疗、安防等各相关行业,赋能AI智能社会。

  BI主要具备以下几点特征:

  1、中国第一款全自研GPGPU云端高端训练芯片

  GPGPU是一种具有类似图形处理器架构的芯片,用来计算原本由中央处理器处理的通用计算任务。GPGPU有强大的并行处理能力和可编程流水线,特别是在面对单指令流多数据流的需要时,GPGPU在性能上大大超越了传统的中央处理器,在很多领域发挥重要作用。BI芯片是中国第一款GPGPU,它采用全自研核心知识产权、极先进的7纳米制程和2.5DCoWoS封装工艺,性能优异。没有图形渲染专有模块,具有更灵活的可编程性,突出通用计算功能,并对人工智能训练和推理进行了优化。

  2、独创的运算单元和指令集

  支持通用计算,BI设计了一套完善和丰富的GPGPU指令集。指令为64位定长。这套指令集支持各种精度的向量操作、标量操作、张量操作等指令。操作类型包括各种数学运算、逻辑运算、数据读写、控制等,具备兼容主流生态的丰富功能。

  BI芯片是国内第一款全自研、真正基于通用GPU架构的GPGPU云端高端训练芯片,采用业界领先的7纳米制造工艺、2.5D CoWoS封装,容纳240亿晶体管,支持FP32、FP/BF16、INT32/16/8等多精度数据混合训练,集成32GB HBM2内存、存储带宽达1.2TB,单芯每秒可进行147万亿次FP16计算(147TFLOPS@FP16)。

  3、CUDA 生态兼容

  通过自主实现的CUDA兼容软件层以及编译器后端,结合适配BI芯片的驱动程序,提供能够从API级别兼容CUDA生态的软硬件综合解决方案。对于现存已有的基于 CUDA的应用程序,只需要用面向BI芯片的工具链进行重新编译,即可运行在BI GPGPU上,免去不必要的二次开发。

  来源 | 世界互联网大会官网

2022年7月12日,世界互联网大会国际组织正式成立,从互联网领域的国际盛会发展为国际组织,总部设于中国北京。我们将致力于搭建全球互联网共商共建共享平台,推动国际社会顺应信息时代数字化、网络化、智能化趋势,共迎安全挑战,共谋发展福祉,携手构建网络空间命运共同体。