在19日凌晨举行的Google I/O 2021上,Google正式公布了第四代计算加速器(TPU)的计划。谷歌表示,
第四代运算加速器可以在接近纪录的时间内完成AI和机器学习训练的工作量。此外,第四代计算加速器集群计算在对象检测、图像分类、自然语言处理、机器翻译等工作负载方面都可以超越上一代。
谷歌称,第四代运算加速器提供的矩阵算法TFLOP是第三代运算加速器的两倍多,一个TFLOP相当于每秒1万亿次浮点运算。至于矩阵算法,通常用于AI模型的数据运算。此外,
得益于互联技术的进步,第四代运算加速器还提供了显著的内存带宽升级。谷歌表示,总体而言,在同样的64位芯片基础上,不考虑软件带来的提升,
第四代运行加速器的性能平均比第三代运行加速器高2.7倍。Google的运算加速器是专门用于加速AI运算的专用ASIC定制芯片,采用水冷机制,主要用于机架式服务器。
它可以提供高达100 petaflops的计算能力,并进一步增强谷歌产品的功能,包括谷歌搜索、谷歌相册、谷歌翻译、谷歌语音助手、
Gmail和Google Cloud AI API等。然而,目前第四代运行加速器正处于最后的研究阶段。
至于谷歌第四代计算加速器的集群计算架构,谷歌指出将有4096个芯片,互联的带宽是大多数其他网络技术的10倍。
这使得谷歌第四代计算加速器的集群计算架构能够提供比exaflop更多的计算能力,相当于平均计算时间最高的约1000万个笔记本处理器的计算能力。
谷歌首席执行官桑德尔皮帅在大会的主题演讲中表示,第四代计算加速器计划是谷歌的一个历史性里程碑。这是因为过去需要定制的超级计算机才能获得exaflop的功能。
然而,在谷歌的数据中心安装了四个第四代计算加速器集群后,其中许多加速器将以90%或接近90%的无碳排放运行,并提供强大的计算能力。
Google还提出了一个实际应用案例,比如在使用ImageNet数据算法(ResNet-50 v1.5)训练图像分类准确率至少为75.9%的任务中,
谷歌新的计算加速在1.82分钟内完成了256。这和768个Nvidia A100显卡,192个AMD Epyc 7742 CPU,512个AI优化的Ascend910芯片差不多。
再加上128个英特尔至强白金8168处理器,速度是一样的。此外,第四代计算加速器在训练大型维基百科数据库的模型时得分很高。
也就是说,用256个第四代运算加速器训练只需要1.82分钟,只比用4096个第三代运算加速器训练需要的0.39分钟略长。同时,使用Nvidia硬件需要0.81分钟的训练时间。
需要2048个A100显卡和512个AMD Epyc 7742 CPU才能完成,可见谷歌第四代计算加速器的优越性。根据谷歌的说法,
预计第四代计算加速器提供的服务将于2021年内上市。(来源:科技报)
标题:Google研发第四代运算加速器,强化Google各项服务性能
链接:https://www.52hkw.com/news/rj/56872.html
版权:文章转载自网络,如有侵权,请联系删除!