亚马逊 网络服务 (AWS)除了最近推出的基于Mac minis的macOS实例外,还得到了另一个创新。它是关于 培训班,是亚马逊云计算部门的一款芯片,是明确为训练神经网络而开发的。与Inferentia ASIC和Graviton2 CPU一样,Trainium也是自主开发的。
客户应该可以从2021年下半年开始使用Trainium。根据亚马逊的说法,在开发中的重点是相对于价格而言,有非常好的表现。根据亚马逊的说法,这些实例的性能应该低于英特尔的Habana高迪,而英特尔的Habana高迪又已经比性价比高40%。 p4d.24xlarge配置 与八个Nvidia A100。
技术细节不明
亚马逊尚未公布Trainium芯片的技术和性能细节。唯一已知的事实是,AWS实例将拥有该公司所有机器学习实例中最高的TBaflops性能。
人们还知道, 云计算 支持Pytorch、MXNet和Tensorflow的标准框架。被称为Neuron的软件开发工具包(SDK)也已经从Inferentia ASICs中得知。
Trainium可在Sagemaker服务和EC2实例(弹性计算云)中使用。AWS中经常使用的学习算法和框架应该是预装的。