今天,AWS 宣布推出采用一个 NVIDIA H100 GPU 的全新 Amazon Elastic Compute Cloud (Amazon EC2) P5 实例大小,使企业能够合理调整机器学习 (ML) 和高性能计算 (HPC) 资源的规模,同时具有成本效益。 新的实例大小使客户能够从小规模开始,并以精细的增量进行扩展,从而更灵活地控制基础设施成本。开发聊天机器人或专业语言翻译工具等中小型大语言模型 (LLM) 的客户现在可以更经济地运行推理任务。客户还可以使用这些实例部署用于药物发现、流体流动分析和财务建模的 HPC 应用程序,而无需投入昂贵的大规模 GPU 部署。 P5.4xLarge 实例现已通过适用于 ML 的 Amazon EC2 容量块在以下 AWS 区域推出:美国东部(弗吉尼亚州北部、俄亥俄州)、美国西部(俄勒冈州)、欧洲地区(伦敦)、亚太地区(孟买、悉尼、东京)和南美洲(圣保罗)区域。这些实例可以在欧洲地区(伦敦)、亚太地区(孟买、雅加达、东京)和南美洲(圣保罗)区域按需、竞价或通过节省计划购买。 要了解有关 P5.4xLarge 实例的更多信息,请访问 Amazon EC2 P5 实例。