典名科技本文主要介绍阿里云GPU云服务器,产品优势,应用场景,GPU云服务器的常见概念、使用限制、地狱和可用区。
GPU云服务器提供GPU加速计算能力,实现GPU计算资源的即开即用和弹性伸缩。作为阿里云弹性计算家族的一员,GPU云服务器结合了GPU计算力与CPU计算力,满足您在人工智能、高性能计算、专业图形图像处理等场景中的需求。阿里云服务器
GPU云服务器EGS平台介绍
GPU作为一种计算芯片,其优势非常明显,具有实时高速、强并行计算能力和强浮点计算能力等特点。阿里云弹性GPU服务(Elastic GPU Service,简称EGS)将阿里云的弹性计算和GPU高速的并行异构加速器组合在一起,兼具弹性计算的特点和GPU的加速能力。
阿里云基于EGS平台推出了GPU云服务器,在提供GPU加速能力的同时,保留了与普通ECS实例一致的使用体验。您在创建ECS实例时,选择企业级异构计算规格即可。
GPU云服务器的功能特性
易监控
提供全面的GPU监控数据,包括GPU、实例和分组维度,免去您的运维压力。
易部署
和阿里云生态深度融合,您可以轻松搭配其他阿里云产品构建应用,例如搭配OSS、NAS等产品满足存储要求,搭配EMR进行深度学习数据预处理等。支持云原生(阿里云Kubernetes),交付更加便捷。
高性能高安全性
支持GPUDirect,GPU之间点对点通信。GPU可以直接通过NVLink总线互联通信,具备高带宽低时延的特点,无需CPU干预。多租户间弹性GPU安全隔离 ,并通过Hypervisor授权和管理。允许灵活配置多块GPU实现互相高速通信的同时,还具备隔离带来的安全性。
高弹性
提供系列化的规格族,分钟级创建GPU实例,支持水平扩容和垂直变配。
一、阿里云GPU云服务器具有领先的覆盖范围、超强的计算能力、出色的网络性能和灵活的购买方式。
覆盖范围领先
阿里云GPU云服务器在全球17个地域实现规模部署,具备全球领先的覆盖范围,结合弹性供应、弹性伸缩等交付方式,能够很好地满足您业务的突发需求。
超强计算能力
阿里云GPU云服务器配备业界领先算力的GPU计算卡,结合高性能CPU平台,单实例可提供高达1000TFLOPS的混合精度计算性能。
网络性能出色
阿里云GPU云服务器实例的VPC网络最大支持450万的PPS及32Gbit/s的内网带宽。在此基础上,超级计算集群产品中,节点间额外提供高达50Gbit/s的RDMA网络,满足节点间数据传输的低延时高带宽要求。
购买方式灵活
支持灵活的资源付费模式,包括包年包月、按量付费、抢占式实例、存储容量单位包。您可以按需要购买,避免资源浪费。
注意:GPU云服务器不支持使用预留实例券。
二、GPU云服务器应用场景
GPU云服务器适用于视频转码、图片渲染、AI训练、AI推理、云端图形工作站等场景。
直播实时视频转码
阿里云异构GPU和FPGA服务器重点支持2019年双11猫晚直播的实时视频转码,以高画质、低带宽、高分辨率、实时的综合优势服务猫晚当天直播业务4K、2K、1080P等各个分辨率的转码。其中FPGA H.265高清编码、720P节省带宽21.6%,GPU云服务器支持高并发实时视频流5000路以上,并逐步上升到峰值6200路每分钟,且顺利度过流量洪峰。异构GPU云服务器还参与实时家居渲染图片生成等业务,首次提供了大量算力强劲的ebmgn6v裸金属实例,支持淘宝渲染方提升几十倍的渲染性能,第一次实现秒级实时渲染,完成总计超过5000张大型家居渲染图。异构FPGA图片转码业务则以3K+片的超大集群,为淘宝图片空间提供高达数百万QPS的处理能力,承担了双十一淘宝图片85%的流量,预计节省计算成本3亿。
AI训练
gn6v和gn6e具有优异的通用GPU计算加速能力,适合为深度学习提供加速引擎。
gn6v和gn6e实例分别配备具有16 GB显存和32 GB显存的NVIDIA V100 GPU计算卡,单节点可提供高达1000TFLOPS的混合精度计算能力。与弹性计算生态的完美结合,为在线和离线场景提供了通用的解决方案。搭配容器服务使用,可以简化部署和运维的复杂度,并提供资源调度服务。
AI推理
gn6i具有优异的AI推理能力。
gn6i实例基于配备NVIDIA Tesla T4 GPU计算卡,单精度浮点计算能力最高可达8.1 TFLOPS,int8定点运算处理能力最高可达130 TOPS,支持混合精度,满足了深度学习(尤其是推理)场景下的算力需求。同时单卡功耗仅75 W,具有极高的性能功耗比。与弹性计算生态的完美结合,为在线和离线场景提供了通用的解决方案。搭配容器服务使用,可以简化部署和运维的复杂度,并提供资源调度服务。镜像市场提供预装NVIDIA GPU驱动和深度学习框架的镜像,简化您的部署操作。
云游戏、云网吧和云端图形工作站
vgn6i和gn6i均采用基于Turing架构的NVIDIA Tesla T4 GPU加速器,具有极佳的图形计算能力。vgn6i提供分片虚拟化后的虚拟GPU,支持T4 GPU计算能力的1/2、1/4、1/8,并提供极佳的3D图像渲染能力,适用于云游戏、云网吧等场景。vgn6i和gn6i实例可以结合云桌面产品提供云端图形工作站服务,应用于影视动画设计、工业设计、医疗成像、高性能计算的结果呈现等场景。
三、使用GPU云服务器时的常见概念。
名词 | 说明 |
---|---|
GPU | 图形处理器(Graphics Processing Unit)。相比CPU具有众多计算单元和更多的流水线,适合用于大规模并行计算等场景。 |
EGS | 弹性GPU服务(Elastic GPU Service)。阿里云弹性计算和GPU高速的并行异构的加速器的组合服务,兼具弹性计算的特点和GPU的加速能力。 |
CUDA | NVIDIA推出的通用并行计算架构,帮助您使用NVIDIA GPU解决复杂的计算问题。 |
cuDNN | NVIDIA推出的用于深度神经网络的GPU加速库。 |
概念 | 说明 |
---|---|
地域 | 物理的数据中心。 |
可用区 | 同一地域内,电力和网络互相独立的物理区域。 |
ECS实例 | 等同于一台虚拟服务器,内含CPU、内存、操作系统、网络配置、磁盘等基础的计算组件。 |
镜像 | 提供实例的操作系统、初始化应用数据及预装的软件。 |
块存储 | 块设备类型产品,具备高性能和低时延的特性。可以像使用物理硬盘一样格式化并建立文件系统,满足大部分通用业务场景下的数据存储需求。 |
快照 | 某一时间点一块云盘的数据状态文件。 |
安全组 | 由同一地域内具有相同保护需求并相互信任的实例组成,是一种虚拟防火墙,用于设置实例的网络访问控制。 |
SSH密钥对 | 一种安全便捷的登录认证方式,由公钥和私钥组成,仅支持Linux实例。 |
专有网络VPC | 逻辑上彻底隔离的云上私有网络。您可以自行分配私网IP地址范围、配置路由表和网关等。 |
弹性网卡 | 是一种可以绑定到专有网络VPC类型ECS实例上的虚拟网卡。 |
标签 | 标记资源,允许企业或个人将相同作用的云服务器ECS资源归类,便于搜索和资源聚合。 |
资源组 | 对您拥有的云资源从用途、权限、归属等维度上进行分组,实现企业内部多用户、多项目的资源分级管理。 |
限制项 | 普通用户限制 | 提升限额方式 |
---|---|---|
创建ECS实例的用户限制 | 实名认证 | 无 |
创建按量付费资源的限制 | 账户余额、代金券和信用度之和不得小于100元。 | 提交工单 |
可以创建按量付费实例的规格 | vCPU核数少于16(不含16)的实例规格 | 提交工单 |
一个账号在每个地域的按量付费实例的总vCPU配额 | 50 vCPU | 提交工单 |
一个账号在每个地域的抢占式实例配额 | 50 vCPU | 提交工单 |
一个账号在每个地域的实例启动模板数量 | 30 | 无 |
一个实例启动模板中的版本数量 | 30 | 无 |
按量付费转包年包月 | 以下实例规格(族)不支持:t1、s1、s2、s3、c1、c2、m1、m2、n1、n2、e3 | 无 |
包年包月转按量付费 |
| 无 |
限制项 | 普通用户限制 | 提升限额方式 |
---|---|---|
一个账号的地域级预留实例券数量 | 20 | 提交工单 |
一个账号在一个可用区的可用区级预留实例券数量 | 20 | 提交工单 |
预留实例券支持的实例规格 | 支持使用预留实例券的规格族包括:
说明 t5只支持可用区级预留实例券。 | 无 |
限制项 | 普通用户限制 | 提升限额方式 |
---|---|---|
创建按量付费云盘的用户限制 | 账号必须实名认证,而且账户余额、代金券和信用度之和不得小于100元。 | 无 |
一个账号在所有地域的按量付费云盘数量配额 | 账号下所有地域的实例数量*5。每个账号至少可以创建10块按量付费云盘,即如果只有1台实例,此时数量配额为10块。 | 提交工单 |
一个账号用作数据盘的按量付费云盘容量配额 | 和云服务器使用情况、地域、云盘类型有关,您可以在权益配额页面查看。 | 提交工单 |
单实例系统盘数量 | 1 | 无 |
单实例数据盘数量 | 16块 | 无 |
单块普通云盘容量 | 5GiB~2000GiB | 无 |
单块SSD云盘容量 | 20GiB~32768GiB | 无 |
单块高效云盘容量 | 20GiB~32768GiB | 无 |
单块ESSD云盘容量 | 20GiB~32768GiB | 无 |
单块SSD本地盘容量 | 5GiB~800GiB | 无 |
单实例SSD本地盘总容量 | 1024GiB | 无 |
单块NVMe SSD本地盘容量 | 1456GiB | 无 |
单实例NVMe SSD本地盘总容量 | 2912GiB | 无 |
单块SATA HDD本地盘容量 | 5500GiB | 无 |
单实例SATA HDD本地盘总容量 | 154000GiB | 无 |
系统盘单盘容量限制 |
| 无 |
本地盘实例是否可以自行挂载新的本地盘 | 不允许 | 无 |
本地盘实例是否支持变更配置 | 仅允许变更带宽 | 无 |
系统盘挂载点范围 | /dev/vda | 无 |
数据盘挂载点范围 | /dev/vd[b-z] | 无 |
限制项 | 普通用户限制 | 提升配额方式 |
---|---|---|
一次可以购买的存储容量单位包最大容量 | 50TiB | 提交工单 |
同一地域内最大支持购买SCU数量 | 100个 | 无 |
一个存储容量单位包的能设置的最大生效时长 | 3年 | 无 |
存储容量单位包支持的产品类型 |
| 无 |
限制项 | 普通用户限制 | 提升限额方式 |
---|---|---|
每块云盘可以保留的手动快照个数 | 256 | 无 |
每块云盘可以保留的自动快照个数 | 1000 | 无 |
一个账号在一个地域可以保留的自动快照策略数量 | 100 | 无 |
限制项 | 普通用户限制 | 提升限额方式 |
---|---|---|
一个账号在一个地域的保有自定义镜像配额 | 100 | 提交工单 |
单个镜像最多可共享的用户数量 | 50 | 提交工单 |
镜像与实例规格的限制 | 4GiB及以上内存的实例规格不能使用32位镜像。 | 无 |
限制项 | 普通用户限制 | 提升限额方式 |
---|---|---|
一个账号在每个地域的SSH密钥对配额 | 500 | 无 |
支持SSH密钥对的实例规格 | 不支持系列I的非I/O优化实例 | 无 |
支持SSH密钥对的镜像类型 | 仅支持Linux系统 | 无 |
限制项 | 普通用户限制 | 提升限额方式 |
---|---|---|
入带宽峰值 |
| 无 |
出带宽峰值 |
| 无 |
单实例更换分配的公网IP地址的限制 | 新建实例六小时内可以更换公网IP地址,一台实例最多可以更换三次。 | 无 |
限制项 | 普通安全组限制 | 企业安全组限制 |
---|---|---|
一个账号在一个地域可以创建的安全组数量 | 100 | 与普通安全组相同 |
一个经典网络类型的安全组能容纳的经典网络类型ECS实例数量 | 1000 ① | 不支持经典网络 |
一个专有网络VPC类型的安全组能容纳的VPC类型ECS实例数量 | 不固定,受安全组能容纳的私网IP地址数量影响。 | 无限制 |
一台ECS实例可以加入的安全组数量 | 5 如需提高上限,请提交工单,可以增加到10个或者16个安全组。 | 与普通安全组相同 |
一台ECS实例的每张弹性网卡可以加入的安全组数量 | ||
一个安全组最大规则数量(包括入方向规则与出方向规则) | 200 ② | 与普通安全组相同 |
一张弹性网卡在所有已加入的安全组中的最大规则数量(包括入方向规则与出方向规则) | 1000 | 与普通安全组相同 |
一个专有网络VPC类型的安全组能容纳的私网IP地址数量 | 2000 ③ | 65536 |
公网访问端口 | 出方向的SMTP默认端口25默认受限,而且不能通过安全组规则打开。 | 与普通安全组相同 |
限制项 | 普通用户限制 | 提升限额方式 |
---|---|---|
一个账号在一个地域内的部署集配额 | 2 | 提交工单 |
一个部署集内能容纳的实例数量 | 一个可用区内最多允许7台实例,一个地域内允许7*(可用区数量)的实例数量。 | 无 |
部署集内能创建的实例规格 | 部署集现阶段能创建的ECS实例规格族仅支持:c6、g6、r6、hfc6、hfg6、hfr6、d2、d2s、d2c、c5、d1、d1ne、g5、hfc5、hfg5、i2、i2g、i1、ic5、r5、se1ne、sn1ne和sn2ne 。 | 无 |
限制项 | 普通用户限制 | 提升限额方式 |
---|---|---|
一个账号在一个阿里云地域下能创建的云助手命令数量 | 100 | 提交工单 |
一个账号在一个阿里云地域下每天能运行的云助手命令数量 | 5000 | 提交工单 |
限制项 | 普通用户限制 | 提升限额方式 |
---|---|---|
一个账号在一个地域的弹性网卡配额 | 100 | 提交工单 |
限制项 | 普通用户限制 | 提升限额方式 |
---|---|---|
单台实例允许绑定的标签数量 | 20 | 无 |
限制项 | 普通用户限制 | 提升限额方式 |
---|---|---|
CreateInstance调用次数 | 一分钟内最多200次 | 提交工单 |
地域名称 | 所在城市 | Region ID | 可用区数量 |
---|---|---|---|
华北 1 | 青岛 | cn-qingdao | 2 |
华北 2 | 北京 | cn-beijing | 8 |
华北 3 | 张家口 | cn-zhangjiakou | 2 |
华北 5 | 呼和浩特 | cn-huhehaote | 2 |
华东 1 | 杭州 | cn-hangzhou | 8 |
华东 2 | 上海 | cn-shanghai | 6 |
华南 1 | 深圳 | cn-shenzhen | 5 |
华南 2 | 河源 | cn-heyuan | 2 |
西南 1 | 成都 | cn-chengdu | 2 |
地域名称 | 所在城市 | Region ID | 可用区数量 |
---|---|---|---|
中国香港 | 香港 | cn-hongkong | 2 |
亚太东南 1 | 新加坡 | ap-southeast-1 | 3 |
亚太东南 2 | 悉尼 | ap-southeast-2 | 2 |
亚太东南 3 | 吉隆坡 | ap-southeast-3 | 2 |
亚太东南 5 | 雅加达 | ap-southeast-5 | 2 |
亚太南部 1 | 孟买 | ap-south-1 | 2 |
亚太东北 1 | 东京 | ap-northeast-1 | 2 |
美国西部 1 | 硅谷 | us-west-1 | 2 |
美国东部 1 | 弗吉尼亚 | us-east-1 | 2 |
欧洲中部 1 | 法兰克福 | eu-central-1 | 2 |
英国(伦敦) | 伦敦 | eu-west-1 | 2 |
中东东部 1 | 迪拜 | me-east-1 | 1 |