阿里云代理商-阿里云服务器-阿里云数据库-重庆典名科技

阿里云典名科技GPU云服务器

发布时间: 2020-11-10 10:03:22文章作者: 网站编辑阅读量: 669

  典名科技本文主要介绍阿里云GPU云服务器,产品优势,应用场景,GPU云服务器的常见概念、使用限制、地狱和可用区。
  GPU云服务器提供GPU加速计算能力,实现GPU计算资源的即开即用和弹性伸缩。作为阿里云弹性计算家族的一员,GPU云服务器结合了GPU计算力与CPU计算力,满足您在人工智能、高性能计算、专业图形图像处理等场景中的需求。阿里云服务器
  
  GPU云服务器EGS平台介绍
  GPU作为一种计算芯片,其优势非常明显,具有实时高速、强并行计算能力和强浮点计算能力等特点。阿里云弹性GPU服务(Elastic GPU Service,简称EGS)将阿里云的弹性计算和GPU高速的并行异构加速器组合在一起,兼具弹性计算的特点和GPU的加速能力。
  阿里云基于EGS平台推出了GPU云服务器,在提供GPU加速能力的同时,保留了与普通ECS实例一致的使用体验。您在创建ECS实例时,选择企业级异构计算规格即可。
  
  GPU云服务器的功能特性
  易监控
  提供全面的GPU监控数据,包括GPU、实例和分组维度,免去您的运维压力。
  易部署
  和阿里云生态深度融合,您可以轻松搭配其他阿里云产品构建应用,例如搭配OSS、NAS等产品满足存储要求,搭配EMR进行深度学习数据预处理等。支持云原生(阿里云Kubernetes),交付更加便捷。
  高性能高安全性
  支持GPUDirect,GPU之间点对点通信。GPU可以直接通过NVLink总线互联通信,具备高带宽低时延的特点,无需CPU干预。多租户间弹性GPU安全隔离 ,并通过Hypervisor授权和管理。允许灵活配置多块GPU实现互相高速通信的同时,还具备隔离带来的安全性。
  高弹性
  提供系列化的规格族,分钟级创建GPU实例,支持水平扩容和垂直变配。
  
  一、阿里云GPU云服务器具有领先的覆盖范围、超强的计算能力、出色的网络性能和灵活的购买方式。
  覆盖范围领先
  阿里云GPU云服务器在全球17个地域实现规模部署,具备全球领先的覆盖范围,结合弹性供应、弹性伸缩等交付方式,能够很好地满足您业务的突发需求。
  
  超强计算能力
  阿里云GPU云服务器配备业界领先算力的GPU计算卡,结合高性能CPU平台,单实例可提供高达1000TFLOPS的混合精度计算性能。
  
  网络性能出色
  阿里云GPU云服务器实例的VPC网络最大支持450万的PPS及32Gbit/s的内网带宽。在此基础上,超级计算集群产品中,节点间额外提供高达50Gbit/s的RDMA网络,满足节点间数据传输的低延时高带宽要求。
  
  购买方式灵活
  支持灵活的资源付费模式,包括包年包月、按量付费、抢占式实例、存储容量单位包。您可以按需要购买,避免资源浪费。
  注意:GPU云服务器不支持使用预留实例券。
  
  二、GPU云服务器应用场景
  

  GPU云服务器适用于视频转码、图片渲染、AI训练、AI推理、云端图形工作站等场景。
  直播实时视频转码
  阿里云异构GPU和FPGA服务器重点支持2019年双11猫晚直播的实时视频转码,以高画质、低带宽、高分辨率、实时的综合优势服务猫晚当天直播业务4K、2K、1080P等各个分辨率的转码。其中FPGA H.265高清编码、720P节省带宽21.6%,GPU云服务器支持高并发实时视频流5000路以上,并逐步上升到峰值6200路每分钟,且顺利度过流量洪峰。异构GPU云服务器还参与实时家居渲染图片生成等业务,首次提供了大量算力强劲的ebmgn6v裸金属实例,支持淘宝渲染方提升几十倍的渲染性能,第一次实现秒级实时渲染,完成总计超过5000张大型家居渲染图。异构FPGA图片转码业务则以3K+片的超大集群,为淘宝图片空间提供高达数百万QPS的处理能力,承担了双十一淘宝图片85%的流量,预计节省计算成本3亿。
  
  AI训练
  gn6v和gn6e具有优异的通用GPU计算加速能力,适合为深度学习提供加速引擎。
  gn6v和gn6e实例分别配备具有16 GB显存和32 GB显存的NVIDIA V100 GPU计算卡,单节点可提供高达1000TFLOPS的混合精度计算能力。与弹性计算生态的完美结合,为在线和离线场景提供了通用的解决方案。搭配容器服务使用,可以简化部署和运维的复杂度,并提供资源调度服务。
  
  AI推理
  gn6i具有优异的AI推理能力。
  gn6i实例基于配备NVIDIA Tesla T4 GPU计算卡,单精度浮点计算能力最高可达8.1 TFLOPS,int8定点运算处理能力最高可达130 TOPS,支持混合精度,满足了深度学习(尤其是推理)场景下的算力需求。同时单卡功耗仅75 W,具有极高的性能功耗比。与弹性计算生态的完美结合,为在线和离线场景提供了通用的解决方案。搭配容器服务使用,可以简化部署和运维的复杂度,并提供资源调度服务。镜像市场提供预装NVIDIA GPU驱动和深度学习框架的镜像,简化您的部署操作。
  
  云游戏、云网吧和云端图形工作站
  vgn6i和gn6i均采用基于Turing架构的NVIDIA Tesla T4 GPU加速器,具有极佳的图形计算能力。vgn6i提供分片虚拟化后的虚拟GPU,支持T4 GPU计算能力的1/2、1/4、1/8,并提供极佳的3D图像渲染能力,适用于云游戏、云网吧等场景。vgn6i和gn6i实例可以结合云桌面产品提供云端图形工作站服务,应用于影视动画设计、工业设计、医疗成像、高性能计算的结果呈现等场景。
  
  三、使用GPU云服务器时的常见概念。

GPU云服务器概念

名词说明
GPU图形处理器(Graphics Processing Unit)。相比CPU具有众多计算单元和更多的流水线,适合用于大规模并行计算等场景。
EGS弹性GPU服务(Elastic GPU Service)。阿里云弹性计算和GPU高速的并行异构的加速器的组合服务,兼具弹性计算的特点和GPU的加速能力。
CUDANVIDIA推出的通用并行计算架构,帮助您使用NVIDIA GPU解决复杂的计算问题。
cuDNNNVIDIA推出的用于深度神经网络的GPU加速库。

ECS通用概念

概念说明
地域物理的数据中心。
可用区同一地域内,电力和网络互相独立的物理区域。
ECS实例等同于一台虚拟服务器,内含CPU、内存、操作系统、网络配置、磁盘等基础的计算组件。
镜像提供实例的操作系统、初始化应用数据及预装的软件。
块存储块设备类型产品,具备高性能和低时延的特性。可以像使用物理硬盘一样格式化并建立文件系统,满足大部分通用业务场景下的数据存储需求。
快照某一时间点一块云盘的数据状态文件。
安全组由同一地域内具有相同保护需求并相互信任的实例组成,是一种虚拟防火墙,用于设置实例的网络访问控制。
SSH密钥对一种安全便捷的登录认证方式,由公钥和私钥组成,仅支持Linux实例。
专有网络VPC逻辑上彻底隔离的云上私有网络。您可以自行分配私网IP地址范围、配置路由表和网关等。
弹性网卡是一种可以绑定到专有网络VPC类型ECS实例上的虚拟网卡。
标签标记资源,允许企业或个人将相同作用的云服务器ECS资源归类,便于搜索和资源聚合。
资源组对您拥有的云资源从用途、权限、归属等维度上进行分组,实现企业内部多用户、多项目的资源分级管理。
  四、云服务器ECS在产品功能和服务性能上的不同限制,以及如何申请更高配额。
  
  限制概述
  使用云服务器ECS有下列限制:
  
  不支持安装虚拟化软件和二次虚拟化(例如安装使用VMware Workstation)。仅弹性裸金属服务器和超级计算集群支持二次虚拟化。
  
  不支持声卡应用。
  
  不支持直接加载外接硬件设备(如硬件加密狗、U盘、外接硬盘、银行U key等),您可以尝试软件加密狗或者动态口令二次验证等。
  
  不支持多播协议。如果需要使用多播,建议改为使用单播点对点方式。
  
  日志服务不支持32位Linux系统云服务器。
  
  如何查看日志服务支持的云服务器系统。
  
  如果云服务器需要备案,则云服务器有购买要求,且每台ECS实例可申请的备案服务号数量有限。详情请参见备案服务器(接入信息)准备与检查。
  
  查看配额
  您可以在ECS控制台概览页面查看权益配额,支持查看某一地域中的部分资源使用情况和配额。如果某项资源的配额无法满足业务需求,请提交工单申请提升配额。

实例

限制项普通用户限制提升限额方式
创建ECS实例的用户限制实名认证
创建按量付费资源的限制账户余额、代金券和信用度之和不得小于100元。提交工单
可以创建按量付费实例的规格vCPU核数少于16(不含16)的实例规格提交工单
一个账号在每个地域的按量付费实例的总vCPU配额50 vCPU提交工单
一个账号在每个地域的抢占式实例配额50 vCPU提交工单
一个账号在每个地域的实例启动模板数量30
一个实例启动模板中的版本数量30
按量付费转包年包月以下实例规格(族)不支持:t1、s1、s2、s3、c1、c2、m1、m2、n1、n2、e3
包年包月转按量付费
  • 是否支持此功能根据您的云服务器使用情况而定。
  • 每月5000 vCPU*小时。
  • 每月有最大退款额度限制,额度以转换页面显示为准。

预留实例券

限制项普通用户限制提升限额方式
一个账号的地域级预留实例券数量20提交工单
一个账号在一个可用区的可用区级预留实例券数量20提交工单
预留实例券支持的实例规格支持使用预留实例券的规格族包括:
  • 计算型:c6e、c6、c5、ic5、sn1ne
  • 通用型:g6e、g6、g5、sn2ne
  • 内存型:r6e、r6、r5、se1ne
  • 本地SSD型:i2、i2g
  • 高主频型:hfc6、hfc5、hfg6、hfg5、hfr6
  • GPU计算型:gn6i、gn6e
  • 弹性裸金属服务器:ebmc6、ebmg6、ebmr6、ebmhfc6、ebmhfg6、ebmhfr6
  • 突发型:t6、t5
说明 t5只支持可用区级预留实例券。

块存储

限制项普通用户限制提升限额方式
创建按量付费云盘的用户限制账号必须实名认证,而且账户余额、代金券和信用度之和不得小于100元。
一个账号在所有地域的按量付费云盘数量配额账号下所有地域的实例数量*5。每个账号至少可以创建10块按量付费云盘,即如果只有1台实例,此时数量配额为10块。提交工单
一个账号用作数据盘的按量付费云盘容量配额和云服务器使用情况、地域、云盘类型有关,您可以在权益配额页面查看。提交工单
单实例系统盘数量1
单实例数据盘数量16块
单块普通云盘容量5GiB~2000GiB
单块SSD云盘容量20GiB~32768GiB
单块高效云盘容量20GiB~32768GiB
单块ESSD云盘容量20GiB~32768GiB
单块SSD本地盘容量5GiB~800GiB
单实例SSD本地盘总容量1024GiB
单块NVMe SSD本地盘容量1456GiB
单实例NVMe SSD本地盘总容量2912GiB
单块SATA HDD本地盘容量5500GiB
单实例SATA HDD本地盘总容量154000GiB
系统盘单盘容量限制
  • Windows Server:40~500GiB
  • CoreOS与FreeBSD:30~500GiB
  • 其他Linux:20~500GiB
本地盘实例是否可以自行挂载新的本地盘不允许
本地盘实例是否支持变更配置仅允许变更带宽
系统盘挂载点范围/dev/vda
数据盘挂载点范围/dev/vd[b-z]
备注 块存储按照二进制单位计算。二进制单位用于表示1024进位的数据大小。例如,1GiB=1024MiB。

存储容量单位包

限制项普通用户限制提升配额方式
一次可以购买的存储容量单位包最大容量50TiB提交工单
同一地域内最大支持购买SCU数量100个
一个存储容量单位包的能设置的最大生效时长3年
存储容量单位包支持的产品类型
  • ESSD云盘、SSD云盘、高效云盘和普通云盘
  • 容量型NAS和性能型NAS
  • 普通快照
  • 标准型OSS、低频型OSS和归档型OSS

快照

限制项普通用户限制提升限额方式
每块云盘可以保留的手动快照个数256
每块云盘可以保留的自动快照个数1000
一个账号在一个地域可以保留的自动快照策略数量100

镜像

限制项普通用户限制提升限额方式
一个账号在一个地域的保有自定义镜像配额100提交工单
单个镜像最多可共享的用户数量50提交工单
镜像与实例规格的限制4GiB及以上内存的实例规格不能使用32位镜像。

SSH密钥对

限制项普通用户限制提升限额方式
一个账号在每个地域的SSH密钥对配额500
支持SSH密钥对的实例规格不支持系列I的非I/O优化实例
支持SSH密钥对的镜像类型仅支持Linux系统

公网带宽

限制项普通用户限制提升限额方式
入带宽峰值
  • 当所购出带宽峰值小于等于10Mbit/s时,阿里云会分配10Mbit/s入方向带宽。
  • 当所购出带宽峰值大于10Mbit/s时,阿里云会分配与购买的出带宽峰值相等的入方向带宽。
出带宽峰值
  • 按使用流量计费:100Mbit/s
  • 按固定带宽计费:
    • 包年包月实例:200Mbit/s
    • 按量付费实例:100Mbit/s
单实例更换分配的公网IP地址的限制新建实例六小时内可以更换公网IP地址,一台实例最多可以更换三次。

安全组

限制项普通安全组限制企业安全组限制
一个账号在一个地域可以创建的安全组数量100与普通安全组相同
一个经典网络类型的安全组能容纳的经典网络类型ECS实例数量1000 不支持经典网络
一个专有网络VPC类型的安全组能容纳的VPC类型ECS实例数量不固定,受安全组能容纳的私网IP地址数量影响。无限制
一台ECS实例可以加入的安全组数量5

如需提高上限,请提交工单,可以增加到10个或者16个安全组。

与普通安全组相同
一台ECS实例的每张弹性网卡可以加入的安全组数量
一个安全组最大规则数量(包括入方向规则与出方向规则)200 与普通安全组相同
一张弹性网卡在所有已加入的安全组中的最大规则数量(包括入方向规则与出方向规则)1000与普通安全组相同
一个专有网络VPC类型的安全组能容纳的私网IP地址数量2000 65536
公网访问端口出方向的SMTP默认端口25默认受限,而且不能通过安全组规则打开。与普通安全组相同
  •  如果您有超过1000台经典网络类型ECS实例需要内网互访,可以将ECS实例分配到多个安全组内,并通过互相授权的方式允许互访。
  •  如果您提高了一台ECS实例的可以加入的安全组数量限制,相应的安全组最大规则数量会下降。该实例可加入的安全组数量乘以每个安全组入方向和出方向规则最大数量必须小于等于1000。即5*200=1000、10*100=1000、16*60≤1000。
  •  如果您有超过2000个私网IP需要内网互访,可以将这些私网IP的ECS实例分配到多个安全组内,并通过互相授权的方式允许互访。

部署集

限制项普通用户限制提升限额方式
一个账号在一个地域内的部署集配额2提交工单
一个部署集内能容纳的实例数量一个可用区内最多允许7台实例,一个地域内允许7*(可用区数量)的实例数量。
部署集内能创建的实例规格部署集现阶段能创建的ECS实例规格族仅支持:c6、g6、r6、hfc6、hfg6、hfr6、d2、d2s、d2c、c5、d1、d1ne、g5、hfc5、hfg5、i2、i2g、i1、ic5、r5、se1ne、sn1ne和sn2ne 。

云助手

限制项普通用户限制提升限额方式
一个账号在一个阿里云地域下能创建的云助手命令数量100提交工单
一个账号在一个阿里云地域下每天能运行的云助手命令数量5000提交工单

弹性网卡

限制项普通用户限制提升限额方式
一个账号在一个地域的弹性网卡配额100提交工单

标签

限制项普通用户限制提升限额方式
单台实例允许绑定的标签数量20

API

限制项普通用户限制提升限额方式
CreateInstance调用次数一分钟内最多200次提交工单
  五、提供完整的阿里云地域和可用区列表。
  
  每个地域完全独立。每个可用区完全隔离,但同一个地域内的可用区之间使用低时延链路相连。地域和可用区之间的关系如下图所示。


地域(Region)

地域是指物理的数据中心。资源创建成功后不能更换地域。当前所有的地域、地域所在城市和 Region ID 的对照关系如下表所示。不同产品可选择的地域有所不同
  • 中国内地
    地域名称所在城市Region ID可用区数量
    华北 1青岛cn-qingdao2
    华北 2北京cn-beijing8
    华北 3张家口cn-zhangjiakou2
    华北 5呼和浩特cn-huhehaote2
    华东 1杭州cn-hangzhou8
    华东 2上海cn-shanghai6
    华南 1深圳cn-shenzhen5
    华南 2河源cn-heyuan2
    西南 1成都cn-chengdu2
  • 其他国家和地区
    地域名称所在城市Region ID可用区数量
    中国香港香港cn-hongkong2
    亚太东南 1新加坡ap-southeast-13
    亚太东南 2悉尼ap-southeast-22
    亚太东南 3吉隆坡ap-southeast-32
    亚太东南 5雅加达ap-southeast-52
    亚太南部 1孟买ap-south-12
    亚太东北 1东京ap-northeast-12
    美国西部 1硅谷us-west-12
    美国东部 1弗吉尼亚us-east-12
    欧洲中部 1法兰克福eu-central-12
    英国(伦敦)伦敦eu-west-12
    中东东部 1迪拜me-east-11
  选择地域时,您需要考虑以下几个因素:
  
  地理位置

  请根据您以及您目标用户所在的地理位置选择地域。
  
  中国内地
  一般情况下建议选择和您目标用户所在地域最为接近的数据中心,可以进一步提升用户访问速度。不过,在基础设施、BGP 网络品质、服务质量、云服务器操作使用与配置等方面,阿里云中国内地地域没有太大区别。BGP 网络可以保证中国内地全部地域的快速访问。
  
  其他国家及地区
  其他国家及地区提供国际带宽,主要面向非中国内地用户。如果您在中国内地,使用这些地域会有较长的访问延迟,不建议您使用。
  对中国香港、东南亚有需求的用户,可以选择中国香港地域、亚太东南 1 地域、亚太东南 3 地域或亚太东南 5 地域。
  对日、韩有需求的用户,可以选择亚太东北 1 地域。
  对印度有需求的用户,可以选择亚太南部 1 地域。
  对澳大利亚地区有需求的用户,可以选择亚太东南 2 地域。
  对美洲有需求用户,可以选择美国地域。
  对欧洲大陆有需求的用户,可以选择欧洲中部 1 地域。
  对中东地区有需求的用户,可以选择中东东部 1 地域。
  
  阿里云产品之间的关系
  如果多个阿里云产品一起搭配使用,需要注意不同地域的云服务器 ECS、关系型数据库 RDS、对象存储服务 OSS 内网不互通。
  
  资源的价格
  不同地域的资源价格可能有差异,请参见阿里云产品定价页面。
  
  关于经营许可证备案
  选择地域时您需要考虑某些地区的特殊要求。如您在中国内地地域购买了 ECS 实例,并用于 Web 服务器,您需要完成经营许可证备案。
  如您有办理经营许可证备案的需求,请您重点关注:
  北京地区企业,请选择购买的地域为华北 2。广东地区企业,请选择购买的地域为华南 1。
  
  备注 各省通信管理局对经营性备案的审批要求不同,如有变化,请以当地管局经营性备案网站公示内容为准。请参考《各省经营性备案网站链接》。
  
  可用区(Zone)
  可用区是指在同一地域内,电力和网络互相独立的物理区域。同一可用区内实例之间的网络延时更小。
  在同一地域内可用区与可用区之间内网互通,可用区之间能做到故障隔离。是否将实例放在同一可用区内,主要取决于对容灾能力和网络延时的要求。
  如果您的应用需要较高的容灾能力,建议您将实例部署在同一地域的不同可用区内。如果您的应用要求实例之间的网络延时较低,建议您将实例创建在同一可用区内。

联系客服免费领取更多阿里云产品新购、续费升级折扣,叠加官网活动折上折更优惠