重庆独木桥广告有限...
服务:5件诚信:90分
动力无限
服务:3件诚信:80分
开腾网络旗舰店
服务:2件诚信:90分
道道的服务小站
服务:3件诚信:80分
阿文网络技术服务中...
服务:3件诚信:80分
喵呜设计
服务:2件诚信:90分
武汉创梦互联科技
服务:4件诚信:90分
悦阁科技
服务:2件诚信:90分
杂记映画
服务:2件诚信:90分
北京毓辰创意
服务:3件诚信:85分

怎样去优化人工智能存储

294

发布：2021-10-13 17:25:22 来自地平线无际蚂蚜会员 L1

如今的人工智能和深度学习应用程序中使用了大数据集和快速 I/O 技术，但数据存储可能会导致性能问题。人们需要了解人工智能和深度学习存储系统应该具备哪些功能。

人工智能技术广泛应用在机器学习和深度学习中，已经引发了研究和产品开发的爆炸性增长，因为企业发现了创造性的方法，将这些新算法用于过程自动化和预测性见解的创新方法。机器学习和深度学习模型的本质要求获取、准备、移动和处理大量数据集，后者通常模拟大脑的神经结构和连接性。

特别是深度学习模型需要大量数据集，这对于人工智能和深度学习的存储是一种独特的挑战。简要介绍机器学习和深度学习软件的本质，将会揭示存储系统对于这些算法如此重要以提供及时准确结果的原因。

为什么人工智能和深度学习的存储很重要

许多研究者已经证明，随着数据集的增加，深度学习模型的准确性也会提高。这一改进意义重大，研究人员经常使用复杂的数据增强技术来综合生成额外的数据用于模型训练。

例如，用于对各种深度学习图像分类算法进行基准测试的ImageNet数据集包含超过1400万张具有大量注释的图像。虽然经常用于对图像分类硬件进行基准测试的ResNet-50模型的大小刚好超过100MB。这些模型最好保存在内存中，必须不断地提供数据，这通常会导致存储系统成为整体性能的瓶颈。

深度学习存储系统设计必须在各种数据类型和深度学习模型之间提供平衡的性能。

无论模型和应用如何，深度学习包括两个步骤：模型训练和数据推理。训练是在使用训练数据集进行重复的、通常是递归的计算的基础上计算和优化模型参数的过程。数据推理是在新的输入数据上使用经过训练的模型进行分类和预测的地方。

每个步骤都会以不同的方式强调为人工智能和深度学习提供存储的系统。通过训练，其压力源于大型数据集和对计算复合体（通常是分布式集群）的快速I/O，这是可接受性能所必需的。通过推理，其压力来自数据的实时性，必须以最小的延迟处理这些数据。

深度学习的存储性能要求

深度学习算法的本质意味着它们使用了大量的矩阵数学。与计算机图形不同，神经网络和其他深度学习模型不需要高精度浮点结果，并且通常由新一代人工智能优化的 GPU 和支持低精度8位和16位矩阵计算的 CPU 进一步加速，这种优化可以将存储系统转变为更大的性能瓶颈。

深度学习模型和数据源的多样性，以及通常用于深度学习服务器的分布式计算设计，意味着旨在为人工智能提供存储的系统必须解决以下问题：

•各种各样的数据格式，包括二进制对象（BLOB）数据、图像、视频、音频、文本和结构化数据，它们具有不同的格式和I/O特性。

•横向扩展系统架构，其中工作负载分布在多个系统中，通常为4到16个，用于培训，可能有数百个或数千个用于数据推理。

•带宽和吞吐量，可以快速向计算硬件提供大量数据。

•无论数据特性如何，IOPS都能维持高吞吐量;也就是说，可以实现许多小交易和较少的大转移。

•以最小的延迟提供数据，因为与虚拟内存分页一样，当GPU等待新数据时，训练算法的性能会显著降低。

深度学习存储系统设计必须在各种数据类型和深度学习模型中提供均衡的性能。根据Nvidia公司一位工程师的说法，在各种负载条件下验证存储系统性能至关重要。

他说，“工作负载的复杂性加上深度学习培训所需的数据量创造了一个具有挑战性的性能环境。考虑到这些环境的复杂性，在投入生产之前收集基准性能数据，验证核心系统（硬件组件和操作系统）是否能够在综合负载下提供预期性能至关重要。”

深度学习存储系统的核心功能

上述性能因素促使人工智能存储系统供应商采用五项核心功能，其中包括：

1.可增量扩展的并行扩展系统设计，其中I/O性能随容量而扩展。这种设计的一个标志是分布式存储体系结构或文件系统，它将对象和文件等逻辑元素与保存它们的物理设备或设备区分开。

2.可编程的、软件定义的控制平台，它是实现横向扩展设计和大多数管理任务自动化的关键。

3.企业级可靠性、耐久性、冗余和存储服务。

4.对于深度学习培训系统，采用紧密耦合的计算存储系统架构，采用无阻塞网络设计，连接服务器和存储，最低链路速度为10GB至2 5G B 以太网或EDR（25Gbps）Infiniband。

5. SSD设备越来越多地使用速度更快的NVMe设备，提供比SATA更高的吞吐量和IOPS。

o DAS系统通常使用NVMe-over-PCIe设备。

o NAS 设计通常使用10Gb以太网或更快的以太网，使用NVMe over fabric、Infiniband或交换PCIe结构。

Nvidia公司的DGX-2系统是深度学习的高性能系统架构的一个例子。

量身定制的存储产品

人工智能现在是一项热门技术，供应商通过混合使用新产品和更新产品快速应对市场，以满足人工智能工作负载的需求。鉴于市场活力，不会尝试提供针对人工智能存储优化或针对的产品的综合目录，但以下是一些示例：

Dell EMC 公司针对人工智能提供的现成解决方案，包括机架、服务器、存储、边缘交换机、管理节点。该存储使用isilon H600或F800所有闪存扩展NAS，带有40GbE网络链路。

DDN A3I使用 AI 200或AI400 NVMe全闪存阵列（AFA），分别具有360TB容量和750K和1.5 MI OPS以及4或8个100GbE或EDR InfiniBand 接口，或DDN AI7990混合存储设备（5.4 PB）容量，750K IOPS和4个100 GbE或EDR InfiniBand接口。DDN还将产品与Nvidia DGX-1 GPU加速服务器和Hewlett Packard En te rprise Apollo 6500加速服务器捆绑在一起。

IBM Elas ti c Storage Server AFA阵列具有多种基于SSD硬盘的配置，可提供高达1.1 PB的可用容量。IBM公司还有一个参考系统架构，它将Elas TI c Storage Server与Power Systems服务器和PowerAI Enterprise软件堆栈相结合。

NetApp OnTap AI参考架构将Nvidia DGX-1服务器与NetApp AFA A800系统和两个Cisco Nexus 3K 100GbE交换机相结合。A800可提供1M IOPS，延迟时间为半毫秒，其横向扩展设计可在24节点集群中提供超过11M的IOPS。

Pure Storage AIRI是另一个DGX-1集成系统，它使用Pure的FlashBlade AFA系统，支持文件和对象存储。Arista、Cisco或Mellanox交换机提供参考系统。例如，Arista公司设计使用15个17TB FlashBlades和8个40GbE链路连接到Arista 32端口100 GbE交换机。

Pure Storage的AIRI系统架构

深度学习推理系统对存储子系统的要求较低，通常可以通过在x86服务器中使用本地SSD硬盘来实现。虽然推理平台通常是具有本地SSD硬盘或NVMe插槽的传统1U和2U服务器设计，但它们越来越多地包括计算加速器，如Nvidia T4 GPU或可以将一些深度学习操作编译到硬件中的 FPGA 。

责任编辑：Ct

特别声明：本文仅供交流学习 , 版权归属原作者，并不代表蚂蚜网赞同其观点和对其真实性负责。若文章无意侵犯到您的知识产权，损害了您的利益，烦请与我们联系vmaya_gz@126.com，我们将在24小时内进行修改或删除。

û79 ñ1380 37

《石器时代》发正式海报锁定2月22日爆笑来袭
《石器时代之百万大侦探》正式海报腾讯娱乐讯由新锐影人王松执导的荒诞喜剧《石器时代之百万大侦探》已锁定春季档，将于2月22日公映。影片讲述
忍受你的坏脾气 ⋅1433人浏览 ⋅一个月前
原著里秦放也对司藤这么好吗？原著秦放终极舔狗且与司藤无感情线
原标题：原著里秦放也对司藤这么好吗？原著秦放终极舔狗且与司藤无感情线看《司藤》电视剧，很多人都get到了秦放和司藤的cp感了吧？在剧中第
傻萌小学妹 ⋅2229人浏览 ⋅一个月前
疑似毛晓彤爸爸聊天截图，索要5000万后，还要带仇人搞垮女儿
在7月初，某“当红女星”的亲生父亲上社会求助类节目，向亲生女儿索要5000万赡养费的节目在网络上引起了轩然大波。根据节目里透露出来的关键
万象皆为过客 ⋅3344人浏览 ⋅一个月前
吴孟达逝世网友不舍，翻出旧作重温，发现他居然和赵本山演过戏？
原标题：吴孟达逝世网友不舍，翻出旧作重温，发现他居然和赵本山演过戏？由于吴孟达的逝世，很多喜欢他的网友都开始重刷他生前拍过的电影电视剧，
我陪着你走 ⋅2974人浏览 ⋅一个月前
《深海历险记》携手天堂电影院为西部贫困儿童带来海洋体验
由西班牙TheThinklab制作团队制作，曾获得奥斯卡参赛资格的导演JulioSoto指导，大地电影和东方龙之梦公司联合出品的3D动画
被风吹过灼思 ⋅677人浏览 ⋅一个月前
《终结者5》曝片场照施瓦辛格亮相与主演摆造型
《终结者5》新片场照，施瓦辛格回归施瓦辛格空降西安老牌硬汉亲和力十足1'44''38关闭自动播放相关专辑推荐视频：收起视频正在播放腾讯娱
巷雨优美回忆 ⋅3698人浏览 ⋅一个月前
复盘《李焕英》的“情感密码”
原标题：复盘《李焕英》的“情感密码”文｜胖部票房告破50亿后，《你好，李焕英》的成绩还在稳定增长。站在目前的节点重新回看《你好，李焕英》
醉枫染墨 ⋅4648人浏览 ⋅一个月前
日本女星工藤静香曾被滑浪板击中致面容歪曲
工藤静香木村嫂工藤静香与AKB同登台显老态0'8''收起推荐视频：取消自动播放正在播放信息时报5月16日报道据日本媒体报道，木村拓哉现年
紫色的彩虹 ⋅4799人浏览 ⋅一个月前
《碟仙诡谭》发海报碟仙替章鱼保罗预测世界杯
《碟仙诡谭》海报-预测世界杯第三十七期：实验揭秘碟仙真的存在吗？14'34''390936关闭自动播放相关专辑推荐视频：收起视频正在播放
傻萌小学妹 ⋅2854人浏览 ⋅一个月前
欢欢黑化、米桃动手、子悠精神分裂，《小舍得》三家教育都有问题
原标题：欢欢黑化、米桃动手、子悠精神分裂，《小舍得》三家教育都有问题文/好饭娱乐（ID:Haofunyule）最近，由宋佳、佟大为、蒋欣
乱世梦红颜 ⋅1609人浏览 ⋅一个月前
《活佛济公3》开播陈浩民三演济公妻女带身边
《活佛济公3》剧照本报讯记者王琳娜报道去年年末“非礼陈嘉桓”一事曝光，陈浩民(微博)原本健康的个人形象大打折扣。半年多来，陈浩民一直努力
格子的夏天 ⋅3513人浏览 ⋅一个月前
谭松韵新戏上映，钟楚曦罗晋加盟，众多明星为这部戏打call
原标题：谭松韵新戏上映，钟楚曦罗晋加盟，众多明星为这部戏打call今天正式上映的新片是《八月未央》，改编自同名小说，是一部非常优秀、非常
全网暗恋者 ⋅1523人浏览 ⋅一个月前
刘宇宁发长文告别，迪丽热巴吴磊拍摄海报，cp感超强，甜蜜开嗑
原标题：刘宇宁发长文告别，迪丽热巴吴磊拍摄海报，cp感超强，甜蜜开嗑《长歌行》大结局，不少人通过超前点播，提前了解了结局，皓都和乐嫣大婚
你的眸中有星辰 ⋅1820人浏览 ⋅一个月前
姚晨新剧看点十足，和白宇的cp莫名般配，只有他被吐槽了
原标题：姚晨新剧看点十足，和白宇的cp莫名般配，只有他被吐槽了本文由明星粉丝团作者芦笙原创，未经允许不得转载姚晨的新剧《假日暖洋洋》开播
海氹有点甜 ⋅1653人浏览 ⋅一个月前
95后拎起钱包支援《阿凡达》
原标题：95后拎起钱包支援《阿凡达》作者：克瑞斯编辑：秦安娜“喜大普奔！”、“爷青回！”今天的朋友圈像是个大喜的日子。朋友们刷屏晒《阿凡
乱世梦红颜 ⋅1145人浏览 ⋅一个月前
郭靖宇导演的《娘道》到底如何？
文｜胖部编辑｜朴芳在刚刚过去的这个周末，导演郭靖宇和他的新作《娘道》成为所有人关注的焦点，关于收视率遭遇“黑势力”的话题也引发了上级有关
你与清晨阳光 ⋅1723人浏览 ⋅一个月前
《长歌行》：上线39天播放量破25亿又怎样？它终究还是辜负了观众
原标题：《长歌行》：上线39天播放量破25亿又怎样？它终究还是辜负了观众自《长歌行》播出以来，褒贬不一，连豆瓣评分都呈现很奇怪的趋势，可
高冷低能儿 ⋅2875人浏览 ⋅一个月前
首周票房8.96亿，力压《碟中谍6》，他创下的轰动不输阿汤哥
9月份第一周全球票房出炉，华纳《修女》新开画力压《碟中谍6》等大片夺得周末全球冠军宝座！这段时间国内没有国产大片，而在映的几部好莱坞大片
蜜心萝莉酱 ⋅3894人浏览 ⋅一个月前
《诡拼车》北京首映设立10万元“吐槽基金”
《诡拼车》主创合影《诡拼车》人物版终极预告1'46''1434收起推荐视频：正在播放腾讯娱乐讯（文/付超）11月5日，惊悚悬疑片《诡拼车
采姑娘的小蘑菇 ⋅3983人浏览 ⋅一个月前
又一部顶级烂剧诞生，烂出了新高度，不输《大宋宫词》
原标题：又一部顶级烂剧诞生，烂出了新高度，不输《大宋宫词》2021年3月，国产新剧可谓看点十足，武侠剧《山河令》最为火爆，收视和口碑双丰
橱窗的光 ⋅2344人浏览 ⋅一个月前