打通任督二脉，突破智能计算的内存瓶颈

熊东旭

2021-05-27

傲腾持久内存智能计算英特尔

导语：英特尔傲腾持久内存是英特尔智能计算平台构建的重要组成部分自2019年发布以来已更新到第二代傲腾持久内存的推出并非取代传统DRAMNAND而是与之共存填补二者之间在容量性能上的空�构成一个完整的存储体系

对剁手党来说，普遍的感受是京东物流比菜鸟物流快，上午订货，下午送达，到底怎么做到的？

其实很简单，因为京东是自建物流，全国各大城市都建有京东的大型物流仓库中心，通过大数据分析区域需求进行提前备货，客户下单后就近发货，同城送达。较之而言，菜鸟物流是通过与各大快递公司建立合作关系，货物寄送依赖卖家和快递公司处理，大多是跨地区的点对点寄送，由买家到当地物流站点领取，物流较慢。

这就好比内存和硬盘的区别，内存离CPU较近，读写速度快，能以更高的效率处理指令。硬盘读写速度较慢，数据需先调入内存，再由CPU读取。倘若要保持计算过程的高速运转，就必须保证内存容量足够大。但实际情况是，服务器往往受限于插槽数量与单根内存容量，内存容量扩展往往受到极大限制。

特别是当前企业数据呈现出爆炸式增长态势，化解不断增加的数据处理需求与捉襟见肘的内存容量及性能需求之间的矛盾，就成为当下企业推进数字化转型和智能化升级面临的主要挑战之一。值得庆幸的是，随着英特尔傲腾持久内存AEP的推出，问题正在迎刃而解。

何谓傲腾持久内存？

英特尔傲腾持久内存全称为Optane Persistent Memory，英特尔内部简称AEP，是英特尔智能计算平台构建的重要组成部分。自2019年发布以来已更新到第二代，傲腾持久内存的推出并非取代传统DRAM、NAND，而是与之共存，填补二者之间在容量、性能上的空档，构成一个完整的存储体系。

相比DRAM，傲腾持久内存在容量和价格上均占优；相比NAND SSD，傲腾持久内存性能占优。傲腾持久内存可提供两种运行模式，即App Direct模式、内存模式。

App Direct模式是一个持久应用模式，只有在操作系统和应用已经被开发出来时，才可以充当新一层的内存，并加以使用。在APP Direct模式下，傲腾持久内存与DRAM可进一步优化应用，确定数据存放的最佳位置，以提升整体性能。

内存模式是易失性存储，可理解为系统额外扩展内存，可与系统原有DRAM一起，在无需重写软件情况下，解决用户内存容量不足问题。由于是与内存捆绑在一起，傲腾持久内存能够帮助用户建立更多的VEM、容器及应用密度。对于内存扩容能力有限的服务器，傲腾持久内存就是企业的完美之选，不仅能大幅提升服务器整体性能，更避免了更换任何部件。

傲腾持久内存价值如何体现？

2020年，新冠肺炎疫情的暴发以及新基建的推出，深刻的影响着企业数字化转型的态度。一方面物联网、5G、大数据以及人工智能等新兴技术在抗击新冠肺炎疫情以及推动企业复工复产中的成熟表现，让企业更加坚定了推进数字化转型的决心和信心。另一方面“新基建”的推出进一步强化了数字化转型、智能化升级以及融合创新等基础设施服务体系建设，不断释放企业数字化转型新动能。双重因素叠加为企业转型提供了良好发展条件和时代环境，然而不可回避的是，企业转型路途依然任重道远。

首先，基于安全性和可靠性等多重因素考虑，企业都不敢冒然将研发、生产等核心业务托管到云端。对于这类业务，企业大多选择在本地数据中心部署。随着数字化应用和工业智能化场景的增多，企业每天需要处理的数据在急剧飙升，不仅对平台性能提出了更高要求，对数据的存储管理能力也提出了更严峻的挑战。

其次，随着物联网、边缘计算以及人工智能等技术融入到工业场景，企业的工业智能化水平也在逐步提升，工业智能化不仅会产生海量过程工业数据，而且大多是低延时、高实时性的边缘计算应用，对服务器的性能、可靠性和稳定性都有极高要求。

近年来，针对企业关键业务数据的急剧增长以及工业智能化场景应用的大量落地，为支撑海量数据存储以及智能计算需求，英特尔通过智能计算能力革新，为华为新一代FusionServer Pro服务器搭配AI加速的至强可扩展处理器以及傲腾持久内存，不仅突破传统服务器广泛存在的存储性能瓶颈，更让服务器具备AI加速能力。在面对海量密集型智能计算时，能极大提升数据处理分析效率。目前华为FusionServer Pro智能服务器在企业的很多场景都得到了广泛应用。

在产品研发领域，为加速工厂的建设并降低成本，企业依赖工业仿真平台对从产品设计、工艺、装配、生产线及工厂布局进行全三维虚拟化仿真以验证设计过程，过程中涉及大量复杂的静动态结构性分析，对硬件的计算能力有着极高要求。以往为支撑这一过程，企业采用服务器、工作站等高性能平台来支撑，这需要企业配置更快的CPU、GPU以及更大的内存。然而受限于服务器和工作站有限的内存扩展能力，往往会出现内存已用尽，CPU利用率却很低的情况，使得整体性能无法充分发挥，英特尔傲腾持久内存恰好可以解决这一问题。

在最新的存储性能测试中，傲腾持久内存的延迟低至350纳秒，接近普通DRAM性能。而单根容量最高可达512G，使得传统服务器内存很容易扩展到TB级，内存容量的极大扩展以性能的大幅提升，极大地满足了高复杂场景仿真过程中海量数据计算的需求。

目前，华为为德国几大领先车企提供 FusionServer Pro X系列高密服务器，搭配的就是英特尔至强可扩展处理器和傲腾持久内存。以碰撞测试为例，这些德国大型车厂每年要做几万次碰撞模拟，只有几百次是用真实的原型车碰撞模拟,其他都是通过软件实现的，每年所产生的仿真数据高达几十EB，虽然经过数据过滤选出关键数据，但是数据量还是高达几百TB。而利用傲腾持久内存的TB级内存级扩充能力，不仅帮助车企提高汽车设计效率、缩短设计周期，还帮助节省了能耗和物理空间，简化了使用和维护，并大幅降低了总体成本。

在业务运营领域，以ERP、MES为核心的业务资源运营对内存及缓存的容量和性能延时极为敏感。ERP处理特点是每到月底做报表统计时，各部门业务数据都要汇总进来处理，数据计算量特别高，基本好多天都处于峰值，这时候内存容量就捉襟见肘。MES每分钟都有大量的工厂基础数据被收集到MES系统中，长期运行MES系统，必然需要超大容量的存储才可以保证数据完整性，所以在MES系统硬件采购中，要保证系统具有良好的扩展能力。

这意味着这些应用效率与内存容量大小以及性能高低存在密切的正向关系。内存越大可支撑的用户并发数就越多，内存延时越低则代表I/O性能更好，单位时间内数据处理效率越高。显然，傲腾持久内存有着其他存储介质无法比拟的优势。

在生产制造领域，随着物联网、5G、边缘计算以及人工智能等技术融入到工业制造，在加速工业智能化场景得以落地，如VR/AR培训、产品预测维护、机器视觉检测等，这些智能化场景依赖于推理和运算，需要高性能的AI服务器做支撑，不但内存容量需求大，对智能计算的性能要求也很高。

美的与英特尔合作打造的工业视觉检测云平台，就是以Analytics Zoo数据分析 + AI平台，利用 Spark的各种流水线、内置模型、特征操作等，构建基于大数据的深度学习端到端应用。整个视觉检测过程一个重要的性能瓶颈节点是，从磁盘中读取输入数据并进行预处理，构建模型并进行训练和推理分析，这个过程对边缘计算服务器的AI计算能力以及内存性能有着很高的要求。

目前，第二代英特尔至强可扩展处理器以及傲腾持久内存已经发布，针对工业边缘计算场景，两大产品组合能从智能计算和内存扩展两个方面进一步帮助企业优化并提升服务器性能，无需改变现有硬件。

除此之外，针对日趋复杂的异构算力融合以及跨平台架构的AI开发需求，英特尔发布了oneAPI统一编程平台以及端到端大数据处理+分析平台，不但实现了跨CPU、GPU、FPGA、ASIC的异构算力整合，并提供跨架构、跨平台的AI应用开发支持，解决开发者在不同架构开发需要使用不同的语言、库和软件工具进行编程的局限，真正意义上放大了AI开发的价值。

当前，随着企业数字化转型和智能化升级的推进，企业的数据量正呈现出快速增长，而智能化场景的落地也提升了企业对于智能计算的应用需求，这同时使得企业对于计算的需求出现了明显的变化：

第一，企业需要性能更强的处理器以及容量更大、性能更好的内存。第二，面对日渐增多的训练推理场景，企业需要服务器的计算过程更加智能；第三，对于多元化应用发展，企业对跨架构的异构算力整合有着急迫需求。

作为全球唯一一家拥有CPU、GPU、FPGA、ASIC全场景芯片的公司，近年英特尔加速推进工业智能化平台的算力布局，不仅实现了异构算力整合，还实现了从云到端、从训练到推理的全业务AI场景覆盖。为加速落地智能计算落地步伐，为中国工业智能化转型赋能，英特尔正在不断深化与华为在服务器领域的合作，通过FusionServer Pro智能服务器为企业数字化和工业智能化转型赋能，让智能计算在云、边缘到端的自由流动。

暂无评论,等你抢沙发

特别推荐

对话侯康选：从“抢修”到“预防”，智能IT运维的正确打开方式

中小企业数字化转型框架与总路线图

一周热榜