DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools...

33
Dell Customer Communication - Confidential SSD 策略 采用 Dell EMC Isilon SmartPools 的新一代存储分层 © 2019 Dell Inc. 或其子公司。 采用 DELL EMC ISILON SMARTPOOLS 存储分层 摘要 本白皮书介绍 Dell EMC Isilon SmartPools 软件的技术概况,包括该软件提供 基于策略的本机分层功能的方式,这种方式通过自动将数据移至 Isilon 群集内 最合适的存储层,让企业降低存储成本并优化存储投资。 2019 8 白皮书

Transcript of DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools...

Page 1: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

1 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

SSD 策略

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

采用 DELL EMC ISILON SMARTPOOLS 的

存储分层

摘要

本白皮书介绍 Dell EMC Isilon SmartPools 软件的技术概况,包括该软件提供

基于策略的本机分层功能的方式,这种方式通过自动将数据移至 Isilon 群集内

最合适的存储层,让企业降低存储成本并优化存储投资。

2019 年 8 月

白皮书

Page 2: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

2 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

目录

简介 ...................................................................................................................................................... 4

适用对象............................................................................................................................................... 4

Isilon 横向扩展 NAS 体系结构 .............................................................................................................. 4

单一文件系统 ...................................................................................................................................................................... 4

数据布局和保护 .................................................................................................................................................................. 5

作业引擎 ............................................................................................................................................................................. 6

数据重新平衡 ...................................................................................................................................................................... 6

缓存 .................................................................................................................................................................................... 7

SmartPools .......................................................................................................................................... 8

概述 .................................................................................................................................................................................... 8

硬件层 ................................................................................................................................................................................. 8

存储池 ................................................................................................................................................................................. 9

磁盘池 ................................................................................................................................................................................. 9

节点池 ............................................................................................................................................................................... 10

层 ...................................................................................................................................................................................... 11

节点兼容性和等效性 ......................................................................................................................................................... 12

SSD 兼容性 ...................................................................................................................................................................... 14

数据溢出 ........................................................................................................................................................................... 14

自动调配 ........................................................................................................................................................................... 14

手动管理的节点池 ............................................................................................................................................................ 14

全局命名空间加速 ............................................................................................................................................................ 15

虚拟热备盘 ....................................................................................................................................................................... 15

SmartDedupe 和分层 ....................................................................................................................................................... 16

SmartPools 许可 .............................................................................................................................................................. 16

文件池 ............................................................................................................................................................................... 16

文件池策略 ....................................................................................................................................................................... 17

自定义文件属性 ................................................................................................................................................................ 19

SmartPools 作业剖析 ....................................................................................................................................................... 20

文件池策略引擎 ................................................................................................................................................................ 20

FilePolicy 作业 .................................................................................................................................................................. 21

数据位置 ........................................................................................................................................................................... 23

节点池亲近性 .................................................................................................................................................................... 24

通过 SmartPools 提高性能 ............................................................................................................................................... 24

Page 3: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

3 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

使用 SmartPools 提高性能 ............................................................................................................................................... 24

数据访问设置 .................................................................................................................................................................... 25

利用 SSD 提高元数据和数据性能..................................................................................................................................... 25

启用 L3 缓存 (SmartFlash) ............................................................................................................................................... 26

最大程度降低分层数据的性能影响 ................................................................................................................................... 27

SmartPools 最佳做法 ....................................................................................................................................................... 27

SmartPools 使用情形 ....................................................................................................................................................... 27

SmartPools 工作流示例 ..................................................................................................................... 28

示例 A:媒体后期制作中的存储成本效率 ........................................................................................................................ 28

示例 B:半导体设计中的数据可用性和保护 ..................................................................................................................... 29

示例 C:金融市场数据的投资保护 ................................................................................................................................... 30

示例 D:用于地震解读的元数据性能................................................................................................................................ 31

结论 .................................................................................................................................................... 32

版本历史记录 ..................................................................................................................................... 33

采取下一步行动 .................................................................................................................................. 33

Page 4: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

4 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

简介

Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

的存储资源池中聚合和整合广泛应用程序的功能。这有助于通过单点管理提供精细的性能优化、工作流隔离、更高的利用率和独立的可

扩展性。

SmartPools 使您能够基于策略定义您的工作流内数据的价值,并随着时间推移自动将数据与性价比合适的层对应起来。可以无缝地移动

数据,而且借助于文件级粒度以及采用自动策略的控制措施、手动控制或应用程序编程接口 (API),您可以调整性能和数据布局、存储层

对应关系以及保护设置,而这一切对终端用户的影响极小。

存储分层具有极具说服力的价值主张,即根据数据的业务价值对其进行隔离,并为其匹配适当的存储类别以及性能和保护级别。信息生

命周期管理技术已经问世多年,但通常难以解决以下效率低下的问题:复杂的安装和管理,涉及对文件系统的更改,需要使用存根文

件,等等。

Dell EMC Isilon SmartPools 是下一代分层方法,可推动异构群集的管理。SmartPools 功能是 Isilon OneFS 横向扩展文件系统的本机功

能,可实现卓越的灵活性、粒度和易管理性。为实现此目的,SmartPools 利用了 OneFS 的许多组件和属性,包括数据布局和移动性、

保护、性能、调度和影响管理。

适用对象

本白皮书提供有关部署和管理异构 Dell EMC Isilon 群集的信息,本白皮书不包含 Isilon OneFS 体系结构的详细背景。

有关 OneFS 体系结构的更多详细信息,请参阅 OneFS 技术概述白皮书。

本白皮书面向在 Isilon 群集存储环境中配置和管理数据分层的人士。假定读者已具有存储、网络连接、操作系统和数据管理的基本

知识。

OneFS 管理指南中提供了有关 OneFS 命令和功能配置的详细信息。

Isilon 横向扩展 NAS 体系结构

在 Isilon 横向扩展 Network Attached Storage (NAS) 中,OneFS 将传统存储体系结构的三个层次(文件系统、卷管理器和数据保护)

整合为一个统一的软件层,创建了一个在 Isilon 存储群集上运行的智能分布式文件系统。

图 1. OneFS 将文件系统、卷管理器和数据保护整合为单个智能分布式系统。

这是一种核心创新,直接助推企业成功地在其当今环境中利用横向扩展 NAS。它遵循了横向扩展的重要原则:智能软件、商用硬件和分

布式体系结构。OneFS 不仅是操作系统,也是在 Isilon 存储群集中存储和管理数据的底层文件系统。

单一文件系统

OneFS 提供了一个单一文件系统,摆脱了传统纵向扩展构造(如 RAID 组)的限制,允许将数据放在群集的任意位置,适应各种级别的

性能和保护。

每个群集在单个卷和命名空间中运行,文件系统分布在所有节点上。因此,没有分区,客户可以从群集中的任何节点获得其数据的连贯

视图。

Page 5: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

5 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

由于所有信息都跨内部网络在节点之间共享,因此数据可写入任何节点或从中读取,从而在多个用户同时读取和写入相同数据集时优化

性能。

从应用程序或用户的角度来看,所有容量均可用,因为对于用户和管理员,存储已被完全虚拟化了。文件系统可以有机地增长,不需要

太多规划或监督。不需要管理员特别考虑将文件分层到适当的磁盘,SmartPools 可以自动完成这一工作。另外,也不需要考虑如何复制

这么大的一个文件系统,因为 Isilon SyncIQ 服务会自动并行地将数据传输到一个或多个备用群集上。

有关 OneFS 体系结构的更多详细信息,请参阅 OneFS 技术概述白皮书。

数据布局和保护

即便同时发生了多个组件故障(目前为每个节点池四个),OneFS 也完全能提供对整个文件系统和数据集的访问。数据保护在文件级别

实施,使用 Reed Solomon 擦除编码,不依赖任何硬件 RAID 控制器。这会带来许多好处,包括能够随着市场条件或硬件属性和特点的

演变而添加新的数据保护方案。由于保护应用在文件级别上,所以只需升级 OneFS 软件,即可使用新的保护和性能方案。

OneFS 采用主流的 Reed-Solomon 擦除编码算法进行保护计算。保护应用在文件级别上,让群集能够快速、高效地恢复数据。信息节

点、目录和其他元数据在与它们所引用的数据块相同或更高的级别上得到保护。由于所有数据、元数据和前向纠错 (FEC) 数据块跨多个

节点分条,所以不需要专用的奇偶校验驱动器。这样可以防止单点故障和瓶颈,允许文件重建高度并行化,确保了一个群集中的所有硬

件组件始终发挥有效作用。

OneFS 支持多种保护方案,其中包括无处不在的 +2d:1n 方案,该方案可防止两个驱动器发生故障或一个节点发生故障。

Isilon 最佳做法是对特定群集配置使用建议的保护级别。在 OneFS WebUI 存储池配置页面中,这个建议的保护级别被明确标记为

“建议”,通常默认进行配置。对于所有当前的新一代硬件配置,建议的保护级别为“+2d:1n”。

混合保护方案对于 Isilon 新一代机箱和其他高密度节点配置尤其有用,在这些配置中,多个驱动器发生故障的概率远远超过整个节点发

生故障的概率。假设多个设备同时出现故障(机率很小),导致文件“超出相应的保护级别”,OneFS 将尽可能重新保护所有文件,并

在群集日志上报告受影响文件上的相关错误。

OneFS 还提供多种镜像选项(2 倍到 8 倍),可实现指定内容的二至八次镜像。这种方法被用来保护 OneFS 元数据。例如,默认元数

据在 FEC 以上的一个级别中完成镜像。例如,如果按照 +1n 方案保护某个文件,则其关联元数据对象将被镜像 3 次。

下表总结了 OneFS 保护级别的完整范围:

保护级别 描述

+1n 可容忍 1 个驱动器或者 1 个节点发生故障

+2d:1n 可容忍 2 个驱动器或者 1 个节点发生故障

+2n 可容忍 2 个驱动器或者 2 个节点发生故障

+3d:1n 可容忍 3 个驱动器或者 1 个节点发生故障

+3d:1n1d 可容忍 3 个驱动器或者 1 个节点和 1 个驱动器发生故障

+3n 可容忍 3 个驱动器或者 3 个节点发生故障

+4d:1n 可容忍 4 个驱动器或者 1 个节点发生故障

+4d:2n 可容忍 4 个驱动器或者 2 个节点发生故障

+4n 可容忍 4 个节点发生故障

2 倍到 8 倍 根据配置在 2 到 8 个节点上镜像

表 1:OneFS FEC 保护级别

Page 6: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

6 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

此外,单个 OneFS 文件系统中数据和元数据结构的逻辑分离允许 SmartPools 单独管理数据和元数据对象,正如我们所看到的那样。

OneFS 将文件和目录元数据存储在信息节点和 B 树中,允许文件系统扩展至数十亿个对象,并且仍提供非常快速的数据或元数据查找。

OneFS 是完全对称的完全分布式文件系统,数据和元数据分布在多个硬件设备上。出于空间效率原因,一般采用擦除编码来保护数据,

使得在有五个或五个以上节点的群集上的空间利用率高达 80% 及以上。镜像元数据(通常占系统的大约 2%)可提高性能和可用性。保

护级别可按照从文件到文件系统的粒度来动态配置。数据和元数据访问和锁定在整个群集中是连贯的,这种对称性对于实现 OneFS 的

无共享体系结构的简单性和弹性至关重要。

当客户端连接到 OneFS 管理的节点并执行写入操作时,文件先被分成更小的逻辑区块或条带单元,然后写入磁盘。然后,在群集节点

之间条带化这些区块,通过擦除编码或镜像保护这些区块。OneFS 主要使用 Reed-Solomon 擦除编码系统进行数据保护,并对元数据进

行镜像。Isilon 的文件级保护通常提供业界领先的利用率级别。对于九个节点的群集和更大的群集,OneFS 能够承受最多四个完整节点

故障,同时仍提供对数据的完全访问权限。

OneFS 根据数据的访问模式,如流式传输、并发、随机等,使用多种数据布局方法来进行优化,以期获得最高效率和性能。而且,同保

护一样,也可以按照文件或系统来应用这些性能属性。

有关 OneFS 数据保护级别的更多详细信息,请参阅 OneFS 技术概述白皮书。

作业引擎

作业引擎是 OneFS 的并行任务计划框架,负责整个群集中关键作业和操作的分布式执行和影响管理。

OneFS 作业引擎规划和管理所有数据保护和后台群集任务:为每个任务创建作业、确定作业的优先级,以及确保节点间通信和群集范围

容量利用率及性能实现平衡且得到优化. 作业引擎确保核心群集功能优先于不太重要的工作,使与 OneFS 集成的应用程序(通过

OneFS API 集成到 OneFS 的 Isilon 附加软件和应用程序)能够控制其各项功能的优先级,从而确保获得最佳资源利用率。

以 SmartPools 作业为例,每项作业都有一个“影响配置文件”,其中包含一个可配置策略、一个反映作业将占用系统资源量的计划、

以及一个影响策略和一个影响计划。虽然作业要执行的工作量是固定的,但用于该工作的资源是可调整的,因此能够最大限度地减少对

其他群集功能(如提供客户端数据)的影响。

SmartPools 功能包含的特定作业包括:

作业 描述

SmartPools 在同一群集内的节点层之间运行和移动数据的作业。如果经过许可和配置,

也执行 CloudPools 功能。

SmartPoolsTree 在子树上实施 SmartPools 文件策略。

FilePolicy 高效的基于更改列表的 SmartPools 文件池策略作业。

IndexUpdate 为 FilePolicy 作业创建并更新高效的文件系统索引。

SetProtectPlus 应用默认文件策略。如果在群集中激活了 SmartPools,则此作业将被禁用。

当运行 FSAnalyze 作业的群集升级到 OneFS 8.2 时,将删除旧的 FSAnalyze 索引和快照,替换为 IndexUpdate 首次运行时的新快

照。新 FSA 索引存储比旧 FSA 索引多得多的文件和快照属性。在 IndexUpdate 作业影响此更改之前,FSA 一直在旧索引和快照上

运行。

数据重新平衡

另一个关键作业引擎任务是 AutoBalance。该任务使 OneFS 可以在群集的节点中间重新分配、重新平衡或重新条带化数据,使存储空间

利用率更加一致和高效。

Page 7: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

7 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

OneFS 直接管理文件数据保护,当发生驱动器或整个节点故障时,它会以并行方式重建数据。OneFS 避免了对于专用热备盘和串行驱

动器重建的需要,只借取文件系统中的可用自由空间来恢复故障;此技术称为“虚拟热备盘”。此方法使得群集可以自行修复,无需人

工干预,且具有快速并行重建数据的优势。管理员可以创建虚拟热备盘预留,以防止用户消耗为虚拟热备盘预留的容量。

选择一个新布局的过程称为“重新条带化”,这种机制对于修复、重新平衡和分层完全一样。数据在后台移动,文件始终可用,过程对

于终端用户和应用程序来说完全透明。

有关详细信息,请参阅 OneFS 作业引擎白皮书。

缓存

SmartCache 是全局连贯的读写缓存基础架构,提供低延迟的内容访问。如同群集中的其他资源,当添加更多节点时,群集的总缓存大

小也会增加,使得 Isilon 能够在单个文件系统中提供可预测、可扩展的性能。

Isilon 群集提供高度的缓存/磁盘比(每节点数 GB),可根据需要为读取操作动态分配。本缓存在群集中的所有节点上都是统一、连续

的,可使某个节点的用户从已在另一个节点上处理的 I/O 中受益。OneFS 在每个节点上仅存储截然不同的 数据。该节点的 RAM 用作此

类数据的“2 级”(L2) 缓存。可以非常快速地跨底板访问这些截然不同的缓存数据块,同时,随着群集增长,缓存优势增加。因此,

Isilon 群集上的磁盘 I/O 量通常明显低于传统平台,从而有利于减少延迟并提供更好的用户体验。对于按顺序访问的数据,OneFS

SmartRead 主动预取数据,这大幅提高了所有协议的读取性能。

可选的第三层读取缓存称为 SmartFlash 或 3 级缓存 (L3),也可在包含固态驱动器 (SSD) 的节点上配置。SmartFlash 是一种逐出缓存,

当 L2 缓存数据块在内存中老化时,则填充到 SmartFlash 中。使用 SSD 而非传统文件系统存储设备进行缓存有诸多优势。例如,将

SSD 预留用于缓存时,整个 SSD 都将得以使用,而且写入也将以高度线性和可预测的方式发生。相比常规文件系统的使用,特别是包

含随机写入工作负载的情形,这将大幅优化利用率,同时显著降低磨损,提高耐用性。相比将 SSD 用作存储层,将 SSD 用于缓存还能

大为简化 SSD 容量调整,且更不容易产生错误。

OneFS 写缓存使用写缓冲将多个写入操作聚合或合并到 NVRAM 文件系统日志中,以便将它们安全、高效地写入到磁盘。这种形式的缓

冲减少了磁盘写入代价,或者每次写入操作都可能需要多个读取和写入。

图 2:OneFS 缓存层次结构

有关详细信息,请参阅 OneFS SmartFlash 白皮书。

Page 8: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

8 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

SmartPools

概述

SmartPools 是新一代数据分层产品,直接构建在上述核心 OneFS 特性之上。其中包括单文件系统、可扩展数据布局和保护框架、并行

作业执行和智能缓存体系结构。

SmartPools 最初设想为两个基本概念的组合:

• 在单个异构群集中定义子硬件集的能力。

• 通过简单的逻辑定义或规则将文件的逻辑分组与这些硬件子集相关联的方法。

图 3. SmartPools 分层模型

当前的 SmartPools 实施在这两个核心概念上以多种其他方式扩展,同时保持简单性和易用性作为主要目标。

硬件层

异构 Isilon 群集可以采用各种节点样式和容量进行架构,以满足不同数据集和广泛工作负载的需求。这些节点样式包含几代硬件,大致

可分为四类或四层。下表显示这些层以及相关的硬件模型:

具有 SmartPools

的 OneFS

以太网或 Infiniband 网络

闪存

I/Ops

混合

吞吐量

归档

容量

Page 9: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

9 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

表 1:Isilon 硬件层和节点世代

存储池

存储池提供了在单个群集内定义硬件子集的功能,允许通过配置存储池策略将文件布局与特定的节点集相对应。存储池是一个抽象概

念,其中包含磁盘池、节点池和层,如下所述。

磁盘池

磁盘池是存储池层次结构中的最小单元,如下面的图 4 中所示。OneFS 资源调配的前提是将类似节点的驱动器划分为集合或磁盘池,

每个池代表一个单独的故障域。

默认情况下,按照 +2d:1n 方案(即可承受两个磁盘或整个一个节点故障)来保护这些磁盘池,并通过 Isilon 的新一代硬件从四个节点

扩展到二十个节点。新一代机箱包含四个计算模块(每个节点一个),每个节点五个驱动器容器(或“托架”)。

图 4. 显示驱动器托架的新一代机箱前视图

每个托架是一个托盘,可以从机箱前端滑入,包含三到六个驱动器,具体取决于特定节点机箱的配置。磁盘池分布在每个节点的所有

五个托架上。例如,新一代节点(每个托架具有三个驱动器)将具有以下磁盘池配置:

节点 1 节点 2 节点 3 节点 4

托架 1

托架 2

托架 3

托架 4

托架 5

Page 10: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

10 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

图 5. 新一代节点磁盘池

上一代 Isilon 硬件利用从三个节点扩展到四十个节点的六驱动器节点池。

每个驱动器只能属于一个磁盘池,数据保护条带或镜像不能跨磁盘池扩展(全局命名空间加速额外镜像例外,如下所述)。磁盘池由

OneFS 管理,用户不能配置。

节点池

节点池是一组磁盘池,分布于类似的 Isilon 存储节点(同等类)上。如下面的图 5 所示。多组不同节点类型可以在单个异构群集中协同

工作。例如:一个用于 I/Ops 密集型应用程序的 F 系列节点的节点池,一个主要用于高并行和串行工作负载的 H 系列节点的节点池,以

及一个主要用于近线和/或深度归档工作负载的 A 系列节点的节点池。

这允许 OneFS 呈现一个存储资源池,其中包含多个驱动器介质类型(如 SSD、高速 SAS、大容量 SATA),可提供一系列不同的性

能、保护和容量特性。这种异构存储池反过来又可以通过一个统一的管理点来支持多种应用程序和工作负载要求。它还有利于融合旧的

和新的硬件,轻松实现多代产品的投资保护和无缝硬件更新。

每个节点池仅包含来自相同类型的存储节点的磁盘池,磁盘池只属于一个节点池。例如,具有 1.6 TB SSD 驱动器的 F 系列节点将位于

一个节点池中,而具有 10 TB SATA 驱动器的 A 系列节点将位于另一个池中。目前,对于新一代硬件,每个节点池至少需要 4 个节点

(一个机箱),或者每个节点池至少需要 3 个上一代节点。

当在一个节点池中分配了至少三个来自同一兼容性类的节点之后,调配节点(节点不相互关联且不可写入),。如果从节点池中删除

了节点,则该节点池变为未调配池。在这种情况下,如果保留两个类似节点,它们仍然可写。如果只保留一个节点,该节点自动设置

为只读。

创建节点池后,可以轻松修改池来适应不断变化的要求。可以将单个节点从一个节点池重新分配到另一个节点池。也可以放弃节点池关

联,释放其中的成员节点,以便将其添加到新的或现有池中。也可以随时重命名节点池,而无需更改节点池配置中的任何其他设置。

添加到群集中的任何新节点会自动分配给某个节点池,然后再细分为磁盘池,无需任何额外的配置步骤,并将继承节点池的 SmartPools

配置属性。这意味着,只需为每个节点池配置一次磁盘池数据保护、布局和缓存设置,可以在首次创建节点池时配置。自动分配由新节

点与匹配最近的节点池的共同属性确定(具有 600GB SAS 驱动器的 S 节点加入具有 600GB 驱动器的 S 节点的磁盘池)。如果新节点

与任何现有节点池中的节点都大不相同,则它保持未调配状态,直到满足关于类似节点的最低节点池节点成员资格(即三个具有相同或类

似存储和内存配置的节点)。

Page 11: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

11 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

创建新节点池并添加节点后,SmartPools 将这些节点与一个 ID 相关联。该 ID 还用于文件池策略和文件属性中,以指示特定磁盘池中的

文件放置。

默认情况下,特定文件池策略未涵盖的文件将转到默认节点池或设置期间标识的池中。如果未指定默认池,SmartPools 将把该数据写入

具有最高可用容量的池中。

图 6. 自动调配到节点池

层是根据 OneFS 平台类型划分的节点池组,组合为一个逻辑超集来优化数据存储。如下面的图 6 所示。例如,类似的“存档”节点池

经常整合到一个层中。此层可将不同样式的 NL 和 HD 系列节点池(即带有 2 TB SATA 驱动器的 NL410 和带有 4 TB SATA 驱动器的

HD400)合并到一个逻辑容器中。这是一个巨大的好处,因为它允许那些始终如一购买高容量节点的客户能够将各种样式节点整合到一

个组或层中并作为一个逻辑组来管理。

Page 12: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

12 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

图 7. SmartPools 层配置

SmartPools 用户通常部署 2 到 4 层,最快的层通常包含 SSD 节点,用于工作流中性能要求最严苛的分区,最低的层偏向容量,包含数

TB SATA 驱动器节点。

图 8. SmartPools WebUI 视图 — 层和节点池

节点兼容性和等效性

SmartPools 允许将特定 OneFS 版本支持的任何类型的节点合并到同一群集中。类似节点将根据其物理属性调配到不同的节点池,这些

节点的等效分类非常严格。这样做是为了避免将不合比例的工作量导向群集资源的某一部分。这通常称为“节点霸凌”(node bullying),

可表现为严重过度利用资源,如 CPU、网络或磁盘等。

Page 13: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

13 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

表 2:OneFS 中最新一代的节点内存兼容性。

但是,管理员可以通过创建层来安全地将特定数据定位到更广泛的存储类。例如,如果一个群集包含两种不同类型的 X 节点,则两种节

点将自动调配到两个不同的节点池。这两个节点池可以在逻辑上组合成一个层,作为文件的放置目标,实现跨节点池之间的自动平衡。

创建节点池的准则包括:

1. 在调配节点池之前,对于新一代硬件,一个特定类型的至少四个节点必须添加到群集中,对于老一代硬件,则必须至少添加三个。

2. 如果添加了三个或三个以上节点,但可访问的节点不到三个,则群集将处于降级状态。群集能否使用,取决于是否仍有群集仲裁

(超过总可用节点一半以上)。

3. 群集中的所有节点都必须具有一个当前有效的支持合同。

SmartPools 按节点类型分隔硬件,并为每个截然不同的硬件型号创建一个单独的节点池。要驻留在同一个节点池中,节点必须具有一组

共同的核心属性:

1. 系列(如 X 系列)

2. 机箱大小(如 4 机架单元)

3. 世代(410 系列)

4. RAM 容量(如 256GB)

5. 驱动器容量(硬盘和 SSD 容量和数量)

但是,为第四代和第五代节点样式保留了等效类。如果在一个群集中添加了不到三个 S210 或 X410 节点,则可以使用现有 S200 或

X400 节点池来定义兼容性,以使新节点在同一个池中发挥功能。

Page 14: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

14 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

S210 节点与 S200 节点池兼容,X410 与 X400 节点兼容。节点兼容性仅允许将具有相同驱动器类型、数量、容量、兼容 RAM 配置的

节点调配到相同的池中。

由于巨大的体系结构差异,新一代 Isilon 硬件与任何老一代 Isilon 硬件之间不存在节点兼容性。

SSD 兼容性

OneFS 还包含 SSD 兼容性选项,允许将具有不同 SSD 容量和数量的节点调配到一个节点池中。

以下节点类型可以创建 SSD 兼容性:S200、S210、X200、X210、X400、X410、NL400 和 NL410。例如,如果为 S200 节点池配置

了 SSD 兼容性,那么所有 S200 节点(不管其 SSD 容量如何)都可以调配到同一个节点池中。

以具有两个 S200 节点池的群集为例:第一个池有三个 S200 节点,每个节点包含一个 400GB SSD,第二个池包含三个 S200 节点,

每个节点包含一个 800GB SSD。如果您想要将这两个 S200 池合二为一,可以创建 SSD 兼容性来实现此目的。

在 OneFS WebUI SmartPools 兼容性列表中创建和描述 SSD 兼容性,并且也在“Tiers & Node Pools”列表中显示。

在创建此 SSD 兼容性时,OneFS 会自动检查要合并的两个池是否具有相同数量的 SSD(如果需要)、层、请求的保护和 L3 缓存

设置。如果这些设置不同,OneFS WebUI 将提示您整合和对齐这些设置

数据溢出

如果一个节点池填满,则对该池的写入会自动溢出到下一个池。此默认行为确保了工作的继续,即便一种容量已满。在某些情况下,溢

出是不合时宜的,例如,当组织中的不同业务部门购买了单独的池,或者数据位置存在安全或保护影响时。在这些情况中,只需禁用溢

出功能。禁用溢出可确保一个文件位于一个池中,不会移到另一个池中。请记住,为虚拟热备份预留的容量会影响溢出,例如,如果将

VHS 配置为预留 10% 的池容量,则溢出将在池容量达到 90% 时发生。

可以在 SmartPools 之外配置保护设置,在群集级别管理这些设置,或在 SmartPools 内配置,在节点池或文件池级别管理。无论保护级

别存在与否,它们都是完全可配置的,并且节点池的默认保护设置为 +2d:1n。

自动调配

OneFS 中的数据分层与管理由 SmartPools 框架处理。从数据保护和布局效率的角度来看,SmartPools 有助于将大量高容量同构节点细

分为更小、更高效的受保护磁盘池。例如,具有 3TB SATA 磁盘的 40 个节点近线群集通常在 +4n 保护级别运行。不过,如果将它分成

两个 20 个节点的磁盘池,则每一个池可在 +2n 保护级别运行,从而降低保护开销,提高空间利用率,而不会净增加管理开销。

为了达到简化存储管理的目的,OneFS 将自动计算群集并将其划分为磁盘池,并且会针对平均数据丢失时间 (MTTDL) 和高效空间利用

率优化这些磁盘池。这意味着保护级别决策(如上面的四十个节点的群集示例)不会留待客户作出。

通过自动调配,每组等效节点硬件将自动分为磁盘池,其中包含高达四十个节点,每个节点六个驱动器。这样的磁盘池可承受每个磁盘

池上发生至多两个驱动器故障。多个类似的磁盘池自动合并为节点池,节点池进一步聚合成逻辑层,通过 SmartPools 文件池策略进行

管理。将一个节点的磁盘细分为多个受单独保护的磁盘池后,节点比之前更能抵抗多磁盘故障。

最初配置群集时,OneFS 会自动将节点分配给节点池。节点不会池化,不会彼此关联,直到至少将三个节点分配到节点池为止。少于三

个节点的节点池被视为未调配池。

手动管理的节点池

在有些环境中,当 OneFS 创建的自动调配节点池不适合时,可以手动重新配置它们。过程是,先创建一个手动节点池,然后将节点从

现有节点池移到新近创建的节点池。

Isilon 建议使用默认的自动调配的节点池。手动分配的池在性能和存储效率上可能不如自动分配的池,特别是当所做更改导致手动

节点池中不足 20 个节点时。

Page 15: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

15 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

全局命名空间加速

全局命名空间加速 (GNA) 是一种未授权的可配置的 SmartPools 组件。GNA 的首要目标是帮助加速元数据读取操作(如,文件名查

找),所采用的方法是在高性能、低延迟的 SSD 介质上保留群集元数据的一个副本。这让客户可以跨整个文件系统提高特定工作负载的

性能,而无需为群集中的每个节点升级/购买 SSD。如下面的图 9 所示。为了实现这一点,会将不含 SSD 的存储池的额外元数据镜像存

储在群集中其他可用的 SSD 上,无论节点池边界如何。因此,元数据读取操作将得以加速,即使是针对不含 SSD 的节点池中的数据,

依旧如此。

图 9. 全局命名空间加速

GNA 的目的是提高元数据密集型应用程序和工作负载(如主目录、具有密集枚举的工作流和需要大量比较的活动)的性能。Isilon 的大

多数成熟市场和新兴市场中有元数据读取密集型工作流的示例。在某些工作流(例如 EDA)中,此类工作负载占主导地位,使用 SSD

提供其所需的性能十分普遍。

虚拟热备盘

SmartPools 虚拟热备盘 (VHS) 可帮助确保节点池保持足够的可用空间,以便在发生驱动器故障时成功地重新保护数据。尽管全局配置

了 VHS,但它实际上在节点池级别运行,因此,具有不同大小驱动器的节点会预留适当的 VHS 空间。这有助于确保在修复期间,数据

即便可能从一个磁盘池移到另一个磁盘池,但仍保留在同类存储上。VHS 预留是在群集范围内的,可配置为总存储的一定百分比 (0-

20%),或一定的虚拟驱动器数量 (1-4)。此预留机制就是在每个节点池的组成磁盘池中分配一小部分节点池的 VHS 空间。

除非整个节点池由 SSD 组成,否则不会在 SSD 上为 VHS 预留空间。这意味着,在修复期间,故障 SSD 可能将数据移动到 HDD,但

如果不添加额外的配置设置,则需在节点池中预留不合比例的 SSD 空间。

新群集的默认设置是,虚拟热备盘通过一个虚拟驱动器同时启用“减少可用空间量”和“拒绝新数据写入”。升级时将保留现有设置。

建议所有客户启用虚拟热备盘。

Page 16: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

16 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

SmartDedupe 和分层

Isilon 的 SmartDedupe 产品通过减少承载组织数据所需的物理存储量,最大限度提高群集的存储效率。通过扫描磁盘数据中的相同数据

块,然后消除任何重复项目来实现高效率。此方法通常称为“后处理”或“异步重复数据消除”。在发现重复数据块之后,

SmartDedupe 会将这些数据块的一个副本移到称为“卷影存储”的一组特殊文件中。在此过程中,将从实际文件中删除重复数据块并替

换为指向卷影存储区的指针。

OneFS SmartDedupe 不会对跨越 SmartPools 节点池或层或者设置了不同保护级别的文件执行重复数据消除。这避免了潜在的性能问题

或保护不对称,而如果文件的各个部分位于不同类别的存储上,则可能发生这类问题。但是,已经消除了重复数据并且移到具有不同磁

盘池策略 ID 的池的文件仍将保留对原始池上卷影存储的卷影引用。 这虽然违反了有关跨不同磁盘池策略进行重复数据消除的规则,但

这样做总比再扩充 (rehydrate) 移除的文件要好。

针对该文件的进一步重复数据消除活动将不再允许引用原始卷影存储中的任何数据块。 需要针对同一磁盘池策略中的其他文件对该文件

进行重复数据消除。如果该文件尚未执行重复数据消除,则重复数据消除索引可能了解该文件,并仍认为其位于原始池中。 当与该文件

中的数据块进行匹配时,将发现并纠正此情况。由于移动的文件已进行重复数据消除,所以,重复数据消除索引将仅了解卷影存储。因

为卷影存储未移动,所以不会导致进一步匹配的问题。但是,如果卷影存储也移动了(但不是两个文件都移动),则会发生类似情况,

SmartDedupe 作业将发现此情况,并从重复数据消除索引中清除卷影存储的知识。

有关详细信息,请参阅 OneFS SmartDedupe 白皮书。

SmartPools 许可

基本 SmartPools 许可证允许做三件事:

1. 手动将单个文件设置为特定的存储池。

2. 配置文件池策略的所有方面。

3. 运行 SmartPools 作业。

SmartPools 作业按计划运行,并应用因文件池策略配置、文件系统活动或仅仅是时间推移而发生的更改。可通过标准作业引擎方式配置

计划,默认值为每天晚上 10 点。

SmartPools 的存储池配置不需要许可证。驱动器自动调配到磁盘池和节点池。可以创建层,但没有多大用处,因为文件将在磁盘池之间

均匀分配。“全局 SmartPools 设置”仍全部可用,但前提是,对于未授权情况下的“一切”将强行启用溢出。当任何文件可随处存储

时,溢出则无意义。

默认文件池策略将应用于所有文件。这可用于设置保护策略和 I/O 优化设置,但不能更改磁盘池策略。在作出更改时,SetProtectPlus

作业将运行,以强制实施这些设置。

在 SmartPools 许可证失效的情况下,将忽略文件信息节点上设置的磁盘池策略,并将该策略视为“ANY”(任何)磁盘池策略。但

是,因为只在选择新磁盘池目标时才评估磁盘池策略,所以,对具有有效目标的文件的写入将继续根据旧磁盘池策略定向到那些目标,

直至“重新保护”或更高级别的重新条带化导致磁盘池目标被重新评估。新文件将继承父文件的磁盘池策略(可能通过新文件属性机

制),但该磁盘池策略将被忽略,并将根据“ANY”(任何)策略选择其磁盘池目标。

当 SmartPools 未获许可时,将忽略任何磁盘池策略。取而代之的是,将考虑包括所有磁盘池的策略,这样一来,文件数据将定向到所

有池并平衡分布。

文件池

这是 SmartPools 逻辑层,用户可配置的文件池策略在此控制放置、保护、访问数据的位置以及数据在节点池和层之间的移动方式。从

概念上讲,它与存储 ILM(信息生命周期管理)类似,但不涉及文件存根或其他文件系统修改。文件池允许数据在单个群集中从一种存

储类型自动移动到另一种存储类型,以满足性能、空间、成本或其他要求,同时保留其数据保护设置。例如,一条文件池策略可以规

定:写入路径 /ifs/foo 的任何数据都将进入节点池 1 中的 S 系列节点,然后在超过 30 天后,移至节点池 3 的 NL 系列节点。

为了简化管理,已为节点池和文件池设置了默认值,以处理基本的数据放置、移动、保护和性能。所有这些也可以通过简单直观的 UI

进行配置,实现精细化控制。此外,所提供的可自定义的模板策略针对归档、额外保护、性能和 VMware 文件进行了优化。

当 SmartPools 作业运行时,可能会移动、保护数据或更改数据布局等。没有存根。因为文件系统本身在做这项工作,所以没有透明度

或数据访问风险。

Page 17: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

17 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

数据移动与被用来加快作业完成速度的多个节点的资源并行。当一个作业正在进行时,所有数据完全可用于用户和应用程序。

通过添加系统缓存或固态硬盘 (SSD),也可以增强不同节点的性能。Isilon 横向扩展 NAS 群集可以利用最多 37TB 的全局连贯缓存。

可通过多达六个 SSD 驱动器扩充大多数节点。

在文件池内,可以将 SSD“”策略”配置为在该池中的 SSD 上放置该池的元数据(甚至其部分数据)的副本。启用全局命名空间加速

(GNA) 后,整个群集的所有元数据的副本将保存在 SSD 上,这样,可以加快对群集上所有数据(甚至不含 SSD 的节点上的数据)的访

问。对于永远不需要加速的数据,正确的 SSD 策略是避开 SSD。

可对总体系统性能影响进行配置,以适应环境工作负载的高峰与低谷。可以更改任何 SmartPools 作业的时间或频率,以及分配给

SmartPools 的资源量。对于极高利用率的环境,可以使用文件池策略示例将 SmartPools 运行时间与非峰值计算小时数进行匹配。虽然

执行 SmartPools 作业所需的资源很低,默认设置对于绝大多数环境而言足够,但是,当系统资源被大量利用时,额外控制是有益的。

图 10. SmartPools 文件池策略引擎

文件池策略

SmartPools 文件池策略可用于广泛地控制一个文件的三个主要属性。即:

1. 文件驻留的位置。

2. 层

3. 节点池

文件性能配置文件(I/O 优化设置)。

1. 顺序

2. 并发

3. 随机

4. SmartCache 写缓存

文件的保护级别。

1. 奇偶校验保护(+1n 到 +4n、+2d:1n 等)

Page 18: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

18 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

2. 镜像 (2x – 8x)

文件池策略基于策略可以匹配的文件属性。文件池策略可以使用的属性包括:文件名、路径、文件类型、文件大小、修改时间、创建时

间、元数据更改时间、访问时间或用户属性。

在设置文件属性以选择相应的文件后,可以添加要在这些文件上执行的操作。例如,如果属性是文件大小,则可以使用其他设置来规定

阈值(所有文件大于 ... 小于 ...)。接下来,应用操作:移至节点池 x,设置为 y 保护级别,并针对 z 访问设置进行布局。

文件属性 描述

文件名 根据文件名指定文件条件

路径 根据文件的存储位置指定文件条件

文件类型 基于文件系统对象类型指定文件条件

文件大小 根据文件大小指定文件条件

修改时间 根据上次修改文件的时间指定文件条件

创建时间 根据文件的创建时间指定文件条件

元数据更改时间 根据上次修改文件元数据的时间指定文件条件

访问时间 根据上次访问文件的时间指定文件条件

用户属性 根据自定义属性指定文件条件 — 见下

表 3. OneFS 文件池文件属性

“与”和“或”运算符可在一个策略中组合条件,实现非常精细化的数据操作。

规定基于数据路径来放置数据的文件池策略将在数据直接写入该节点池时强制将数据放到正确的磁盘上,而不运行 SmartPools 作业。

当下个 SmartPools 作业运行时,如果有必要匹配文件池策略,则规定除了基于路径名还基于其他属性来放置数据的文件池策略会让数

据写入具有最高可用容量的磁盘池,然后移动数据。这确保了初始数据放置不会影响写入性能。

如前面的节点池部分中所述,文件池策略未涵盖的任何数据将移至完全为了此目的而选作默认位置的层。如果没有为此目的而选择的磁

盘池,则 SmartPools 默认为具有最高可用容量的节点池。

事实上,几乎总是使用默认文件池策略,因为它们可以非常强大。大多数管理员并不希望设置规则来管理其所有数据。他们通常关心的

是部分或大部分数据放置在哪里、如何访问等,但总有一些数据,它们在群集中的位置将变得不太重要。对于这样的数据,有一条默认

策略,针对的是未应用列表中任何其他策略的文件。通常,默认策略设置为优化成本并避免使用专供其他数据之需的存储池。例如,大

部分默认策略都处于较低的保护级别,仅使用最便宜的存储层。

当一条文件池策略创建后,SmartPools 会将其连同任何其他 SmartPools 策略一道存储在 Isilon OneFS 配置数据库中。当 SmartPools

作业运行时,它按顺序运行所有策略。如果文件与多个策略匹配,则 SmartPools 只应用匹配的第一个规则。例如,如果有一条规则是

将所有 jpg 文件移至近线节点池,另一条规则是将 2MB 下的所有文件移至性能层,假如 jpg 规则是列表中的首条规则的话,那么 2MB

以下的 jpg 文件将移至近线节点池,而不是性能层。如前所述,可在一条策略中使用“与”或“或”来组合条件,以便精细化地分类数

据。

以上为例,如果所需的行为是将所有 2MB 以上的 jpg 文件移动到近线节点池,则只需要用“与”运算符构造文件池策略来准确覆盖该条

件即可。

策略顺序以及策略本身在任何时候都可以轻松更改。具体而言,可以添加、删除、编辑、复制和重新排序策略。

Page 19: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

19 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

图 11. 用于控制数据移动的 SmartPools 文件池策略

图 12. 文件池策略示例

图 9 和图 10 给出了一个常见的文件池使用情形:组织想让活动数据位于第 1 层 (SAS + SSD) 中的性能节点上,而将 6 个月来未被访问

过的任何数据移至成本优化的归档层第 2 层上。

随着文件池策略列表不断增长(SmartPools 目前支持最多 128 条策略),当应用策略时,手动遍历所有这些策略以查看文件的行为已不

太现实。此外,SmartPools 还提供一些在命令行上可用的高级选项,用于此类场景的测试和故障排除。

可以随时创建、复制、修改、删除文件池策略或划定其优先级。此外,还有一些示例策略可以直接拿来使用,或作为自定义的模板。

自定义文件属性

当需要更精细的控制,但使用标准文件属性选项(文件名、路径、文件类型、文件大小、修改时间、创建时间、元数据更改时间、访问

时间)无法达到目的时,可以使用自定义文件属性或用户属性。用户属性使用键值对,通过额外标识标准来标记文件,供 SmartPools

之后用来应用文件池策略。尽管 SmartPools 没有用于设置文件属性的应用工具,但通过“setextattr”命令可以轻松做到这一点。

自定义文件属性通常用于指定所有权或创建项目相关性。例如,生物科学领域的用户知道,当科研人员早晨来到实验室上班后,便会立

即访问大量基因组测序文件,所以,他们可能会使用自定义文件属性,以确保这些文件已迁移到最快的可用存储上。

Page 20: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

20 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

设置后,自定义文件属性被 SmartPools 仅仅用作文件名、文件类型或任何其他文件属性,来为一组匹配文件指定位置、保护和性能访

问权限。与其他 SmartPools 文件池策略不同,自定义文件属性可从命令行或平台 API 上设置。

SmartPools 作业剖析

当一项 SmartPools 作业运行时,SmartPools 会检查所有文件属性,并对照 SmartPools 策略列表进行检查。为了最大限度提高效率,

SmartPools 作业会尽可能利用高效并行的元数据扫描(逻辑信息节点(或 LIN)、树扫描),而不是代价更昂贵的目录和文件树遍历。

当部署了 SmartPools SSD 元数据加速策略时,这一过程会更高效。

SmartPools LIN 树扫描针对每个节点将元数据细分为范围,然后并行处理。然后,每个节点可以指定一个或多个线程,以在指定范围内

执行扫描。LIN 树遍历还可确保每个文件只打开一次,这比目录遍历更高效,在目录遍历中,硬链接和其他构造会导致单线程、多次打

开等等。

当 SmartPools 文件池策略引擎在文件和策略之间找到匹配项时,它会停止为该文件处理策略,因为第一个策略匹配决定了对该文件做

什么。接下来,SmartPools 会对照策略检查文件当前设置,看哪些匹配,哪些不匹配。一旦 SmartPools 拥有需要应用于该文件的完

整设置列表,则会同时设置它们,并转为重新条带化该文件,以反映对节点池、保护、SmartCache 使用、布局等所做的任何及所有

更改。

文件池策略引擎

SmartPools 文件池策略引擎属于作业引擎的控制和管理范畴。此过程的默认计划是每天晚上 10 点,并带有一条低影响策略。计划、

优先级和影响策略都可以手动配置,可以根据特定环境和工作负载定制。

该引擎还可以使用单独的调用按需运行,以便将适当的文件池成员身份设置应用到单个文件或子目录,而无需等待后台扫描来完成该

操作。

要测试新策略如何影响文件处置,可以在数据子集上运行一个 SmartPools 作业。这既可以是单个文件或目录,也可以是一组文件或目

录。作业可以实时运行,以实际进行策略更改,也可以在“预演”模式下运行,以估计策略的范围和影响。这意味着可以模拟最终状

态,了解每个文件如何受到实施的文件池策略集的影响。

针对一个或一组目录运行 SmartPools 作业可用作命令行选项。以下的 CLI 语法为特定文件或子树按需运行该引擎:

isi filepool apply [-r] <文件名>

对于只计算和报告而不做更改的预演评估,可使用

isi filepool apply –nv [路径]

对于特定文件池策略,将返回以下信息:

1. 策略编号

2. 匹配的文件

3. 匹配的目录

4. 匹配的 ADS 容器

5. 匹配的 ADS 流

6. 跳过的访问更改

7. 跳过的保护更改

8. 匹配的文件创建模板

9. 放置在 HDD 上的文件数据

10. 放置在 SSD 上的文件数据

当使用上面的 CLI 应用工具时,SmartPools 将遍历指定的目录树,而不是执行 LIN 扫描,因为已在目录级别指定了操作。另外,

该命令也是同步的,因此,直到完成后才会返回命令提示符。

Page 21: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

21 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

FilePolicy 作业

传统上,OneFS 使用 SmartPools 作业来应用其文件池策略。为此,SmartPools 作业会访问每个文件,SmartPoolsTree 作业会访问

文件树。但是,这些作业的扫描部分会对群集产生重大的随机影响,并导致冗长的执行时间,特别是在 SmartPools 作业中。

为了解决这些问题,OneFS 8.2 引入了 FilePolicy 作业,该作业为应用文件池策略提供比全面的 SmartPools 作业速度更快、影响更低

的方法。当与 IndexUpdate 作业配合使用时,FilePolicy 可改善作业扫描性能,它使用文件系统索引或更改列表来查找需要策略更改的

文件,而不是完整的树扫描。

图 13. 文件系统索引、作业和使用者。

避免完整的树遍历可以大幅减少作业需要执行的锁定和元数据扫描工作量,降低对 CPU 和磁盘的影响,但代价是停掉 SmartPools

所做的一切。FilePolicy 作业仅强制执行 SmartPools 文件池策略,而非存储池设置。例如,FilePolicy 不处理存储池或存储池设置更

改,例如:

• 因添加、删除或重新组织节点池而造成的重新条带化活动。

• 存储池设置或默认值(包括保护)更改。

但是,大多数时候 SmartPools 和 FilePolicy 执行相同的工作。FilePolicy 默认处于禁用状态,它支持全部文件池策略功能,报告与

SmartPools 作业同样的信息,提供同样的配置选项。由于 FilePolicy 是基于更改列表的作业,所以最好频繁运行,一天一到多次,具体

取决于配置的文件池策略、数据大小和更改率。

可以轻松从 OneFS WebUI 配置作业计划,方法是,导航至“Cluster Management”>“Job Operations”,突出显示所需的作业,并

选择“View\Edit”。以下示例说明了如何将 IndexUpdate 作业配置为在低影响级别、优先级值为 5 的情况下每隔 6 小时运行一次:

Page 22: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

22 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

图 14. 通过 OneFS WebUI 进行 IndexUpdate 作业计划配置。

在启用并使用 FilePolicy 和 IndexUpdate 作业时,建议继续同时运行 SmartPools 作业,但频率可以低一点(每月)。

除了按配置的计划运行外,还可以手动执行 FilePolicy 作业。

FilePolicy 需要访问当前索引。在 IndexUpdate 作业未运行时,若试图启动 FilePolicy 作业,则会失败,并显示下面的错误。错误消息中

的说明将显示,提示您先运行 IndexUpdate 作业。创建索引后,FilePolicy 作业将成功运行。IndexUpdate 作业可以每天运行多次(即

每隔 6 个小时),以保持索引为最新,并防止快照变得过大。

图 15. 提示先运行 IndexUpdate 的 FilePolicy 作业错误消息。

Page 23: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

23 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

考虑将 FilePolicy 作业及下面的作业计划用于具有下列特征的工作流和数据集:

• 保留时间较长的数据

• 大量小文件

• 基于路径的文件池筛选器已配置

• 其中的 FSAnalyze 作业已在群集上运行(InsightIQ 监视的群集)

• 已经配置了一个 SnapshotIQ 计划

• SmartPools 作业通常需要运行一到多天才能在低影响下完成

在不具上述特征的群集上,建议继续如常运行 SmartPools 作业,不要激活 FilePolicy 作业。

下表提供了部署 FilePolicy 时的建议作业计划:

作业 计划 影响 优先级

FilePolicy 每天的 22:00 低 6

IndexUpdate 每天,每隔 6 个小时 低 5

SmartPools 每月,星期日的 23:00 低 6

表 4:激活 FilePolicy 作业时建议的作业计划、优先级和影响配置。

请记住,没有两个群集是相同的,所以,建议的作业计划可能需要额外调整,以适应特定环境需求。

有关作业配置的详细信息,请参阅 OneFS 作业引擎白皮书。

数据位置

文件系统资源管理器提供了一个详细的有关 SmartPools 管理的数据实时位置的视图,既包含实际节点池的位置,也包含文件池策略规

定的位置(即,下次成功完成 SmartPools 作业后,文件将移至的位置)。

当数据写入群集时,SmartPools 仅将其写入一个节点池中。这意味着,在几乎所有情况下,一个文件都会在一个节点池内完整存在,而

不是跨节点池存在。SmartPools 根据以下两种情形之一确定写入哪个池:如果文件基于目录路径与文件池策略匹配,则文件将被立即写

入文件池策略所规定的节点池。如果文件与文件池策略匹配是基于路径名以外的其他任何标准,SmartPools 将把该文件写入具有最高可

用容量的节点池。如果文件与文件池策略匹配,但后者将其放在其他节点池,而不是具有最高容量的节点池,则当下次计划的

SmartPools 作业运行时,该文件将被移走。

图 16. 文件池和节点池

考虑到性能、扣款、所有权或安全性,有时,知道一个特定文件或一组文件在任何给定时间在磁盘上的确切位置非常重要。尽管 SmartPools

环境中的任何文件通常会全部位于一个存储池中,但也有例外,即一个文件可能被临时拆分,于是在同一时间跨两个或多个节点池存在。

Page 24: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

24 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

节点池亲近性

SmartPools 通常只允许一个文件驻留在一个节点池中。在某些情况下,一个文件可能会临时横跨多个节点池。当文件池策略规定一个文

件从一个节点池移到另一个节点池时,该文件会部分位于源节点池上,部分位于目标节点池上,直到移动完成。如果节点池配置更改

(例如,将一个节点池拆分为两个节点池时),一个文件则可能被两个新池所拆分,直到下一次计划的 SmartPools 作业运行。如果一个

节点池满了,则数据会溢出到另一个节点池,以便群集可以继续接受写入,这样,一个文件可能一部分位于目标节点池上,一部分位于

默认的溢出节点池上。在最后一种情形中,一个文件可能横跨不止一个节点池,典型的重新条带化活动,如跨节点池重新平衡或重建便

是这样。

通过 SmartPools 提高性能

存储分层的原则目标之一是在降低数据存储成本的同时不牺牲数据保护或访问。分层对于性能的影响既有利也有弊。重要的是视情况而

定,并考虑在每种情况下 SmartPools 的行为方式。

使用 SmartPools 提高性能

SmartPools 可以通过多种方式来提高性能:

• 基于位置的性能

• 性能设置

• SSD 策略

• 性能隔离

基于位置的性能利用 SmartPools 的文件池策略来分类数据,将数据定向到最合适的介质(SSD、SAS 或 SATA)以满足其性能需求。

此外,SmartPools 文件池规则也允许优化数据,以同时提高性能和保护。

如我们所见,SSD 也有各种用途,可以加快数据组合、元数据读写和其他层上的元数据读取性能。

基于位置的性能的另一项应用是实现性能隔离目标。使用 SmartPools,一个特定节点池可以与几乎所有数据隔开,除了最高性能数据,

而使用文件池策略,则几乎可以将所有数据引导出该节点池,除了最关键的数据。有时,出于紧张工作原因,会采用该方法从群集中隔

离出某种类型的少许节点。由于节点池易于配置,所以可将一个大节点池拆分成许多小的节点池,然后将其中之一隔离出来用于临时用

途。拆分出的小节点池以后又可以重新配置为一个大节点池。

例如,此群集的管理员们接到一个临时需求,要为一个特定应用程序在一个有限时间内提供更高的性能支持。他们将最高性能层拆分,

并设置策略,以将所有与该项目无关的数据都迁移到其他节点池上。运行其关键应用程序的服务器可以直接访问隔离的节点池。设置的

默认策略可确保环境中的所有其他数据不会放置在隔离的节点池上。这样,新创建的节点池完全可用于关键应用程序。

图 17. 性能隔离示例

Page 25: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

25 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

数据访问设置

在文件池(甚至是单一文件)级别,可以配置数据访问设置,为访问数据的应用程序类型优化数据访问。可针对并行、流式或随机访问

优化数据。所有这些设置都可以改变数据在磁盘上的布局方式以及缓存方式。

数据访问设置 描述 磁盘上的布局 缓存

并发 优化群集上的当前负载,特点是有许多并

发客户端。本设置为混合工作负载提供最

佳行为。

将数据条带化到所需最少的驱动器上,

实现为文件配置的数据保护设置。

适度预取

流式 优化单个文件的高速流,例如使用单个客

户端进行快速读取。

将数据条带化到更多驱动器上。 积极预取

随机 通过执行几乎无缓存的预取,优化不可预

知的文件访问。

将数据条带化到所需最少的驱动器上,

实现为文件配置的数据保护设置。

几乎不需要预取

表 5. SmartPools 数据访问设置

如设置所示,随机访问设置几乎不执行读缓存预取,以避免浪费磁盘访问。这种模式最适合小文件 (< 128KB) 和具有随机小数据块访问

权限的大文件。流式访问最适合顺序读取大中型文件。这种访问模式使用积极的预取来提高总体读取吞吐量,而磁盘上的布局将文件分

布在大量磁盘上来优化访问。并行(所有文件数据的默认设置)访问是采用适度预取的一种中间态。这种模式适用于具有混合的随机和

顺序访问权限的文件集。

利用 SSD 提高元数据和数据性能

在节点池中添加 SSD 可以显著提高许多工作负载的性能。在 Isilon 体系结构中,可以使用 SSD 以及 SSD 数据或元数据加速策略,

来加速整个群集的性能。

有多个 SSD 策略可供选择:元数据加速、避开 SSD、SSD 上的数据、全局命名空间加速和 L3 缓存 (SmartFlash)。对于提供 SSD 的

池,默认设置是“元数据加速”。

• 元数据读取加速:在 SSD 上创建文件元数据的一个首选镜像,将其余元数据以及所有实际文件数据写入 HDD。

• 元数据读写加速:在 SSD 上创建文件元数据的所有镜像。

• 避开 SSD:从不使用 SSD,仅将所有关联文件数据和元数据写入 HDD。当没有足够 SSD 存储而您希望优先安排其利用时,可使

用此策略。

• SSD 上的数据:节点池的所有数据和元数据全都驻留在 SSD 上。

• 用于 L3 缓存的 SSD:一个节点池的所有 SSD 均用于 L3 或 SmartFlash 读缓存。

要在并未在默认策略中指定为“存储目标”的任何节点池上配置不同的 SSD 策略,应为每个池创建一个新的用户定义的策略。

SSD 策略和 GNA 协同工作。例如,如果一个群集的所有数据都设置为“避开 SSD”策略,则启用 GNA 不起作用,并且也不会使

用 SSD。如果文件全部设置为“元数据读取”,且 GNA 禁用,则仅具有 SSD 的节点池上的文件将获得读取加速。如果启用了 GNA,

则所有文件将获得读取加速。

混合群集(并非所有节点都包含 SSD)的共同设置通常是针对所有文件的“元数据读取”SSD 策略以及 GNA 启用。只是在将不同文件

定向到不同存储层时才需要 SmartPools 许可证。实际上,SSD 策略为全局设置,因为将在所有文件上将它设置成同样的值,即便不同

文件池的存储池设置得不一样。

确保所有 F800 节点池都配置了“元数据 + 数据”的 SSD 策略。如果为它们配置了另外的 SSD 策略,则 OneFS 不会自动使用

它们。

Page 26: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

26 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

启用 L3 缓存 (SmartFlash)

L3 缓存可通过一个简单的开启或关闭配置设置以每个节点池为基础逐一启用。除此以外,并无其他可见的配置设置需要更改。启用时,

L3 将使用节点池中的所有 SSD。而且,L3 不能与其他 SSD 策略共存,全局命名空间加速除外。L3 缓存节点池 SSD 无法参与 GNA。

默认情况下,L3 缓存将在包含 SSD 的任何新节点池中启用。

图 18. 在包含 SSD 的节点池上启用 L3 缓存。

WebUI 的“SmartPools Settings”页面也提供决定 L3 缓存是否为包含 SSD 的任何新节点池的默认配置的功能。

图 19. 在新的节点池上默认配置 L3 缓存。

当在特定节点池中转换 SSD 以使用 L3 缓存而非 SmartPools 时,用户可通过跟踪转换过程中 SSD 空间(已使用容量)而估计转换进

度。此外,也可重新设定负责 L3 转换的 FlexprotectPlus 或 SmartPools 作业的作业影响策略的优先级,以加快或减慢运行。这能够影

响反向增加或降低对群集资源转换过程的影响。

有关详细信息,请参阅 OneFS SmartFlash 白皮书。

Page 27: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

27 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

最大程度降低分层数据的性能影响

除了看到 SmartPools 增强性能的一面,还应看到,任何分层方法都存在因数据位置、分层数据移动活动等而导致的对于性能不利的

一面。

上面我们讨论过作为 SmartPools 的性能增强功能的数据位置和性能隔离。正如预料的那样,如果数据位于较慢的驱动器介质上,那么

访问它的速度通常也较慢。

横向扩展 NAS 的另一个体系结构属性是,数据可能驻留在一个节点上,而访问该数据的客户端的网络访问点却可能在另一类节点上,

或负载平衡到另一类节点。该访问节点可能具有不同的前端 IO 功能和缓存,但性能特性仍主要由数据所在的存储类掌控。

一条好的经验是,尽管 SAS 大多数时候都比 SATA 快,但磁盘轴计数产生的影响也不小。对 SmartPools 环境中性能的最大影响是应用

程序连接到的节点池中的节点特征,而不是数据实际所在的介质类型。例如,假定网络端没有瓶颈,那么流式应用程序会看到,在性能

方面,CPU 功耗较低的 SATA 节点上的数据与 CPU 功耗较高的 SAS 节点上的数据之间几无差别,只要它是通过其中的节点拥有大量

缓存的节点池连接到群集的。同样,对于具有随机访问模式的应用程序,只要它们连接到的节点池拥有充足的 CPU,那么在大多数情况

下,实际数据位置(根据旋转介质类型)就不会在性能方面有多大差别。

分层存储环境中的另一个重要性能考量因素是数据移动本身对整体系统资源的影响。数据从一个节点池移动到另一个节点池确实要使用

系统资源。SmartPools 通过多种方式减轻数据移动造成的影响。首先,在体系结构上,作业引擎非常高效。其次,利用可完全由最终用

户配置的影响策略来控制系统资源分配给数据移动的度和数据移动发生的时机。作业引擎影响策略包括:

• 已暂停:不执行任何操作并等待。

• 低:使用 10% 或更少的作业引擎分配的资源。

• 中:使用 30% 或更少的作业引擎分配的资源。

• 高:使用作业引擎分配的最大数量的资源。

可以为 SmartPools 作业设置一次影响策略,也可以通过文件池策略进行控制,文件池策略可以更改影响设置,以与特定环境中工作负

载的典型高峰与低谷相匹配。

SmartPools 最佳做法

为了获得最佳群集性能,我们建议遵循以下 OneFS SmartPools 最佳做法:

• 为每个层定义一个性能和保护配置文件,并相应地进行配置。

• 启用 SmartPools 虚拟热备盘,并分配最少 10% 的空间。

• 避免为文件创建硬链接,否则会导致文件与不同的文件池策略匹配

• 如果将节点池组合到层中,则文件池规则应以层而不是层中的特定节点池为目标。

• 避免创建将带 SSD 的节点池与不带 SSD 的节点池组合的层。

• 确保 SSD 包含至少 2% 的群集可用总容量,分布在至少 20% 的节点中,然后再启用 GNA。

• 确定特定工作负载的元数据操作是读取、写入还是读写各半,并选择最佳的 SmartPools 元数据策略。

• 确保群集容量利用率(HDD 和 SSD)始终低于 90%。

• 在启用并使用 FilePolicy 作业时,建议继续运行 SmartPools 作业,但频率可以低一点。

• 确保所有 F800 节点池都配置了“元数据 + 数据”的 SSD 策略。如果为它们配置了另外的 SSD 策略,则 OneFS 不会自动使用它

们。

• 如果 SmartPools 在 OneFS 8.2 上运行的时间超过一天,或者群集已经在运行 FSAnalyze 作业,可考虑安排 FilePolicy(以及相应

的 IndexUpdate 作业)每天运行,并将 SmartPools 作业的频率降低到每月。

SmartPools 使用情形

OneFS SmartPools 通常的使用情形有:

Page 28: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

28 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

传统文件分层

• 将“当前”数据存储在更快的节点上,将“旧”数据存储在成本优化的存储上。

• 更灵活地选择驻留哪些文件,驻留在哪里。

• 更快地移动文件。

元数据加速

• 使用 SSD 节点加速对于存储在 NL 节点上的存档数据的元数据操作(如搜索和索引)。

应用程序分区

• 将来自不同用户、组或项目的文件存储到单独的硬件上。

等效节点支持

• 将新样式的节点添加到由近乎相同的老一代节点组成的池中,或更换节点。

自动资源调配和大型群集支持

• 大型群集会自动调配到磁盘池中,以提高可靠性。

• 轻松添加节点。

• 自动配置相应的保护。

SmartPools 工作流示例

示例 A:媒体后期制作中的存储成本效率

在媒体后期制作中,通常每个阶段都会处理大量非常大的文件。编辑和视觉效果工作非常消耗存储资源,在完成后,产品归档为参考作

品并长时间保留。仅在过去五年中,随着向 3D 渲染和高清格式转移,后期制作所需的存储量增加了十倍,完工项目的规模增加了一两

倍。后期制作设施面临越来越大的压力,它们需要提供更快的周转时间、更丰富的效果,以及提供更多后期发布项目给市场搭售品、许

可产品及衍生产品。

后期制作产生大量的数据作为其主要产品。数据量可以增长到数百 TB 或者数十 PB,并且在项目处于活跃状态时,大量的人和流程需要

非常快速地访问数据。然后,产品在公司内继续其丰富的商业寿命,长期地、时不时地为后续项目提供取材内容。这意味着,当需要后

期制作数据时,它能提供关键而及时的帮助,在不需要时,它处于休眠状态,等待再次被需要和流程重复。

Page 29: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

29 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

图 20. 媒体后期制作示例

流行的做法是,采用两层或三层的解决方案,其中,工作数据位于高性能磁盘上,所有其余数据位于低性能存储上,全都设置为流式访

问,并在高级别下受保护。这样,被管理的所有数据中有 60% 到 95% 的数据可以驻留在较便宜的磁盘上,但全都能以合理的性能速率

访问。此外,可以随时将归档的数据提升到最快的磁盘上,并且,这些数据在长时间内得到全面的保护。

示例 B:半导体设计中的数据可用性和保护

逻辑和物理设计及验证是半导体生产的电子设计自动化 (EDA) 流程中复杂的早期阶段。设计数据非常关键,而上市时间是这个行业的

一个制高点。公司依靠这款产品取得收入,工作流具有高优先级。来自全球各地的众多工程师合作完成这一项目,他们都需要及时访问

数据。

以前的设计数据和其他知识产权也在后续项目中被大量利用和复用,因此,几十年的归档和保留需求非常普遍。此外,它在几年甚至几

十年中仍将发挥重要作用。但是,它已经不是及时的,没有人需要以高速性能访问老旧设计。纵然存在对于深度存档有碍限时法律取证

的争议,但引用历史设计数据的实例一般都并非很紧急,不需要改变存储它们的磁盘的类型。因此,老旧设计虽然重要,但并非及时。

Page 30: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

30 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

图 21. EDA 中的数据性能和保护

这些工程设计数据和历史设计数据示例很有价值,因为它们阐明了对于并存在同一基础架构中的两套数据(一套及时而重要,另一套重

要但不及时)的数据保护的需求。显然,需要一个系统,既能快速、便宜地供应数据,又能平等地保护两种数据。

EDA 工作流通常采用额外的存储层或“暂存空间”,以满足 HPC 计算场的瞬时处理要求。通常情况下,这会产生较高的事务处理性能

要求,并且经常会利用基于 SSD 的存储节点。但是,由于暂存的是临时数据,所以保护和保留要求非常低。

使用 SmartPools,通过一个三层的体系结构即可实现一箭三雕,这三层是:高性能 SAS 和 SSD 节点分别用于性能和暂存层,高容量

SATA 节点用于高容量归档层。使用一条文件池策略可将历史设计数据限制为高容量层,在某个高级别下保护,使用另一条策略可将当

前设计数据限制为最快层,在同样的级别下保护。

示例 C:金融市场数据的投资保护

一家投资公司全天候地从多个全球来源收集了金融市场数据。为了佐证购买建议,需要捕获和存储这些实时数据,对它们进行分析,

以预测微观和宏观的市场趋势。

数据捕获以及后续的分析结果每天会产生数 TB 的数据。实时捕获是免费的,但是,如果错过了任何时间段,则只能从服务购买历史数

据。因此,性能和可靠性很重要。大多数被分析的数据都是 48 小时内的数据,但数据也会被无限期保留,以用于长期分析和在任何审查

期限内审查模型随时间变化的准确性。

Page 31: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

31 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

图 22. 金融服务工作负载示例

由于这是一个要求严格的生产环境,数据寿命非常长,所以,非常需要一个可扩展、耐用的系统,将性能和归档功能与极具吸引力的拥

有成本相结合。

在这种情况下,首选的体系结构通常是一个使用 L3 缓存的三层的 SmartPools 群集,其中,新数据被引入到中等性能的旋转介质中,

分析在高性能旋转介质(可能包含 SSD)上运行,较老的数据因为只间歇性地使用,所以被移到较慢、成本优化的磁盘上。

原始设备长年在线,只是在变成完全资本化的容量时才在层次结构中下沉,而具有更好的价格和/或性能特性的新的驱动器和新节点添加

到它们之上。这种 OneFS 投资保护方法有助于消除因频繁更换硬件而带来的痛苦和中断。

示例 D:用于地震解读的元数据性能

能源勘探所需的地震数据通常非常庞大,且在不断增长,许多组织保留了成 PB 的数据在线,以获得更快的分析和更准确的钻探预测。

这些数据可能分布在数以万计的文件中,跨越数以万计的目录。虽然常用的文件不到 30%,但管理员不时需要找到文件来作叠前叠后

分析、解读和项目规划。遍历巨大的目录结构和文件数量、列出目录内容和其他元数据操作所涉及的时延通常以分钟为单位。显然,对

于每日重复多次的操作,这不可接受。地震数据是勘探的核心,因此非常重要,但对于很少访问的文件,数据可能不及时,但元数据及

时。总之,地震数据至关重要,其元数据是及时的;其数据是否及时则不定。在这种情况下,元数据读取加速(而非 L3 缓存)是首选

方法。

Page 32: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

32 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

图 23. 使用元数据读取加速的分层

虽然所有元数据的镜像都存储在 SSD 中,但可以根据数据的相对及时性,将数据归入更快或更慢的磁盘。由此得到的结果是:一方面可

以快速定位任何数据,另一方面仍可为系统中的大部分数据降低成本。由于元数据处理得到加速,因此还能为许多其他活动带来性能益

处,譬如备份、迁移和复制。

结论

到目前为止,传统存储分层实施通常价格高昂、存在技术风险、管理复杂。更重要的是,它们往往无法达到使数据价值与可访问性、保

护和性能要求保持一致的主要目标。

SmartPools 与业界领先的横向扩展 NAS 体系结构 Isilon OneFS 相结合,同时实现了简单存储分层、节省巨大存储成本、不牺牲性能或

数据保护的好处。

SmartPools 具有简单但强大的界面、灵活的选项和智能化的默认设置,易于配置和管理,可从数 TB 扩展到数 PB。可扩展到数 PB 的

扩展性、添加新功能、新技术的能力、在同一系统中保留老旧容量等等,这些都意味着强大的投资保护。与 OneFS 核心功能的集成消

除了数据迁移风险,让用户能够掌控哪些系统资源可分配给数据移动操作。

Page 33: DELL EMC ISILON SMARTPOOLS · Dell EMC Isilon SmartPools 软件支持多个级别的性能、保护和存储密度在同一个文件系统中共存,并能够解锁在单个可扩展、无处不在

33 |

采用 Dell EMC Isilon SmartPools 的新一代存储分层

© 2019 Dell Inc. 或其子公司。

Dell Customer Communication - Confidential

版本历史记录

作者: Nick Trimbee

版本 日期 注释

1.0 2013 年 11 月 针对 OneFS 7.1 的第一版

2.0 2014 年 6 月 针对 OneFS 7.1.1 进行了更新

3.0 2014 年 11 月 针对 OneFS 7.2 进行了更新

4.0 2015 年 6 月 针对 OneFS 7.2.1 进行了更新

5.0 2015 年 11 月 针对 OneFS 8.0 进行了更新

6.0 2016 年 9 月 针对 OneFS 8.0.1 进行了更新

7.0 2017 年 4 月 针对 OneFS 8.1 进行了更新

8.0 2017 年 11 月 针对 OneFS 8.1.1 进行了更新

9.0 2019 年 2 月 针对 OneFS 8.1.3 进行了更新

10.0 2019 年 4 月 针对 OneFS 8.2 进行了更新

11.0 2019 年 8 月 针对 OneFS 8.2.1 进行了更新

采取下一步行动

请联系您的 Dell EMC 销售代表或授权经销商,以便进一步了解 Isilon 横向扩展 NAS 存储解决方案能为您的组织带来哪些优势。

访问购买 Dell EMC Isilon,以对比功能并获得更多信息。

版权所有 © 2019 Dell Inc. 或其子公司。保留所有权利。Dell、EMC、Dell EMC 和其他商标为 Dell Inc. 或其子公司的商标。

Dell® / EMC® / Dell EMC® 等品牌商标将有可能同时出现在戴尔易安信相关企业级产品(包括硬件和软件),和/或产品资料、

戴尔易安信的官方网站。如果您有有关戴尔易安信产品相关的任何疑问,欢迎联系您的指定客户经理。其他商标可能是其各自

所有者的商标。参考编号:H8321.5

详细了解 Dell EMC

解决方案

联系 Dell EMC 专家 查看更多资源 加入 #DellEMCStorage

对话