适合企业的NAS网络存储服务器

群晖如何优化Hyper Backup性能?让备份速度更快更便捷

2024年04月2日 | 资讯动态

备份性能被认为是数据保护最关键的要素之一。 Synology 针对 1500 名 IT 决策者进行了一项调查,超过一半的受访者将备份速度列为主要挑战之一。缓慢的备份可能会阻碍组织的生产流程。如果备份任务超过其指定的时间范围,它有可能无限期地拖延,从而使关键工作负载得不到保护。

作为保护 Synology 系统上存储的数据的一项重要服务,Hyper Backup 自推出以来就支持增量备份模式,从而减少了备份任务所需的时间。然而,随着企业以指数速度积累数据,对更快备份的呼声也随之激增。认识到这一趋势,我们重新审视了 Hyper Backup 的设计,并引入了一系列增强功能来提高 DSM 7.0 中 Hyper Backup 的性能。

为了达到加快备份速度的目的,我们将Hyper Backup的任务执行流程彻底解构为六步:

  • 备份任务启动
  • 文件元数据收集
  • 备份内容分析和启动
  • 重复数据删除
  • 备份文件集合
  • 备份数据处理

对于每个步骤,我们都利用 perf、ebpf 和 iperf 等工具来分析 CPU 上的方面(例如,CPU 使用情况、内存)和 CPU 外的元素(例如,磁盘 I/O、系统调用)。我们的研究结果表明,通过增强两种机制,我们可以显着提升 Hyper Backup 的性能,尤其是在涉及海量数据的场景中。

增强型并行处理

首先,我们微调了备份任务中的并行工作流程。在每个备份服务中,“提供者”生成任务,而“消费者”执行任务。例如,提供者可能会识别需要备份的文件,然后消费者执行读/写操作。在整个备份任务中,消费者和提供商的平衡负载和等待时间至关重要。任务分配和 CPU/内存资源分配等因素会影响这种平衡。

事实上,平衡软件开发中的任务和资源分配是一个持续的过程。经过彻底的重新评估和重组,我们对备份任务进行了模块化,以避免 DSM 7.0 中的资源冲突。这些改进可实现每个备份流程段的无缝并发处理,从而缓解瓶颈并将增量备份效率显着提高 30%。

改进的元数据收集流程

接下来,我们整合并简化了元数据收集。在备份过程中,增量备份和重复数据删除需要大量的元数据。这些元数据收集过程以前分散在多个过程中,阻碍了备份速度。为了解决这个问题,我们仔细检查了每个流程中的元数据请求,消除了冗余,并简化了元数据收集流程。

此外,我们引入了内存缓存机制和集中式元数据检索,以减轻硬盘的 I/O 负担。这加快了增量备份和重复数据删除任务的速度。

通过这些增强功能,Hyper Backup 的性能得到了显着提高。在我们的实验室测试中,使用总计 18TB 的 1000 万个文件数据集,在文件更改率为 5% 的情况下,新的 Hyper Backup 版本比之前的版本有了 95% 的显着改进。在处理超过一百万个文件的场景中,这种效果尤其明显。因此,我们强烈建议拥有大量数据的企业将其 DSM 和 Hyper Backup 升级到最新版本。

下一步,我们将继续探索如何在备份任务执行过程中更快速、更准确地识别文件变化,应对更严峻的挑战,例如上亿文件变化的极端情况或异常断电等突发事件。优化产品性能是一项持续的努力,Synology 致力于不断提供更好的用户体验。

文章标签:

相关文章

群晖2024产品蓝图,提前了解未来“晖”科技

群晖2024产品蓝图,提前了解未来“晖”科技

你第一次接触到群晖是什么时候?一个小黑盒子可以帮你存下电脑、硬盘、手机的数据,在家中,在外面都能随时存取照片和视频。二十多年来,群晖不止服务个人用户,更是为生物医药、高科技制造、教育、影视、金融、科研单位打造数据存储、企业云盘、安全备份、安...

百度网盘套件在群晖DSM正式上线,带来更稳定的同步

百度网盘套件在群晖DSM正式上线,带来更稳定的同步

百度网盘作为网盘届的元老,相信大家肯定都不陌生,无论是用来存储各类资源,还是团队、工作室用来交换文件,或是与 NAS 搭配互相同步、备份都是不错的选择。 以往群晖 NAS 想要与百度网盘连接,需要借助我们的 Cloud Sync...