Skip to content

运行 SQL Server 2022 Anywhere

利用 RustFS 的强大功能,使用外部表函数和 PolyBase 在任何云(公有云、私有云或边缘云)上运行 SQL Server 2022。

任何对任何,所有时间

使用 SQL Server 2022 数据云查询和分析驻留在 RustFS 上的多个数据源。现在,企业可以从任何 SQL Server 实例(在公有云、私有云甚至流边缘实例)中查询驻留在 RustFS 上的数据。

支持的部署环境

RustFS 与 SQL Server 2022 的集成支持以下部署环境:

  • AWS:Amazon Web Services 云环境
  • GCP:Google Cloud Platform
  • Azure:Microsoft Azure 云平台
  • Tanzu:VMware Tanzu 容器平台
  • OpenShift:Red Hat OpenShift 容器平台
  • HPE Ezmeral:HPE 的容器平台
  • SUSE Rancher:SUSE 的 Kubernetes 管理平台
  • 传统裸机部署:本地数据中心环境

统一数据访问

通过 RustFS 提供的统一 S3 兼容接口,SQL Server 2022 可以:

  • 跨多个云环境访问数据
  • 消除数据孤岛问题
  • 提供一致的查询体验
  • 降低数据集成复杂度

连接到数据,不要移动它

使用外部表,企业可以享受 SQL Server 的全部功能,而不会产生移动数据的成本或协调的挑战。

PolyBase 功能优势

PolyBase 功能允许用户使用 Transact-SQL 直接从 SQL Server 以及大多数其他数据库安装查询数据:

支持的数据源

  • SQL Server:本地和云端实例
  • Oracle:企业级关系数据库
  • Teradata:大数据分析平台
  • MongoDB:NoSQL 文档数据库
  • S3 API:通过 RustFS 访问对象存储

核心优势

  1. 零数据移动:直接查询远程数据源
  2. 统一查询语言:使用熟悉的 T-SQL 语法
  3. 实时数据访问:无需预先加载数据
  4. 降低存储成本:避免数据重复存储

数据孤岛整合

RustFS 提供了访问所有超大规模云环境的独特功能。SQL Server 2022 和 RustFS 的结合使企业能够:

  • 访问分散在不同系统中的数据
  • 从数据孤岛中获取综合见解
  • 实现数据的统一视图
  • 简化复杂的数据集成场景

大规模性能

适用于所有企业数据的大规模性能解决方案。

性能特征

借助这项新功能,企业可以对组织的所有数据使用 SQL Server 2022:

无限数据规模

  • 位置无关:数据可位于任何地方
  • 规模无限:支持数 PB 级数据存储
  • 快速查询:针对海量数据的高速查询
  • 并发处理:支持多用户并发访问

性能优化

凭借 RustFS 行业领先的性能特征:

  1. 高吞吐量:优化的数据传输速度
  2. 低延迟:快速响应查询请求
  3. 智能缓存:提升频繁访问数据的性能
  4. 负载均衡:自动分配查询负载

资源利用率提升

这意味着更高的利用率:

  • SQL Server 利用率:更充分地使用现有 SQL Server 投资
  • RustFS 实例利用率:最大化存储资源价值
  • 企业数据利用率:释放数据的全部价值

备份和恢复

像您梦寐以求的那样备份和恢复。

核心用例

SQL Server 2022 和 RustFS 的核心用例之一是备份和还原:

多样化配置支持

  • 多种架构:支持不同的部署架构
  • 灵活配置:适应各种业务需求
  • 可扩展性:随业务增长而扩展

快速恢复能力

RustFS 行业领先的吞吐量特点:

  1. 时间压缩:将数周的恢复时间缩短为数小时
  2. 高可用性:确保业务连续性
  3. 数据完整性:保证备份数据的完整性
  4. 自动化流程:减少人工干预

备份策略优化

有效的备份策略包括:

  • 增量备份:只备份变更数据
  • 差异备份:基于上次完整备份的变更
  • 完整备份:定期完整数据备份
  • 即时恢复:快速恢复关键业务数据

安全且可用

为了保证正确的数据可供正确的用户使用,必须在这些多云数据湖上进行细粒度的访问控制。

身份认证与授权

第三方 IDP 集成

RustFS 能够与第三方身份提供商(IDP)集成:

  • 统一身份管理:集中管理用户身份
  • 单点登录(SSO):简化用户访问体验
  • 多因素认证(MFA):增强安全性
  • 角色映射:自动分配合适的权限

访问控制机制

确保对对象存储的访问仅限于需要它的人:

  1. 最小权限原则:只授予必要的权限
  2. 定期权限审查:确保权限的时效性
  3. 访问日志记录:完整的审计追踪
  4. 异常检测:识别异常访问行为

基于策略的访问控制(PBAC)

精细化权限管理

RustFS 复杂的 PBAC 功能确保:

  • 资源级控制:精确到具体资源的权限
  • 动态权限分配:根据上下文调整权限
  • 策略继承:简化权限管理
  • 合规性支持:满足法规要求

安全性保障

  • 数据加密:传输和存储过程中的加密保护
  • 网络隔离:安全的网络通信
  • 威胁检测:实时安全威胁监控
  • 事件响应:快速响应安全事件

弹性

SQL Server 是企业中使用最广泛的分析工具之一,这使它成为企业中的关键任务应用程序。

灾难恢复功能

连续数据复制

SQL Server 2022 允许将数据持续复制到云或从云复制数据:

  • 实时同步:确保数据的最新状态
  • 双向复制:支持双活部署
  • 冲突解决:自动处理数据冲突
  • 故障转移:快速切换到备用系统

分层存储策略

与 RustFS 的结合允许:

  1. 快速存储层:NVMe 高速存储
  2. 温存储层:平衡性能和成本
  3. 冷存储层:长期归档存储
  4. 自动分层:智能数据移动

数据处理能力

多种处理方式

企业可以使用多种方式读取、写入和处理大数据:

  • Transact-SQL:传统的 SQL 查询语言
  • Spark 库:大数据处理框架
  • 混合分析:关系型与非关系型数据结合
  • 实时处理:流数据处理能力

高可用性架构

  • 多站点部署:跨地域数据分布
  • 主动-主动复制:提供最高可用性
  • 严格一致性:确保数据一致性
  • 云故障恢复:抵御完全云故障

流式传输边缘

通过添加外部表功能,现在企业可以设置流式流管道,将数据保存在 RustFS 上 - 在云中或本地。

实时数据处理

流式数据管道

  • 实时数据摄取:持续接收流数据
  • 数据预处理:清洗和转换数据
  • 存储优化:高效的数据存储
  • 查询优化:针对流数据的查询优化

实时查询能力

SQL Server 可以配置为实时执行对这些数据的查询:

  1. 消除批量导入:无需等待批处理
  2. 即时洞察:实时获取业务洞察
  3. 降低延迟:减少数据处理延迟
  4. 提升体验:为 SQL Server 添加新维度

边缘计算优势

边缘部署特点

  • 低延迟处理:就近处理数据
  • 带宽优化:减少数据传输
  • 离线能力:支持间歇性连接
  • 本地智能:边缘智能决策

应用场景

  • IoT 数据处理:物联网设备数据
  • 实时监控:系统状态监控
  • 预测维护:设备故障预测
  • 智能制造:生产过程优化

云作为运营模式

从 S3 开始的云运营模式。

云运营特征

RustFS 坚持云运营模式:

核心技术栈

  • 容器化:应用容器化部署
  • 编排:Kubernetes 容器编排
  • 自动化:自动化运维管理
  • API 驱动:完整的 API 接口
  • S3 兼容性:标准 S3 API 支持

统一接口优势

跨云和存储类型提供统一接口:

  1. 简化开发:统一的开发接口
  2. 降低学习成本:标准化操作方式
  3. 提高可移植性:应用跨云迁移
  4. 减少锁定:避免供应商锁定

AI/ML 框架兼容性

广泛的框架支持

由于大多数 AI/ML 框架和应用程序都旨在使用 S3 API:

  • TensorFlow:Google 的机器学习框架
  • PyTorch:Facebook 的深度学习框架
  • Scikit-learn:Python 机器学习库
  • Apache Spark:大数据处理引擎

开发者验证

拥有超过 13 亿个 Docker 拉取:

  • 最多开发者验证:广泛的开发者社区
  • 24/7/365 验证:持续的兼容性验证
  • 最佳兼容性:行业最佳的兼容性记录
  • 生产就绪:经过大规模生产验证

数据管理灵活性

这种兼容性确保:

  • AI 工作负载访问:无缝访问存储数据
  • 云基础架构无关:不依赖特定云环境
  • 灵活数据方法:适应不同的数据处理需求
  • 跨云环境处理:支持多云数据处理

边缘 AI 存储

在边缘,网络延迟、数据丢失和软件膨胀会降低性能。

边缘优化特性

性能优势

RustFS 是世界上最快的对象存储:

  • 小于 100 MB:极小的二进制文件
  • 任何硬件:可以部署在任何硬件上
  • 高性能:优化的边缘性能
  • 低资源消耗:最小的系统要求

智能功能

RustFS 的高级功能:

  1. Bucket Notifications:存储桶事件通知
  2. Object Lambda:对象处理函数
  3. 实时推理:即时数据处理
  4. 自动触发:基于事件的自动处理

边缘应用场景

关键任务应用

  • 机载物体检测:高空无人机应用
  • 交通轨迹预测:自动驾驶汽车
  • 工业控制:实时工业控制系统
  • 安全监控:实时安全监控

技术特点

RustFS 的 AI 存储特点:

  • 快速响应:毫秒级响应时间
  • 容错能力:高可靠性设计
  • 简单部署:简化的部署流程
  • 边缘优化:专为边缘场景优化

ML/AI 工作负载的生命周期管理

现代 AI/ML 工作负载需要复杂的生命周期管理。

自动化数据管理

核心功能

RustFS 的生命周期管理功能:

  • 自动化任务:自动执行数据管理任务
  • 存储优化:优化存储效率
  • 减少开销:降低运营开销
  • 智能分层:自动数据分层

成本优化策略

借助生命周期策略:

  1. 自动迁移:将不常访问的数据迁移到低成本存储
  2. 资源释放:为活跃工作负载释放资源
  3. 存储分层:多层存储架构
  4. 成本控制:有效控制存储成本

ML/AI 专用功能

开发者体验

这些功能确保 AI/ML 从业者可以:

  • 专注核心:专注于模型训练和开发
  • 自动管理:RustFS 智能管理数据
  • 性能增强:提升整体工作流程性能
  • 成本效益:实现成本效益最大化

合规性支持

生命周期管理层:

  • 强制策略:强制执行保留和删除策略
  • 法规遵循:确保符合法规要求
  • 审计追踪:完整的操作记录
  • 自动合规:自动化合规流程

AI/ML 工作流的对象保留

与 AI/ML 相比,更少的工作负载更多地依赖于何时发生的情况。

高级对象保留

核心保障

通过高级对象保留功能解决:

  • 数据完整性:确保存储数据的完整性
  • 合规性要求:满足法规合规要求
  • 时间敏感性:处理时间相关的业务需求
  • 数据一致性:维护数据的一致性

保留策略实施

通过实施保留策略,RustFS 可以帮助组织:

  1. 模型一致性:维护 AI/ML 模型和数据集的数据一致性
  2. 防止意外删除:避免意外或未经授权的删除
  3. 防止修改:保护数据免受未授权修改
  4. 版本控制:维护数据版本历史

数据治理优势

治理框架

此功能对以下方面至关重要:

  • 数据治理:建立完善的数据治理框架
  • 法规遵从性:满足各种法规要求
  • 实验可重复性:确保 AI/ML 实验的可重复性
  • 数据追溯:完整的数据血缘追踪

保证机制

保证关键数据:

  • 特定持续时间:在指定时间内保持可访问
  • 数据不变性:确保数据不被修改
  • 精确训练:支持精确的模型训练
  • 可靠分析:提供可靠的数据分析基础

核心 AI 数据集的数据保护

RustFS 通过不同功能的数量提供全面的数据保护。

数据冗余与容错

保护机制

  • 纠删码:高效的数据冗余机制
  • 站点复制:跨站点数据复制
  • 数据冗余:确保数据冗余存储
  • 容错能力:防止硬件故障或数据损坏

故障恢复

自动处理各种故障场景:

  1. 硬件故障:自动检测和恢复
  2. 数据损坏:实时检测和修复
  3. 网络故障:网络中断自动恢复
  4. 站点故障:跨站点故障转移

数据加密保护

加密机制

RustFS 支持多层次的数据加密:

  • 静态加密:存储数据的加密保护
  • 传输加密:数据传输过程中的加密
  • 密钥管理:安全的密钥管理机制
  • 合规加密:满足合规要求的加密标准

访问控制

  • 未授权访问保护:防止未授权数据访问
  • 身份验证:强制身份验证机制
  • 权限控制:精细化权限控制
  • 访问监控:实时访问行为监控

身份和访问管理(IAM)

IAM 支持

RustFS 对 IAM 的支持使组织能够:

  • 访问控制:控制对 AI 存储数据的访问
  • 用户管理:统一的用户管理
  • 应用程序授权:应用程序访问控制
  • 权限分配:灵活的权限分配机制

安全保障

确保只有授权的用户或应用程序才能:

  1. 访问数据:安全的数据访问
  2. 修改数据:受控的数据修改
  3. 删除数据:安全的数据删除
  4. 管理权限:权限管理操作

全生命周期保护

综合保护机制

RustFS 提供的全面数据保护机制:

  • 完整性保护:维护 AI 数据集的完整性
  • 可用性保障:确保数据的高可用性
  • 机密性保护:保护数据的机密性
  • 生命周期覆盖:覆盖数据的整个生命周期

通过 SQL Server 2022 与 RustFS 的深度集成,企业可以构建一个强大、安全、高性能的现代数据平台,支持从传统的关系型数据处理到最新的 AI/ML 工作负载的全方位需求。

Released under the Apache License 2.0.