运行 SQL Server 2022 Anywhere
利用 RustFS 的强大功能,使用外部表函数和 PolyBase 在任何云(公有云、私有云或边缘云)上运行 SQL Server 2022。
任何对任何,所有时间
使用 SQL Server 2022 数据云查询和分析驻留在 RustFS 上的多个数据源。现在,企业可以从任何 SQL Server 实例(在公有云、私有云甚至流边缘实例)中查询驻留在 RustFS 上的数据。
支持的部署环境
RustFS 与 SQL Server 2022 的集成支持以下部署环境:
- AWS:Amazon Web Services 云环境
- GCP:Google Cloud Platform
- Azure:Microsoft Azure 云平台
- Tanzu:VMware Tanzu 容器平台
- OpenShift:Red Hat OpenShift 容器平台
- HPE Ezmeral:HPE 的容器平台
- SUSE Rancher:SUSE 的 Kubernetes 管理平台
- 传统裸机部署:本地数据中心环境
统一数据访问
通过 RustFS 提供的统一 S3 兼容接口,SQL Server 2022 可以:
- 跨多个云环境访问数据
- 消除数据孤岛问题
- 提供一致的查询体验
- 降低数据集成复杂度
连接到数据,不要移动它
使用外部表,企业可以享受 SQL Server 的全部功能,而不会产生移动数据的成本或协调的挑战。
PolyBase 功能优势
PolyBase 功能允许用户使用 Transact-SQL 直接从 SQL Server 以及大多数其他数据库安装查询数据:
支持的数据源
- SQL Server:本地和云端实例
- Oracle:企业级关系数据库
- Teradata:大数据分析平台
- MongoDB:NoSQL 文档数据库
- S3 API:通过 RustFS 访问对象存储
核心优势
- 零数据移动:直接查询远程数据源
- 统一查询语言:使用熟悉的 T-SQL 语法
- 实时数据访问:无需预先加载数据
- 降低存储成本:避免数据重复存储
数据孤岛整合
RustFS 提供了访问所有超大规模云环境的独特功能。SQL Server 2022 和 RustFS 的结合使企业能够:
- 访问分散在不同系统中的数据
- 从数据孤岛中获取综合见解
- 实现数据的统一视图
- 简化复杂的数据集成场景
大规模性能
适用于所有企业数据的大规模性能解决方案。
性能特征
借助这项新功能,企业可以对组织的所有数据使用 SQL Server 2022:
无限数据规模
- 位置无关:数据可位于任何地方
- 规模无限:支持数 PB 级数据存储
- 快速查询:针对海量数据的高速查询
- 并发处理:支持多用户并发访问
性能优化
凭借 RustFS 行业领先的性能特征:
- 高吞吐量:优化的数据传输速度
- 低延迟:快速响应查询请求
- 智能缓存:提升频繁访问数据的性能
- 负载均衡:自动分配查询负载
资源利用率提升
这意味着更高的利用率:
- SQL Server 利用率:更充分地使用现有 SQL Server 投资
- RustFS 实例利用率:最大化存储资源价值
- 企业数据利用率:释放数据的全部价值
备份和恢复
像您梦寐以求的那样备份和恢复。
核心用例
SQL Server 2022 和 RustFS 的核心用例之一是备份和还原:
多样化配置支持
- 多种架构:支持不同的部署架构
- 灵活配置:适应各种业务需求
- 可扩展性:随业务增长而扩展
快速恢复能力
RustFS 行业领先的吞吐量特点:
- 时间压缩:将数周的恢复时间缩短为数小时
- 高可用性:确保业务连续性
- 数据完整性:保证备份数据的完整性
- 自动化流程:减少人工干预
备份策略优化
有效的备份策略包括:
- 增量备份:只备份变更数据
- 差异备份:基于上次完整备份的变更
- 完整备份:定期完整数据备份
- 即时恢复:快速恢复关键业务数据
安全且可用
为了保证正确的数据可供正确的用户使用,必须在这些多云数据湖上进行细粒度的访问控制。
身份认证与授权
第三方 IDP 集成
RustFS 能够与第三方身份提供商(IDP)集成:
- 统一身份管理:集中管理用户身份
- 单点登录(SSO):简化用户访问体验
- 多因素认证(MFA):增强安全性
- 角色映射:自动分配合适的权限
访问控制机制
确保对对象存储的访问仅限于需要它的人:
- 最小权限原则:只授予必要的权限
- 定期权限审查:确保权限的时效性
- 访问日志记录:完整的审计追踪
- 异常检测:识别异常访问行为
基于策略的访问控制(PBAC)
精细化权限管理
RustFS 复杂的 PBAC 功能确保:
- 资源级控制:精确到具体资源的权限
- 动态权限分配:根据上下文调整权限
- 策略继承:简化权限管理
- 合规性支持:满足法规要求
安全性保障
- 数据加密:传输和存储过程中的加密保护
- 网络隔离:安全的网络通信
- 威胁检测:实时安全威胁监控
- 事件响应:快速响应安全事件
弹性
SQL Server 是企业中使用最广泛的分析工具之一,这使它成为企业中的关键任务应用程序。
灾难恢复功能
连续数据复制
SQL Server 2022 允许将数据持续复制到云或从云复制数据:
- 实时同步:确保数据的最新状态
- 双向复制:支持双活部署
- 冲突解决:自动处理数据冲突
- 故障转移:快速切换到备用系统
分层存储策略
与 RustFS 的结合允许:
- 快速存储层:NVMe 高速存储
- 温存储层:平衡性能和成本
- 冷存储层:长期归档存储
- 自动分层:智能数据移动
数据处理能力
多种处理方式
企业可以使用多种方式读取、写入和处理大数据:
- Transact-SQL:传统的 SQL 查询语言
- Spark 库:大数据处理框架
- 混合分析:关系型与非关系型数据结合
- 实时处理:流数据处理能力
高可用性架构
- 多站点部署:跨地域数据分布
- 主动-主动复制:提供最高可用性
- 严格一致性:确保数据一致性
- 云故障恢复:抵御完全云故障
流式传输边缘
通过添加外部表功能,现在企业可以设置流式流管道,将数据保存在 RustFS 上 - 在云中或本地。
实时数据处理
流式数据管道
- 实时数据摄取:持续接收流数据
- 数据预处理:清洗和转换数据
- 存储优化:高效的数据存储
- 查询优化:针对流数据的查询优化
实时查询能力
SQL Server 可以配置为实时执行对这些数据的查询:
- 消除批量导入:无需等待批处理
- 即时洞察:实时获取业务洞察
- 降低延迟:减少数据处理延迟
- 提升体验:为 SQL Server 添加新维度
边缘计算优势
边缘部署特点
- 低延迟处理:就近处理数据
- 带宽优化:减少数据传输
- 离线能力:支持间歇性连接
- 本地智能:边缘智能决策
应用场景
- IoT 数据处理:物联网设备数据
- 实时监控:系统状态监控
- 预测维护:设备故障预测
- 智能制造:生产过程优化
云作为运营模式
从 S3 开始的云运营模式。
云运营特征
RustFS 坚持云运营模式:
核心技术栈
- 容器化:应用容器化部署
- 编排:Kubernetes 容器编排
- 自动化:自动化运维管理
- API 驱动:完整的 API 接口
- S3 兼容性:标准 S3 API 支持
统一接口优势
跨云和存储类型提供统一接口:
- 简化开发:统一的开发接口
- 降低学习成本:标准化操作方式
- 提高可移植性:应用跨云迁移
- 减少锁定:避免供应商锁定
AI/ML 框架兼容性
广泛的框架支持
由于大多数 AI/ML 框架和应用程序都旨在使用 S3 API:
- TensorFlow:Google 的机器学习框架
- PyTorch:Facebook 的深度学习框架
- Scikit-learn:Python 机器学习库
- Apache Spark:大数据处理引擎
开发者验证
拥有超过 13 亿个 Docker 拉取:
- 最多开发者验证:广泛的开发者社区
- 24/7/365 验证:持续的兼容性验证
- 最佳兼容性:行业最佳的兼容性记录
- 生产就绪:经过大规模生产验证
数据管理灵活性
这种兼容性确保:
- AI 工作负载访问:无缝访问存储数据
- 云基础架构无关:不依赖特定云环境
- 灵活数据方法:适应不同的数据处理需求
- 跨云环境处理:支持多云数据处理
边缘 AI 存储
在边缘,网络延迟、数据丢失和软件膨胀会降低性能。
边缘优化特性
性能优势
RustFS 是世界上最快的对象存储:
- 小于 100 MB:极小的二进制文件
- 任何硬件:可以部署在任何硬件上
- 高性能:优化的边缘性能
- 低资源消耗:最小的系统要求
智能功能
RustFS 的高级功能:
- Bucket Notifications:存储桶事件通知
- Object Lambda:对象处理函数
- 实时推理:即时数据处理
- 自动触发:基于事件的自动处理
边缘应用场景
关键任务应用
- 机载物体检测:高空无人机应用
- 交通轨迹预测:自动驾驶汽车
- 工业控制:实时工业控制系统
- 安全监控:实时安全监控
技术特点
RustFS 的 AI 存储特点:
- 快速响应:毫秒级响应时间
- 容错能力:高可靠性设计
- 简单部署:简化的部署流程
- 边缘优化:专为边缘场景优化
ML/AI 工作负载的生命周期管理
现代 AI/ML 工作负载需要复杂的生命周期管理。
自动化数据管理
核心功能
RustFS 的生命周期管理功能:
- 自动化任务:自动执行数据管理任务
- 存储优化:优化存储效率
- 减少开销:降低运营开销
- 智能分层:自动数据分层
成本优化策略
借助生命周期策略:
- 自动迁移:将不常访问的数据迁移到低成本存储
- 资源释放:为活跃工作负载释放资源
- 存储分层:多层存储架构
- 成本控制:有效控制存储成本
ML/AI 专用功能
开发者体验
这些功能确保 AI/ML 从业者可以:
- 专注核心:专注于模型训练和开发
- 自动管理:RustFS 智能管理数据
- 性能增强:提升整体工作流程性能
- 成本效益:实现成本效益最大化
合规性支持
生命周期管理层:
- 强制策略:强制执行保留和删除策略
- 法规遵循:确保符合法规要求
- 审计追踪:完整的操作记录
- 自动合规:自动化合规流程
AI/ML 工作流的对象保留
与 AI/ML 相比,更少的工作负载更多地依赖于何时发生的情况。
高级对象保留
核心保障
通过高级对象保留功能解决:
- 数据完整性:确保存储数据的完整性
- 合规性要求:满足法规合规要求
- 时间敏感性:处理时间相关的业务需求
- 数据一致性:维护数据的一致性
保留策略实施
通过实施保留策略,RustFS 可以帮助组织:
- 模型一致性:维护 AI/ML 模型和数据集的数据一致性
- 防止意外删除:避免意外或未经授权的删除
- 防止修改:保护数据免受未授权修改
- 版本控制:维护数据版本历史
数据治理优势
治理框架
此功能对以下方面至关重要:
- 数据治理:建立完善的数据治理框架
- 法规遵从性:满足各种法规要求
- 实验可重复性:确保 AI/ML 实验的可重复性
- 数据追溯:完整的数据血缘追踪
保证机制
保证关键数据:
- 特定持续时间:在指定时间内保持可访问
- 数据不变性:确保数据不被修改
- 精确训练:支持精确的模型训练
- 可靠分析:提供可靠的数据分析基础
核心 AI 数据集的数据保护
RustFS 通过不同功能的数量提供全面的数据保护。
数据冗余与容错
保护机制
- 纠删码:高效的数据冗余机制
- 站点复制:跨站点数据复制
- 数据冗余:确保数据冗余存储
- 容错能力:防止硬件故障或数据损坏
故障恢复
自动处理各种故障场景:
- 硬件故障:自动检测和恢复
- 数据损坏:实时检测和修复
- 网络故障:网络中断自动恢复
- 站点故障:跨站点故障转移
数据加密保护
加密机制
RustFS 支持多层次的数据加密:
- 静态加密:存储数据的加密保护
- 传输加密:数据传输过程中的加密
- 密钥管理:安全的密钥管理机制
- 合规加密:满足合规要求的加密标准
访问控制
- 未授权访问保护:防止未授权数据访问
- 身份验证:强制身份验证机制
- 权限控制:精细化权限控制
- 访问监控:实时访问行为监控
身份和访问管理(IAM)
IAM 支持
RustFS 对 IAM 的支持使组织能够:
- 访问控制:控制对 AI 存储数据的访问
- 用户管理:统一的用户管理
- 应用程序授权:应用程序访问控制
- 权限分配:灵活的权限分配机制
安全保障
确保只有授权的用户或应用程序才能:
- 访问数据:安全的数据访问
- 修改数据:受控的数据修改
- 删除数据:安全的数据删除
- 管理权限:权限管理操作
全生命周期保护
综合保护机制
RustFS 提供的全面数据保护机制:
- 完整性保护:维护 AI 数据集的完整性
- 可用性保障:确保数据的高可用性
- 机密性保护:保护数据的机密性
- 生命周期覆盖:覆盖数据的整个生命周期
通过 SQL Server 2022 与 RustFS 的深度集成,企业可以构建一个强大、安全、高性能的现代数据平台,支持从传统的关系型数据处理到最新的 AI/ML 工作负载的全方位需求。