微软推出一个称为Fabric的端到端统一分析平台,其集成了各种资料和分析工具,将Azure Data Factory、Azure Synapse Analytics和Power BI技术都汇集到同一个平台中,并且以多云资料湖OneLake存积分析服务需要用到的所有资料。

微软强调Fabric是一个完整的分析平台,所有资料分析项目需要用到的工具,全部被集成到同一个产品。Fabric针对团队中不同的角色,提供特定的功能体验,因此资料工程师、数据科学家甚至是业务,都能够以熟悉的工作方式使用Fabric。Fabric的核心工作负载包括Data Factory、Synapse Data Engineering、Synapse Data Warehousing、Synapse Real-Time Analytics和Power BI等。

这些核心工作负载需要用到的资料,皆来自多云资料湖OneLake,微软解释,这样的概念就与Microsoft 365应用程序都会连接到OneDrive相同,资料会在同一处被组织并自动索引,供后续探索、共享、治理、法遵目的使用。

每个Fabric租户皆使用OneLake,以避免因不同用户配置产生资料孤岛,OneLake向所有用户提供统一的存储系统,并且统一应用策略和安全配置,进而使资料能够更简单地探索和共享。

在API层,OneLake创建在Azure Data Lake Storage Gen2(ADLSg2)之上,因此可接上ADLSg2既有的应用程序、工具和开发人员生态系。OneLake有一个称为Shortcuts的重要功能,能够虚拟化ADLSg2、Amazon S3和Google云计算存储的资料湖,供开发人员跨云组合和分析资料,并让用户和应用程序更简单地共享资料。

OneLake采用以Parquet为基础的开源文件格式Delta,而这也是Fabric所有工作负载默认使用的格式,因该旦资料被加载到OneLake中,所有工作负载就可直接操作该资料,不需要执行额外的截取工作。

Fabric还对OneLake应用通用安全模型,所有引擎在处理查询和执行任务时,都将统一受该模型控制。Fabric大量集成Azure OpenAI服务Copilot,使用户可以通过自然语言,创建资料流和资料工作管线,甚至生成程序代码和构建机器模型等工作。