「エンパワーリング・インサイト: マイクロソフトのデータ分析のためのファブリックの潜在能力を解き放つ」

「エンパワーリングな洞察:マイクロソフトのデータ分析のためのファブリックの潜在能力を最大限に引き出す方法」

エンタープライズの運用における顕著な課題の1つは、データエコシステムの複雑さと複雑性に関連しています。さまざまなプラットフォームでの異なるデータソースの存在や、データの取り込みや変換を行うさまざまなETL(Extract, Transform, Load)ツールの利用により、複雑な状況が生まれます。これらのプロセスを効果的に効率化し、ビジネスユーザーがデータに簡単にアクセスし、情報に基づいた意思決定に活用できるようにする必要がありました。Microsoft Fabricは、堅牢で柔軟性のあるデータワークロードとデータ分析の機能を提供し、Azureサービスとシームレスに統合することで、ビジネスに力強く、柔軟に、安全にデータを利用できるトッププレーヤーとして浮上します。

Microsoft Fabricとは何ですか?

Microsoftは、Power BI、Azure Synapse Analytics、Azure Data Lake、Azure Data Factoryなどのプラットフォームによって示されるように、ビッグデータの領域で強力な能力を示してきました。Microsoft Fabricが行なっているのは、これらの能力を一つのパッケージに統合し、ビジネスとデータ専門家のために作られたオールインワンの分析プラットフォームを提供することです。このプラットフォームでは、データサイエンスからリアルタイムの分析、データストレージ、データ移行まで、すべてを扱います。Fabricの本質をつかむためには、シンプルさが最大の目標であると考えるのが最善です。このツールは、組織が統一された環境内で複数のソースからデータをシームレスに統合することができるようにします。

MicrosoftのCEOであるSatya Nadellaによれば、「これはSQL Server以来最も重要なデータプラットフォームの革新です」とのことです。

Microsoft Fabricのビルディングブロック

Microsoft Fabricは、データエンジニアリング、データファクトリー、データサイエンス、データウェアハウス、リアルタイム分析、Power BIなど、さまざまな経験を統合したサービスとして提供されるSoftware as a Service(SaaS)プラットフォームです。

Data Factory

Data Factoryは、200以上のコネクタのサポートにより、さまざまなデータソースからデータの取り込み、準備、変換を行う、現代的なデータ統合のエクスペリエンスを提供します。主な高レベルの特徴は次のとおりです:

1. Dataflowsにより、データフローのデザイナーで300を超える変換を活用し、Power Queryのエクスペリエンスを基にしたスマートなAIベースのデータ変換を含む、より簡単かつ柔軟なデータ変換が可能です。

2. Data pipelinesにより、データのワークフローを柔軟に作成するための高機能なデータオーケストレーション機能を活用することができます。

Synapse Data Engineering

Microsoft Fabricのデータエンジニアリング機能では、ユーザーが大量のデータを収集、保存、処理、分析できるインフラストラクチャとシステムを設計、構築、維持することができます。この機能は、優れた著述体験を備えた世界クラスのSparkプラットフォームを提供し、データエンジニアが大規模なデータ変換を実行し、データをレイクハウスによってデモクラタイズすることができるようにします。Microsoft Fabric Sparkは、Data Factoryと連携して、ノートブックやSparkジョブをスケジュールし、オーケストレーションすることが可能です。

Synapse Data Warehousing

SQLのパフォーマンスがオープンなデータ形式で利用できる、統合されたレイクハウスとデータウェアハウスの体験です。データウェアハウスのワークロードは、SQLエンジンの堅牢な機能から利益を得ます。これにより、データの準備、分析、レポート作成に集中することができますが、すべてのデータはMicrosoft OneLake内に統合されます。

Synapse Data Science

データサイエンティストが機械学習モデルの構築、トレーニング、デプロイ、運用化を行うことができるデータサイエンスエクスペリエンスです。Azure machine learningとの統合により、組み込みの実験トラッキングとモデルレジストリの機能を提供します。

Synapse Real-Time Analytics

組織が即座の洞察力の価値を認識し、情報に基づいた意思決定と迅速な対応策のためのリアルタイムの洞察力がますます重要視されているため、リアルタイム分析の採用は増加しています。リアルタイム分析では、データエンジニアが高パフォーマンスと低レイテンシで大量の半構造化データを分析し、データとクエリのニーズが増加するにつれてシームレスにスケールアップすることができます。

Power BI

微软的商业智能工具Power BI被许多组织广泛接受。这种集成可以实现直观的视觉数据探索,使用户能够创建交互式仪表板和报告,并将原始数据转化为可操作的见解。现在它还配备了一个生成式AI副驾驶员,旨在协助业务分析师和用户在数据洞察力方面进行导航。 直接湖模式是一项令人兴奋的功能,它为用户提供导入速度,而无需复制数据,将导入和直接查询的优点结合在一起。

Data Activator

数据激活器(当前处于预览阶段)是Microsoft Fabric中的无代码体验,用于在检测到变化的数据中发现模式时自动采取行动。它使业务用户能够自主服务并启动操作,例如通知、电子邮件、自动化流程或根据业务工作流程/条件调用某些第三方系统。

Microsoft Purview Hub

Microsoft Purview Hub位于Fabric内部,作为Fabric管理员和用户高效监督和管理其Fabric数据资源的集中平台。通过敏感数据和项目认可的深入报告,它作为进入Microsoft Purview治理和合规门户内高级功能的门户网站,包括数据目录、信息保护、数据丢失预防和审计。

OneLake

OneLake是Microsoft Fabric生态系统的核心;它建立在Azure Data Lake Storage (ADLS) Gen2之上,可以支持任何类型的文件,结构化或非结构化,并且可以被视为整个组织的统一逻辑数据湖。它以开放的Delta Parquet格式存储数据,以允许您在多种引擎上使用相同的数据。

OneLake的设计目标是:

  • 消除孤立并减少管理工作量:所有组织数据都存储、管理和安全管理在一个数据湖资源中,无需额外的资源供应或管理,因为OneLake已集成到您的Fabric租户中。
  • 减少数据移动和复制:OneLake的目标是只存储一份数据副本。数据副本越少,数据移动过程就越少,这导致效率提高并减少复杂性。它提供了创建快捷方式的选项,用于统一不同领域、云和帐户的数据,而不是将其复制到OneLake。
  • 与多个分析引擎一起使用:OneLake中存储的数据采用开放格式,允许各种分析引擎进行查询,如Power BI使用的Analysis Services,T-SQL和Spark,而非Fabric应用程序可以通过API和SDK访问OneLake。

Lakehouse(数据湖仓库)

Microsoft Fabric Lakehouse作为一个数据架构平台,将结构化和非结构化数据的存储、管理和分析统一在一个库中。这种灵活和可扩展的解决方案使组织能够有效地管理大量的数据,并利用各种工具和框架进行数据处理和分析。

Microsoft Fabric的优势

采用Microsoft Fabric可以为希望提升数据管理和分析能力的组织带来多个好处:

  • 统一的数据管理:Microsoft Fabric提供了一个集中平台,用于存储、管理和分析结构化和非结构化数据。这种统一的方法简化了数据管理任务,简化了访问信息的流程,并鼓励保留数据的单一副本。
  • 可扩展性和灵活性:Fabric被设计为一个灵活且可扩展的解决方案,使组织能够处理大量数据。这种适应性对于数据需求随时间演变和增长至关重要。
  • 治理和合规:Microsoft Fabric包括Purview hub等功能,为管理员和用户提供管理和监督数据资源的工具。Lineage视图提供工作区内所有项与工作区外部数据源之间的关联关系。
  • 开放数据格式:Fabric支持开放数据格式,允许各种分析引擎(如Analysis Services、T-SQL和Spark)查询数据。这种开放性增强了互操作性,并使组织能够使用最适合其分析需求的工具。
  • 生成式AI副驾驶员:对于业务分析师和用户,Fabric提供了一个生成式AI副驾驶员,增强了数据分析过程。这个功能有助于在数据洞察力方面进行导航,提高了工作效率。
  • 成本效益:通过将数据管理和分析集中在Fabric中,组织可以优化资源利用率,潜在地减少管理多个数据解决方案所需的成本。由于计算成本在Fabric的所有服务中共享,因此可以更便宜地尝试混合服务。
  • 全面的解决方案:Microsoft Fabric Lakehouse提供了全面的数据工程和分析解决方案,涵盖了数据存储和处理到高级分析和治理的各个方面。这种综合方法减少了对不同工具和解决方案的需求。
  • 与Microsoft生态系统的集成:作为Microsoft的解决方案,Fabric与Microsoft生态系统中的其他工具和服务无缝集成。
  • API和SDK访问:Fabric允许非Fabric应用程序通过API和SDK访问数据,促进互操作性,并使外部系统更容易与存储在Fabric中的数据进行交互。

Microsoft Fabricの価格パズルを解読する

Microsoft Fabricは、F2からF2048までの容量単位(SKU)サイズを使用する容量ベースの価格設定モデルを使用しています。容量ユニット(CU)は、計算能力のプールを表す測定単位です。ファブリック内のすべてのクエリ、ジョブ、またはタスクを実行するためには計算能力が必要です。

Microsoft Fabricには、2つの価格設定モデルがあります:都度決済型と予約済み容量型。1年間のコミットメントを通じたファブリック容量の予約を選択することで、毎月約41%の節約が可能です。予約は自動的に更新されないことに注意してください。

OneLakeの価格は、Azure Data Lake Storage(ADLS)Gen2の価格と等価であり、月単位でGBごとに価格が設定されています。

データ転送ネットワークの料金は、各ストレージアクセスのソース/宛先に基づいて適用される場合があります。マイクロソフトと同じ帯域料金が予想されますが、現時点では請求情報はまだ公開されていません。

導入と移行の考慮事項

  • 現在のインフラストラクチャの評価:既存のインフラストラクチャを徹底的に分析し、依存関係、設定、および潜在的な課題を把握するための詳細な分析を実施してください。現在の分析スタックのランドスケープを分析し、冗長性を減らし、Microsoft Fabricのエコシステムに組み込む方法を見つけてください。
  • データ移行戦略:Microsoft Fabricを使用する利点の1つは、同じデータレイクやソースを引き続き使用し、ショートカットを利用できることです。Microsoft Fabricがエコシステム内の他のシステムとどのように統合されるかを評価してください。Microsoft Fabricと他のアプリケーション間のスムーズなコミュニケーションを促進するために必要なAPI、コネクタ、およびミドルウェアを評価してください。
  • コストモデルの理解:Microsoftのエコシステムとは独立して使用している同様のMicrosoft製品をすべて評価し、統合ソリューションによる共有容量によるコスト削減も提供されます。
  • セキュリティとコンプライアンスとガバナンス:セキュリティに関する考慮事項を優先し、Microsoft Fabricが関連する規制基準に準拠していることを確認してください。暗号化、アクセス制御、および監視などのセキュリティ対策を実施してください。
  • 機能評価:組織がMicrosoft Fabricの機能を現在または将来的にすべて利用するかどうかを検証してください。OneLakeとData activatorを除いて、他のすべての機能はすでにスタンドアロンのサービスとして利用可能です。
  • ベンダーロックイン:包括的なSaaS構成は、統合されたソリューションを提供している一方で、特定の欠点もあります。ベンダーロックインの可能性に対する重大な懸念があります。ファブリックプラットフォームは、固有の好みに基づいて個々のツールを選択およびカスタマイズする能力をユーザーに制限する可能性があり、組織の柔軟性に課題をもたらす場合があります。
  • プレビューフィーチャ:Data Activator、Purview Hub、およびIntegration with Private Endpointsなど、一部の機能は現在一般に利用できません。Microsoft Fabricへの移行に関する意思決定を行う前に、製品のロードマップを注意深く監視することをお勧めします。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more