Microsoft Fabricとは?
メリットやコストなど全貌を一挙解説

Microsoft Fabric GA

こんにちは、日商エレクトロニクスの鈴木です。

データは今日のビジネスにとって不可欠となってきましたが、その真の価値を引き出すためには、先進のツールとテクノロジーが必要ですね。

ここで登場した新たなデータ活用ソリューションが、「Microsoft Fabric」です。

本日は、そのMicrosoft Fabricについて、
今までのデータ分析ツールと何が違うのか、その構成要素、特徴、コストなど、基本を解説したいと思います。

 

こんな方におススメ

  • データ活用ツールを比較検討している
  • Microsoft Fabricについて調べている
  • Microsoft Fabricが他のデータ分析ツールと比べて何が違うかイメージを付けたい


1. Microsoft Fabricとは

では、まずは製品の基本から解説します。

Microsoft Fabric(以下、Fabric )は、2023年11月一般提供が開始した、次世代の「SaaS型データ分析ツール」です。
データの重要性が認識され活用が進められる中で発生した、データの増大、サイロ化、分析ツールの混在による複雑化…などの問題解決や、データアクセスと共有やデータガバナンスとコンプライアンス強化のニーズを実現するために誕生しました。

そのため、Fabricを利用すると、データ レイク、データエンジニアリング、データ統合、ビジネスインテリジェンス(BI)など、幅広い機能を、統合された環境で活用できるようになります。

Microsoft Fabricの全貌を解説したダウンロード資料もございます。
気になる方はぜひチェックしてみてください。
Microsoft FabricMicrosoft Fabricの概要資料
ダウンロードする

2. Microsoft Fabricの特徴

Fabricの特徴は、下記の4点です。

①統合されたSaaS基盤

前述の通り、Microsoft Fabricはデータ活用に必要な要素を包含した「オールインワンデータプラットフォーム」です。
様々なデータ分析ツールをツギハギすることで生じる複雑な運用管理の解消、全社横断のデータ共有の簡易化が実現します。
さらに、SaaSですので、複雑なプロビジョニング作業やメンテナンスも不要になり、よりデータの管理と利用に集中できるようになります。

②既存のデータ資産を活用できる

Microsoft Fabricは、「データの仮想化」により、既存のデータ資産を活用できます。

既存データの仮想化とは、データのコピーを作らずに、複数のデータソースを仮想的な単一のデータソースとして扱うことを可能にする技術のことです。(ショートカットを作るイメージです。)

基本はすべてのデータをデータレイクに集めるのが良い、とはいっても完璧に1か所に集めるのはかなり骨が折れますよね。
そこでこの技術を用いることで、データの場所を意識せずに必要な情報にアクセスできるようになるのです。
Azureの他のデータ関連サービス(Azure Synapse Analyticsなど)には、これは実現できません。

さらに、Azureサービスだけでなく、AWS S3にも対応しているなど、マルチクラウド環境でも活用できます。(Google Storageは近日公開予定とのことです。)

③データセキュリティとコンプライアンスを強化

Fabricには、データのセキュリティとコンプライアンスを確保し、組織のガバナンス基準に合わせて管理する機能が構成されています。

情報保護
Microsoft Purview Information Protectionの秘密度ラベルを使用してFabricデータを検出、分類、保護します。

データ損失防止 (DLP) ポリシー:
Power BI セマンティックモデルに対してDLPがサポートされており、機密データの検出と保護を可能にします。

推奨:
保証によって、ユーザーが信頼できる高品質のアイテムを特定しやすくなります。

メタデータのスキャン:
カタログ化ツールがテナント内すべてのFabricアイテムのメタデータをカタログ化し、レポート化します。

系列:
ワークスペース内のアイテム間の関係を視覚化し、データフローをわかりやすくします。

これらを、Microsoft Purview ハブ(*現状プレビュー)というレポートページで確認できます。

④Copilotとの統合

Fabricでは、すべてのワークロードにAI Copilotが標準搭載される予定です(*現状プレビュー)。
ChatGPTの様な対話型AIにより、自然言語を用いたデータのクエリやモデルの構築が可能になります。
これにより、コード補完によるデータパイプライン構築や複雑な分析モデルの作成の簡易化、日常タスクの自動化による運用負荷軽減が期待できます。

参考記事:Microsoft FabricでCopilotがプレビュー利用可能に!

⑤コストを抑えて使える

Fabricは、コンピューティングリソースを複数のワークロードで共有することができます。これにより、未使用のリソースの無駄遣いを減らし、コストを最適化することができます。

 

3. Microsoft Fabricで実現できること

① データ統合

組織内のさまざまなデータソースからデータを統合し、一元化されたデータレイクで管理できます。異なるデータエンジンからのデータを統合するためのデータ統合機能が提供されています。

② データエンジニアリング

データの整形や加工などのデータエンジニアリング作業を行えます。データのクレンジング、変換、統合などを行うための機能が提供されています。

③ データウェアハウス

データの保存、管理、クエリの実行など、データウェアハウスに関連する作業を行うことができます。

④ データサイエンスモデリング

データサイエンスモデルの構築や実行をサポートしていますので、データを活用して予測モデルや機械学習モデルを作成を行えます。

⑤ リアルタイム分析

リアルタイムでのデータ分析とビジュアライゼーションが可能です。データのストリーミング処理やリアルタイムのダッシュボード作成を行えます。

⑥ ビジネスインテリジェンス(BI)

データの可視化、レポート作成、ダッシュボードの作成などを行うことができます。

 

4. Microsoft Fabricの構成要素

以上の様なことは、下記のコンポーネントにより実現されています。

① OneLake

OneLake
Fabricの中核をなすコンポーネントで、組織内のすべてのデータを一元的に管理するデータレイクの役割を持っています。(Azure Data Lake Storage Gen2が基盤)
Fabric内のすべてのコンピューティングエンジンが、このOneLakeにデータを保存します。

大きな特徴は、「One Copy」のコンセプトで設計開発されている点です。
Fabric内の異なるコンピューティングエンジンがOneLake上にある同じデータにアクセスすることができ、データのコピーが発生しない仕組みになっているのです。

例:Sparkのエンジンを使ってOneLakeにデータ出力した際、そのデータにT-SQLやKQLクエリを使ってアクセスできる。

これまでは、異なるコンピューティングエンジン間でデータをやり取りする際にはデータをエクスポートしてインポートする必要がありましたが、その手間が省けるということです。
これは、データの移動にかかる時間とリソースを節約するだけでなく、データの一貫性と整合性を維持する上でも重要ですね。

また、「データのためのOneDrive」というキャッチコピーがついており、OneDriveのように細かい設定なしですぐに使い始めることができる点も特徴の1つです。

参考:https://learn.microsoft.com/ja-jp/fabric/onelake/onelake-overview

② DataFactory

DataFactory オンプレ、クラウドを問わず、様々なデータソースからデータを取り込み、準備し、変換する役割を持っています。(ネイティブコネクタは200 種類超)Power Query のセルフ サービス性とAzure Data Factory のエンタープライズ性のイイとこ取りをしたようなものです。

データフローとデータパイプラインの2つの機能が実装されています。

データフロー
数百のデータソースからデータを収集し、300以上の変換オプションを用いてローコードで簡単にデータを変換できる

データパイプライン
クラウド環境で高度なワークフロー機能を実現できる。
大規模で複雑なETLワークフローやデータファクトリーワークフローを構築できる。

参考:https://learn.microsoft.com/ja-jp/fabric/data-factory/data-factory-overview

③ Synapse Data Engineering

データの収集、保存、加工、および分析を効果的に行うためのプロセスとツールを提供する機能です。
下記のことが実現できます。

  • レイクハウスを使用して、データを作成および管理する
  • レイクハウスにデータをコピーするためのパイプラインを設計する
  • Spark ジョブ定義を使って、バッチまたはストリーミング ジョブを Spark クラスターに送信する
  • ノートブックを使用して、データ インジェスト、準備、変換のコードを記述する

参考:https://learn.microsoft.com/ja-jp/fabric/data-engineering/data-engineering-overview

④ Synapse Data Science

Synapse Data Science機械学習モデルの構築、展開、運用をシームレスに行うためのデータサイエンスコンポーネントです。これにより、データモデリング、分析、機械学習プロジェクトを効率的に実施できるようになります。
具体的には、ノートブックとVisual Studio Codeなどの使いやすいツール、豊富なMLツールセット、Azure ML、MLFlowの統合、SynapseML Sparkライブラリ、PBI Direct Lake機能により実現されます。

参考:https://learn.microsoft.com/ja-jp/fabric/data-science/data-science-overview

⑤ Synapse Data Warehouse

Synapse Data Warehouse 大規模なデータ処理と分析のための高度なデータウェアハウスコンポーネントです。
膨大なデータセットを効率的に管理し、複雑なデータ分析とレポート作成を実現します。
強力なクエリ性能と柔軟なスケーリングオプションが特徴で、データの洞察を迅速に得られるようになります。
データは Delta-Parquet 形式で保存されるため、ベンダーロックインも起こりません。

参考:https://learn.microsoft.com/ja-jp/fabric/data-warehouse/data-warehousing

⑥ Synapse Real Time Analytics

Synapse real time Analytics Synapse Real Time Analyticsは、IoTデバイスやログなどのリアルタイムデータを分析するためのツールを提供します。ストリーミングデータやライブデータを迅速に分析し、即時の洞察を得ることができます。
ビジネス上の迅速な意思決定やリアルタイムのデータ駆動型アクションが行えるようになります。

参考:https://learn.microsoft.com/ja-jp/fabric/real-time-analytics/overview

⑦ Power BI

Power BIPower BIは、データをグラフィカルに可視化するBIツールで、データの収集、整理、分析、共有、視覚化を可能にします。Fabric上でも利用することができます。
Power BIを活用することで、ユーザーは、さまざまなデータソースからデータを取り込み、インタラクティブなダッシュボードやレポートを作成できます。これにより、データドリブンな意思決定を支援し、ビジネスの洞察を得ることができます。

参考:https://learn.microsoft.com/ja-jp/power-bi/fundamentals/power-bi-overview

⑧ Data Activator(プレビュー)

Data Activator

データの変更において、パターンまたは条件が検出されたときに自動的にアクションを実行できるようにするコンポーネントです。データが特定のしきい値に達したときや他のパターンと一致した場合に、Power BI レポートおよび Eventstreams 項目のデータを監視、その後、ユーザーへの警告や Power Automate ワークフローの開始などの適切なアクションが自動的に実行されます。
ノーコードで実装できます。

参考:https://learn.microsoft.com/ja-jp/fabric/data-activator/data-activator-introduction

5. Microsoft Fabricのコストについて

それでは、いよいよ、気になるコストについて解説していきます!

① Fabricの価格の構成要素

Fabricは、コンピューティングであるFabric容量とストレージであるOneLakeの2種類で構成されます。

Fabricの費用の構成

② 購入方法は2種類

そして、2種類の購入方法があり、それぞれに特徴があります。
基本的には、コミットメントが無く従量課金制であるAzureからの購入が推奨されているようです。

Azure Poratal から購入(F SKU) Power BI Premium 容量 を購入
課金制度 従量課金 月/年単位で課金
コミットメント なし 月単位のコミットメントあり
ストレージ 含む
特徴 予約容量あり、容量の一時停止や再開が可能

 

<Azureから購入した際の料金>

参考:https://azure.microsoft.com/ja-jp/pricing/details/microsoft-fabric/#purchase-options

SKU 容量ユニット (CU) 従量課金制 予約
F 2 2 ¥56.895/時間 ¥33.838/時間
~41% の節約
F 4 4 ¥113.789/時間 ¥67.676/時間
~41% の節約
F 8 8 ¥227.577/時間 ¥135.351/時間
~41% の節約
F 16 16 ¥455.153/時間 ¥270.702/時間
~41% の節約
F 32 32 ¥910.305/時間 ¥541.403/時間
~41% の節約
F 64 64 ¥1,820.609/時間 ¥1,082.805/時間
~41% の節約
F 128 128 ¥3,641.217/時間 ¥2,165.610/時間
~41% の節約
F 256 256 ¥7,282.433/時間 ¥4,331.219/時間
~41% の節約
F 512 512 ¥14,564.865/時間 ¥8,662.437/時間
~41% の節約
F 1024 1024 ¥29,129.729/時間 ¥17,324.873/時間
~41% の節約
F 2048 2048 ¥58,259.457/時間 ¥34,649.746/時間
~41% の節約

これに加えてOneLakeの費用が従量課金制でかかります。

ストレージ 価格
OneLake ストレージ / 月単位** GB あたり ¥3.6982
OneLake BCDR ストレージ/月 GB あたり ¥5.9170
1 か月あたりの OneLake キャッシュ* GB あたり ¥36.9812

③ 利用時にかかる費用

実際にFabricを利用するためには、Fabricそのものの費用に加え、ネットワーク利用料と、とユーザライセンスが必要になります。

Fabricにかかる費用

Fabric ワークスペースへのPower BI 以外のアイテムの利用作成でしたらPower BI Freeで十分ですが、Power BIも含んだすべてのアイテムを触らせたい際には、ユーザーにPro以上のライセンスを付与する必要があります。(*ただし、CUが64以上の容量を購入することでPower BIのユーザライセンスを問わずデータを見ることができるようになります)

Power BIの価格については下記をご参考ください。
参考:Power BIの価格と製品の比較

Microsoft FabricMicrosoft Fabricの概要資料
ダウンロードする

各機能の深堀り、ライセンスの考え方などを図を用いて解析していますので、気になる方はぜひチェックしてみてください。

 

6. Microsoft Fabricの始め方

Fabricの始め方は3つのパターンがあります。自社に合った方法を選択しましょう。

パターン① Power BI Premium容量を購入する

月額固定費用で始めたい場合は、Power BI Premium容量を購入しましょう。
すでにお持ちの場合は有効化されているはずです。

パターン② 無料試用版のFabric容量を使ってみる

管理ポータルで試用版の設定を有効化すると、60日間の試用版のFabric容量と最大1TBのOneLakeストレージが利用できます。

パターン③ Azure Portalからプロビジョニングする

従量課金制が良い際は、Azure PortalからFabric容量を作成し、ワークスペースを容量に割り当てることで利用を開始できます。

 

Microsoft Fabric、興味はあるけれど自分だけで始めるには不安だ…という方は、ぜひ一度ご相談くださいませ。
データ専任エンジニアがサポートさせていただきます。
ご相談はコチラ

 

7. まとめ

ここまでで、Microsoft Fabricの概要、特長、できる事からコストの考え方まで解説してきましたがいかがでしたでしょうか?

Microsoft Fabricは…

  • 次世代の「SaaS型データ分析ツール」
  • データ活用に必要な機能を1つのプラットフォームに実装している
  • OneLakeによりデータの一元管理が実現されている
  • SaaSである点と、データ仮想化を実現する点が他のAzureデータサービスと大きく異なる
  • 月額固定制と従量課金制、2つの課金方法がある

です。

今後、詳しい技術情報も併せて公開していければと思いますので、ご興味お持ちいただきましたらぜひチェックしてみてくださいね。

どうぞよろしくお願いいたします。

この記事を書いた人

鈴木梨玖
マーケティング担当の鈴木です。
VDIやDataAI製品を中心に、セミナー、ブログ、メルマガなどで情報を発信しています!
よろしくお願いいたします_(._.)_