1.はじめに

皆さんこんにちは。
この連載では、Azure Databricks サンプルダッシュボードを使ったデータの可視化と基本的な操作方法と

ダッシュボードの作成方法について説明します。

今回は、「NYCタクシーデータセット」を使用して降車時間別の乗車回数の可視化の作成方法について詳細に説明していきます。

第1回:【Azure Databricks SQL ダッシュボード】サンプルダッシュボードのインポートと基本操作

第2回:【Azure Databricks SQL ダッシュボード】総走行数の可視化の作成

第3回:【Azure Databricks SQL ダッシュボード】曜日ごとの運賃と距離の可視化の作成

第4回:【Azure Databricks SQL ダッシュボード】乗車時間分布の可視化の作成

第5回:【Azure Databricks SQL ダッシュボード】ルート別運賃の分析の可視化の作成

第6回:【Azure Databricks SQL ダッシュボード】降車時間別の乗車回数の可視化の作成(今回)

2.ダッシュボードの作成

2-1.クエリを作成

まず、データ取得のためのクエリを作成する必要があります。

①サイドバーで「クエリー」をクリックして、「クエリーを作成」を選択すると、SQLエディタの画面が表示されます。

②以下のコードをエディタにコピーし、以下の2つテキストボックスでパラメーターを入力し、コマンドを実行します。

※動的に値を指定したい場合は列名を {{ パラメータ名 }} で囲います。

※日付の範囲指定を行う場合 {{ パラメータ名.start }}と{{ パラメータ名.end }} で指定します。

文法

USE CATALOG 「カタログ名」;

SELECT
CASE
WHEN 「テーブル名」.「列名」 = 「値」 THEN ‘「値」’
WHEN 「テーブル名」.「列名」 = 「値」 THEN ‘「値」’
WHEN 「テーブル名」.「列名」 = 「値」 THEN ‘「値」’

ELSE ‘「値」’
END AS 「別名」,
「テーブル名」.「列名」 AS 「別名」
FROM
(SELECT
hour(「列名」) AS 「別名」,
COUNT(*) AS 「別名」
FROM
「カタログ名」.「スキーマ名」.「テーブル名」
WHERE
「列名」 BETWEEN TIMESTAMP ‘{{ 「パラメータ名」.start }}’
AND TIMESTAMP ‘{{ 「パラメータ名」.end }}’
AND 「列名」 IN ({{ 「パラメータ名」 }})
GROUP BY
1) 「別名」

③総走行数の可視化と同じように「pickupzip」と「pickup_date」の2つテキストボックスを以下の2つテキストボックスに変更します。情報を入力して「変更を適用」をクリックすると、クエリの結果が表示されます。

④結果は以下の画像の通りです。「保存」をクリックしてクエリを保存します。

⑤クエリに「 降車時間別の乗車回数 」の名前を付けて「保存」をクリックします。

2-2.降車時間別の乗車回数の可視化の作成

①サイドバーで「ダッシュボード」をクリックして、「NYCタクシーダッシュボード」を選択します。

②ダッシュボードで  をクリックして、「編集」を選択します。

③「追加」をクリックし、「可視化」を選択してダッシュボードに可視化を追加します。

④ダイアログでクエリ「降車時間別の乗車回数」を選択します。

⑤「タイトル」項目で「降車時間別の乗車回数 」等の情報を入力して、「ダッシュボードに追加」をクリックします。

⑥結果は以下の通り取得できます。

⑦ビジュアライゼーション「降車時間別の乗車回数 」にマウスを移動して  をクリックして、「ビジュアライゼーションを編集」を選択します。

⑧「Visualization type」項目で「Bar」を選択します。

⑨「X column」で「降車時間」を選択して、「Y columns」で「乗車回数」を選択します。

⑩「X axis」タブに移動して、「Name」項目で「降車時間」等の期待値を入力すると、その値がグラフの横軸の下に表示されます。

⑪「Y axis」タブに移動して、「Name」項目で「乗車回数」等の期待値を入力すると、その値がグラフの縦軸の下に表示されます。「保存」をクリックします。

⑫ビジュアライゼーションが追加され、以下の通りダッシュボードが表示されます。

⑬ダッシュボードを改善するために、ビジュアライゼーションを調整します。

3.まとめ

本連載では、
「NYCタクシーデータセット」を使用して降車時間別の乗車回数の可視化の作成方法について詳細に説明していきます。

第1回:【Azure Databricks SQL ダッシュボード】サンプルダッシュボードのインポートと基本操作

第2回:【Azure Databricks SQL ダッシュボード】総走行数の可視化の作成

第3回:【Azure Databricks SQL ダッシュボード】曜日ごとの運賃と距離の可視化の作成

第4回:【Azure Databricks SQL ダッシュボード】乗車時間分布の可視化の作成の可視化の作成

第5回:【Azure Databricks SQL ダッシュボード】ルート別運賃の分析の可視化の作成

第6回:【Azure Databricks SQL ダッシュボード】降車時間別の乗車回数の可視化の作成(今回)

今回の記事が少しでもDatabricksを知るきっかけや、業務のご参考になれば幸いです。

日商エレクトロニクスでは、Azure Databricksの環境構築パッケージを用意しています。

Azure DatabricksやAzure活用、マイクロソフト製品の活用についてご相談事がありましたらぜひお問い合わせください!

・Azure Databricks連載シリーズはこちら

お問い合わせはこちら


この記事を読んだ方へのオススメコンテンツはこちら