GA4(Google Analytics 4)のデータ利用の幅を広げるため、BigQueryとの連携を検討する企業は多いかと思います。GA4のデータをBigQueryに連携することでRAWデータを扱えるようになり、分析の幅を広げたり、データの長期保存が可能になるなど、多くのメリットがあります。
一方で、BigQueryの利用する場合、追加コストが発生する懸念があります。
本記事では、GA4とBigQueryの連携によって実現できることや懸念点を紹介します。また、GA4のRAWデータを扱い、データ利用の幅を広げるBigQuery以外の選択肢についても紹介します。
※本記事は、2024年11月時点の情報をもとに作成しています。
なお、弊社EVERRISEでは、GA4のデータの高速抽出・AWS連携をスムーズにするツールとして「JetJunction」を提供しています。JetJunctionを利用することで、ユーザー単位ですべてのRAWデータを最短1分間隔で取得できるうえに、Amazon RedshiftおよびAmazon S3に出力可能なため、コストを大幅に削減できる可能性があります。JetJunctionについて、詳しくは下記の無料資料をご覧ください。
BigQueryとは
BigQueryとは、GCP(Google Cloud Platform)で提供されているクラウドDWHです。数テラバイトや数ペタバイトというビッグデータでも、超高速で解析できる点に特徴があります。データベース言語の1つであるSQLを用いて、データ処理を行うことが多いです。
GA4とBigQueryの連携によって実現できること
GA4のデータとほかのデータの統合
BigQueryを利用することで、GA4のデータとほかのデータを統合して利用できるようになります。
GA4が集計するデータは分析用に加工されたものであるため、基幹システム内に蓄積されたほかのツールやシステムで収集したデータと統合して利用できません。
BigQueryを利用すると、加工される前の生のデータであるGA4のRAWデータを扱えるようになります。スマホアプリのログデータやwebサイトからの問合せ履歴、実店舗での来店履歴や購買データなど、オンライン・オフラインで収集したGA4以外のデータと統合して利用できるようになり、顧客を多角的に理解できるようになります。
RAWデータを利用した分析
GA4単体では、セグメンテーション分析やエンゲージメント分析などが可能ですが、GA4のRAWデータを扱えるようになると、より分析の幅が広がります。
GA4のRAWデータの利用によって可能となる分析の例を4つ紹介します。
自由度の高いn1分析
GA4とBigQueryを連携しRAWデータを利用することで、自由度の高いn1分析を行えます。n1分析とは、1人の顧客を詳しく分析することを通じてユーザー理解を深め、新たな訴求方法や製品を生み出そうとするマーケティング手法です。
GA4の探索レポート内の「ユーザーエクスプローラー」レポートを利用することで、特定のイベントが発生したユーザーを抽出・分析できます。これにより、特定の行動をとったユーザーを分析し、顧客理解に繋げられます。
一方で、GA4とBigQueryを連携しRAWデータを扱った場合、セッション・イベントに関する詳しい条件を設定し、より自由度の高いn1分析が可能となります。例えば、イベントA発生後にイベントBが発生しなかったユーザーの抽出・分析を通じて、仮説として立てていた購入プロセスの中でユーザーが離脱する原因を特定し、改善施策の精度を向上できます。
幅広い方法でのLTV算出・分析
BigQueryでGA4のRAWデータを扱うことで、多様な項目でのLTV分析や、任意の計算式でのLTV分析を行えるようになります。
LTV(Life Time Value:顧客生涯価値)とは、ユーザーが生涯を通じて企業にもたらす価値を表したマーケティング指標です。
LTVの算出方法はいくつかありますが、GA4の管理画面上で算出されるLTVは、ECサイト・アプリなどからの購入イベントをもとにした収益の合計であり、サイト単位や初回の流入チャネル・キャンペーン別といった特定のディメンション(分析軸)で分けられたユーザーグループ単位での算出です。
分析したいサイト全体のLTVを確認できたり、どのチャネル・キャンペーンで流入したユーザーグループのLTVが高い傾向があるかを分析することで、今後注力して施策を実行すべきチャネル・キャンペーンの検討に活かせます。
しかし、GA4の管理画面上では設定可能なディメンションが限定的で、分析の幅が限られるという課題があります。
GA4のRAWデータを利用すると、多様な軸でLTVの分析が可能です。訪れたページを基準として分析することで、どのようなページを閲覧しているユーザーのLTVが高くなる傾向があるかなどを把握できます。
また、GA4のRAWデータの利用によって、任意のLTVを定義し算出できるようにもなります。例えば、ECサイトを運営している企業の場合、ユーザーの獲得・維持コストを考慮したLTVの算出が求められるケースがあります。RAWデータを利用すれば、新規ユーザーの獲得・既存ユーザーの維持コストといった必要な数値を式に組み込んでLTVを算出できるようになるなど、自社のビジネスモデルや分析の目的に合わせた柔軟なLTVの算出・分析が可能です。
柔軟なセグメント作成・クロス集計
GA4とBigQueryを連携しRAWデータを扱うことで、より柔軟なセグメント作成、相関関係や相違点を明らかにするためのクロス集計ができます。セグメントとは、年齢や性別、業種などの特定の属性・行動データをもとに分割されたグループを指します。
GA4の管理画面で作成できる探索レポートでは「最近のアクティブユーザー」などのデフォルトのセグメントや、ユーザー・セッション・イベントのそれぞれにスコープを当てたカスタムのセグメントを作成・利用できます。例えば、1ヶ月以内に商品を購入したユーザーを分析したい場合、ユーザーにスコープを当てたセグメントを作成し、分析に利用します。
また、作成した複数のセグメントを同一レポート上に設定することで、セグメント間の簡単なクロス集計も可能です。
上図は、新規ユーザーと既存ユーザーのセグメントを作成し、ページURL別に「セッション」と「セッションあたりの平均エンゲージメント時間」を比較するためにクロス集計を行った例です。
対して、GA4のRAWデータを利用すると、より柔軟なセグメントを作成できます。例えば 、複数セッションにわたる詳しい行動パターンをもとにしたセグメント作成が挙げられます。webサイトへの初回訪問時にはCVに至らなかったものの、期間内のn回目の訪問で特定のページからCVに至ったユーザーのセグメントなどを作成することで、CVに至ったユーザーの分析に活かせます。
また、独自の指標を用いたセグメント作成・分析もできます。例として、商品の購入金額や頻度、ECサイトへの訪問頻度などをもとにロイヤルティ別のセグメントを作成し、クロス集計を行うケースがあります。
ロイヤルティ別に比較することで、ロイヤルティの高いセグメントに対する理解が深まり、優良顧客を対象に特典を付与し長期的な関係構築を目指すための施策を実施する際のヒントが見つかります。
時系列分析による行動予測
BigQueryを連携しGA4のRAWデータを利用することで、特定のユーザーがweb上でどのような行動をとっているかを時系列で確認・分析できるようになります。
分析結果をもとに、ユーザーがどのようなコンテンツ・キャンペーンを起点として自社に興味を持ち、どのような遷移・きかっけで購買行動に至ったかなどをより詳細に把握できるようになり、今後どのような行動をとる可能性が高いかを予測するのに役立てられます。
また、BigQuery MLなどの機械学習モデルを構築できる機能を利用すれば、機械学習による行動予測が可能となります。
APIの割り当て制限への対応
BigQueryの利用によって、GA4のAPIの割り当て制限を解決できます。
GA4のデータをLooker StudioなどのBIツールに連携する手段として、Google Analytics Data APIがあります。Google Analytics Data APIとは、GA4のデータを各種BIツールに呼び出す機能です。BIツールからGoogle Analytics Data APIにデータを呼び出すためのリクエストを送信することで、内容に応じたデータを抽出しレポート作成やダッシュボード構築などができます。
しかし、Google Analytics Data APIには、APIの使用量の制限があり、リクエストの量・回数に割り当てが設けられています。GA4から抽出するデータ量が増えたり短時間でのリクエスト回数が多くなったりして割り当ての上限に達すると、エラーが表示されデータを取得できず、最新のレポートを作成できなくなります。
関連:GA4のAPIに関する割り当て制限と4つの対応策|GA4のデータを活用しより深い分析を行うためには
Google Analytics Data APIの割り当て制限は、GA4をデータソースにした場合に適用されます。BigQueryからRAWデータをエクスポートすることで、割り当て制限を気にすることなくデータを抽出し各種BIツールなどに連携できます。
データの長期保存
GA4のデータをBigQueryに連携することで、データを長期保存できるようになります。
GA4の探索レポートで扱えるデータの保存期間は、無料で使える標準プロパティで最大14ヶ月です。有料版であるアナリティクス360プロパティでも最大50ヶ月であり、それ以前のデータは自動的に削除されるため利用できません。そのため、トレンド分析などの長期間のデータを必要とする分析の精度の低下が懸念されます。
GA4のデータをBigQueryに出力・保存しておくことで、より長期のデータを扱った分析や長期的な戦略の設計が可能となるだけでなく、データを保存する環境整備にも繋がります。
ただし、GA4のRAWデータは過去のものは出力できず、出力設定を行って以降のデータのみ出力・保存できます。事業フェーズが進むにつれて、分析の観点からRAWデータの利用が必要となるケースは少なくないため、将来を見据えてGA4のRAWデータを出力・保存できる環境を構築しておくことが重要です。
関連:GA4のデータ保持期間とは?14か月に延長する方法、期間制限なしで分析するための解決策
GA4のデータをBigQueryに連携する方法
GA4のデータをBigQueryに連携する方法は以下のとおりです。
- GoogleCloudでプロジェクトを作成する
- BigQuery APIを有効にする
- BigQueryのプロジェクトをGA4に連携する
GA4のデータをBigQueryに連携する方法の詳細は、Google公式のヘルプページであるアナリティクスヘルプで紹介されています。
1.GoogleCloudでプロジェクトを作成する
初めに、GoogleCloudで該当のBigQueryプロジェクトを作成する必要があります。
GoogleCloudの管理画面にログインし、左上のGoogleCloudのアイコンの隣にあるプルダウンをクリックします。
リソースの選択画面になるので、右上の「新しいプロジェクト」をクリックします。
プロジェクト作成画面に移行したら、下記の情報を入力します。
- プロジェクト名
- 組織
- 場所
入力後、画面下部の「作成」をクリックすると、プロジェクトの作成が完了します。
2.BigQuery APIを有効にする
続いて、BigQuery APIを有効にする作業を行います。
GoogleCloudの左側のナビゲーションメニューにある「APIとサービス」内の「ライブラリ」をクリックします。APIが一覧表示されるので、左側の「カテゴリ」内にある「ビッグデータ」をクリックします。
ビッグデータに関するAPIが表示された後、その中から虫眼鏡のアイコンの「BigQuery API」をクリックしましょう。
BigQueryのAPIの詳細ページに移るので、「有効にする」をクリックします。
「APIが有効です」と表示されたらAPIの有効化が完了です。
3.BigQueryのプロジェクトをGA4に連携する
最後に、作成したBigQueryプロジェクトをGA4に連携する作業を行います。
GA4の管理画面の左側のメニュー下部にある歯車のアイコンの「管理」をクリックします。
続いて、「サービス間のリンク設定」の項目から「BigQueryのリンク」をクリックします。
右上に表示される「リンク」をクリック後、作成したBigQueryプロジェクトを選択します。その後、データロケーションや頻度などの設定項目を選択し、最後に「送信」をクリックします。
問題なく連携が完了すると「BigQueryのリンク設定」の画面上に連絡先のプロジェクトが表示され、おおよそ24時間後からデータが反映されます。
GA4のデータをBigQueryに連携する際のコストの問題
GA4とBigQueryの連携によって実現できることが増えますが、コストの問題もあります。
エンジニアのサポートコスト
GA4とBigQueryを連携しRAWデータを利用する際、エンジニアのサポートコストが発生する可能性があります。
GA4とBigQueryを連携しRAWデータを出力する設定は複雑な作業が必要なく、専門知識がない人でも行えます。しかし、BigQueryに出力したデータを利用するためには、データを必要な形に加工する必要があり、GA4のRAWデータについて理解しているエンジニアのサポートが必要となります。
そのため、エンジニアにサポートしてもらえる体制を構築できるかを確認したうえで、体制構築に伴うコストを想定しておかなければいけません。
BigQueryの管理に伴うコスト
BigQueryを管理するためのコストが発生することも懸念点として挙げられます。
BigQueryを利用するためには、GCPを管理する必要があります。AWS環境をメインで利用している企業の場合、GA4のデータをBigQueryに連携するためにGCPを管理しなければならず、管理コストが追加で発生します。
関連:GA4のデータをAWS環境に連携する2つの方法|GCPの管理コスト削減を実現
なお、GA4とBigQueryを連携することは無料でできますが、データ連携以降は大きく分けて2種類の費用がかかります。
- クエリ処理の費用:分析を行うためにかかる費用
- ストレージ費用:データを保管するためにかかる費用
BigQueryの費用の詳細は、Google Cloudの公式サイトでも紹介されています。
GA4のRAWデータ管理におけるコスト削減を実現するJetJunction
GA4のRAWデータの利用におけるBigQueryのコスト面を解消する選択肢の1つに、JetJunctionが挙げられます。
JetJunctionとは、GA4のデータを簡単に抽出・集計できる、弊社EVERRISEが提供するツールです。JetJunctionはGA4のRAWデータを扱うことができるうえに、ユーザー単位ですべて最短1分間隔で取得できます。
また、管理画面上でRAWデータの項目や順番を自由にカスタマイズして構築できます。セッションに属する情報として集計する加工データを用意しているため、BigQueryを利用する場合に必要となるデータの前処理も不要であり、GA4のRAWデータの収集・加工・連携を管理画面上で完結できます。
さらに、JetJunctionはGA4のRAWデータをAmazon RedshiftやAmazon S3といったAWS環境に出力できるため、BigQueryの管理工数やコストの削減も可能です。
JetJunctionのより詳しい機能や特長、料金の目安について、詳しくは下記の無料資料をご覧ください。
無料資料:JetJunctionご紹介資料
JetJunctionと連携し発展的な分析・施策が行えるCDP
JetJunctionとCDPを連携することで、より発展的な分析・施策を行えます。
CDPとは「カスタマー データ プラットフォーム:Customer Data Platform」の略称で、あらゆる顧客のデータを収集・統合し、データを活用できる環境を整えるマーケティングシステムです。
関連:CDPとは?機能や部門・業界別の活用例、今後の動向などをまとめて解説
CDPを利用することで、オンライン・オフライン問わず、あらゆる顧客データを一元管理できるようになります。また、CDPは顧客一人ひとりに合わせた体験が提供できるよう、BIツールやMAツール、プッシュ通知、web接客ツールなどの分析・施策を行うツールと連携できます。
例えば、JetJunctionとCDPの連携によって、GA4のデータと位置情報や実店舗への来店履歴といったGA4では収集できないデータを組み合わせた分析を行えるようになり、分析の幅が広がることでより深く正しく顧客を理解できるようになります。加えて、組み合わせたデータをもとに顧客単位でセグメントを作成し異なるコンテンツを提供するなど、それぞれの顧客の状況に合わせた施策を実行できます。
JetJunctionとCDPの連携によって、正確な顧客データを利用したセグメンテーションが可能となり、最適なタイミング、最適なチャネルで、最適な情報を顧客に届けるOne to Oneマーケティングを実現できます。
CDPとは何かについて、詳しくは下記の無料動画をご覧ください。CDPに関する基本的な知識から具体的なユースケースまで紹介しています。