GA4(Google Analytics 4)ではデータ探索機能で作成したレポートのみに適用されるデータ保持期間というものがあり、デフォルトでは2か月に設定されています。この期間を超えたデータはGA4から削除され、レポート上で表示できなくなります。
無料版のGA4では管理画面の設定を変更することで、データ保持期間を14か月まで延長することができます。
本記事では、データ保持期間の対象になるデータ・レポートについてや、GA4の管理画面での設定変更の方法、さらにデータ保持期間の影響を受けずにGA4のデータを分析する方法についても紹介します。
※本記事は、2024年11月時点の情報をもとにしています。
なお、弊社EVERRISEでは、データ保持期間を気にせずにGA4のデータの高速抽出を可能とするツールとして「JetJunction」を提供しています。JetJunctionを利用することで、ユーザー単位ですべてのRAWデータを最短1分間隔で取得できます。詳細は、下記の無料資料をご覧ください。
GA4のデータ保持期間とは
GA4のデータ保持期間とは、GA4のデータが保管されているサーバーから、データが自動的に削除されるまでの期間のことです。
データ保持期間はGA4の「データ保持」の機能で設定・変更ができます。この機能の対象はユーザー単位とイベント単位のデータで、公式ヘルプでは以下のように定義されています。
ユーザーデータとイベントデータの保持
保持期間は、Cookie、ユーザーの識別子(例: User-ID)、広告 ID(DoubleClick Cookie、Android の広告 ID [AAID or AdID]、Apple 広告主向け識別子 [IDFA] など)に関連付けられたユーザー単位とイベント単位のデータに適用されます。
引用:アナリティクス ヘルプ「データの保持」
データ保持期間は「データ探索」のデータのみに適用、初期設定は2か月
GA4の管理画面には「レポート」「データ探索」「広告」という3つの分析機能があります。このうち、データ探索機能を用いて作成したレポートのみ、データ保持期間がデフォルトで2か月に設定されています。
主要なデータの確認に役立つ標準レポートやリアルタイムレポートを作成できるレポート機能、およびGoogle広告と連携することでアトリビューション分析などを行える広告機能にはデータ保持期間の制限がなく、計測開始以降の全期間のデータを閲覧することが可能です。
データ探索はユーザー・イベント単位の詳細なデータを扱う機能で、以下の画像のような個々のユーザー行動レポートや、経路分析レポートなどを作成することができます。
データ保持期間で設定された期間を超えたデータは、レポート上では表示できなくなります。
延長可能なデータ保持期間
データ保持期間の初期設定の2か月という期間は、GA4の管理画面上で延長可能ですが、変更できる期間には制限があります。無料版のGA4では最長14か月、有料版のGoogleアナリティクス360では最長50か月まで延長が可能です。
無料版では最長でも14か月しかデータを保持できないため、前年比較などの長期的な分析ができません。さらに、データ探索では前日までのデータしか参照できず、リアルタイムの分析ができない点にも注意が必要です。
また、延長が適用されるのは、まだ削除されていないデータです。一度データ保持期間を超えて消えたデータは、後から延長設定をしても復元できないため、GA4の初期設定時に保持期間の延長をしておくことが望ましいと言えます。
EVERRISEでは「GA4導入・活用支援」サービスにおいて、データ保持期間の延長設定を含めたGA4の初期設定や、GTMを用いた設定の支援を行っています。設定だけでなく、GA4の教育・トレーニングや分析環境構築まで総合サポートが可能です。ぜひお気軽にご相談ください。
GA4の管理画面でのデータ保持期間の変更方法
本記事では、無料版のGA4の管理画面でデータ保持期間を変更する方法を紹介します。
GA4の管理画面から、「管理」(左のサイドメニュー最下部の歯車マーク)>「プロパティ設定」>「データの収集と修正」>「データの保持」へ遷移します。
イベントデータ、ユーザーデータの保持期間をプルダウンメニューからそれぞれ選択します。
ユーザーデータは、必要に応じて「新しいアクティビティのユーザーデータのリセット」オプションの設定を変えられます。この設定はデフォルトではオンになっています。
このオプションをオンにすると、ユーザーからの新しいイベントが発生するたびにそのユーザーのデータ保持期間がリセットされます。そのため、データをより長い期間保持しておくことが可能になります。
各設定を終えた後は、「保存」を押して完了です。
データ保持期間を変更できないデータ
データ探索のレポートに関連するデータの中でも、データ保持期間を変更できないデータがあります。以下のデータはデータ保持期間が定められていますが、ユーザー側では変更することができません。
Googleシグナル
Googleシグナルとは、Googleアカウントにログインし、広告のカスタマイズがオンなっているユーザーに関連付けられたセッションデータです。Googleシグナルにより、Googleアカウントから取得される年齢や性別といったユーザー属性を、GA4のデータで確認することが可能になります。
Googleシグナルのデータ保持期間は、設定にかかわらず最長26か月です。GA4で設定されているデータ保持期間が26か月よりも短い場合は、その期間が適用されます。
Googleシグナルは、2024年2月にレポートID(レポート用識別子)から削除されました。レポートIDはGA4のレポートでユーザー数をカウントする方法に使用されるもので、現在はレポートIDにGoogleシグナルは使われていません。
Googleシグナルはユーザー数の判別には利用されなくなりましたが、年齢・性別などのユーザー属性のレポートの作成には引き続き使用されています。
イベント数の上限を超えたプロパティのデータ
GA4では、収集したイベント数に基づいてプロパティの規模が分類されます。イベント数が250億件を超えたプロパティや、短期間で大量のイベントデータを収集したプロパティは、プロパティの規模が「大」や「特大」に分類されます。
プロパティが「大」以上になると、イベント単位のデータ保持期間は自動的に2か月になります。
データ保持期間の影響を受けずにGA4のデータを分析する方法
データ保持期間を延長できるとはいえ、データ探索では長期的な分析や当日のデータを含む分析は行えません。GA4のデータを最大限に活用するためには、データ保持期間の制約を受けない方法を利用することが重要です。
データ保持期間の影響を受けずに分析を行う方法と、それぞれのメリット・デメリットについて紹介します。
探索レポート | 標準レポート | Google Analytics Data API | Google BigQuery | JetJunction | |
---|---|---|---|---|---|
データ保持期間 |
ユーザーデータ ・2か月〜最長14か月 イベントデータ ・2か月〜最長14か月(無料版) ・2か月〜最長50か月(有料版) |
なし | なし | なし | なし |
扱うGA4のデータ | ユーザー・イベント単位の詳細データ | 集計データ | 集計データ | RAWデータ | RAWデータ |
データの表示先 (ダッシュボード) |
・GA4の管理画面 | ・GA4の管理画面 |
・Looker Studio ・Google スプレッドシート ・GA4と連携しているBIツール |
・Looker Studio ・Google スプレッドシート ・BigQueryと連携が可能な各種BIツール |
以下のデータ格納先と連携可能なBIツール ・Amazon Redshift ・Amazon S3 ・Google Cloud Storage ・Google BigQuery ・各種DWH・CDP ・CDP「INTEGRAL-CORE」 |
メリット | ・集計データよりも詳細なデータで分析ができる | ・比較的簡単にレポート作成が可能 | ・レポートのカスタマイズ性が高い |
・詳細で柔軟な分析ができる ・レポートのカスタマイズ性が高い |
・詳細で柔軟な分析ができる ・レポートのカスタマイズ性が高い ・データ加工のコストを抑えられる ・Google以外のサービスへのデータ連携ができる ・費用の管理がしやすい |
デメリット |
・データ保持期間がある ・レポートのカスタマイズ性が低い |
・利用可能データが限定されている ・レポートのカスタマイズ性が低い |
・利用可能データが限定されている ・割り当て制限が起こることがある |
・データ加工作業が必要 ・データ量によって利用料金がかかる ・費用の管理がしづらい |
・利用料金がかかる |
GA4の標準レポートの利用
GA4の標準レポートは、目的に応じて最適化したテーブルに自動的に集計されたデータを利用して作成されています。集計データを使用するレポートにはデータ保持期間が適用されないため、標準レポートは期間を気にせず分析に利用できます。
標準レポートでは、流入チャネル別やページ別のセッション数やユーザー数、キーイベント(コンバージョン)数を、以下の画像のようなレポートで見ることができます。ただし、個々のユーザー行動やイベントの詳細なデータを確認することはできません。
標準レポートを利用するメリットは、GA4の管理画面でレポートを直接作成・閲覧できるため、比較的簡単に分析環境を構築できることです。
デメリットとしては、表示可能なデータが限られており詳細な分析には不向きであることや、レポートのデザインのカスタマイズ性が低い点が挙げられます。
Google Analytics Data APIの利用
Google Analytics Data APIとはGA4のデータを外部へ呼び出すための仕組みで、BIツールなどのほかのツールへ連携する際に使用されます。Google Analytics Data APIは集計データを使用するため、標準レポートと同様にデータ保持期間を気にせず分析が可能です。
Google Analytics Data APIを利用して取得したデータを表示するダッシュボードの例として、以下があります。
- Looker Studio
- Googleスプレッドシート
- GA4と連携している各種BIツール
Google Analytics Data APIを利用するメリットは、データの表示先としてBIツールなどと連携することで、GA4の管理画面よりもデザインのカスタマイズ性が高いダッシュボードを作成できる点です。
デメリットは、標準レポートと同様に扱えるデータが限られているために、必要なデータを取得できない場合があることです。また、データ量や使用方法によってはAPIの割り当て制限が起こり、データの共有がされないことがあります。
関連:GA4のAPIに関する割り当て制限と4つの対応策|GA4のデータを活用しより深い分析を行うためには
BigQueryにエクスポートしたRAWデータの利用
BigQueryとはGoogleが提供するクラウドDWHで、大量データを高速に処理できるため、分析用途で広く利用されているサービスです。BigQueryでは、GA4のすべてのデータを含む未加工のRAWデータをエクスポートできます。
GA4のRAWデータにはデータ保持期間の制限がないため、BigQueryを利用することでデータ保持期間を気にせずに、より多くのデータを使った分析が可能になります。
関連:GA4とBigQueryの連携で実現できること|RAWデータ活用でコスト削減する方法
BigQueryで取得したデータでは、一人ひとりのユーザーのイベントを時系列で確認したり、イベントに付属するパラメーターと呼ばれる詳細情報を確認したりすることができます。以下の画像のようなデータがエクスポート可能です。
BigQueryで取得したデータを表示するダッシュボードの例として、以下があります。
- Looker Studio
- Googleスプレッドシート
- BigQueryと連携が可能な各種BIツール
BigQueryを利用するメリットは、長期間にわたるデータの保存や、GA4のRAWデータを活用した詳細かつ柔軟な分析が可能になることです。また、BIツールとの連携でデザインのカスタマイズ性が高いダッシュボードを作成できます。
デメリットは、分析に必要なデータ加工のためにSQLやJSONを扱えるエンジニアリソースが必要になることです。さらに、大量のデータを扱う場合はBigQueryの利用料金が発生することがあり、その費用が読みづらいために費用の管理も必要になるという点が挙げられます。
関連:GA4におけるAPIとBigQueryの問題。CDPならGA4のデータを最大限活用できるのか?
JetJunctionで取得したRAWデータの利用
弊社EVERRISEが提供するJetJunctionは、GA4のRAWデータを簡単に抽出・集計できるツールです。BigQueryと同じようにGA4のRAWデータを扱えるため、データの保持期間の制限はありません。
JetJunctionでは、データ抽出後の格納先として以下があり、これらと連携可能なBIツールなどでデータの表示をすることができます。
- Amazon Redshift
- Amazon S3
- Google Cloud Storage
- Google BigQuery
- 各種DWH・CDP
- CDP「INTEGRAL-CORE」
JetJunctionを利用するメリットは、BigQueryと同様にRAWデータによる詳細で自由な分析が可能であり、BIツールとの連携でデザインのカスタマイズ性が高いレポートが作成できる点です。
さらに、管理画面上で簡単にデータ加工が行えるため、分析に必要なデータ加工のコストを削減できることや、AWSなどGoogle以外のサービスにもデータを連携できることが挙げられます。また、JetJunctionではGoogle Analytics Data APIのように割り当て制限を気にせずに、最短1分間隔でデータを取得可能です。
デメリットは、JetJunctionのツール利用料金が発生することです。ただし、イベント数やテーブル数に基づいた料金プランが用意されており、BigQueryと比較してコスト管理がしやすくなっています。
取得できるGA4データの自由度に加え、データ加工のしやすさが備わったJetJunctionを活用した分析は、高度な分析を行いたい企業や、AWS環境をメインに使用している企業に適しています。
JetJunctionの詳しい料金体系や機能については、下記の無料資料をご覧ください。
無料資料:JetJunctionご紹介資料のダウンロードはこちら
GA4の枠を超えたユーザー分析に役立つCDP
GA4はwebサイトやアプリのユーザー行動を分析するのに役立ちます。しかし、ユーザーのすべてのタッチポイントに関わる分析や、マーケティング活動全体の分析のためには、ほかのツールのデータやオフラインのデータが必要になる場合があります。
ツールやシステムを横断したデータの分析には、さまざまなデータを収集・統合し、一元管理するためのCDPのようなデータ基盤を持つことが重要です。
CDPとは「カスタマー データ プラットフォーム:Customer Data Platform」の略称で、顧客に関するデータを収集・統合し、各マーケティングツールに適した形で加工・連携することができる、顧客データ活用に特化したシステムです。
関連:CDPとは?顧客データ活用に特化したCDPの機能とメリット、事例などの基礎知識まとめ
CDPはデータを統合することで分析や顧客理解に役立つだけでなく、統合したデータから作成した詳細な条件のセグメントをマーケティング施策ツールへ受け渡すことで、より最適なタイミングでのメール送信やプッシュ通知など、施策の実行にも活用できます。
CDPの主な機能やDWHなどのほかのツールとの違い、ユースケースや事例については、下記の無料資料で紹介しています。
EVERRISEが提供するCDP「INTEGRAL-CORE」
弊社EVERRISEでは、顧客データをノーコードで管理できるCDP「INTEGRAL-CORE」を提供しており、これまでTVerさまやキーコーヒーさま、hoyuさまなどを含め複数社の導入実績がございます。
CDP「INTEGRAL-CORE」はJetJunctionと連携でき、JetJunctionの加工データなどの機能を使いながら、CDPとしてのデータ収集・統合・加工・連携の機能も扱えるため、より顧客データ活用がしやすいシステムとなっています。
- CDP「INTEGRAL-CORE」の特長
- 顧客に関するデータをノーコードで統合
- 統合データをノーコードで加工・セグメントを作成
- 統合データを外部連携機能でBIでの分析やMAやCRMでのマーケティング施策に利用
- 国産CDP・自社開発システムならではの総合支援体制
- SaaSプランのみでなく、専用環境での提供も可能
CDP「INTEGRAL-CORE」の機能や特長、ユースケース、実際の画面については、以下の無料資料で詳しく紹介しています。データ活用にお困りの際はぜひお気軽にご相談ください!