衣袋教授の新・Googleアナリティクス入門講座

分析に不要なパラメータを除外してGoogleアナリティクスのレポートを見やすくする[第5回]

集計に不要なパラメータを除外する方法とサイト内検索の設定方法を解説

URLには「?s=xxxx」といったさまざまなパラメータが付くことがあるが、Googleアナリティクスでは、何も設定しないとそれぞれがすべて別のページとして集計されてしまう。

そうした事態を防ぐため、分析に不要なパラメータを削除して集計処理する設定が「除外するURLクエリパラメータ」だ。

この記事で学べること:
  • 「クエリパラメータ」「ダミーパラメータ」の意味を理解する
  • 「除外するURLクエリパラメータ」を設定する
  • 「サイト内検索のトラッキング」を設定する

ビューの設定の2回目となる今回は、「除外するURLクエリパラメータ」の設定を解説する。普段「パラメータ」という言葉を聞き慣れていない人もいるだろう。設定に入る前に、「クエリパラメータ」や「ダミーパラメータ」をしっかり理解しておこう。

目的は「同じページが分散されて集計される」のを防ぐこと

この設定の目的は、前回の「デフォルトのページ」設定と基本的に同じだ。Googleアナリティクスでは基本的にアドレスバーに表示されたURLを1つずつ閲覧ページとして記録するので、同じと見なして構わないページはまとめておかないと非常に使いにくいデータになってしまう

特に大規模サイトにおいては、この設定が極めて重要だ。Googleアナリティクスでは1日に1つの分析軸で利用できるデータベースの行数が5万までと制限されているので、それ以上の行数が発生すると、データベースからあふれて「(other)」という表示でくくられてしまう。

ある程度以上の規模のサイトになると、集計後のページ名(URL)の数がこの制限に引っかからないかを留意しないといけないだろう。そのためにも、不要なパラメータは極力削除することが必要なのだ。

クエリパラメータとは?

さて、設定の前に「クエリパラメータ」について確認しておこう。クエリパラメータとはURLに付け加える文字列のことで、さまざまな情報をWebサーバーに伝えるために使われる。たとえば、筆者の運営する「GAフォーラム」(http://gaforum.jp/)のサイト内検索で「gaiq」を検索すると、サイト内検索結果ページのURLは次のようになる。

http://gaforum.jp/?s=gaiq
パラメータを付けた例(サイトで見る

この場合、末尾に付いている「?s=gaiq」がクエリパラメータだ。

1つずつ説明すると、「?」が「ここからクエリパラメータが始まる」ことを示し、「s」という名前のパラメータ(変数)に「gaiq」という値を指定している。Webサーバーは、これに対応するコンテンツ(ここでは「gaiq」の検索結果のページ)をユーザーのブラウザに動的に返して表示するというわけだ。

つまり、「?」+「変数名」+「=」+「変数の値」が、クエリパラメータの基本構造になっている。しかし、パラメータは1つとは限らない。パラメータが複数ある場合は「&」でつないでいく。つまり、次のようになる。

?a=x&b=y&c=z

上の例は、「a=x」「b=y」「c=z」という3つのパラメータと値がある場合だ。パラメータの最初は「?」で始まり、2つ目以降のパラメータは「&」でつながれている。

ページの表示に影響しないダミーパラメータ

これ以外にも、ページ表示内容とは無関係にURLに付与されるパラメータもある。ここでは「ダミーパラメータ」について説明しておこう。

ダミーパラメータは「ダミー」という名の通り、仮のパラメータのことだ。静的なWebページでは、後ろに「?」に続く任意の文字列を付けてもページ表示の際には無視されるという性質がある。また、動的なページでも特定のパラメータ以外はページの表示内容に関係がないことが多い。

たとえば、前出のGAフォーラムのサイトを例にすると、サイトのトップページにアクセスするのに、通常は次のURLを使う。

http://gaforum.jp/

しかし、次のURLでも問題なくトップページにアクセスできる。

http://gaforum.jp/?mm=gaiq
パラメータを付けた例(サイトで見る

「mm」というパラメータ(変数)は、GAフォーラムでは動的なページ生成用のパラメータに利用されていない変数なので、「?」以降の文字列が無視され、URL表示はそのままで「http://gaforum.jp/」、つまりトップページの内容が表示されるのだ。

表示の際には無視されるこのダミーパラメータだが、アクセス解析にとっては意味がある。Googleアナリティクスをはじめとする多くのアクセス解析ツールでは、アドレスバーに表示されるURL情報を取得する仕組みを採用している。よって、同じページへのアクセスであっても、ダミーパラメータが付いたURLへのアクセスは別URLとして区別されるのだ。

なぜわざわざこのようなことをするのかというと、その多くはどこから来たかを把握するための「参照元」のデータをより正確に取るためだ。

http://example.com/example.html?ad=b20160624

Googleアナリティクスの参照元の情報だけでは精度が低いと感じる場合に、それを補完するために計測対象サイトへのリンクにダミーパラメータを付けて、どの広告やメルマガから訪問してきたのかを正確に取得できるようにしているのだ。

しかし、参照元の精度を上げるためとはいえ、URLに無駄な文字列を付加するのは「同じコンテンツなのに違うURLでアクセスさせる」ということで、一方のメリットが他方のデメリットになるという関係にある。

このあたりについて詳しく知りたい場合は、下記の記事を参照してほしい。

Googleアナリティクスもダミーパラメータを利用する

詳しくは連載の続きで解説するが、Googleアナリティクスでは「カスタムキャンペーンのパラメータ」と呼ばれるパラメータ群があり、基本的にはこの形式に従ってランディングページへのリンクにパラメータを付与することになる。これも、表示に影響しないダミーパラメータだ。

たとえば広告やメルマガから移動させたいリンク先URLが下記だったとしよう。

http://www.example.com/lp.html

これにカスタムキャンペーンのパラメータを付与すると、実際に記述するリンクは下記のようになる。

http://www.example.com/lp.html?utm_source=abc&utm_medium=email&utm_campaign=xyz

「utm_source」「utm_medium」などといったパラメータの書式は決まっているので、この書式やレポートで実際にどのように分類されるかといったことは、別の記事で解説する。ここではGoogleアナリティクスにも専用のダミーパラメータがあるということを知っておこう。

現存するパラメータを5パターンに分けて対処を決める

これらを踏まえて、まずは自社サイトで利用しているパラメータの棚卸しをしてほしい。

サーバー管理者や関連する部門のWebマーケター、広告代理店や制作会社などの関係者にヒアリングを行い、Webサイトが利用しているすべてのパラメータを洗い出していただきたい。そして、洗い出したパラメータを次の5つの種類別に分類して対処を決める。

対処の基本方針は、分析に不要なものは「除外するURLクエリパラメータ」に記述して、集計に影響を与えないようにすることだ。ただしあくまでも基本方針であって、本設定を行うことで本来の目的を果たせなくなってしまわないように、ケースバイケースでの判断が求められることもあるだろう。

  1. 商品IDなど、ページ内容の判別に直接関係する動的なパラメータ
  2. サイト内検索で使用する動的なパラメータ
  3. セッションIDなどで使用する、ページ内容の判別に直接関係ない動的なパラメータ
  4. Googleアナリティクスで使用するカスタムキャンペーンパラメータ
  5. それ以外の目的で使用しているダミーパラメータ

1. 商品IDなどで使用する、ページ内容の判別に直接関係する動的なパラメータ

商品ごとのページのURLに付与された商品IDなどを表すパラメータの場合は、パラメータの値で各ページを1つ1つ区別する必要がある。この場合、「URLクエリパラメータの除外」に記述すべきではない。

たとえば、「ビックカメラ.com」では、次のように商品カテゴリや個々の商品の詳細情報ページを識別するためのパラメータが、URLの最後に付く形になっている。このケースでは商品カテゴリを表すために「dispNo」というパラメータを利用していることがわかる。

http://www.biccamera.com/bc/disp/CSfDispListPage_001.jsp?dispNo=001100005
「ビックカメラ.com」のデスクトップパソコンのカテゴリページ(サイトで見る

ただし、商品点数が膨大でURLパターンがあまりにも多くなりすぎて、冒頭に書いた1日5万件ルールに抵触しそうな場合は、どうせ(other)にくくられてしまいまともな分析が困難なので、あえて商品IDを表すパラメータを「URLクエリパラメータの除外」に記述するという判断もありだろう。その場合は、当然個々の商品ページ別の分析はできなくなる。

2. サイト内検索で使用する動的なパラメータ

Googleアナリティクスには、サイト内検索のキーワードをレポートする専用の機能がある。本記事の後半であらためて解説する。

3. セッションIDなどで使用する、ページ内容の判別に直接関係ない動的なパラメータ

セッション管理などのためだけに利用しているパラメータの場合は、閲覧コンテンツに違いはなく、別々のURLとして判別する必要性は低い。このようなパラメータは「URLクエリパラメータの除外」に該当のパラメータを記述して、集計の際には削除されるようにしておこう。

4. Googleアナリティクスで使用するカスタムキャンペーンパラメータ

「utm_source」「utm_medium」などのGoogleアナリティクスのカスタムキャンペーンのパラメータは、正しく付与されていれば、レポートに表示されるページ名(URL)からは自動的に削除され、集客系のレポートの参照元情報に取り込まれる。「URLクエリパラメータの除外」の項目に記述する必要はない。

5. それ以外の目的で使用しているダミーパラメータ

上記4つの目的に当てはまらないパラメータも、誰かが何らかの目的と意図を持って設定/運用しているはずだ。もし集客を計測する目的で利用しているパラメータであれば、可能なら上記4. のカスタムキャンペーンを利用する方法をおすすめしておこう。

その他の目的であれば、何かしらの識別子として利用しているのだろうから、「URLクエリパラメータの除外」設定はしないでおく。ただし、使用目的が済んだら、速やかに該当のパラメータの使用を終了するように、その担当者に依頼しておこう。

「除外するURLクエリパラメータ」を設定する

では実際にどのように設定を行うかを説明しよう。まずGoogleアナリティクスにログインし、「アナリティクス設定」画面から「ビュー設定」画面を表示しよう。

操作手順
  1. [アナリティクス設定]をクリック(図1赤枠部分)
  2. アカウント、プロパティ、ビューをそれぞれのプルダウンから選択(図1青枠部分)
  3. [ビュー設定]をクリック(図1緑枠部分)
図1:ビュー設定の画面を表示
図1:ビュー設定の画面を表示

「ビュー設定」画面(図2赤枠部分)が表示されたら、「除外するURLクエリパラメータ」の項目(図2青枠部分)に除外したいパラメータの変数を入力する。

操作手順
  1. [ビュー設定]画面が表示された(図2赤枠部分)
  2. [除外するURLクエリパラメータ]にパラメータの変数名を入力(図2緑枠部分)
図2:ビュー設定(上部)
図2:ビュー設定(上部)

たとえば、「sessionId」と「visitorId」の2つのパラメータを集計から除外したければ、この入力ボックス(図2緑枠部分)に「,(半角カンマ)」で区切って「sessionId,visitorId」と記述すればよい。

パラメータを除外することによる集計への影響は?

「除外するURLクエリパラメータ」でパラメータを記述したら、Googleアナリティクスのレポートに表示されるページ名(URL)では、そのパラメータがないものとして扱われる。たとえば、前述のビックカメラ.comの例であれば、次のようになる。

http://www.biccamera.com/bc/disp/CSfDispListPage_001.jsp?dispNo=001100005(元のURL) http://www.biccamera.com/bc/disp/CSfDispListPage_001.jsp(レポート上の表記)

複数のパラメータを利用している場合は、削除対象のパラメータ部分だけが間引きされる。「除外するURLクエリパラメータ」の項目に「abc」と入力していれば、その部分のみが間引かれる。

http://example.com/lp.jsp?abc=001&xyz=002(元のURL) http:// example.com/lp.jsp?xyz=002(レポート上の表記)

この「除外するURLクエリパラメータ」設定は、ページ名(URL)を強制的に修正するので、実際には存在しないURLに変更されることもあり、レポートに多少影響が出る。たとえば、該当ページ(URL)へのリンクや[行動]>[ページ解析]レポートはエラーで表示されないといった具合だ。

いくつかのレポートでエラーが生じるとしても、表記URLをきれいに統合するメリットの方が勝る場合が多いので、5万URL上限問題の解消の方を優先し、この設定を実行することをおすすめしたい。

サイト内検索のパラメータは別の枠に入力する

これでクエリパラメータを除外する設定は完了だが、同じビュー設定の一番下に「サイト内検索の設定」がある。これはサイト内検索機能がある場合に、[行動]>[サイト内検索]レポート群を有効にするための設定だ。同じパラメータの処理なので、ここで一緒に解説しておこう。

ただし、冒頭で紹介したGAフォーラムのように、サイト内検索結果のURLにクエリパラメータを利用していることが条件だ。

http://gaforum.jp/?s=gaiq

クエリパラメータを利用したサイト内検索を実装している場合には、ビュー設定の下部にある「サイト内検索のトラッキング」をオン(図3赤枠部分)にしよう。ここをオンにすると、その下の「クエリパラメータ」と「サイト内検索のカテゴリ」の2つの設定項目が表示される。

図3:ビュー設定(下部)
図3:ビュー設定(下部)

GAフォーラムの例の場合、「s」がサイト内検索用のパラメータになるので、「クエリパラメータ」の入力ボックスには「s」と入力(図3青枠部分)する。2つの設定項目は少し複雑なので、詳しく見ていこう。

「URLからクエリパラメータを削除」は削除後のURLで判断する

「クエリパラメータ」の下にある「URLからクエリパラメータを削除」(図3緑枠部分)は、「除外するURLクエリパラメータ」の項目の意味と同じだ。例で見ていこう。

http://gaforum.jp/?s=gaiq

この場合に「クエリパラメータ」を「s」と指定し(図3青枠部分)、「URLからクエリ パラメータを削除」(図3緑枠部分)をチェックすると、URLから該当パラメータ部分を削除するので、ページ名(URL)は、次のようになる。

http://gaforum.jp/

つまり、検索結果のページなのに、トップページを見たことにされてしまう。そのためこういった場合はチェックをオンにしてはいけない。

一方、検索結果のページのURLが仮に下記のようなパターンだったらどうだろう。

http://gaforum.jp/search?kw=a

「kw」を「クエリパラメータ」に指定して、「URLからクエリパラメータを削除」にチェックをしたとする。この場合はクエリパラメータを削除した次のURLへのアクセスとして記録される。

http://gaforum.jp/search

この場合、トップページとは別の「検索結果ページ全体」としてまとめられることになる。サイト内検索キーワードの内訳は[行動]>[サイト内検索]レポート群で確認できるので、それで問題ないのであれば、「URLからクエリパラメータを削除」をチェックしてオンにしよう。

このように、「URLからクエリパラメータを削除」の指定については、該当パラメータをURLから削除したあとのURLを考えてオンとオフを選択しよう。

「サイト内検索のカテゴリ」とは

その下の「サイト内検索のカテゴリ」(図3茶枠部分)は、検索時に「ファッション」「メンズ」などのカテゴリを分類するためのパラメータ(カテゴリパラメータ)を付けられる場合のオプションだ。カテゴリで使われるパラメータを指定すると、その分類軸でも見ることができるようになる。

具体的には「検索キーワード」と「サイト内検索のカテゴリ」という2つのディメンション(分析軸)の値に実際の検索キーワードがレポートされることになる。図4を見ると、「検索キーワード」ディメンションと「サイト内検索のカテゴリ」ディメンションの2つがあることがわかる。

なお「クエリパラメータ」も「カテゴリパラメータ」も最大5つまで指定することが可能で、複数指定する場合は、「,(半角カンマ)」で区切って列挙すればよい。

図4:[行動]>[サイト内検索]>[サイト内検索キーワード]レポート
図4:[行動]>[サイト内検索]>[サイト内検索キーワード]レポート

これでクエリパラメータとサイト内検索の設定は完了だ。次回は、ビューに「目標」を設定する方法を解説する。

◇◇◇

📝筆者が継続的に主催している講座群(Google アナリティクス中心)に興味がある方はこちらをご確認ください。
http://xfusion.jp/train.html

用語集
Googleアナリティクス / Webサーバー / アクセス解析 / キャンペーン / セッション / リンク / 広告代理店 / 訪問
この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

Python
「Python」(パイソン)は、プログラミング言語の1つ。プログラマのグイド・ヴ ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]