衣袋教授の新・Googleアナリティクス入門講座

不要なトラフィックを除外! GAで必ず最初に行っておきたい「フィルタ」設定[第7回]

「フィルタ」機能で関係者やスパムなどの集計に必要ないトラフィックを除外しよう

Googleアナリティクスを導入して、そのまま使ってはいないだろうか? 何も設定をしないと、社員や制作会社など、自社サイトの関係者による訪問も記録してしまう。これらは本来集計には不要なデータなので、除外して集計した方がよい。

そうした場合に、収集したデータを絞り込んで加工処理を行うのが「フィルタ」機能だ。フィルタはかなり複雑な処理も行えるが、今回は標準で用意されている4種類のフィルタを使った「よく使う設定例」を紹介する。

この記事で学べること:
  • ビューに「フィルタ」を設定する
  • 4つの「定義済み」フィルタを知る

「フィルタ」画面を表示する

早速、どのようにフィルタを設定するのか説明していこう。まずGoogleアナリティクスにログインし、「アナリティクス設定」画面でプロパティとビューを選択して「フィルタ」を選択しよう。

操作手順
  1. [アナリティクス設定]をクリック(図1赤枠部分)
  2. アカウント、プロパティ、ビューをそれぞれのプルダウンから選択(図1青枠部分)
  3. [フィルタ]をクリック(図1緑枠部分)
  4. [+フィルタを追加]をクリック(図2青枠部分)
図1:「フィルタ」画面を表示
図1:「フィルタ」画面を表示

「フィルタ」画面(図2赤枠部分)は、最初は何もフィルタが登録されていない状態だ。ここで「+フィルタを追加」(図2青枠部分)をクリックして、新規フィルタを設定していくという流れだ。

「フィルタ」画面
図2:「フィルタ」画面

「定義済み」フィルタと「カスタム」フィルタ

それでは新しいフィルタを作っていこう。今回は標準で選択されている「定義済み」フィルタを中心に解説していく。

フィルタで複雑な処理もできるという話を冒頭でしたが、それは、「定義済み」(図3赤枠部分)の右側にある「カスタム」で行うことができる。よく使うだろうとグーグルが想定している処理は、「定義済み」の方にまとめられている

図3青枠部分の3つあるプルダウンでフィルタの条件を指定して、「保存」(図3緑枠部分)をクリックすればフィルタを作成できる。条件の指定は、このあと個別に解説していく。

操作手順
  1. [定義済み]を選択(図3赤枠部分)
  2. フィルタの種類を選択(図3青枠部分)
  3. [保存]をクリック(図3緑枠部分)
図3:フィルタを追加
図3:フィルタを追加

標準で選択できる4種類の「定義済み」フィルタ

3つあるプルダウン(図3青枠部分)のうち、中央のプルダウン(図4赤枠部分)をクリックすると、よく使う4つのフィルタを選択できる。それぞれの利用シーンを簡単に解説しよう。

図4:4種類のフィルタ
図4:4種類のフィルタ
  • ISPドメインからのトラフィック
    計測対象サイトに訪問してくるユーザーが所属しているネットワークのドメイン名の条件によって、除外したり絞り込んだりする。具体的には特定のインターネットサービスプロバイダー経由のユーザー、特定の企業ネットワーク(たとえば自社)内のユーザーなどだ。

  • IPアドレスからのトラフィック
    特定のIPアドレスからの利用を除いたり、絞り込んだりする場合に利用する。自社の従業員、サイトの制作会社、プロモーションに関与する広告代理店などの関係者が、インターネットを利用するときのIPアドレスが定まっている場合にこのフィルタを利用する。

  • サブディレクトリへのトラフィック
    「/example/」など、特定のディレクトリ配下のページの利用だけにデータを絞り込みたい場合に利用する。たとえば、特定の部門が管理しているコンテンツのデータのみを見せるためのビューを用意するときに利用する。

  • ホスト名へのトラフィック
    自社のドメイン(example.jp)やテスト環境(test-example.jp)など、特定のホスト名の利用だけに絞り込みたい場合に利用する。スパムを除外するときなども有効だ。

それでは、それぞれの設定方法について説明していこう。

「ISPドメインからのトラフィック」フィルタ

自社のサイトには、自社社員も頻繁に訪問する。しかし自社社員の訪問は、アクセス解析には意味のない訪問なので、できるだけ集計からは除外したいところだ。そんな場合に使うのが、「ISPドメインからのトラフィック」フィルタだ。

たとえば「example.jp」というドメイン名のネットワークからの訪問を除外したい場合の設定方法を説明しよう。

操作手順
  1. [フィルタ名]を入力(図5赤枠部分)
  2. [除外]か[右のみを含む]かを選択(図5青枠部分)
  3. [ISPドメインからのトラフィック]を選択(図5緑枠部分)
  4. 条件をプルダウンから選択(図5茶枠部分)
  5. [ISPドメイン]にドメイン名を入力(図5黒枠部分)
図5:「ISPドメインからのトラフィック」フィルタ
図5:「ISPドメインからのトラフィック」フィルタ

「フィルタ名」には、わかりやすいフィルタの名前を入力しよう。今回は「自社ドメインからの利用を除外」とした(図5赤枠部分)。左側のプルダウン(図5青枠部分)は、「除外」と「右のみを含む」の2つから選べるが、今回は「example.jp」からの訪問データを除外したいので「除外」を選択する。逆に、特定のドメイン名のネットワークからの訪問だけに絞り込んで集計したいときは、「右のみを含む」を選択する。

真ん中のプルダウンは「ISPドメインからのトラフィック」を選択する(図5緑枠部分)。右側のプルダウン(図5茶枠部分)は、「等しい」「前方が一致」「最後が一致」「次を含む」の4つから選択できる。今回は「等しい」を選択した。

そして、「ISPドメイン」にフィルタの対象となるネットワークのドメイン名を入力する(図5黒枠部分)。今回の例では「example.jp」と入力すればよい。これで、「『ISPドメイン』が『example.jp』からのトラフィックを除外するフィルタ」の設定は完了だ。

以上の設定を行って保存(図3緑枠部分)すると、もとの「フィルタ」画面に戻り、新たに設定したフィルタの行が追加される(図6赤枠部分)。フィルタ名をクリックすると、設定画面が表示されて設定内容の修正を行うことができる(図6青枠部分)。また「削除」(図6緑枠部分)をクリックすると、該当のフィルタを削除することもできる。

図6:「フィルタ」画面
図6:「フィルタ」画面

ドメイン名はどうやって調べる?

ドメイン名は自社でもよいし、他社でもよいし、ISPのドメインでもよい。ドメイン名がGoogleアナリティクスのレポートのどこを見ればわかるかというと、図7の[ネットワーク]レポートでセカンダリディメンションに「ネットワークドメイン」を指定して(図7赤枠部分)、ここに表示されるネットワークドメインの名称(図7青枠部分)を見ればよい。

図7:[ユーザー]>[ユーザーの環境]>[ネットワーク]レポート
図7:[ユーザー]>[ユーザーの環境]>[ネットワーク]レポート

ドメイン名は、インターネットサービスプロバイダーなら「*****.ne.jp」というパターンが一般的だ。大企業なら「*****.co.jp」、学校なら「*****.ac.jp」というパターンになる。

Googleアナリティクスでは、IPアドレスを逆引きしてユーザーのドメイン名を検出している。大企業の場合は、その企業のドメイン名にIPアドレスがマッピングされている。つまり社員が自社のドメイン名にひもづくIPアドレスから訪問したトラフィックを除くことになる。

ドメイン名にIPアドレスがマッピングされておらず、サイトの関係者が特定のIPアドレスから訪問していることがわかっている場合は、次に説明する「IPアドレスからのトラフィック」フィルタの出番だ。

「IPアドレスからのトラフィック」フィルタ

前述した通り、訪問してくるIPアドレスがわかっている場合は、IPアドレスでフィルタを設定しよう。ここで使うのが「IPアドレスからのトラフィック」フィルタだ。

操作手順
  1. [フィルタ名]を入力(図8赤枠部分)
  2. [除外]か[右のみを含む]かを選択(図8青枠部分)
  3. [IPアドレスからのトラフィック]を選択(図8緑枠部分)
  4. 条件をプルダウンから選択(図8茶枠部分)
  5. [IPアドレス]にIPアドレスを入力(図8黒枠部分)
図8:「IPアドレスからのトラフィック」フィルタ
図8:「IPアドレスからのトラフィック」フィルタ

「フィルタ名」には、わかりやすいフィルタの名前を入力しよう。今回は「関係者のIP除外」とした(図8赤枠部分)。左側のプルダウン(図8青枠部分)は、「除外」と「右のみを含む」の2つから選べるが、今回は「除外」を選択する。

真ん中のプルダウンは「IPアドレスからのトラフィック」を選択する(図8緑枠部分)。右側のプルダウン(図8茶枠部分)は、「等しい」「前方が一致」「最後が一致」「次を含む」の4つから選択できる。今回は「等しい」を選択する。

「IPアドレス」には、フィルタの対象となるIPアドレス、たとえば「74.125.109.103」を入力する(図8黒枠部分)。これで、「IPアドレスが『74.125.109.103』からのトラフィックを除外するフィルタ」の設定内容になる。

この「定義済み」にある「IPアドレスからのトラフィック」フィルタは正規表現では記述できないので、複数のIPアドレスを指定したい場合やIPアドレスを範囲で指定したい場合は、より汎用的な指定が可能な「カスタム」フィルタを使う必要がある。「カスタム」フィルタの設定方法は、高度なフィルタを説明する別の記事で扱う予定だ。

「サブディレクトリへのトラフィック」フィルタ

プロパティのレベルで収集するおおもとのデータは、通常はドメイン名全体を対象に収集する。しかし、会社の部門ごとに管轄するWebサイトのディレクトリが分かれている場合、それぞれの部門に所属している社員には、自分の部門だけのデータしか見られないようにしたいことがある。

そんなときに使うのが、この「サブディレクトリへのトラフィック」フィルタだ。このフィルタを使って、各部門のデータだけ(特定のディレクトリ以下だけ)しか見ることのできないビューを作成すればよい。

操作手順
  1. [フィルタ名]を入力(図9赤枠部分)
  2. [除外]か[右のみを含む]かを選択(図9青枠部分)
  3. [サブディレクトリへのトラフィック]を選択(図9緑枠部分)
  4. 条件をプルダウンから選択(図9茶枠部分)
  5. [サブディレクトリ]にディレクトリのパスを入力(図9黒枠部分)
図9:「サブディレクトリへのトラフィック」フィルタ
図9:「サブディレクトリへのトラフィック」フィルタ

「フィルタ名」には、わかりやすいフィルタの名前を入力しよう。今回は「宣伝部管轄に絞り込み」とした(図9赤枠部分)。左側のプルダウン(図9青枠部分)は、「除外」と「右のみを含む」の2つから選べるが、今回はマッチするディレクトリのデータのみに絞り込むため「右のみを含む」を選択する。

真ん中のプルダウンは「サブディレクトリへのトラフィック」を選択する(図9緑枠部分)。右側のプルダウン(図9茶枠部分)は、「等しい」「前方が一致」「最後が一致」「次を含む」の4つから選択できる。今回は「前方が一致」を選択する。

「サブディレクトリ」には、絞り込みたい範囲のディレクトリを入力する(図9黒枠部分)。これで、『ディレクトリが「/pr/」配下のページへのトラフィックのみを含むフィルタ』の設定は完了だ。

「ホスト名へのトラフィック」フィルタ

最後は、「ホスト名へのトラフィック」フィルタだ。ホスト名とは計測対象サイトのことだが、自社の計測対象サイト以外にトラッキングコードは実装していないはずなので、このフィルタの意味がよくわからないかもしれない。少し補足説明しよう。

[ユーザー]>[ユーザーの環境]>[ネットワーク]レポート(図10赤枠部分)で「ホスト名」を選択(図10青枠部分)すれば、ホスト名別の利用状況が表示される。

図10の例では、「gaforum.jp」というドメイン名のサイトを計測しているのだが、それとは関係ないホスト名へのトラフィックが混在していることがわかるだろう。

図11:[ユーザー]>[ユーザーの環境]>[ネットワーク]レポート
図10:[ユーザー]>[ユーザーの環境]>[ネットワーク]レポート

Googleアナリティクスでは、トラッキングコードの中に含まれる特定のトラッキングID(UA-XXXXXXX-X)をキーにして1つのプロパティの元データとして集約するようになっている。

グーグルキャッシュで読まれたコンテンツ(図10緑枠部分)や別ドメインのテスト環境のページ閲覧、はたまた別ドメインの管理者が間違えて自社と同じトラッキングIDのトラッキングコードを利用してしまった場合なども含めて、すべてのデータが集まってくるのだ。そのため、こういったゴミを除いて集計をすることが必要になる。

それでは、「ホスト名へのトラフィック」フィルタの設定方法を説明しよう。

操作手順
  1. [フィルタ名]を入力(図11赤枠部分)
  2. [除外]か[右のみを含む]かを選択(図11青枠部分)
  3. [ホスト名へのトラフィック]を選択(図11緑枠部分)
  4. 条件をプルダウンから選択(図11茶枠部分)
  5. [ホスト名]にホスト名を入力(図11黒枠部分)
図10:「ホスト名へのトラフィック」フィルタ
図11:「ホスト名へのトラフィック」フィルタ

「フィルタ名」には、わかりやすいフィルタの名前を入力しよう。今回は「自社ホストのみに限定」とした(図11赤枠部分)。左側のプルダウン(図11青枠部分)は、「除外」と「右のみを含む」の2つから選べるが、今回は「右のみを含む」を選択する。

真ん中のプルダウンからは「ホスト名へのトラフィック」を選択する(図11緑枠部分)。右側のプルダウン(図11茶枠部分)は、「等しい」「前方が一致」「最後が一致」「次を含む」の4つから選択できる。今回は「等しい」を選択する。

「ホスト名」には、絞り込みたい計測対象サイトのドメイン名を入力する(図11黒枠部分)。これで、「ホスト名が『example.com』へのトラフィックのみを含むフィルタ」の設定は完了だ。

スパムの対策にも有効

昨今では、ユニバーサルアナリティクスのデータ収集の仕組みである「Measurement Protocol(メジャメントプロトコル)」の特性を利用したスパムがデータに混入している。図10の例でいえば、ホスト名が「(not set)」(不明の意味)になっているデータの大半はスパムに該当するものだ(図10茶枠部分)。

こうしたゴミもビューからは削除すべき対象になる。スパムについて詳しくは別の記事で解説しているので、興味があれば下記を参照してほしい。

フィルタの注意点

最後に、フィルタの注意点に触れておこう。

フィルタを設定したビューは、それ以降フィルタによって加工されたデータをもとに集計されることになる。フィルタが適用されるのは、フィルタを設定した後から計測されたデータだけだ。フィルタを設定しても、設定以前にさかのぼってデータが加工されるわけではない。

従って、集計し始めてから途中でフィルタを設定すると、設定前と設定後で集計範囲が変わってしまうので、設定前の時期と比較してトレンドを見る場合には注意が必要だ。フィルタは、できるだけ集計し始めのうちに設定しておこう。

◇◇◇

アクセス解析の基本的な知識や分析の型を丸二日かけて座学と演習で学ぶアクセス解析ゼミナール(6/21、6/28開催)申込受付中。詳細とお申込みはこちらから

Googleアナリティクスを徹底的に使えるように丸二日かけて座学で学ぶGoogleアナリティクスゼミナール(7/14、7/21開催)申込受付中。詳細とお申込みはこちらから

この記事が役に立ったらシェア!
tweet18はてなブックマークに追加
みんなが読んでるWeb担メルマガで、あなたも最新情報をチェック
  • SEOやアクセス解析のなどノウハウをゲット
  • 事例やインタビューも見逃さない
  • 要チェックのセミナー情報も届く
  • 編集長コラムを一足先に読める

日本赤十字社 東日本大震災 義援金募集
みんなが読んでるWeb担メルマガで、あなたも最新情報をチェック
  • SEOやアクセス解析のなどノウハウをゲット
  • 事例やインタビューも見逃さない
  • 要チェックのセミナー情報も届く
  • 編集長コラムを一足先に読める

今日の用語

ドメインオーソリティ
ドメインオーソリティ(DA)は、そのWebサイトが検索エンジンでの順位においてど ... →用語集へ

連載/特集コーナーから探す

インフォメーション

Web担のメルマガを購読しませんか?
Web担の記事がコンパクトに毎週届くメールマガジン「Web担ウィークリー」は、10万人が読んでいる人気メルマガ。忙しいあなたの情報収集力をアップさせる強い味方で、お得な情報もいち早く入手できます。

Web担に広告を掲載しませんか?
購読者数10万人のメールマガジン広告をはじめとする広告サービスで、御社の認知向上やセミナー集客を強力にお手伝いいたします。

サイトマップ
RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]

GOLD SPONSOR
さくらインターネット株式会社株式会社KDDI ウェブコミュニケーションズ株式会社日本レジストリサービスオープンテキスト株式会社トランスコスモス株式会社株式会社ハイパーボックスDomain Keeper株式会社ブレインパッド
SPONSOR
株式会社キノトロープ株式会社アイレップ株式会社ニューズ・ツー・ユーシックス・アパート株式会社ウェブアンテナ株式会社サイバーエージェント富士通株式会社Sitecore