衣袋宏美のデータハックス

関係者からのアクセス除外

ページ

関係者からのアクセス除外

意外と忘れがちだが、関係者からのアクセスを除くという処理も必須だ。全体のアクセス数が少ない中小のサイトだと、かかわっている社員、Webサイトの制作会社、広告代理店など、本来の計測対象としては除くべき人たちのアクセスが相対的に多くの割合を占めることもある。これらを集計から外すという工夫も、正確な集計を行うために大事である。

関係者からのアクセスを完全に除くことは難しい。プロバイダ経由で関係者が自宅からアクセスするような場合は、IPアドレスなども接続のたびに変化するからだ。会社など固定的なIPアドレスの範囲がわかっている場合には、それらのIPからのアクセスを集計対象外にし、関係者の頻繁なアクセスは除くような設定にしよう。

図4 社内からのアクセスを除くフィルターの設定画面(Google Analytics)
図4 社内からのアクセスを除くフィルターの設定画面(Google Analytics)

ロボット(検索エンジンクローラ)からのアクセスの除外

サーバーログファイル型では、ロボットを区別するための定義を作り、ロボットからのアクセスを分離する必要がある。主要な検索エンジンのロボットは、あらかじめデフォルトで登録されているのが普通だが、検索エンジンは日々新しいものが出現しており、日本オリジナルの結構著名なものがデフォルトの設定から漏れていたりする。最初の項目のところで書いたが、ユーザーエージェント名などのレポートを見て、ロボットの可能性があるユーザーエージェント名をピックアップして、追加登録するような試行錯誤が必要である。

下記はUrchinの設定画面の例だが、ユーザーエージェント名で該当の文字列が含まれたものを集計から除くというフィルタで、ロボットのアクセスを除外する。

図5 ロボットフィルター設定画面(Urchin6.6)
図5 ロボットフィルター設定画面(Urchin6.6)

ページタイトルの表示

アクセス解析ツールの中には、上位コンテンツや離脱率などのWebページランキング表示画面で、URLの代わりにWebページのタイトル(titleタグの中身)を表示するツールも多い。自動的にWebページのタイトルを取得してくれるツールもあれば、表示したいタイトルとURLの対応表を手動で指示したりインポートしたりしなくてはならないツールもある。

いずれにせよ、気をつけたいのは、複数ページで同じタイトルが存在する場合である。タイトルが同じであれば、URLが違ってもまとめて集計されてしまうのか(Google Analyticsはこちら)、タイトルが同じでも、URLが違えば同じタイトルが複数表示されるのかといった表示仕様を確認した方がよいだろう。

◇◇◇

以上、初期設定で見落としがちな6つの設定項目を説明した。改めて説明されると、いかにも簡単で当たり前のことのように思えるが、できていないまま解析を行っているサイトは、実は意外なほど多い。本記事を読んでいるみなさんのサイトはどうだろうか?「うちのサイトに限って」と思い込まず、特に前任者から引き継いだ場合などは、この機会に一度チェックしてみることをお勧めする。

これまで約1年間にわたって連載してきた「データハックス」は、今回の記事をもって最終回となります。2011年1月からは、衣袋宏美氏の新たな連載「有名サイト、勝手に解析」がスタートします。引き続きご愛読いただきますよう、よろしくお願いいたします。

ページ

この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

インデックス
検索エンジンがWebページをデータベースに保存しているデータベース。データベース ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]