連載衣袋宏美のデータハックス
アクセス解析をはじめたら必ず設定すべき6つの項目 [アクセス解析tips]

衣袋 宏美(株式会社クロス・フュージョン) 2010/12/16(木) 10:00 (85) この記事をはてなブックマークに追加(108) 印刷用印刷用
‹ 前12次 ›
この記事を読むのにかかる時間: 約 4 分
衣袋宏美のデータハックス

前回に引き続いて、アクセス解析ツール導入のプロセスの2回目ということで、前回ご紹介できなかった、実際のいくつかの設定例やそれが必要な理由などを解説していく。

この記事で紹介する内容は、次の6点だ。

では、それぞれについて見ていこう。

集計対象の拡張子やページの決定

まずはページビューの計測対象とするファイルの絞り込みだ。JavaScriptタグ型なら計測対象のページにタグを実装するだけで済むが、サーバーログファイル型ではすべてのファイルのリクエストが記録されるので、どの拡張子を対象とするのか、あるいは対象としないのかなどを決めないと、必要ないページまで集計対象に含まれてしまう

図1はサーバーログファイル型ツールであるSiteTrackerの「除外するページ」の設定画面である。画像ファイルの拡張子である.gif、.jpg、.pngやJavaScriptファイルの.js、CSSファイルの.cssなどは、あらかじめデフォルトとして設定されている。

図1 集計から除外するページの設定画面(SiteTracker8.1)
図1 集計から除外するページの設定画面(SiteTracker8.1)

デフォルトの設定以外にどのような拡張子やファイルを除外するべきなのかは、実際に集計してみないとわからないものだ。そのため、導入の際に完璧を目指すのではなく、とりあえずわかる範囲で設定した段階で、いったん集計してみることがお勧めだ。そうすると、デフォルトで除外されている拡張子以外にも、favicon.ico、robots.txtといったファイルは除いておこうといった判断ができるようになる。

サーバーログファイル型のツールでは、最初から一発で完成度の高い集計を出そうとしても難しい。データをきれいにするための準備として、こうしたテスト集計をすることは非常に重要である。2~3回の試行錯誤で、かなりきれいなデータにできる。

テスト集計では、集計する必要のないページやファイルの削除に加え、検索エンジンのロボットからのアクセスを排除する指定を行う。これは後でも述べるが、ロボットと思われるユーザエージェントを見つけて、そのデータを除くという処理を行うことで対処する。これでかなりきれいなデータになる。

内容が同じページのURLの統一

次に必要となる設定は、実質的に同じ内容のページのURLを1つにまとめることである。たとえば、トップページやコーナートップページのURLだが、URLの末尾が「/」と「/index.html」のどちらでリクエストされても、そのまま表示できるようになっている場合がある。このまま何も設定をしないと、同じページであるにもかかわらず、URLが異なるために別々に集計されてしまうといった事態が生じてしまう。

これはサーバーログファイル型でもJavaScriptタグ型でも生じる可能性がある問題だ。こういったケースでは、アクセス解析のツール側の設定で同一化処理をすることで対処できる。

図2 インデックスページの設定画面(SiteTracker8.1)
図2 インデックスページの設定画面(SiteTracker8.1)

クエリーパラメータの処理

クエリーパラメータの処理も大事だ。セッションIDなどのあまり意味のない変数(パラメータ)がある一方、非常に大事なパラメータもある。たとえば、ECのサイトで、商品カテゴリや商品を表すIDなどは重要な意味を持つパラメータなので、残しておかなければならないだろう。

図3は、Google Analyticsのプロファイル設定画面だが、ここにある「URLクエリパラメータを除外」という設定項目を使うと、意味のないパラメータを無視するように指定できる。ここで何も設定しない場合は、パラメータの異なるURLはすべて異なるURLとして集計する。

図3 プロファイル設定画面(Google Analytics)
図3 プロファイル設定画面(Google Analytics)

これとは逆に、基本的にはパラメータはすべて捨てる(無視する)のがデフォルトになっているツールもある。そのようなツールでは、特定のパラメータを残す、あるいは残したいパラメータをグルーピングするような処理を施すといった対処をする必要がある。具体的にどのようなパラメータを残すか、どのように設定するかについては、ベンダーと相談すべきだ。

次のページへ
  • 関係者からのアクセス除外
  • ロボット(検索エンジンクローラ)からのアクセスの除外
  • ページタイトルの表示
  • 連載終了のご挨拶
‹ 前12次 ›

■丸2日でアクセス解析をマスターする「アクセス解析ゼミナール」を、 アクセス解析イニシアチブが4月14日と4月21日に開催します → 詳しくはこちら(3月中に申し込むと早割あり)

衣袋 宏美(いぶくろ ひろみ)

1960年東京都生まれ。東京大学教養学部教養学科卒業。大手電気メーカー勤務後、日経BP社インターネット視聴率センター長を経て、2000年ネットレイティングス入社視聴率サービス立ち上げに参画、2006年ネットレイティングス社フェローに就任。株式会社クロス・フュージョン代表取締役。またデジタルハリウッド大学院客員教授、米Web Analytics Association会員、アクセス解析イニシアチブ副代表。

編著に『ネット視聴率白書2009〜2010』、監訳書に『Webアナリスト養成講座』がある。ブログ:Insight for WebAnalytics

(85) この記事をはてなブックマークに追加(108)
あなたの評価 : なし 平均 : 2.3 (投票数:3)
日本赤十字社 東日本大震災 義援金募集

今日の用語

オプトイン
何らかの選択を望んですること。 広告メールを受け取ることなどを、ユーザーが ... →用語集へ

インフォメーション

Web担のメルマガを購読しませんか?
Web担の記事がコンパクトに毎週届くメールマガジン「Web担ウィークリー」は、10万人が読んでいる人気メルマガ。忙しいあなたの情報収集力をアップさせる強い味方で、お得な情報もいち早く入手できます。

Web担に広告を掲載しませんか?
購読者数10万人のメールマガジン広告をはじめとする広告サービスで、御社の認知向上やセミナー集客を強力にお手伝いいたします。

サイトマップ
RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]

さくらインターネット株式会社株式会社KDDI ウェブコミュニケーションズYahoo!リスティング広告at+link
ウェブアンテナ株式会社日本レジストリサービスWindows Azureオートノミー株式会社
株式会社キノトロープ株式会社アイレップ株式会社ニューズ・ツー・ユーシックス・アパート株式会社
株式会社サイバーエージェント富士通株式会社Sitecore