連載アクセス解析 Step by Step
アクセス解析ツールの精度とコスト - 見えにくい予算項目を理解する(第3回)

‹ 前12次 ›
この記事を読むのにかかる時間: 約 6 分
タイトル画像:アクセス解析 Step by Step

前回ではアクセス解析ツールで採用されている3つの測定方式について、基本的な動作を示した。今回は各測定方式について、データ精度とコストという観点から、注意すべき違いの比較を行いたい。

アクセス解析ツールのデータの精度

アクセス解析の測定方式というものは、すでに確立されているWebの仕組みの中で、どうしたら人々の行動の測定ができるかと各ベンダーが工夫をして考案したものである。その点から言っても、期待されるような100%の精度でデータの計測ができるというのは有り得ない。まずはこの点を認識しておいていただきたい。さらに、それぞれの測定方式で、無視できないデータの精度上の違いがある。この点について、順に説明していこう。

(1) ロボット(クローラー)からのアクセス

サーバーログ取得型とパケットキャプチャリング型の場合、通常の人間のアクセスの仕方とは異なる検索エンジンのロボット(クローラー)のアクセスも、ログに蓄積されてしまう。もちろんこうしたアクセスは、ツール側で除去することができる。しかし、こうしたロボットの種類、アクセス数ともに増加している。特に除去するための条件として、ユーザーエージェントを指定する場合があるが、ロボットの中には我々が通常に使うユーザーエージェントと詐称して、アクセスを行うものがある。この場合は通常のアクセスなのか、ロボットのアクセスなのかが識別できない。よって、どれだけデータを除去しても、こういったデータが混入してしまうことは否めない。

Webビーコン型の場合は、ロボットのアクセスは受けにくい。なぜならWebビーコン型の場合、通常はhtmlファイルの最後部にJavaScriptで設定したタグにより計測を行うが、ロボットの場合はJavaScriptに反応しないものがほとんどだからである。この点で、Webビーコン型は、サーバーログ取得型・パケットキャプチャリング型に比べて、データの精度は高い。

(2) ブラウザの「戻る」・「進む」のアクセス

通常のブラウザでインターネットを利用しているとき、ブラウザの「戻る」「進む」ボタンのアクセスでは、クライアント側のキャッシュが利用されることが多い。そうすると、クライアントとWebサーバーの間に通信が発生せず、ログが記録されたり、パケットが送信されたりすることがない。そのため、こうしたアクセスを測定することができない。

一方でWebビーコン型の場合、そのページ表示がキャッシュかどうかに関わらず、ページを表示するたびにJavaScriptは作動する。そのため、表示されたページすべてのデータを計測するという点で、Webビーコン型の方が、サーバーログ取得型・パケットキャプチャリング型の方が精度は高いといえる。

(3) PDFへのアクセス

PDF自体にタグを挿入することはできない。そのため、Webビーコン型の場合だと、PDFファイルへのアクセスが計測できるのは、タグが実装されたhtmlファイルからのリンクにより、PDFファイルがアクセスされた場合に限られる。それ以外の手段でPDFがアクセスされても、計測はできない。

これが最も大きく影響するのが、検索エンジンからPDFへの直接アクセスによる、流入キーワードの計測である。サーバーログ型やパケットキャプチャリング型ならこの計測が可能だが、Webビーコン型は計測ができない。

以上からデータの精度についてまとめると、基本的には(1)(2)から、Webビーコン型の方がデータの精度が高いといえる。特に経験的に(1)の影響は甚大で、解析ツール導入後ロボット(クローラー)の削除設定をメンテナンスしていないため、実情と異なるデータを報告しているということも多くあるようだ。一方で、(3)の点については注意が必要で、PDFコンテンツを多くもつサイトの場合、必ずしもWebビーコン型を導入するのが得策とはいえない(場合によっては異なる測定方式をもつツールを併用するということも考えられる)。

アクセス解析ツールの3つの測定方式とデータの精度
データ精度に関する懸念点 サーバーログ取得型 Webビーコン型 パケットキャプチャリング型
ロボット(クローラー)からのアクセスの影響 ×受けやすい
定期的にメンテナンスする必要がある
○受けにくい ×受けやすい
定期的にメンテナンスする必要がある
ブラウザの「戻る」「進む」のアクセス ×取得しきれない ○取得できる ×取得しきれない
PDFからのアクセス ○すべて取得する ×取得しきれない
htmlからのリンクのみ取得し、外部からPDFへの直接アクセスは取得できない
○すべて取得する
次のページへ
タイプ別にみるアクセス解析ツールのコスト計算のポイント
‹ 前12次 ›
画像:西川季宏氏

西川 季宏(にしかわ としひろ)
株式会社ミツエーリンクス チーフアナリスト

入社以来、アクセス解析及びリスティング運用に関する業務に一貫して従事。 特にアクセス解析は、アクセス解析ツールの導入・運用支援だけでなく、ログファイル(生ログ)を用いた自社開発ツールによるデータマイニングを用いた分析・コンサルティングまで幅広い活動を行なっている。

株式会社ミツエーリンクス

(10) この記事をはてなブックマークに追加(15)
あなたの評価 : なし 平均 : 1 (投票数:3)
日本赤十字社 東日本大震災 義援金募集

今日の用語

オプトイン
何らかの選択を望んですること。 広告メールを受け取ることなどを、ユーザーが ... →用語集へ

インフォメーション

Web担のメルマガを購読しませんか?
Web担の記事がコンパクトに毎週届くメールマガジン「Web担ウィークリー」は、10万人が読んでいる人気メルマガ。忙しいあなたの情報収集力をアップさせる強い味方で、お得な情報もいち早く入手できます。

Web担に広告を掲載しませんか?
購読者数10万人のメールマガジン広告をはじめとする広告サービスで、御社の認知向上やセミナー集客を強力にお手伝いいたします。

サイトマップ
RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]

さくらインターネット株式会社株式会社KDDI ウェブコミュニケーションズYahoo!リスティング広告at+link
ウェブアンテナ株式会社日本レジストリサービスWindows Azureオートノミー株式会社
株式会社キノトロープ株式会社アイレップ株式会社ニューズ・ツー・ユーシックス・アパート株式会社
株式会社サイバーエージェント富士通株式会社Sitecore