アクセス解析 Step by Step
アクセス解析ツール3つのタイプ - ログ型/ビーコン(タグ)型/パケットキャプチャ型(第2回)

解析ツールを導入する前に、現在大きく3種類あるアクセス解析の仕組みを知っておこう。
タイトル画像:アクセス解析 Step by Step

今回はまず、アクセス解析ツールの仕組みについて示したい。主に3つある測定方式の基本的な動作の仕方を理解しよう。測定方式に応じたデータの違いやコストの違いなど、より実際の運用に即した各測定方式の特徴については、次回詳しく説明する予定である。

3つの測定方式について

アクセス解析を行うためには、アクセス解析ツールを導入しなければならない。しかし、アクセス解析でどんなことをしたいかという要件は、「解析ツール自体の機能」ではなく、「測定方式の違い」によっても左右されることがある。そのため、解析ツールを導入する前に、現在大きく3種類あるアクセス解析の仕組みのそれぞれについて熟知することが、まず必要だ。

アクセス解析ツールの測定方式は時代とともに変遷してきた。まず、一番古くからあるのが、Webサーバーのログを解析する「サーバーログ取得型」だ。それから、HTMLファイルにJavaScriptのタグを記述する「Webビーコン型(タグ型)」、最後の1つが「パケットキャプチャリング型」である。しかし、必ずしも新しい方が優れているというものではなく、解析の要件によってどの測定方式が良いかが決まる。この点を踏まえた上で、説明を始めたい。

サーバーログ取得型

「サーバーログ取得型」は、「Webサーバーに記録されたアクセスログファイルをもとに解析を行う」方式である。図示すると、以下のようになる。

図1 サーバーログ取得型
図1 サーバーログ取得型
  1. ユーザーは、Webサーバーに対してページ表示のリクエストを行う
  2. リクエストを受けて、Webサーバーはページ内容をユーザーに送信する
  3. このユーザーのリクエストが、Webサーバーに「アクセスログファイル」として記録される
  4. 解析マシンが、一定の更新頻度でアクセスログを取り込み、解析を行う
  5. 解析結果は、基本的にはブラウザなどに表示される

この図では、理解しやすいようにWebサーバーを1台で示しているが、最近は冗長化して複数のサーバーを立てる場合も多い。その場合は、もちろんすべてのサーバーのログファイルを集める必要がある。

サーバーのログ形式は、記録するデータの多寡によって標準(コモン)ログ形式や結合(コンバインド)ログ形式などいくつかあるが、いずれにしても「リファラ」(参照元URL)と「ユーザーエージェント」(ブラウザの種類とバージョン、使用OSなど)が記録されていないと、アクセス解析には大きな障害となる。そのため、これらの情報がログに付加される設定にしておこう。

最近はインターネットのトラフィックが増大し、解析するログの容量も増えてきた。そのため、更新頻度は1日1回とする場合がほとんどである。それ以上になると、解析マシンのスペックを圧迫してしまう可能性が高くなるので注意しよう。

Webビーコン型(タグ型)

続いて紹介するのが、「Webビーコン型」である。これは、「htmlに記述したJavaScriptのタグが動作して、アクセスされたデータを解析マシンに送信し、解析する」方式である。図示すると、以下のようになる。Google AnalyticsはこのWebビーコン型である。

図2 Webビーコン(タグ)型
図2 Webビーコン(タグ)型
  1. ユーザーは、Webサーバーに対してページ表示のリクエストを行う
  2. リクエストを受けて、Webサーバーはページ内容をユーザーに送信する
  3. ページが表示されると、あらかじめページに書き込んでいたJavaScriptのコードが作動し、アクセスのデータをASP、または自社で構築した解析マシンに送信する
  4. ASP、または自社で構築した解析マシンにアクセスデータは蓄積され、解析される
  5. 解析結果は、基本的にはブラウザなどに表示される

Webビーコン型の場合、解析を行いたい全部のドメインの全ページにJavaScriptのタグを実装する必要がある。タグの入れ忘れできちんと解析できていないことは案外多いので、おかしいなと思ったら、まずはタグが入っているかどうかを確かめてみよう。

データの更新頻度は、解析ツールによって異なる。更新の早いツールだと数分という単位で更新されるが、最長でも1日で更新される。

パケットキャプチャリング型

最後に紹介するのが、「パケットキャプチャリング型」である。これは、「Webサーバーに流れるトラフィックを監視し、その状況を解析マシンに送信し、解析する」方式である。RTmetrics(アール・ティー・メトリクス)という解析ツールはこの形式だ。仕組みを図示すると、以下のようになる。

図3 パケットキャプチャリング型
図3 パケットキャプチャリング型
  1. ユーザーは、Webサーバーに対してページ表示のリクエストを行う
  2. リクエストを受けて、Webサーバーはページ内容をユーザーに送信する
  3. このやり取りで流れるトラフィックをパケットキャプチャという装置で読み取る。そのデータを解析マシンに取り込む。
  4. 解析マシンでデータが解析される。
  5. 解析結果は、ブラウザなどで表示される

パケットキャプチャリング型では、直接Webサーバーのトラフィックを測定するため、ホスティングやハウジングでサーバーを管理している場合は、導入が難しい。ホスティングサービス運営会社が一括してパケットキャプチャリング型のアクセス解析ツールを導入しているといった場合を除き、基本的には、Webサーバーが自社内で管理できる環境にあるときしか導入できない。

パケットキャプチャリング型の売りは、Webサーバーに流れるトラフィックを直接測定して解析するため、リアルタイムでの解析ができるという点だが、トラフィックの量や解析マシンのスペック次第では、もう少し長いスパンでの更新とすることもできる。

以上の3つが主なアクセス解析のツールである。今回は基本的な仕組み述べたが、仕組みを理解しただけでは、解析結果や運用にどのような影響を与えるのか、なかなか想像ができにくいだろう。しかし、それぞれの仕組みがアクセス解析環境の運用に及ぼす影響は思っているよりも大きく、それぞれの場合に注意すべき事項は大きく異なるのである。次回は、こうした点についてもう少し詳しく説明する予定だ。

この記事が役に立ったらシェア!
tweet12このエントリーをはてなブックマークに追加
みんなが読んでるWeb担メルマガで、あなたも最新情報をチェック
  • SEOやアクセス解析のなどノウハウをゲット
  • 事例やインタビューも見逃さない
  • 要チェックのセミナー情報も届く
  • 編集長コラムを一足先に読める
日本赤十字社 東日本大震災 義援金募集
みんなが読んでるWeb担メルマガで、あなたも最新情報をチェック
  • SEOやアクセス解析のなどノウハウをゲット
  • 事例やインタビューも見逃さない
  • 要チェックのセミナー情報も届く
  • 編集長コラムを一足先に読める

人気記事トップ10(過去7日間)

今日の用語

CPM
本来は、「広告が1000回表示されるごとに何円の費用がかかるか(かかったか)」を ... →用語集へ

連載/特集コーナーから探す

インフォメーション

Web担のメルマガを購読しませんか?
Web担の記事がコンパクトに毎週届くメールマガジン「Web担ウィークリー」は、10万人が読んでいる人気メルマガ。忙しいあなたの情報収集力をアップさせる強い味方で、お得な情報もいち早く入手できます。

Web担に広告を掲載しませんか?
購読者数10万人のメールマガジン広告をはじめとする広告サービスで、御社の認知向上やセミナー集客を強力にお手伝いいたします。

サイトマップ
RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]

GOLD SPONSOR
さくらインターネット株式会社株式会社KDDI ウェブコミュニケーションズ株式会社日本レジストリサービスオープンテキスト株式会社トランスコスモス株式会社株式会社ハイパーボックスDomain Keeper
SPONSOR
株式会社キノトロープ株式会社アイレップ株式会社ニューズ・ツー・ユーシックス・アパート株式会社ウェブアンテナ株式会社サイバーエージェント富士通株式会社Sitecore