初代編集長ブログ―安田英久

グーグル「SSL化して検索キーワード見えなくするよ」 Web担当者「ええぇ? (not provided)って何!」

アクセス解析で検索キーワードを調べられなくなる可能性が。
Web担のなかの人

今日は、SEOとアクセス解析とに関係するグーグルの動きについて解説します。なんと、アクセス解析でユーザーの検索キーワードを詳しく調べられなくなっていくかもしれないのです!

検索キーワード「(not provided)」

グーグルは10月18日に、ウェブ検索のSSL(HTTPS)化を進めることを発表しました。具体的には、グーグルアカウントでログインしているユーザーが、グーグルのウェブ検索を行う場合、これまでのhttp(通常のページ)ではなく、SSLで通信が暗号化されるhttpsになるように、今後数週間にわたって変えていくとのことです。

これはグーグル全体のSSL化推進の動きの一部であり、暗号化されること自体は良いことなのですが、Web担当者にとってはちょっとした問題になる可能性があります。

というのも、グーグルの検索結果ページがSSL化されると、ユーザーがどんな検索キーワードで検索してサイトにたどり着いたのかを、アクセス解析で調べられなくなるのです。

御社のGoogleアナリティクスでも、すでに検索キーワードとして「(not provided)」(つまり「キーワード情報は提供されず」)が表示されるトラフィックが計測されているはずです。これがHTTPS検索の影響です。

全体統計の検索キーワードじゃ足りない!

こうした変化に対してグーグルは、次のように解説しています。

SSL化されても、各ユーザーがグーグル検索からサイトを訪問したってことはわかるし、検索キーワードに関してはGoogleウェブマスターツールで過去30日間の上位1000キーワードは分析できるから大丈夫だよ。

しかし、ウェブマスターツールの検索キーワード情報は「全体」の傾向を示しているだけであり、本来のアクセス解析には不十分です。「どういった検索をするユーザーがコンバージョンしやすいのか」「どの検索キーワードで来たユーザーはどういったコンテンツを欲しがるのか」といった、検索キーワードを軸にしたセグメント化をしようとすると、やはり各ユーザーのアクセス情報に紐付いた検索キーワード情報が必要になります。

このことは、Googleアナリティクスのなかに「検索エンジン最適化>検索クエリ」としてウェブマスターツールの検索キーワード情報が統合表示されるようになっていても変わりません。Googleアナリティクスのアドバンスセグメントでウェブマスターツールの検索クエリ情報を使えるわけじゃないですからね。

受けサイトもHTTPSにすりゃいいんじゃないの?

なぜ検索エンジンがSSL化すると検索キーワードがアクセス解析できなくなるのでしょうか?

それは、Webの標準仕様で「HTTPSのページからHTTP(非SSL)のページに移動する場合、どのページから移動してきたかを示すリファラー(参照元)情報を渡さないようにするべし」となっており、ほとんどのブラウザがそのように処理しているからです。

HTTP(非SSL、これまで)のグーグル検索では、次のようになっていました。

  1. ユーザーが検索エンジンでキーワードを入れて検索する
  2. 検索結果ページが表示される(URLに検索キーワードが含まれている)
  3. ユーザーが検索結果ページからあなたのサイトをクリックする
  4. あなたのサイトにアクセスする際にブラウザがリファラー情報を送る

このリファラー情報として渡された検索キーワードの情報をアクセス解析ツールが記録していたんですね。だから、グーグル検索がSSL化されると、検索結果ページがHTTPSなのでリファラー情報が渡されず、検索キーワードがわからなくなるということです。

これに対して、技術的な知識がある人は次のように考えるかもしれません。

んじゃ、うちのサイトを全部SSL化して、ページには基本的にHTTPSでアクセスするようにすりゃ検索キーワードとれるんじゃない?

でも残念ながら、これはうまくいきません。SSL化されたグーグル検索は、次のように動作しているのです。

  1. ユーザーが検索エンジンでキーワードを入れて検索する
  2. 検索結果ページがHTTPSで表示される(URLに検索キーワードが含まれている)
  3. ユーザーが検索結果ページからあなたのサイト(HTTPS)をクリックする
  4. ブラウザはいったんHTTP(非SSL)のグーグル内リダイレクトURLに飛ぶ
    (このリダイレクトURLでは検索キーワード情報が削除されている
  5. あなたのサイトにアクセスする際にブラウザがリファラー情報を送る
    (渡されるリファラー情報にも検索キーワード情報は含まれない)

HTTPSのグーグル検索では、ブラウザは検索結果から「検索キーワードなしで検索した場合と同様の検索結果ページURL」のようなリダイレクトURLを通ってあなたのサイトに来るため、サイトのアクセス解析で参照元として記録されるのは、検索結果ページのキーワードを含んだURLではなく、検索キーワードが削除されているリダイレクトURLなのです。

このリダイレクトURLにより、「グーグル検索から来た」ことはわかりますが、検索キーワードはわからないという状態になるのです。

実は、これまでのHTTP(非SSL)検索でも、ブラウザは検索結果ページからあなたのサイトに直接移動しているのではなく、いったんリダイレクトURLを通っているのですが、ほとんど影響がないので無視しても問題ありませんでした。

しかしHTTPS検索では、意図的に検索キーワードを削除したリダイレクトURLを使っています。つまり今回のSSL化は、「検索キーワードをジャンプ先のサイトに渡さないため」に行われているものなのです。

2011-10-26追記: ここでいう「検索キーワードを渡さないため」というのは、検索ユーザーのプライバシー保護の観点からという意味で使っています。SSL通信というと通信の保護が目的ですが、今回のSSL化は単なる通信の暗号化だけでなく、プライバシー保護も目的に行われているということですね。

そして残念なことに、オーガニック検索ではジャンプ先のサイトには隠される検索キーワードは、リスティング広告経由ならばリファラー情報として取得できるのです。うーん。

海外では怒りの声が。でも影響範囲は限定的……うーん

こうしたグーグルの動きに対して、海外ではすでに反対の声が上がっています。

グーグルは検索ユーザーのプライバシー保護のためにこうしたと言っているが、リファラーのキーワード情報をうまく使っている他の広告ネットワークに情報を渡さないようにするためだ」と怒りを表すブログ投稿もありますし、SEOmozのランド・フィッシュキン氏は怒りの解説ビデオ記事を緊急で公開して「良くないと感じた人は、文句を言うだけじゃなく、ブログ記事を書こう」と呼びかけています。

もちろん、現在はグーグルアカウントにログインしているユーザーだけが対象(しかも一部だけの模様)ですから、さほど数は多くないようです。SEOmozによると、(not provided)なデータは現時点で全体の2%前後であり、今後増えていっても、おそらく90%ぐらいのトラフィックはこれまでと同様に分析できるだろうとしています。

しかし、もしこれが増えていくと……もし非ログインユーザーも含まれるようになると(そんな予定は出されてませんが)……サイトを訪れるユーザーの意図や行動を把握するのが難しくなってしまうのではないかと不安になります。また、一部とはいえ貴重なロングテールのキーワードデータが失われるのも心情的には気になりますよね。

さて、日本ではどうなっていくのでしょうか。あなたのアクセス解析ツールの画面で「(not provided)」のトラフィックは今後どれぐらい増えていくのでしょうか。「(not provided)」がどれくらいの比率までなら許容できるでしょうか。多くのトラフィックで検索キーワードがわからなくなったら、我々はどうすればいいのでしょうか?

用語集
Googleアナリティクス / Googleウェブマスターツール / SEO / アクセス解析 / オーガニック検索 / コンバージョン / リスティング広告 / 検索エンジン / 訪問
この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

Python
「Python」(パイソン)は、プログラミング言語の1つ。プログラマのグイド・ヴ ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]