リファラスパムは何?どんな仕組み?除外方法についても解説
スパムサイトへの誘導を目的として、アクセス解析のデータへ意図的に参照元の情報を残す仕組みのことをリファラスパムと呼びます。今回はこのリファラスパムの概要や仕組み、問題点や除去する方法について解説します。
リファラスパムとはどんな仕組みか
スパムサイトへの誘導を目的として、アクセス解析のデータへ意図的に参照元の情報を残す仕組みのことをリファラスパムと呼びます。リファラとは参照元を意味する言葉で、閲覧者がサイトを訪れた際にアクセスログに記録されるリンク元のサイト情報のことを指します。どこからアクセスがあったのか、どのような属性のユーザーが訪問しているのかを知ることは、サイトの改善に役立ち、アクセスアップにもつながります。そのため、ウェブサイトやブログの運営者は、訪問データの解析の際には、リファラ情報を元にそのページへ確認に行くこともありますが、こうした運営者の行動を見越したうえで、リファラスパムは仕掛けられます。
サイト運営者をスパムサイトへ誘導する目的はいくつかあります。例えば、参照元のページにウイルスを仕込み、ウイルス感染を狙うというもの。運営しているのが個人サイトならまだしも、金銭のやりとりなどが絡むECサイトなどだった場合、顧客の個人情報の流出や、直接的な金銭的損害の可能性も否定できません。また、リダイレクトなどを利用して有害なページへと訪問させ、高額なお金をだまし取ろうとする場合も考えられます。単にアクセス数の増加を狙ったものもありますが、リファラスパムはサイトの改善に勤しむ運営者をターゲットにした悪質な行為なのです。
リファラスパムの主な問題点
Webマーケティングを行ううえで考えられる問題点は、運用しているウェブページやブログへの正確な流入状況がつかめなくなるということです。前述したとおり、アクセス解析を行う目的は、どこからどのような人たちが訪問しているのか、どれくらいの訪問数があるかを把握する点にあります。そのうえで、必要に応じてページを改善したり、リファラが多く残っているサイトとコラボレーションしたキャンペーンを行ったりするなど、訪問者の数を増やしつつ、そのあとにつづく成果の獲得を目指していくのです。
しかし、リファラスパムが増えると、訪問者数や滞在時間、PVなどの分析指標が正確に把握できなくなり、アクセス解析を行う意味自体がなくなってしまいます。リファラスパムを放っておくと、解析データ上では1万人が訪問したことになっていても、そのほとんどがスパムサイトのリファラという事態に陥ることも考えられます。そのため、Webマーケティングにおいて、リファラスパムを疑われるサイトからのリファラは除外するなどの対処をする必要があるのです。
リファラスパムの有無を確認するには
リファラスパムを除外するには、まず、自サイト内でそういった行為が行われているのかを確かめなければなりません。そのために有効的なツールがGoogleアナリティクスです。GoogleアナリティクスはGoogleが無料で提供するサイト分析ツール。これひとつで、閲覧者の数や流入経路、行動パターンまでチェックできます。蓄積されたデータが多ければ多いほど、解析を詳細に行うことが可能です。
リファラの確認を行うには、「レポート」>「集客」>「すべてのトラフィック」>「参照元/メディア」の順にクリックするだけです。一覧でリファラの情報が表示されますが、なかでも初見のリファラを気にかけましょう。もちろん、見覚えがないURLのリファラが、全てスパムサイトということはありませんが、そのサイトからのアクセス回数が急に増えている、直帰を繰り返しているようなら、その可能性は極めて高いです。また、訪問してきた国、言語などにも注目してください。自サイトがグローバルなウェブページやブログならまだしも、そうでないのなら海外からサイトを訪れるというのは理解しにくいです。特に、日本語のみで書かれた国内向けのコンテンツページに、外国からのリファラが残っていた場合には疑ったほうがよいでしょう。
大まかにリファラスパムの目星がついたら、そのサイトを確かめます。このとき、そのURLへダイレクトに訪れることは避けましょう。前述したとおり、ウイルス感染や詐欺被害など、どのようなリスクが待ち構えているか分かりません。簡単にそのURLのページ内容を調べるためには、検索エンジンを使うのがよいでしょう。検索窓にURLを張りつけ、検索ボタンをクリックします。検索結果に『リファラスパム』などの表示があるようなら、ほとんどの場合、スパムサイトからのリファラです。URLの入力欄にドメインを入れて検索すると、直接リンクされる恐れもあるので、この方法でサイトを確認する際には必ず検索エンジンの検索窓を利用するよう注意してください。
また、このようなときに役立つサービスとして、aguse.jpがあります。使い方は簡単で、検索窓に調べたいURLを入力して「調べる」ボタンを押すだけ。分析結果には管理者の素性やサイトタイトルのほか、IPアドレス、サーバーの位置やMETAタグの情報など、調査したリンクのさまざまな背景情報が表示されます。入力したURLのスクリーンショットも表示されますが、そのページにマルウェアが仕込まれているときにはスクリーンショットの下部に赤文字で警告文が表示されます。どうしてもサイトを閲覧する必要がある場合に便利なゲートウェイ機能も搭載されているので、ログインを伴うサイト閲覧なども安全に行うことが可能です。調査結果で海外からのアクセスが認められ、一覧で掲載されるブラックリスト判定結果に「CAUTION」と表示されるなどがあれば、スパムサイトと断定できます。このサイトを利用すれば、スパムを疑われるサイトが実際どのようなサイトなのか安全に視認することができます。リファラスパムを特定できたら、正しいアクセス解析を得るためにリファラスパムを測定条件から削除していきましょう。
リファラスパムを除外する方法
アクセス情報を正しくつかむためには、リファラスパムを排除しなくてはなりません。リファラスパムが数件程度なら大きな問題にはなりませんが、これが数百、数千ともなると、まともなデータの解析は期待できなくなります。ここでは、Googleアナリティクスを利用した対策をご紹介します。大きく分けて2つの方法があり、「ボットのフィルタリング機能を使用する」、「フィルタ設定を使用する」といった方法が挙げられます。
ボットのフィルタリング機能を使用する場合ですが、まずはGoogleアナリティクスにログインします。「設定(画面左下にある歯車マーク)」>「ビューの設定」をクリックして現れる画面をスクロールしていくと、「ボットのフィルタリング」という項目があります。チェックボックスが設置されているので、そこにチェックを入れましょう。その後、「保存」をクリックして完了です。
ボットのフィルタリング機能だけでは排除できないリファラスパムについては、フィルタ設定を使用する除外方法が有効です。フィルタ機能にはさまざまな設定がありますが、特に、「言語(not set)で除外する」、もしくは「指定URLからの訪問を除外する」の2方法について説明します。
言語設定がないのもリファラスパムの特徴ですが、そのような訪問者からのアクセスは言語で除外するのがおすすめです。Googleアナリティクスの「設定」から管理画面を開き、「アカウント」>「すべてフィルタ」をクリックしてください。開いた画面上で「フィルタ名」「フィルタの種類」「フィルタフィールド」「フィルタパターン」といったフィルタ情報を追加します。フィルタ名は自分の好きな名前で問題ありません。フィルタの種類は「カスタム」とし、ラジオボタンが除外に設定されていることを確認したうえで、フィルタフィールドは「言語設定」を選択、フィルタパターンには「(not set)」と入力します。入力が終わったらページをスクロールし、「ビューにフィルタを適用」欄から「すべてのウェブサイトのデータ」という項目を選択、「追加」>「保存」を押して設定完了です。
フィルタ設定では、言語だけでなく国の設定も可能です。言語だけでは心もとないという場合には、国にフィルタをかけることも検討してみましょう。この段階で、迷惑な行為をするリファラの数は相当排除できているはずですが、ここまでやっても、まだ特定のURLから頻繁にアクセスが来ているというときには、URLの指定をして、リファラスパムを除外しましょう。
まず、「設定」>「アカウント」>「すべてフィルタ」をクリックしてください。設定画面が表示されるので、言語設定のときと同様に「フィルタ名」「フィルタの種類」「フィルタフィールド」「フィルタパターン」を設定していきます。フィルタ名は何でも構いません。フィルタの種類は「カスタム」、ラジオボタンが除外になっているうえで、フィルタフィールドは「参照」に設定し、フィルタパターンは「外したいリファラスパムのURL」を入力します。あとは言語設定の際と同じです。
どの方法も簡単にできる有効な対策なので、なるべく早めに設定しておきましょう。ウェブページにしろ、ブログにしろ、トータルでの訪問者の数を増やすためには高精度な解析が必要です。解析を阻むリファラスパムには、少しでも早い対策が望まれます。