パラメータ付き URL 処理の新機能

2011年10月29日土曜日 | 15:46

ウェブマスター ツールの [サイト設定] > [設定] セクションから「パラメータ処理」機能がなくなっていることに、お気付きの方もいらっしゃるかもしれません。実は、この機能は「URL パラメータ」という新しいセクションとして独立することになりました。また、名前だけでなく機能そのものも一新されたので、より便利に使っていただけるかと思います。なお、以前の「パラメータ処理」機能による URL パラメータの設定は、自動的にこの新しいバージョンに反映されます。では、この新しい「URL パラメータ」には、どのような便利な機能があるのでしょうか。まずはこの機能の目的と役立つケースについてご紹介しましょう。

機能の概要
「URL パラメータ」機能を利用すると、サイト内のどの URL を Googlebot にクロールさせるか、URL 内のパラメータに基づいて指定することができます。それによってたとえば、この機能を使うことで簡単に重複コンテンツがクロールされるのを防ぐことができます。このため、あなたのサイトへのクロール負荷を軽減でき、また重複していないコンテンツがよりたくさんインデックスされやすくなるので、サイトのクロールが効率的に行われるようになるでしょう。また、Googlebot のクロールする範囲がまだ拡大できると思われる場合にも、この機能は有用です。ただし、ご利用にあたっては注意が必要です。というのも、URL パラメータの動作について十分に理解していなければ、クロールされるべき URL が誤ってクロールされない設定になり、そのコンテンツが Googlebot からはアクセスできくなってしまう恐れがあるからです。


新機能の詳細
では次に、新たに追加された機能についてご紹介しましょう。まず、個々のパラメータにクロール アクションを割り当てる際に、パラメータの動作が細かく指定できるようになりました。最初の手順としては、各パラメータがページのコンテンツを変更するかどうかを指定します。もしそのパラメータによってページのコンテンツが変化しないのであれば、設定作業はここで終了です。Googlebot はこのパラメータの代表的な値を持つ URL を選択し、クロールするでしょう。パラメータによってコンテンツが変わることはないので、どの値が選択されても同じ結果になります。一方で、もしパラメータによってページのコンテンツが変わる場合は、そのクロール方法を次の 4 つの中から選択することができます。

  • Googlebot が決定
  • すべての URL
  • 値が指定されている URL のみ
  • クロールしない
なお、「値が指定されている URL のみ」を選択することで、パラメータに使用する値を自分で指定することができます。もう Google が用意する値のリストに制限されることはなくなりました。また、必須ではありませんが、たとえば並べ替えやページ指定、コンテンツ選択など、パラメータの具体的な動作を指定することもできます。さらに、すべてのパラメータに対して、それを含むクロール済み URL の例がそれぞれ表示されるようになりました。

上記の 4 つのクロール オプションのうち、「クロールしない」は今回追加されたもので、特に注意が必要です。このオプションはもっとも優先度が高く、当該の URL に含まれる他のパラメータのどの設定よりも優先されます。つまり、ある URL のパラメータが 1 つでも「クロールしない」に設定されていると、他のパラメータがたとえ「すべての URL」に設定されていたとしても、その URL がクロールされることはありません。なので、このオプションを使用するときには十分にご注意ください。ちなみに、2 番目に適用が優先されるオプションは「値が指定されている URL のみ」です。

事例
では、実際の例を通して、少し頭の体操をしてみましょう。
- - -
fairyclothes.example.com という名前のオンライン ストアがありました。このお店のウェブサイトでは、URL の中でパラメータを使用しており、さまざまな URL から同じコンテンツにアクセスできるようになっていました。ある日、オンライン ストアのオーナーは気付きました。冗長な URL があまりにも多いと、Googlebot がサイト全体をクロールできないかもしれない、と。そこで、好奇心旺盛で何でも知りたがる助手を偉大なる「ウェブの魔法使い」の元へ送り、Googlebot による重複コンテンツのクロールを減らすために「URL パラメータ」機能をどのように使用すればよいか、教えを請うことにしました。賢者として知られる「ウェブの魔法使い」は、URL パラメータに目を通すと、次のような設定を提案しました。

パラメータ名コンテンツへの影響Googlebot がクロールする対象
trackingIdなし代表的な URL 1 つ
sortOrder並べ替え値が「lowToHigh」に指定されている URL のみ
sortBy並べ替え値が「price」に指定されている URL のみ
filterByColor絞り込みクロールしない
itemIdコンテンツ指定すべての URL
pageページ指定すべての URL

助手はさっそく質問します。

助手: trackingId については代表的な URL を Googlebot に選ばせる(値は Googlebot が選択する)よう指定なさっていますね。「値が指定されている URL のみ」を選択して特定の値を自分で指定しなかったのはなぜですか?
ウェブの魔法使い: Googlebot がウェブをクロールしているときに、君のサイトにリンクしている URL で次のようなものが見つかったとしよう:
  1. fairyclothes.example.com/skirts/?trackingId=aaa123
  2. fairyclothes.example.com/skirts/?trackingId=aaa124
  3. fairyclothes.example.com/trousers/?trackingId=aaa125
このとき、もしも Googlebot に「trackingId=aaa125」の URL だけをクロールするよう指定すると、Googlebot は URL 1 と 2 をクロールしなくなってしまうのだ。というのも、どちらの URL も trackingId の値が aaa125 ではないからだ。これらの URL のコンテンツはクロールされず、インデックスもされない。したがって、君の店が仕入れたすてきなスカート(/skirts/)がGoogle の検索結果に並ぶこともない。だからこの場合は、代表的な URL を選ばせるべきなのだよ。なぜかって?そのように指定すると、Googlebot がウェブ上で発見した 2 つの URL がこのパラメータの値だけ違っているとき(上の例でいうと URL 1 と 2)、Googlebot はそのうちどちらか 1 つをクロールするだけで、コンテンツをすべて取得できるからだ。上の例では、1 と 3 か、2 と 3 というペアで、合計 2 つの URL がクロールされることになる。おかげで、スカート(/skirts/)もズボン(/trousers/)も、1 つ残らずクロールされるのだ。

助手: sortOrder パラメータについてはどうですか?商品のリストが昇順でも降順でもかまわないと思うのですが。Google に代表的な値を選ばせるのではいけないのですか?
ウェブの魔法使い: Googlebot がクロールを続ける中で、次のような URL が見つかったとしよう:
  1. fairyclothes.example.com/skirts/?page=1&sortBy=price&sortOrder=’lowToHigh’
  2. fairyclothes.example.com/skirts/?page=1&sortBy=price&sortOrder=’highToLow’
  3. fairyclothes.example.com/skirts/?page=2&sortBy=price&sortOrder=’lowToHigh’
  4. fairyclothes.example.com/skirts/?page=2&sortBy=price&sortOrder=’ highToLow’
最初の 2 つの URL(1 と 2)の違いは sortOrder パラメータの値だけであり、その次の 2 つ(3 と 4)についても同じだ。しかし、URL 1 と 2 のコンテンツは同じではない。最初の URL ではスカートが安い順(’lowToHigh’)に表示され、2 番目の URL では高い順(’highToLow’)になっている。これを踏まえると、この状況で 1 つの代表値だけを使うのは得策ではないといえる。しかも、sortOrder パラメータだけが異なるいくつかの URL から Googlebot に代表的な値を 1 つだけ選択させると、そのたびに違う値が選択される可能性がある。たとえば上の例では、最初の 2 つの URL のうち、URL 1 が選択されたとしよう(sortOrder=’lowToHigh’)。一方で、その次の 2 つの URL では 4 が選択されたとする(sortOrder=’ highToLow’)。もしこの状況になったら、Googlebot は次のように、安い価格帯のスカートだけを 2 回クロールすることになるだろう:
  • fairyclothes.example.com/skirts/?page=1&sortBy=price&sortOrder=’lowToHigh’
  • fairyclothes.example.com/skirts/?page=2&sortBy=price&sortOrder=’ highToLow’
こうなると、高い価格帯のスカートは、まったくクロールされなくなってしまうのだ。このように、並べ替えのパラメータを扱うときは、一貫性が鍵となる。並べ替え順は常に同じにすることだ。

助手: sortBy の値についてはどうですか?
ウェブの魔法使い: sortOrder 属性によく似ているよ。商品一覧の URL がクロールされるときに、並べ替え順はどのページでも同じでなければならない。そうでなければ、一部の商品が Googlebot から認識されなくなるからね。ただし、どの値を選択するかについては注意が必要だ。店で書籍の他に靴も売っているとしたら、「title」という値は選ばない方がよいだろう。というのも、靴を表示する URL に「sortBy=title」が含まれることはまずないので、クロールされなくなってしまうからだ。同じように、「sortBy=size」と設定すると、靴のクロールは問題なくても、書籍はクロールされなくなってしまう。パラメータ設定の影響はサイト全体に及ぶことを忘れないように。

助手: filterByColor というパラメータの付いた URL はクロールさせないのですか?
ウェブの魔法使い: たとえば、スカートの一覧が 3 ページにわたってあるとしよう。そのうち何点かは青で、何点かは赤、残りは緑色だ。
  • fairyclothes.example.com/skirts/?page=1
  • fairyclothes.example.com/skirts/?page=2
  • fairyclothes.example.com/skirts/?page=3
このリストは、さらに絞り込むことができる。たとえば、ユーザーが青を選ぶと、青いスカートが次の 2 ページにわたって表示される:
  • fairyclothes.example.com/skirts/?page=1&flterByColor=blue
  • fairyclothes.example.com/skirts/?page=2&flterByColor=blue
この 2 つは新しいページのように見えるが(表示される商品のセットは他のどのページとも異なる)、実際のところ、新しいコンテンツは何もないのだ。というのも、青いスカートはすべて、元の 3 つのページに含まれているからだ。つまり、コンテンツを色で絞り込んだ URL を別途、クロールさせる必要はないということになる。そのような URL で表示されるコンテンツは既にクロールされているからだ。ここで注意してほしいのは、特定の URL をクロール対象から除外するために「クロールしない」を選択するときだ。そのコンテンツが Googlebot から別の方法でアクセスできるようにしておくことが肝心で、上の例でいえば、最初の 3 つのリンクを Googlebot が発見できる必要があり、このクロールを妨げるような設定がないように配慮しなければならないのだ。
- - -

もしご自分のサイトが URL パラメータ を使用していて、コンテンツが重複して生成される可能性がある場合には、ぜひウェブマスター ツールの新機能である「URL パラメータ」を試してみてください。ご感想やご質問は ウェブマスター ヘルプフォーラム までお寄せください。

再審査リクエストへの回答が、より具体的になりました

2011年10月21日金曜日 | 9:59

あなたのサイトが Google の検索結果に表示されなかったり、以前より掲載順位が下がっているように見える場合(そして ウェブマスター向けガイドライン に違反していないと思われる場合)、再審査をリクエスト することができます。これまで Google は、ウェブマスターの皆さまにとって使いやすくなるよう、再審査プロセスの改善に取り組んできました。数年前からは、再審査リクエストの受付通知 に加え、リクエストを処理したことをお知らせするメッセージもお送りしてきました。このメッセージはウェブマスターの皆さまにとって、審査完了のタイミングがわかるという意味で、一定の役割を果たしてきたと思います。一方でウェブマスターの皆様からは、リクエストの結果を知りたいというご意見を頂いておりました。そこで今年から再審査リクエストへのより詳しい返答をお送りするということを試験的に開始しており、非常に好意的なフィードバックを頂きました。

そこで今回、皆様からの再審査リクエストに応じて手動による スパム 判定を取り消したかどうかを、より多くのケースでお知らせするようにしました。サイトにまだガイドライン違反が見受けられる場合は、その旨をご報告いたします。ご不快に思われるかもしれませんが、サイトにまだ問題が残っているとわかれば、問題の原因究明のお役に立つと考えております。※ もし具体的な原因がわからない場合などはぜひ ウェブマスターヘルプフォーラム へお問い合わせください。ウェブマスターヘルプフォーラムには、経験豊富なウェブマスターの方々だけでなく、Google 社員も参加しており、「『不自然なリンクに関する Google ウェブマスター ツールからのお知らせ』を受け取った際に確認をおすすめするポイント」のように具体的な確認方法をご紹介しています。

また、サイトに対して手動による スパム 判定がされていない場合(ほとんどのケースがこれです)も、より多くのケースでその旨をご報告するようにしました。その場合にサイトのランキングが上位にこないのは、 Google のアルゴリズムによる判定の結果と思われます。サイトに変更が加えられて改善が見られれば、Google のシステムはそれに適切に対応し、ランキングも変化しますので再審査リクエストをお送りいただく必要はありません。他の可能性としては、サイトにアクセス上の問題があって、Googlebot によるクロールやインデックス登録ができない状態であるケースも考えられます。ランキングに関する問題を解消する方法については、サイトの掲載順位が上がらない理由 を参照してください。

Google では再審査リクエストのプロセス全体の透明性を高めるために様々な取り組みを行っています。個々のリクエストに対しての具体的な対応策についてはお答えできないものの、現在は多くのウェブマスターの皆様に、手動によるスパム判定がされているかどうかをお知らせし、再審査レビューの結果もご連絡するようになっています。理想的には、ランキングの仕組みを全て公開することも可能かもしれませんが、Google はウェブマスターに最大限の情報を公開するように努める一方でその情報をスパマーに悪用されないよう配慮する必要があります。Google では、今後も検索ユーザーとウェブマスターの皆さまのお役に立てるよう、よりよい方法を模索し続けていきたいと考えています。

サイトの状態が一目で確認できるようになりました。

2011年10月14日金曜日 | 10:45

ウェブマスターの皆さんとお話する中で、よく聞くお話のひとつに「(サイト運営の)時間のやりくりが大変」というものがあります。ウェブマスターの中には、何十、何百という数のクライアントのサイトを管理している方もいれば、ご自分で事業を営んでいて、財務管理や在庫管理といった業務の合間に、1 日あたり 1 時間しかサイト管理に時間を割けないという方もいるでしょう。Google では、そんな皆さんの助けになればと、ウェブマスター ツールに新しく「サイトの状態」という機能を追加し、問題が発生しているサイトが一目でわかるよう、ウェブマスター ツールのページ デザインもリニューアルいたしました。これによって、管理しているすべてのサイトのレポートを 1 つ 1 つクリックすることなく、重要な項目がひと目でわかるようになります。新しい管理画面は、以下のようになります。


上の図のように、サイトの状態に問題を抱えるサイトはリストの一番上に表示されます(アルファベット順に表示されるように切り替えることもできます)。サイトで検出された問題の詳細を見るには、こちらのアイコンか、それぞれのサイトの横に表示されている「サイトの状態を確認する」というリンクをクリックしてください。


この新しい管理画面は、現時点ではウェブマスター ツールに登録されているサイトの数が、確認済みか未確認かに関わらず 100 以下の場合にのみご利用いただけます。将来的には、サイトの数によらず、すべてのアカウントで利用できるよう対応していく予定です。もし 100 個を超えるサイトを管理されている場合は、各サイトのダッシュボードの一番上の部分で状態をご確認いただけます。現在、次の 3 つの点についてサイトの状態がチェックされます。

  1. サイトでマルウェアが検出されていないか
  2. URL 削除ツール によって重要なページが削除されていないか
  3. robots.txt にて、クロールがブロックされている重要なページがないか

それぞれの項目をクリックすると、サイトで検出された問題に関する詳細な情報を確認することができます。サイトの状態を示すアイコンや、「サイトの状態を確認する」リンクがサイトの横に表示されていないときは、そのサイトでは上記の問題は検出されていないということになります。

また、上記2、3においてチェックされる「重要なページ」について少し補足いたします。ご存知のとおり、削除された URL の一覧は、[サイト設定] 、 [クローラのアクセス] 、 [URL の削除] で確認できます。また、robots.txt のブロックによりクロールできなかった URL の一覧は、[診断] 、 [クロール エラー] 、 [robots.txt により制限] で確認できます。しかし、ウェブマスターの方々が意図的にコンテンツをブロックしたり削除したりすることはよくあるため、Google では、ウェブマスターが意図していないにも関わらずブロックされたり削除されたりしてしまったと思われる場合に限り、この警告を表示するようにしました。「重要なページ」に限定したのは、このような理由によるものです。現時点では、ページのクリック数([ウェブ上のサイト] 、 [検索クエリ] にて確認できます)から重要度を判断していますが、今後この機能が進化するにつれてそれ以外の要素も付加されるかもしれません。もちろんウェブサイトに起きる問題は、上に挙げた 3 つの項目(「マルウェア」「削除された URL」「ブロックされた URL」)だけではありません。チェック項目は今後増加していく予定です。また、今回のアップデートはウェブマスターの皆様ご自身によるサイトの状態の判断や確認には比ぶべくもありませんが、ひとつひとつすべてのデータやレポートを掘り下げて調べなくても、サイトに起きている重大な問題を簡単にいち早く発見できるようになる手助けになれればと思います。

私たちが検出したサイトの問題が解決されたのち、ウェブマスター ツールから警告が消えるまでには通常、数日を要します。これは、Google がサイトの再クロールを行って変更を確認し、さらにその情報を Google 検索とウェブマスター ツールに反映されなければならないからです。1 週間以上経ってもサイトの状態に関する警告がまだ残っている場合は、問題が解決されていない可能性があります。その際はぜひ ウェブマスター ヘルプフォーラム をご利用ください。皆様のご意見をお待ちしております。

ウェブマスター ヘルプ フォーラムからも参加!グローバル トップレベル ユーザーサミット 2011 のご報告

2011年10月3日月曜日 | 11:17

9 月 13、14 日にアメリカのカルフォルニア州サンタクララ、およびマウンテンビューの Google 本社オフィスにて、「グローバル トップレベル ユーザー サミット 2011」が開催されました。このサミットは、世界各国の ヘルプ フォーラム で大きな貢献をされているトップレベル ユーザーの方々へ 日ごろの感謝をお伝えすると共に、より良いヘルプフォーラムコミュニティ運営のためにトップレベル ユーザーの皆様と Google 社員との間でより深いディスカッションをおこなうことを目的とした、今年初開催のグローバル イベントです。

全世界から 300 人近いのトップレベル ユーザーが集まったこのイベントには、 日本からも ウェブマスター ヘルプ フォーラム で日ごろ活躍されているトップレベル ユーザーの 方 2 名を含む合計 4 名の方が参加されました。

サミットに参加された日本のトップレベル ユーザーの皆様(左から 4 名)と Google 社員

Google Japan Blog にサミットの様子や日本から参加されたトップレベル ユーザーの方々の感想などをご紹介する記事が掲載されましたのでぜひご覧ください。また、ウェブマスター ヘルプ フォーラムで、「そもそもトップレベル ユーザーとはどんな人たちなのか?そしてトップレベル ユーザーになるには?」ということについて、ご紹介させていただいていますので併せてご覧ください。

Google Japan Blog 「グローバル トップレベル ユーザーサミット 2011 のご報告
ウェブマスター ヘルプ フォーラム 「 トップレベル ユーザーサミットのご報告 & そもそもトップレベル ユーザーとは?

今後とも ウェブマスター ヘルプ フォーラム をどうぞよろしくお願いします。