検索ページはクローリング対象から外すべし!!
canonical URLとして何が良いのかを調べているうちに学んだこと。
canonical URLって?
canonicalとは、2009年に大手検索エンジンサイト(Google、Yahoo、MSN)がサポートした機能で、正式なURLを検索エンジン側に伝えるURLの正規化を目的としたものとなります。link要素の中で使われる属性値で、head要素の中で使います。 canonicalを設定すると、複数の重複ページが存在している場合に、検索エンジンに優先させるべきページを伝えることでそれ以外のページは重複ページであることを伝える事ができます。
ref. https://ferret-plus.com/1809#p1
何のために設定するのか?
Googleのクローラーは全てのページをクローリングしてくるので、重複したページはそれぞれがインデキシングされてしまいます。 実際は同じ内容だけれどもそれぞれがインデキシングされると、サイト運営側の本当にインデックスして欲しいページが除外されたりと予想外なことが起きるので、そのインデックスをきちんと明示するためにcanonicalを設定します。 また、外部から貼られたリンクによる評価(≒リンクポピュラリティ)の分散を防ぐためにも有用です。
検索ページはどう設定すれば良いのか?
サイト内に検索ページを設置する場合はどのように設定するのが良いのでしょうか? 検索ワードを含める場合と含めない場合が考えられます。
example.com/search/index.php?keywords=fruits_bananas_apples or example.com/search/index.php
その答えはGoogleのWebmaster Trends AnalystであるJohn Mullerが言ってた。
Search pages should be disallowed from crawling with the robots.txt
... 検索ページはそもそもインデックスさせてはいけない。
何か困ったことがあったらtwitterなどで聞こうと思いますw まだまだ勉強不足... でもこれから頑張ります!
参考:
seo - What is a best canonical URL for a search result page? - Webmasters Stack Exchange