以前の話ですが、私の管理しているサイトをGoogleで検索した際、数ヶ月に一度は存在しないページのキャッシュが復活するといったことが度々起こってました。 使っているレンタルサーバはロリポップ、ちなみにロリポップは削除したページがある際は、404 Not Foundのレスポンスを正しく返さずにロリポップの広告ページにリダイレクトで 転送されてしまいます。
404とはステータスコードでリクエストされたページが無い場合に表示されるエラーです、GoogleSitemapを使い始めた頃わかったのですが
GoogleSitemapで「404 (ファイルが見つかりません) エラー ページのヘッダーで 200 (OK) ステータスが返されました」と表示されてました。
要するにページが無いのにヘッダーが200で返ってきてページがあるのかないのかハッキリしない状態ということになっていたということのようです。
そこで、独自のエラーページを作成し.htaccessファイルを追加してみました。
ErrorDocument 404 /404.html
この場合は独自に404.htmlを作りファイルを追加する必要があります。
もしくは、
ErrorDocument 404 default
と.htaccessファイルに記述する方法もあります。
.htaccessファイルの作り方
メモ帳などに ErrorDocument 404 /404.html と記述して保存名はhtaccess.txtで保存します。
FTPツールでアップロードした後に、ファイル名を「htaccess.txt」から「.htaccess」に変更します。それと同時に404.htmlもアップロードします。
ちなみに私のサイト内の存在しない削除済みのページキャッシュは無事にGoogleから削除されました。ロリポップでレンタルされてる方は是非.htaccessファイルを作成することをオススメします。
