イメージ写真 (実際のGooglebotはプログラムでこういった物理的なボディを持たない)
 
 

ある日、アクセス数減、検索アナリティクス大幅減に・・

 
灯台下暗しと申しますか、幸せの青い鳥は自分の家にいたといいますか、遠くばかりを見つめて何かを探していると、自分の足もとに探していたものがあったなんてお話はたくさんありますよね。
 
えー、ウェブのコンテンツの世界にもそういうことがありまして、今日、筆者の身にも起きたわけでございます。
 
ウェブにかかわる身としましては、毎日、毎日、アクセス数が増えて欲しいという思いで生きておるわけです。
 
やれバズだの、いいねボタンの設置場所など、小さな努力にこだわること蟻のごとしです。
 
そんな先日、このサイトも無料SSLを導入してhttps化したんですね。
 
それで、Googleのサーチコンソールにhttpsも登録してインデックスされるのをまってたんです。
 
でもね、なんかJoomlaのコンテンツがインデックスされないんですね。
 
遅い。
 
おかしい。
 
ってなもんで、あれこれ突っつきまわすわけです。
 
Joomlaには重複したURLでもアクセスできる問題があって、これがペナルティなんじゃないかと思っていたんです。
 
解決するプラグインも探しちゃったりして、小さな努力にこだわること蟻のごとしです。
 
もう、サーチコンソールばっかり見ちゃってるんです。
 
そしたらね、Googleインデックスってメニューの中に「ブロックされたリソース」ってのがあって、ブロックされたコンテンツがリストされてるんです。
 
よくみたら、JoomlaのテンプレートのCSSの画像やjsとかがブロックされてるみたいなんです。
 
もっとよく見たら、表示に関わるプラグインがブロックされているわけです。
 
サーチコンソールも
 
「特定のリソースなしでレンダリングすると、ウェブページのインデックス登録に悪影響を及ぼす可能性があります。」
 
なんて言ってるわけです。
 
「ブロックってどういうことだ?」ってなりますよね。
 

犯人は自分だった

 
何のことはないんです、自分でrobots.txtでディレクトリごとブロックしてしまってるんですよ
 
驚きましたね。
 
そりゃね、Googlebotをブロックしてんだからインデックスされないわけですよ、お望み通りってやつですよ。
 
思わず笑いましたね、その後半泣きになりましたね。
 
エアコンが壊れてた~~って大騒ぎしてたら、リモコンの電池がなくなってた。
 
そんな少年時代の思い出がよぎりましたね。
 
 
 

ちょっと前のJoomla!純正robots.txtから

 
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
# Disallow: /images/    <-------- ブロックしない
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /logs/
# Disallow: /media/    <-------- ブロックしない
Disallow: /modules/
#Disallow: /plugins/   <-------- ブロックしない
# Disallow: /templates/    <-------- ブロックしない
Disallow: /tmp/

 

 
/images/ /media/ /temlates/ に画像や、cssファイル、JSファイルが設置されているのでこれらをブロックしない。
またT3のpurityなんかも入ってると、/plugins/ もブロックしてるとダメなのでご注意を。
 
 
ありがたや、ありがたや。