荒川自転車道で主に埼玉方面へ クロモリロードバイクで走行

ちゃりログ




日記・つぶやき

googleのデータベースに登録されない

投稿日:2020年7月12日 更新日:

2020年7月中旬

 6月に 時坂峠の読み方の記事を投稿したが、いつまで経ってもgoogleで検索しても検索されない。

自分のブログは googleアナリティックとgoogle search consoleで解析している。 
普段レポートを見ることはないが、確認してみた。

カバレッジレポートで googleのロボット(クローラー)が記事を認識してデータベースに登録(index登録)したか分かる。

投稿記事の状態を確認したいので「すべての既知のページ」でなく「すべての送信済みページ」を選択する。

ブログ記事数は5年過ぎて600を僅かに越えたぐらいだ。
(google search consoleは1000URLまで管理?出来るようだ。
 それ以上ある場合は登録範囲をサイトではなくカテゴリーなどで分ける必要があるようだ。)

緑の有効がindex登録してある記事数
グレーの除外がindex登録してない記事数

4月中旬から除外が増えてきて、6月下旬からわずかに戻している。
一度登録されても除外されるのか

7月11日にレポート確認したが、7月7日分までしか棒グラフがなかったので
最後のクロールが7月7日だったようだ。

グレーの除外は 2つに分けられている。
 クロール済み-インデックス未登録: クロールは済んでいるが、何らかの理由によりインデックスに登録しなかった。(これから登録する場合もあるらしい)

 検出-インデックス未登録: クロールしてない。

これらをクリックすると、記事のURLの内訳が表示されて、クロール済みであれば、その記事を最後にクロールした日が分かる。

検出ーインデックス未登録だけでも51件もある。URLを確認したら昨年やそれ以前のが47件もあった。
ブログを2019年1月に引っ越ししたが、検出-インデックス未登録のURL内訳には2015年の記事から毎年の様に、数件〜10件ぐらい含まれていた。
いつまで経ってもクロールされない記事があることに驚いた。

URLの文字列でフィルターして2020年の投稿記事の登録状況を
表にした。(URLではわかりにくいので記事件名を載せた下表を作るのに サクラエディタでの置換と表計算ソフトを利用した。)

前回のクロールが空白(まだクロールしてない)のは今年は4件。 
6月最後の記事はクロールされているので投稿順に処理されてない。

投稿日の数日後にクロールされているのもあるが、
前回のクロールが投稿日から半年近く経っているのもあるので、記事によっては 何度もクロールされていると思われる。


自分の2020年の記事で 「クロール済み-index未登録」 なのは、タイトルから推察すると、似たような記事を既に他の人がたくさん登録しているのではないか?

肝心の6月9日に投稿した 時坂峠の読み方 の記事は1ヶ月経ったのにまだクロールされてなかった。

ちなみにマイクロソフトの www.bing.com だと 検索されるが、 「時坂峠」で検索しても出てこない。 「時坂峠 読み方」で検索しなければ自分の記事は検索結果に出ない。
bingで検索するよりも圧倒的にgoogle検索エンジンで検索している人が多いのでbingで検索出来てもダメだ。

googleで「時坂峠」の検索結果1ページ目では、モデルのヒルクライマーの今年の記事1件だけに  (ときさかとうげ) と書いてあるが、
その他の検索結果には 「とっさか」 と読むと書いてあるのが多数。
(「とっさか と呼ぶ」なら 地元では呼んでいるようなので、あながち間違いでは無いだろうが、 「とっさか と読む」 と断言されると 檜原村の意思を尊重していない。)

「とっさか」 に 負けてる。

「時坂峠」 をgoogle検索した1ページ目に ときさか の検索結果が多くなるまで (ときさか) とふりがなを振って記事を投稿してもらいたいものだ。



ちなみに昨日、 登録リクエストしたためか、翌日みたら、
クロールされていたものの、なぜかindex未登録だった。

もっとも、index登録されても、検索結果の上位に表示されなければ意味がないが、
index登録されないことには、土俵にも乗れてない。







-日記・つぶやき

Copyright© ちゃりログ , 2024 All Rights Reserved Powered by STINGER.