Google Sitemap

Google SitemapとはGoogle?のクローラー(ロボット)がこれ読み込みGoogleインデックスへの追加速度を向上する為の独自規格?のようです。

現在はbeta版で試験中らしい。それと、PageRankとかにも影響は無いとの事。

Sitemap Generatorと言うツールも提供してますが、これはPythonスクリプトですので私は使えません(汗。と言うか、Helpが英文のみの為私には色々無理っぽいです。

で、独自に開発しようと思うので以下その為の覚え書。

サンプル §

Code:XML
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
 <url>
  <loc>http://takzweb.com/</loc>
  <lastmod>2005-01-01</lastmod>
  <changefreq>monthly</changefreq>
  <priority>0.8</priority>
 </url>  
</urlset>

要素概要 §

要素役割規則
urlsete全ての親要素。xmlnsは表記を見るとバージョン情報のようですが必須
url<loc> <lastmod> <changefrep> <prioripty>の親要素必須
locページのURL必須
lastmod更新日 形式は ISO 8601 つまり。YYYY-MM-DD とか YYYY-MM-DDThh:mm:ssTZDで表記。オプション
changefreq更新頻度を表す "always"(常に更新) "hourly"(1時間ごと) "daily"(毎日) "weekly"(毎週) "monthly"(毎月) "yearly"(毎年) "never"(変わらない)オプション
priorityサイト内でのページの重要度。0.0~1.0で表す。0.0が低く1.0が重要度が高い。オプション

注意 §

取り合えずスクリプト組んで設置してみた -- 2005/09/12 §

何処にもリンクして無いのでGoogle?にインデックスされるには難しいと思うが。

このスクリプトを元に汎用的なスクリプト組んで配布でもしようか・・・。

インデックスされてた -- 2005/09/16 §

9/13にGoogle Sitemapにログインして確かめたらSitemap Statusでエラーが出ていた。

エラーは<lastmod>YYYY-MM-DDThh:mm:ssTZDで表記していたのだが、具合が悪いらしい。YYYY-MM-DDに替え再送してみた。

昨日(9/15)時点でエラー表示は消えSitemap StatusはOKとなり、本日(9/16)確認したところ見事Google?にインデックスされてた。ちょっとうれしい。

が、ページの方は全くキャッシュされていない。