Google Sitemap
Google SitemapとはGoogle?のクローラー(ロボット)がこれ読み込みGoogleインデックスへの追加速度を向上する為の独自規格?のようです。
現在はbeta版で試験中らしい。それと、PageRankとかにも影響は無いとの事。
Sitemap Generatorと言うツールも提供してますが、これはPythonスクリプトですので私は使えません(汗。と言うか、Helpが英文のみの為私には色々無理っぽいです。
で、独自に開発しようと思うので以下その為の覚え書。
サンプル §
- XML形式でエンコードはUTF-8
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://takzweb.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
- urlをページ分だけ追加する。
要素概要 §
要素 | 役割 | 規則 |
---|---|---|
urlsete | 全ての親要素。xmlnsは表記を見るとバージョン情報のようですが | 必須 |
url | <loc> <lastmod> <changefrep> <prioripty>の親要素 | 必須 |
loc | ページのURL | 必須 |
lastmod | 更新日 形式は ISO 8601 つまり。YYYY-MM-DD とか YYYY-MM-DDThh:mm:ssTZDで表記。 | オプション |
changefreq | 更新頻度を表す "always"(常に更新) "hourly"(1時間ごと) "daily"(毎日) "weekly"(毎週) "monthly"(毎月) "yearly"(毎年) "never"(変わらない) | オプション |
priority | サイト内でのページの重要度。0.0~1.0で表す。0.0が低く1.0が重要度が高い。 | オプション |
注意 §
- ファイル形式は.xmlでgz圧縮しなければならない。(つまりsitemap.xml.gz)
- URLインデックス数は5万以下またはファイル容量は10M未満にする。それ以上はファイルを複数用意した方が良い。その場合はsitemap_index.xmlを作る。
- ファイルはサイトのrootディレクトリに置く。
取り合えずスクリプト組んで設置してみた -- 2005/09/12 §
何処にもリンクして無いのでGoogle?にインデックスされるには難しいと思うが。
このスクリプトを元に汎用的なスクリプト組んで配布でもしようか・・・。
インデックスされてた -- 2005/09/16 §
9/13にGoogle Sitemapにログインして確かめたらSitemap Statusでエラーが出ていた。
エラーは<lastmod>でYYYY-MM-DDThh:mm:ssTZDで表記していたのだが、具合が悪いらしい。YYYY-MM-DDに替え再送してみた。
昨日(9/15)時点でエラー表示は消えSitemap StatusはOKとなり、本日(9/16)確認したところ見事Google?にインデックスされてた。ちょっとうれしい。
が、ページの方は全くキャッシュされていない。