Google Sitemaps

Kłopoty z indeksacją strony? Google nie poznało wszystkich podstron serwisu? Na takie przypadłości Goździkowa poleca Google Sitemaps.

Jedną z najbardziej kosztownych rzeczy w systemach katalogowania i wyszukiwania jest Indeksacja. W przypadku WWW Proces ten polega na skanowaniu i spisywaniu wszystkich odnośników na stronie, po czym odwiedzeniu pobranych odnośników, skanowaniu, itd. w nieskończoność. Idea indeksacji polega na tym aby stworzyć zgodną ze stanem faktycznym “mapę” wszystkich podstron danej domeny (strony/serwisu www), tak aby roboty zczytujące content (zawartość) wiedziały gdzie i skąd mają zbierać dane.

Jakiś czas temu google poszło po rozum do głowy i stworzyło innowacyjny protokół sitemaps. Protokół ten pozwala każdemu właścicielowi na stworzenie mapy swojej strony i wysłanie jej do google. Rozwiązanie to (przynajmniej teoretycznie) skraca czas indeksacji (ponieważ roboty odpowiedzialne za indeksacje w tym przypadku nie mają prawie żadnej roboty do zrobienia) i pozwala na dokładniejsze zaindeksowanie strony. Daje nam również możliwość wyboru priorytetu odwiedzin dla każdej z podstron, opisanie daty ostatniej modyfikacji każdej podstrony, oraz określenie jak często chcielibyśmy widzieć robota google indeksującego content na naszej stronie.

Google sitemaps tworzymy w języku znacznikowym stworzonym na bazie XML’a specjalnie do tego celu, mapa strony wygląda mniej wiecej tak:

XML
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
  <url>
    <loc>http://www.pozycjoner.net/</loc>
    <lastmod>2006-11-19</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.1</priority>
  </url>
</urlset>
  • Linia 1 - standardowe rozpoczęcie dla języków znaczinkowych
  • Linia 2 - cała mapa musi sie zawierać w znaczniku, atrybut xmlns - definiuje tzw. namespace (przestrzeń nazw), mniejsza o szczegóły - musi on być
  • Linia 3-8 - blok opisu 1 podstrony, występują w nim znaczniki takie jak:
    • <loc> - pełen adres,
    • <lastmod> - data ostatniej modyfikacji,
    • <changefreq> - definiuje jak często podstrona ulega zmianom,
    • <priority> - priorytet dal danego url. Oczywiście blok <url> powinien sie powtarzać tyle razy ile jest podstron.

Mapę można ręcznie napisać - dobre w przypadku kilku podstron, przy większej ilości warto posłużyć się generatorami.

Oto kilka z nich:

Natomiast dokładniejszy opis opis XML’s sitemaps można znaleźć na: Sitemaps.org

Po zrobieniu mapy, mapę należy wrzucić do Google Webmaster Tools.


Dzięki za przeczytanie!

To jest archiwum - ten wpis pochodzi z lat 2010-2015