Há alguns meses, vêm se falando muito sobre sitemaps. Mas a final, o que é isso ?
Existem vários tipos de sitemap. Sitemaps são mapas do seu site, aonde lista-se todas as páginas em um arquivo XML (no caso do Google). Deste modo, você informa ao Google, para cada página de seu site, a frequência com que ela é alterada (diária, semanal, mensal, semestral ou anualmente), e também fornece um peso, ou seja, um grau de importância para cada página de seu site.
Tipos de sitemaps
Existem diversos tipos de sitemaps. Cada buscador possui um tipo próprio. Iremos analizar o caso do sitemap no formato Google (XML).
Exemplo de um Sitemap em XML (formato Google)
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="gss.xsl"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.google.com/schemas/sitemap/0.84 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
<url>
<loc>http://www.homehost.com.br/</loc>
<lastmod>2006-12-06T22:34:03+00:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.00</priority>
</url>
<url>
<loc>http://www.homehost.com.br/suporte.php</loc>
<lastmod>2006-12-06T22:34:05+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.50</priority>
</url>
<url>
<loc>http://www.homehost.com.br/empresa.php</loc>
<lastmod>2006-12-06T22:34:06+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.50</priority>
</url>
</urlset>
Frequência de rastreamento do sitemap (changefreq)
Determinar a frequência de alteração é importante, pois o Googlebot (robôzinho do Google) leva um tempo para indexar cada página do seu site. Caso seu site tenha páginas que não são atualizadas muito frequentemente, para quê perder tempo re-indexando elas ?
Acompanhando os logs do servidor de
hospedagem de sites, notamos que o Google busca uma página de nosso site a cada 10 minutos, para evitar sobrecarga, ou suspeita de ataque. Imagine um portal de notícias com 15 mil páginas ? Levaria 150 mil minutos para ser completamente indexado, ou seja, 104 dias.
Daí a vantagem de definirmos uma taxa de frequência para cada página do site (ou grupo de páginas). Você define uma maior frequência para as que são mais atualizadas, e uma menor frequência para as que não sofrem modificações.
Prioridade da página (priority)
Nos sitemaps, para cada página do site, define-se um grau prioridade de 0.0 a 1.0. Definindo grau 0.0 significa que a página é pouco importante, e não deve aparecer nas buscas (só em último caso), enquanto definindo 1.0 como grau, significa que a página é de extrema importância e deve ser priorizada nos resultados das buscas.
Porém, dar prioridade baixa não significa que a página nunca aparecerá nas buscas, tampouco que ela nunca será indexada. A prioridade refere-se apenas aos resultados das buscas no Google que são fornecidas para os usuários.
Como faço para criar um sitemap para meu site ?
Existem ótimas ferramentas para a criação de um sitemap. Uma ótima ferramenta gratuita é o
GSiteCrawler. Ele varre todo o seu site, e constrói um arquivo
sitemap.xml. Basta colocar este arquivo na raiz de seu site.
Mas e agora, como comunico ao Google que já tenho um sitemap ?
O Google NÃO detectará sitemaps automaticamente. É necessário "dizer" ao Google que você tem um sitemap. Para isso, basta criar uma conta no
Google Webmaster Tools, e subir seu sitemap.
Conclusão sobre sitemaps
Ter um sitemap não significa que você irá aparecer melhor nas buscas do Google. Todavia, os sitemaps são de extrema importancia para que você ajude o Google a indexar seu site por completo, evitando desperdício de tempo, conforme explicado anteriormente.
O Google possui algumas limitações quanto a "profundidade" da indexação de sites. Digamos que seu site possua uma página que precise de 5 ou 6 cliques (a partir da homepage) para ser acessada. Esta página corre um sério risco de não ser indexada pelo Google. Algumas vezes, nosso site pode vir a ter páginas chamadas por javascript (window.open, location, etc...), o que pode ser outro fator de dificuldade para o Google.
Recomendamos que seu sitemap XML seja atualizado pelo menos uma vez por mês.
Todo o conteúdo deste site
é de autoria própria da Homehost, registrado e protegido por copyright.
A cópia ou reprodução
parcial ou total deste conteúdo é expressamente proibida.
Caso queira fazer menção a este artigo, insira um link a partir de seu site para esta página.
Homehost ® 2006 - Todos os direitos reservados