Controle como o Google indexa seu conteúdo com metatags
Existem muitos mecanismos de busca por aí, mas na maioria das vezes, os proprietários de sites se importam em ter seu site indexado no todo-poderoso Google. Uma maneira de ter um melhor desempenho no mecanismo de pesquisa é usar tags de meta robots.
o meta
O tag do robô é uma meta tag de consenso entre os mecanismos de pesquisa, como Google, Yahoo e Bing. O uso da metatag é permitir que os desenvolvedores da Web tenham controle de acessibilidade para páginas da Web, contra rastreadores de mecanismos de pesquisa. Por exemplo, algo como noindex
impedirá que todos os robôs dos mecanismos de pesquisa coloquem sua página da web em seus índices.
O robô do Google é chamado de Googlebot. Nesta postagem, veremos como lidamos exclusivamente com o Googlebot por meio de meta tags.
Endereçando o Googlebot
Para abordar o Googlebot, especifique o meta nome
Como googlebot
em vez de apenas robôs
. Este exemplo impedirá que o Googlebot coloque sua página da Web em seu índice, mas ainda permita que bots do Bing e do Yahoo rastreiem a página. Assim, suas páginas da Web ainda podem aparecer nos resultados de pesquisa do Bing e do Yahoo.
O Google tem vários robôs especiais que rastreiam diferentes tipos de conteúdo, como imagem, notícias, vídeo, anúncios e dispositivos móveis. O Google permite que você bloqueie esses robôs individualmente. Se você não quiser que seu website apareça nos resultados de pesquisa do Google Mobile, por exemplo, você pode especificar a tag meta robot dessa maneira:
A lista completa de tipos de bots do Google pode ser encontrada na página de Rastreadores de sites do Google..
Impedir a indexação de imagens
É realmente irritante quando você encontra sua imagem protegida por direitos autorais usada por outra pessoa sem a sua permissão prévia. Se você quiser minimizar isso, você pode impedir que o Google coloque suas imagens em seus índices.
Especifique a tag do meta-robô com o valor de noimageindex
. Isso impedirá que o robô indexe todas as imagens da página e suas imagens não apareçam nos resultados da Pesquisa de imagens do Google, que é onde as pessoas geralmente pesquisam imagens.
Como alternativa, você pode definir o nome da meta como googlebot-image
para impedir especificamente que os robôs do Google rastreiem seu site em busca de imagens.
Evitar a tradução
O Google Chrome oferece a tradução de um site em idioma estrangeiro para o idioma local ou favorito do visitante, com a ajuda do Google Tradutor. Embora a tradução do Google Tradutor esteja melhorando, está longe de ser perfeita para alguns idiomas. A saída de tradução às vezes pode ser muito peculiar.
Se você não quiser que o Google traduza suas páginas da Web, defina a meta do googlebot com o valor de não traduzir
, igual a.
Se você quiser impedir que uma determinada seção da página seja traduzida, você pode adicionar não traduzir
classe dentro do elemento que envolve o conteúdo:
O Google irá ignorar isso Você também pode impedir que o Google indexe suas páginas da Web após determinado período de tempo. Isso será particularmente útil para páginas da web que são relevantes apenas em um período de tempo, como uma página de registro de eventos, por exemplo. Nesse caso, você provavelmente quer dizer ao robô para não rastrear e indexar essa página após o término do evento, impedindo que ele apareça nos resultados de pesquisa do Google.. Para fazer isso, especifique a meta tag com o valor de Dando o exemplo acima, o robô do Google não rastreará a página depois de 29 de setembro de 14. A página eventualmente desaparecerá do índice, mas você ainda pode manter a página para arquivamento em seu site.Impedir a indexação após um horário especificado
unavailable_after
então seguido pela informação do tempo. O formato de hora deve estar de acordo com o formato RFC-850, por exemplo: quinta-feira, 26-set-14 10:00:00 UTC