PUBLICIDADE

Vazamento detalha como o Google escolhe os sites em destaque nas buscas; veja

Documentos internos revelam que número de cliques pode pesar mais do que a confiabilidade de uma página

PUBLICIDADE

Por Sabrina Brito

O mecanismo de busca do Google é um dos recursos mais utilizados de toda a internet. Apesar disso, pouco se sabe sobre como a ferramenta escolhe quais sites aparecem primeiro na lista - desde 1998, quando o Google foi criado com a missão de organizar o conhecimento online, esse sempre foi o grande segredo da empresa.

Cerca de 2,5 mil páginas de documentos vazaram do Google Foto: Steve Marcus/Reuters

PUBLICIDADE

Isso, porém, pode estar prestes a mudar. No final de maio, foram vazadas aproximadamente 2,5 mil páginas de documentos que detalham como opera o buscador. A papelada aponta para a forma como o mecanismo estabelece a ordem de páginas que aparece para o usuário - algo que pode gerar mudanças entre os donos de sites que tentam posicionar melhor suas páginas no ranking do Google. Especialistas apontam que o vazamento pode causar movimentação intensa na indústria especializada em ranqueamento de páginas

Os dados foram revelados por Rand Fishkin e Mike King, especialistas em SEO (nome dos profissionais focados em técnicas para otimizar o ranqueamento de páginas). Segundo eles, as informações estavam no GitHub e teriam sido repassadas pelo leaker Erfan Azimi, que supostamente tinha objetivo de divulgar o que há por trás do algoritmo da empresa.

No dia 29 de maio, o Google confirmou a veracidade das informações ao site The Verge - mas pregou cautela para evitar conclusões definitivas sobre a ferramenta.

“Aconselhamos cuidado ao se fazer suposições imprecisas sobre o Search baseado em informações descontextualizadas, ultrapassadas ou incompletas”, afirmou o porta-voz da empresa, Davis Thompson. “Nós compartilhamos informações extensas sobre como o Search funciona e os tipos de fatores que nossos sistemas pesam, ao mesmo tempo em que trabalhamos para proteger a integridade de nossos resultados da manipulação”, disse.

Os documentos sugerem que, ao menos em algum momento, o Google Search contou com cerca de 14 mil indicadores focados em organizar a ordem e o ranking em que aparecem os sites na internet. Estão incluídos nessa fórmula número de cliques, palavras-chave e até mesmo a autoridade da página em relação a certo tema.

No entanto, os papéis revelaram que alguns desses indicadores existem apesar de o Google ter negado anteriormente a sua influência no processo de ranqueamento. É o caso do número de cliques, do tempo gasto por internautas em determinada página e de outros dados coletados dos usuários a partir do Google Chrome - sites visitados a partir do navegador do Google ganham mais pontos, algo que a companhia negava fazer.

Publicidade

Assim, páginas mais populares podem aparecer primeiro na fila de sites, ainda que suas informações não apresentem a mesma qualidade dos sites em posições inferiores no ranking. Isso contradiz o que o Google vinha informando até o momento.

O vazamento mostra também que o buscador pode determinar uma quantidade máxima de sites ou posts que aparecerão após a busca e pode rebaixar páginas por conter pornografia ou por apresentar altos níveis de insatisfação do usuário. A companhia também mantém um filtro específico para temas sensíveis, como eleições, o que sugere que o teor político de uma página pode influenciar no seu ranqueamento.

O Google possui um histórico com uma cópia de cada versão de todos os sites já indexados para poder compará-las e perceber cada mudança realizada. Por fim, descobriu-se que as páginas indexadas pelo Google são monitoradas e avaliadas quanto ao tempo em que estão no ar, apontando para a importância de sua longevidade.

Tudo Sobre
Comentários

Os comentários são exclusivos para assinantes do Estadão.