Google, Duck Duck Go e Mariana

No dia 22 de novembro de 2015, a página no facebook do Deputado Chico Alencar [0] publicou (republicou) uma foto da página Ministério da Verdade [5]:

12243196_748439131925007_4206916744002470779_n.jpg

Logo em seguida, começaram as especulações. Reproduzindo algumas aqui, sem nomes:

  • “Tantos defensores do google… Uma empresa tão neutra no mundo atual…”
  • “Devem estar manipulando com bots para por essas imagens lá em cima.”

Em tempos “aquecidos” por escândalos e crises no país, não é de se estranhar que apareçam pessoas com conclusões sobre determinadas notícias ou acontecimentos. Quando se trata de tecnologia então, a probabilidade de aparecerem tais pessoas se torna ainda maior. Não julgo ninguém aqui como “conspirador”, “pessimista” ou qualquer outro adjetivo  negativo, e sabe o porquê? Simplesmente porque todos nós estamos sujeitos a conclusões precipitadas. Faz parte da nossa natureza (quem quiser entender mais do que estou falando, procure por Semiótica e Semiose, em especial por Charles Sanders Peirce e Umberto Eco). Em resumo, o que falta antes de tirar conclusões é mais informação. Nesse caso, sobre como sistemas de busca funcionam.

Lá nos idos de 1990, muitos mecanismos de busca utilizavam uma forma trivial de organizar links para páginas web: listagens [1]. Queria sua página aparecendo no mecanismo de busca X? Você deveria mandar um e-mail para eles pedindo a inclusão em alguma listagem (que era geralmente separado por categorias). Para uma internet com alguns milhares de links, isso não era muito problema.

No entanto, com a popularização da internet, popularizou-se outra forma de buscar por esses links: daí surgem os web-crawlers, ou robôs de busca, ou robôs indexadores (coletores de páginas). Eles quase que literalmente varrem a internet em busca de links. Hoje, eles são o “modo padrão” de qualquer mecanismo de busca.

Sergey Brin e Larry Page, lá em 1996, criaram um mecanismo de busca no qual links eram ordenados de acordo com o número de citações. Seu mecanismo de busca foi chamado na época de BackRub [2]. De lá pra frente, o BackRub se tornou o Google (desde 1998), e o PageRank até hoje é a base do mecanismo de indexação (ou seja, de coleta de páginas na internet).  De lá pra cá, muita, mas muita coisa mudou no mecanismo de busca [3][4], seja para tornar as respostas mais relevantes para o usuário (buscando resultados passados), ou então para dar mais segurança (filtrando sites que tem algum problema com vírus ou mecanismos de roubo de dados) e até para evitar “engraçadinhos” tentando burlar o algoritmo para ter resultados não relacionados a busca sempre em primeiro lugar (fato esse que motiva o Google – e qualquer outro mecanismo de busca – a não divulgar seu algoritmo de indexação de páginas). Porém, isso ainda não garante que veremos o resultado exato da busca que estamos precisando e procurando. Este, inclusive, é um dos maiores desafios que qualquer mecanismo de busca (e que, alguns acreditam, ser impossível de conseguir).

E isso não é exclusividade do Google. Qualquer outro mecanismo de busca também tem suas formas particulares de indexar conteúdo. E é por isso que vemos a diferença nos resultados do Google e do Duck Duck Go. Ambos processam a palavra “Samarco” de formas completamente diferentes. Tentando fazer um chute (já que os algoritmos não são revelados), o Google dá mais ênfase a uma relação direta dos resultados com a palavra do que o Duck Duck Go, que provavelmente dá mais relevância a fotos mais recentes relacionadas aquela palavra. Se eu estou buscando notícias relacionadas, isso é excelente. Mas se eu de fato estou buscando informações sobre a empresa, essa estratégia do Duck Duck Go não me ajuda. O Google entende que sua forma de retornar resultados é mais interessante. E eu acredito que seja, já que o Duck Duck Go tem uma política de não armazenar quaisquer informações de busca de seus usuários, o que não permite inferências sobre interesses de busca.

Esse post é só uma pincelada nessa área. Como não conheço a fundo, não posso falar sobre pesquisas recentes relacionadas a este universo dos mecanismos de busca (que por sinal é bem interessante e passa por um monte de áreas de pesquisa em Computação). Mas espero que com essa explicação todos possamos ficar mais informados antes de achar que há uma “conspiração” a favor de uma mineradora, por parte de uma empresa americana. E por mais que existam pessoas que ainda não entendam a tecnologia e suas capacidades e limites, fico feliz ao ver as respostas no post da página que mencionei, entendendo que existe um motivo por trás daquelas respostas tão estranhas.

PS: Outra questão que apareceu e que vale a pena ser comentada é sobre SEO. “SEO ? O que é isso ? Ele pode realmente ajudar a modificar resultados de busca? R: SEO = Search Engine Optimization, ou Otimização para Mecanismos de Busca. Nessa área se estudam formas de tornar páginas mais facilmente acessíveis por mecanismos de busca, bem como estratégias para deixa-las no topo dos resultados. Sim, essas técnicas podem modificar resultados de busca, mas tenha em mente que os buscadores estão prontos para lidar com boa parte das tentativas de manipulação de resultados.

Gostou do Papo de Computeiro? Quer ficar por dentro de novos posts e comentários? Curta nossa página no facebook: http://www.facebook.com/papodecomputeiro  🙂 

Referências: 

[0] https://www.facebook.com/chicoalencar/photos/a.220261591409433.36789.184693888299537/748439131925007/

[1] http://www.wordstream.com/articles/internet-search-engines-history

[2] http://infolab.stanford.edu/~backrub/google.html

[3] http://searchengineland.com/library/google/google-algorithm-updates

[4] https://www.google.com/intl/pt-br/insidesearch/howsearchworks/algorithms.html

[5] https://www.facebook.com/ministerioverdaderiodoce

Anúncios

2 comentários sobre “Google, Duck Duck Go e Mariana

  1. É isso aí! vamos corrigir sempre! Não devemos permitir a desinformação! Excelente post, Cleyton!

Faça comentários com sugestões, dicas, palpites. Ajude o blog e seus leitores!

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s