Google: a ferramenta mais popular da web (artigo JB) -- I N F O A R Q

[ Show ]

Support VoyForums

[ Shrink ]

VoyForums Announcement: Programming and providing support for this service has been a labor of love since 1997. We are one of the few services online who values our users' privacy, and have never sold your information. We have even fought hard to defend your privacy in legal cases; however, we've done it with almost no financial support -- paying out of pocket to continue providing the service. Due to the issues imposed on us by advertisers, we also stopped hosting most ads on the forums many years ago. We hope you appreciate our efforts.

Show your support by donating any amount. (Note: We are still technically a for-profit company, so your contribution is not tax-deductible.) PayPal Acct: Feedback:

Donate to VoyForums (PayPal):

[ Login ] [ Main index ] [ Post a new message ] [ Search | Check update time | Archives: 1, 2, [3], 4 ]

[ Next Thread | Previous Thread | Next Message | Previous Message ]

Date Posted: 18:42:03 02/11/02 Mon
Author: Jos� Maria
Subject: Google: a ferramenta mais popular da web (artigo JB)

Confiss�es de um buscador

Entenda como a ferramenta de pesquisa mais popular da web continua surpreendendo internautas at� hoje

L�CIO TINOCO

Quando o Google http://www.google.com surgiu em 1998, tanto internautas quanto investidores se assustaram: o que faz esses moleques empreendedores (na �poca um com 23 e outro com 24) pensarem que, entrando 3 anos atrasados no mercado, teriam alguma chance perto de Yahoos, Altavistas, Infoseeks e Inktomis? O que eles teriam de t�o inovador assim que viabilizaria um investimento t�o alto em um mercado j� t�o competitivo?
Depois de apenas 4 anos, o Google de Sergey Brin e Larry Page n�o s� se tornou o mecanismo de busca favorito dos internautas, mas tamb�m provou a investidores e clientes que seu modelo alternativo de neg�cios baseado em informads (an�ncios descritivos contendo somente texto, sem banners) p�de brevemente se tornar uma alternativa bem lucrativa. Ahn, algu�m disse ''lucro''?! Esses contos de fada aparentemente t�picos da internet do final de s�culo ainda existem em portais de informa��o? Acreditar na qualidade do mecanismo de busca parece ser f�cil: de fato, as pessoas que usam o Google parecem encontrar o que procuram com maior sucesso e mais rapidamente do que em outros lugares. Mas por que afinal a busca no Google parece produzir resultados t�o melhores?

A hist�ria do Google, ou melhor, de Sergey e Larry, come�a em 1995 durante uma visita de Sergey (ent�o ex-aluno de Stanford e mestrando em Michigan) ao departamento de Ci�ncia da Computa��o em Stanford, onde Larry ficara encarregado de cicerone�-lo. Diz a lenda que os dois de in�cio n�o tinham muito assunto um com o outro, mas que compartilhavam da mesma frustra��o quanto aos mecanismos de busca da �poca. A queixa: com a estrondosa democratiza��o da informa��o dispon�vel na web, estava ficando cada vez mais dif�cil distinguir conte�do de qualidade (i.e., com credibilidade e autoridade) de p�ginas amadoras. Por exemplo, se procurassem sobre ''bibliotecas nos EUA'', no Yahoo!, teriam a mesma chance de encontrar a p�gina da Biblioteca do Congresso Americano (a maior e mais prestigiosa biblioteca do mundo) e a da biblioteca de uma escola prim�ria qualquer nos EUA. Enfim, n�o havia ainda um m�todo que classificasse os resultados de uma busca levando em conta o ''prest�gio'' ou ''autoridade'' de um determinado site. E mais, o problema n�o parecia ter uma resposta trivial. No passado, alguns mecanismos, como o Magellan (e depois, Excite, Yahoo!, entre outros) , j� haviam tentado resolver o problema contratando editores de conte�do para avaliar manualmente a ''qualidade'' de cada nova p�gina que encontravam, em um m�todo tipo ''Guia Michelin'' (sites importantes valeriam 4 ''estrelas'', sites novos, zero ''estrela'', e assim por diante) -- e falharam terrivelmente ao perceberem que ''prest�gio'' � um conceito bem mais din�mico do que pensavam -- um site de nenhuma import�ncia hoje poderia rapidamente se tornar uma refer�ncia na internet ou vice-versa.

Backlinks? - Depois daquele primeiro encontro em Stanford, Sergey e Larry voltaram a prancheta e, � dist�ncia (um em Michigan e o outro na Calif�rnia), desenvolveram em um ano o primeiro prot�tipo do que seria 3 anos mais tarde o Google. Se chamava ''BackRub'' e se propunha a resolver o ''problema do prest�gio'', introduzindo um conceito chave relativamente simples chamado medida de ''backlink''. Um backlink nada mais � do que um link hipertexto ligando alguma p�gina de outro site � p�gina examinada, citando-a como a refer�ncia. Uma medida de backlink � calculada, ent�o, somando-se todos esses links de fora pra dentro, ou seja, todas as cita��es. A hip�tese era que uma p�gina que tivesse mais backlinks do que outra, por ter mais refer�ncias, provavelmente teria mais prest�gio ou autoridade e portanto deveria aparecer primeiro no ranking dos resultados. Voltando ao nosso exemplo anterior, se eu agora digitasse as palavras-chave ''biblioteca EUA'', desta vez a Biblioteca do Congresso Americano apareceria antes da outra biblioteca da escola prim�ria, j� que o n�mero de p�ginas que se refere a primeira (i.e., sua medida de backlink) seria provavelmente maior do que aquelas que se referem � segunda.

Bem, essa foi s� a id�ia inicial. A coisa foi ganhando mais sofistica��o com o tempo. Por exemplo, para uma determinada p�gina, ser� que um backlink do site do Zezinho (nada contra o Zezinho) deveria ter o mesmo peso de um backlink do site da ONU? D� pra notar que o m�todo � recursivo: a indica��o de algu�m de prest�gio vale mais do que a de algu�m que ningu�m conhece, e assim por diante. Eventualmente, a id�ia dos backlinks se transformou em um algoritmo bem complicadinho chamado ''Page Rank'' (um trocadilho com Larry Page, co-autor junto com Sergey). � interessante saber que o artigo original � p�blico e pode ser consultado em citeseer.nj.nec.com/brin98anatomy.html.

Capturar a web inteira? - Apesar do m�todo de ''Page Rank'', apresentar res ultados promissores logo de cara, ainda restava o imenso desafio de capturar uma parte da web que fosse grande o suficiente para ser �til a algu�m. Em 1997, estimava-se que a web deveria ter pelo menos uns 10 terabytes de informa��o, crescendo exponencialmente a cada ano (hoje estima-se que o n�mero esteja pr�ximo de 30 terabytes). Mesmo que algu�m conseguisse capturar isso tudo, seria prov�vel que ao final do processo a maior parte das p�ginas j� capturadas estivesse completamente desatualizada! Portanto, al�m de um grande n�mero de m�quinas atuando em conjunto (para atingir um volume aceit�vel), seria necess�rio estabelecer um crit�rio para selecionar quais sites deveriam ser revisitados com maior freq��ncia.

Por todos esses problemas, era de se esperar que construir um ''capturador de p�ginas'' (web crawler, em ingl�s) dessa escala n�o fosse das tarefas mais f�ceis. At� hoje, � um mist�rio saber qual das ferramentas de busca possui a maior fatia da web. Cada um se diz o l�der: Inktomi, NorthernLight, Altavista, Internet Archive (Alexa) e o pr�prio Google. Seja l� qual for, sabe-se hoje (atrav�s de algumas medi��es por amostragem) que todos devem possuir mais ou menos o mesmo n�mero de p�ginas capturadas. A diferen�a principal est� mesmo no processo de sele��o de novas p�ginas e na freq��ncia de visita��o de p�ginas antigas. E, nesses crit�rios, estima-se que os capturadores do Google e da Alexa estejam hoje mais avan�ados que os outros.

No caso do Google, a solu��o elaborada se baseia em visitar com maior freq��ncia e profundidade as p�ginas de maior ''page rank''. Pra ilustrar, voltando novamente ao exemplo das bibliotecas, deduzimos que o site da Biblioteca do Congresso Americano � visitado muito mais vezes do que o da biblioteca da escola prim�ria. Como esses sites mais visitados s�o tamb�m os de ''maior prest�gio'', � por isso que as primeiras p�ginas que aparecem nos resultados de uma busca parecem estar sempre atualizadas. Engenhoso, n�o?

Como ganhar dinheiro? - Em agosto de 1998, depois de demonstrarem com sucesso o primeiro prot�tipo do BackRub a amigos e pequenos investidores, Sergey e Larry conseguiram levantar 1 milh�o de d�lares e, alguns meses depois, rebatizaram o mecanismo para Google, botando no ar uma vers�o Beta.

Mas se projetar e desenvolver uma ferramenta de busca engenhosa e que aguentasse 10 terabytes j� era uma tarefa dif�cil, viabilizar o projeto a longo prazo parecia ser ainda mais dif�cil. Pra come�ar, teriam que convencer investidores que poderiam conquistar popularidade competindo com marcas j� estabelecidas. Na verdade, o primeiro impulso foi tentar vender a ferramenta pra uma dos concorrentes. Ainda em 1997, quando ofereceram o Google a um desses sites de busca, ouviram um executivo rejeit�-los sem maiores considera��es: ''Por que vou botar no meu site uma ferramenta para as pessoas acharem algo mais r�pido se meus clientes (leia-se, os anunciantes) me pagam por excesso de cliques e n�o por busca!?'' Para esses anunciantes, a internet era um mundo de page views e ''quanto mais cliques melhor''. O plano de uma ferramenta de busca que fosse mais simples e r�pida de usar a princ�pio n�o agradava muito. At� mesmo David Filo, tamb�m ex-aluno de Stanford, co-fundador do Yahoo!, e atual cliente do Google falava: ''Fa�am um site, provem sua id�ia a um n�mero grande de usu�rios e depois voltem para a gente conversar novamente''.

Foi exatamente o que fizeram. Em meados de 1998, ainda em fase Beta, o Google j� contabilizava 10000 buscas/m�s. Em 1999, esse n�mero j� chegava a 500000 buscas/m�s e o site era eleito por v�rias revistas especializadas como o melhor servi�o de busca da internet. Com tanta enchida de bola e adoradores se multiplicando pelo mundo inteiro, os investidores pareciam estar mais amig�veis...

Restava um ''pequeno'' problema, entretanto: com tanto concorrente competindo pelo mesmo mercado publicit�rio de banners, ser� que esse modelo de neg�cio seria uma alternativa vi�vel? Tanto naquela �poca como hoje, mecanismos de busca t�m basicamente duas formas de ganhar dinheiro. A primeira � com propaganda (na maior parte das vezes, em forma de banners) e a segunda, vendendo a ferramenta para outros sites de busca ou portais de informa��o, evitando assim a concorr�ncia direta pela mesma fatia do bolo publicit�rio. Os donos do Google optaram pela segunda. O neg�cio, a princ�pio, somente se pagaria com acordos B2B, com clientes tipo Washington Post ou qualquer empresa que oferecesse busca em seus sites. Melhor para os usu�rios comuns, que n�o teriam que lidar com banners no site principal e poderiam utilizar uma interface t�o simples e amig�vel que seria imposs�vel n�o gostar.

Vinte e cinco milh�es de d�lares mais tarde (financiados por grandes firmas de capital de risco, como a Sequoia Investments do not�rio ''dur�o'' Joe Doerr), e com acordos com o Yahoo! (David Filo cumpriu a promessa de conversar novamente e fechou contrato, tornando a busca do Google o mecanismo padr�o do Yahoo!), Washington Post, entre outros, o mecanismo de busca do Google hoje reina soberano nesse mercado, empurrando concorrentes como o Inktomi e Altavista cada vez mais para o limbo.

Com a adi��o de m�ltiplos idiomas e capturadores especializados por regi�o geogr�fica, o Google hoje conquista mercados at� mesmo aqui no Brasil, para a infelicidade de concorrentes tupiniquins como o Radix, o TodoBr etc

''Informads'', busca por imagens, etc - Mas as novidades n�o pararam a�. Buscando diversificar sua receita, em meados de 2000, o Google iniciou o servi�o de an�ncios de texto em seu site principal. Para quem nunca viu, um an�ncio de texto (ou ''informad'') no Google � um par�grafo de umas 20 palavras que aparece destacado ao lado dos resultados de busca, em uma coluna � parte. Para testar a receptividade dos usu�rios � id�ia e saber se isso traria retorno de investimento aos anunciantes, contrataram nada mais nada menos do que Jakob Nielsen, o todo poderoso expert em usabilidade (ver www.useit.com) , para conduzir testes e entrevistas com usu�rios. Os resultados foram estimulantes: as pessoas se interessam e clicam mais em informads do que em banners comuns. Explica-se: como informads s� aparecem quando existe uma rela��o direta entre o conte�do buscado e o conte�do do an�ncio, o usu�rio implicitamente associa o contexto dos dois tipos de informa��o, o que gera interesse e conseq�entemente mais cliques.

Outra novidade recente � a adi��o de busca por imagens. Muitos j� perguntaram intrigad�ssimos como funciona isso, mas o conceito b�sico at� que � simples. Uma imagem normalmente vem com sua descri��o no texto pr�ximo a dela, ou no texto de links que a citem. Por exemplo, se toda a vez que algu�m procurar por carro, mostrarmos as imagens associadas a esse contexto, provavelmente essas imagens ser�o de carro tamb�m. O m�todo est� longe de ser infal�vel, mas � um tanto ou quanto pioneiro no mundo comercial tamb�m. At� ent�o, buscas por imagens na web s� se baseavam nas legendas e nas URLs das imagens para associar as palavras-chave (vide Radix). Como se baseia em mais pistas para determinar as associa��es entre texto e imagem, o m�todo do Google � comprovadamente mais eficaz, embora seja bem mais caro de implementar.

O que vem por a�? - Antes que todo mundo saia por a� falando que esse artigo parece um ''informad'' do Google, que o mecanismo n�o � essas maravilhas todas, saibam que eu tamb�m tenho as minhas queixas. Para tipos de informa��o altamente perec�veis e sens�veis ao tempo, como not�cias, o m�todo de backlinks simplesmente n�o funciona bem. Nestes casos, a dimens�o do tempo � quase t�o importante quanto a do conte�do. O problema � que uma not�cia que � muito apontada pelas outras tende a ser tamb�m mais antiga e, logo, n�o t�o valiosa. Curiosamente, para not�cias, o mecanismo de backlinks n�o � um bom indicador de relev�ncia!

Outra queixa comum contra o Google diz respeito a utilidade de seu diret�rio de sites, o Open Source Directory, incorporado atrav�s de um acordo entre a AOL/Netscape e o Google, em 1999. Muitos questionam a qualidade do diret�rio, que n�o � nem t�o abrangente nem t�o atualizado assim, especialmente em lugares fora dos EUA. Al�m do mais, se o Yahoo! j� usa Google pra classificar os resultados em seu diret�rio, por que algu�m iria usar o Open Source? Pessoalmente, algumas vezes tentei cadastrar p�ginas l� sem sucesso. De que adianta?

Mas enfim, essas s�o s� pequenas queixas. S� de pensar em buscar alguma informa��o na web hoje sem o Google, j� fico de mau-humor. E ter que ag�entar aqueles banners in�teis e janelas pop-up se abrindo com propagandas irritantes? E um mont�o de resultados in�teis que eu tenho que ficar horas pra digerir? N�o, n�o, salvem Larry e Sergey!

L�cio Tinoco (contato@lexicality.com) � CEO da Lexicality Ltda (www.lexicality.com), empresa de consultoria especializada na aplica��o de tecnologia para gest�o do conhecimento e intelig�ncia de neg�cios.

[07/FEV/2002]
http://jbonline.terra.com.br/

[ Next Thread | Previous Thread | Next Message | Previous Message ]

Forum timezone: GMT-4
VF Version: 3.00b, ConfDB:
Before posting please read our privacy policy.
VoyForums^(tm) is a Free Service from Voyager Info-Systems.
Copyright © 1998-2019 Voyager Info-Systems. All Rights Reserved.