A Google anunciou hoje a conclusão do Caffeine — um novo sistema de indexação na Web. O Caffeine fornece novos resultados nas pesquisas na Internet. Segundo a empresa, é na verdade “um sistema 70% mais renovado relativamente ao anterior sistema e é a maior colecção de conteúdos de Internet que já disponibilizámos“.
Não importa se é uma nova notícia, blogue ou um post num Fórum, com o Caffeine irá encontrar ligações para os temas que está a pesquisar de uma forma muito mais rápida, logo após a sua publicação — garante o press-release hoje difundido pela Google.

Excerto da nota de Imprensa
Alguma informação de base sobre motores de pesquisa: Quando pesquisa no Google, não procura na Web ao vivo. Em vez disso procura no índice Google da Web – no fundo, é como recorrer ao glossário de um livro e escolher a informação exacta de que precisa.
Então porque é que criámos um novo sistema de indexamento de pesquisa? Existem duas razões: primeiro, os conteúdos na Internet florescem a cada dia. Estão a crescer não só em dimensão e número como também em novos vídeos, imagens, novas actualizações e em tempo real. As páginas Web tradicionais são cada vez mais ricas e complexas. Segundo, a expectativa das pessoas quando fazem uma pesquisa é mais elevada do que costumava ser. Quem pesquisa quer encontrar os últimos autores e conteúdos, mal estes sejam publicados.
Para estar a par da evolução da Internet e responder às crescentes expectativas dos utilizadores, criámos o Caffeine. A ilustração abaixo demonstra como funcionava o sistema antigo de indexamento comparando ao que estamos a fazer com o Caffeine:
O nosso índice anterior tinha várias camadas, alguns faziam a actualização mais rapidamente do que outros; a grande maioria do índice só era actualizada de duas em duas semanas. Para actualizar um camada do índice anterior teríamos que analisar toda a Internet o que nos levaria a um atraso desde que encontravámos numa página até ao tornarmos disponível ao utilizador.
Com o Caffeine, podemos analisar a Internet por partes e procurar ou actualizar o nosso índice de modo contínuo e global. À medida que encontramos novas páginas ou nova informação em páginas existentes, podemos adicioná-las imediatamente ao índice. Isso significa que quando procurar, vai estar a fazê-lo o mais próximo possível da versão mais recente da informação que pretende – Independentemente de quando e onde foi publicada.
O Caffeine permite-nos indexar páginas Internet numa enorme escala. De facto, o Caffeine processa centenas de páginas em paralelo, a cada segundo. Se fosse uma pilha de papéis teria 5 km de altura (empilhados, indexados e reempilhados a cada segundo). O Caffeine tem quase 100 milhões de giga bytes de capacidade de armazenamento numa base de dados e acrescenta novas informações inúmeras vezes por dia. Teria que ter 625,000 de Ipods com a máxima capacidade para conseguir armazenar tanta informação. Se esta estivesse toda ligada representaria um total de cerca de 65 quilómetros. Se quisesse fazer a transferência desta quantidade de informação para o seu computador precisava de 1000 ligações de Internet de alta velocidade ao longo do dia.
Nós construímos o Caffeine com o futuro nas nossas mentes. É um alicerce sobre o qual estamos a construir índices mais rápidos e mais abrangentes, porque é capaz de escalar de uma forma mais muito mais eficiente para lidar com a crescente quantidade de informação disponível on-line. Também vamos ser capazes de fazer mais com o ranking e localização para garantir que os resultados da pesquisa são mais ricos e mais precisos para os utilizadores em todo o mundo. Então, espere por mais novidades este Verão e nos meses que se seguem.
Tags: Caffeine, google







