Google estrena sistema de indexacion

Google anuncio ayer el cambio de su sistema de indexacion de webs, es decir la forma en que examina la web y guarda las referencias para ofrecernos los resultados. Su nombre es Caffeine y según sus responsables proporciona resultados un 50% más “frescos”. Segun Google el cambio era necesario por la forma en que ha crecido la red y en la necesidad de ofrecer datos en tiempo real como noticias y el ultimo contenido disponible.

El sistema anterior tenia varias capas, algunas eran actualizadas mas rapido que otras, por lo que existia un delay entre cuando Google encontraba una nueva pagina, hasta que la mostraba en los resultados de busqueda. Con Caffeine “analizamos la web en pequeñas porciones y actualizamos nuestro índice de búsquedas de forma global y continua. A medida que encontramos nuevas páginas, o nueva información en las páginas ya existentes, podemos añadir esos datos directamente al nuevo índice. Eso significa que puedes encontrar información más fresca que nunca, sin importar donde o cuando fue publicada”.

Cada segundo Caffeine procesa cientos de miles de paginas en paralelo. Tantas que si fuera una pila de papel creceria 3 millas hacia arriba cada dia. Caffeine toma cerca de 100 milloges de GigaBytes, y agrega nueva informacion a razon de cientos de miles de GB por dia, necesitariamos 625,000 de los iPods mas grandes para almacenar tanta informacion.

Caffeine esta construido con el futuro en mente, no solo es mas fresco, sino es una robusta plataforma que hace posible construir motores de busqueda que crecen con la informacion en linea.