Caffeine
Ищейка Google по кличке Caffeine
Компания Google продолжает радовать нас своими нововведениями и сегодня (то есть 09 июня 2010 года) Кэрри Грим – один из разработчиков Google, сообщил на об успешном окончании работ по созданию новой системы индексирования веб-сайтов – Caffeine. Сообщается что данная система не только содержит самую большую коллекцию веб-страниц но и на 50% «свежее» предыдущего индекса.
Схема работы Caffeine.
На абсолютно непонятной схеме можно увидеть как графически представляется работа старой и новой системы индексирования сайтов. И если в старой схеме понятно что индекс разбит на несколько слоев которые по-разному обновляются (некоторые более регулярно некоторые менее). Полный “update” индекса в среднем занимал примерно две недели. То из новой схемы пока нечего не понять но утверждается, что Caffeine будет гораздо быстрее благодаря непрерывному обновлению разных частей поискового индекса и глубокому анализу получаемой информации. В свою очередь пользователи увидят результаты поиска, которые будут отображать максимально свежую информацию. Утверждается, что на данный момент система содержит порядка 100 млн. гигабайт данных, а новая информация добавляется со скоростью нескольких сотен тысяч гигабайт в день. Больше подробностей видимо удастся получить только летом с выходом обещанных обновлений.