Коли звичайний користувач вводить запит у Google і натискає Enter, мільйони результатів з’являються за 0,3 секунди. Людському мозку це здається магією: ніби пошукова система миттєво просканувала кожен сервер на планеті, зазирнула на кожен вебсайт від Нью-Йорка до Токіо і видала ідеальну відповідь.
Це велика ілюзія. Насправді, в момент пошуку, Google взагалі не звертається до глобальної мережі.
Погляньмо на це з точки зору системної архітектури. Інтернет — це хаотична, децентралізована мережа із сотень мільйонів серверів. Сайти виходять з ладу, переміщуються, змінюють код щосекунди. Якби Google надсилав запит до реального інтернету щоразу, коли хтось шукав рецепт борщу або огляди відеокарт, очікування тривало б годинами або днями, а не мілісекундами.
Тож Google робить те, що робить прагматичний архітектор. Він заздалегідь створює «дзеркало» інтернету. Він завантажує копії всіх сторінок, до яких може дістатися, і зберігає їх на своїх колосальних серверних фермах. Ця локальна база даних називається Індексом.
Коли ви натискаєте кнопку «Пошук», ви шукаєте виключно всередині Індексу Google, а не в самому інтернеті. Ви дивитеся на знімок реальності, захоплений алгоритмом деякий час тому.
Основний висновок для власників сайтів:
Ви можете створити блискучий продукт, розгорнути потужну інфраструктуру та написати чудовий текст. Але якщо ваш сайт з якихось причин не потрапив до бази даних Google (не був проіндексований) — ви не існуєте в цифровому всесвіті. Просування починається не з краси сайту, а з гарантії того, що система взагалі вас бачить і додала до свого кешу.