digital-garden/_inbox/Кэширование.md

7.0 KiB
Raw Blame History

aliases tags date zero-link parents linked
зрелость/🌱
2024-05-24
00 HighLoad

Для каждого ресурса критичной для пользователя является такая характеристика, как время отклика сервера (Latency). Увеличение времени отклика сервера приводит к оттоку посетителей. Следовательно, необходимо минимизировать время отклика: для этого необходимо уменьшать время, требуемое на формирование ответа пользователю, при этом для формирования ответа пользователю необходимо получить данные из каких-то внешних ресурсов (Бэкенд).

Ускорить сложные запросы может кэширование: мы помещаем результат вычислений в некоторое хранилище (например, Memcached или Redis), которое обладает отличными характеристиками по времени доступа к информации. Теперь вместо обращений к медленным, сложным и тяжелым backendам нам достаточно выполнить запрос к быстрому кэшу.

Система должна уметь выдерживать нагрузку и без кэша. Задача кэша ускорить ответ, а не держать нагрузку.

Чаще всего реализуется на основе хэш-таблиц и использует принцип локальности.

==Системы используемые для кэширования обычно не являются надежными, так что не следует хранить только там какие-то важные данные.==

Данные можно разделить на несколько категорий:

  • «Можно потерять». К этой категории относятся кэши выборок из базы данных. Потеря таких ключей не так страшна, потому что мы можем легко восстановить их значения, обратившись заново к backendу. Однако частые потери кэшей приводят к излишним обращениям к БД.
  • «Не хотелось бы потерять». Здесь можно упомянуть счетчики посетителей сайта, просмотров ресурсов и т.п. Хоть и восстановить эти значения иногда напрямую невозможно, но значения этих ключей имеют ограниченный по времени смысл: через несколько минут их значение уже неактуально, и будет рассчитано заново.
  • «Совсем не должны терять». Кэш удобен для хранения сессий пользователей. Однако содержимое сессий не хотелось бы терять никогда иначе пользователей на сайте будет «разлогинивать». Как попытаться избежать? Можно кластеризовать систему кэширования, так вероятность потери снижается.

Уровни кэширования

Виды кэширования:

  • Сквозное. Все запросы проходят через кэш. Схема.
  • Кэширование на стороне сервиса. Схема.
  • Опережающее. Кладем данные в кэш заранее. Схема.

Ключ кэширования

Ключ кэширования должен обладать следующими свойствами:

  • При изменении параметров выборки, которую мы кэшируем, ключ кэширования должен изменяться (чтобы с новыми параметрами мы не «попали» в старый кэш).
  • По параметрам выборки ключ должен определяться однозначно, т.е. для одной и той же выборки ключ кэширования должен быть только один, иначе мы рискуем понизить эффективность процесса кэширования, создавая несколько кэшей для одной и той же выборки.

Можно использовать следующий вариант (пример для PHP): если существует некоторая точка в коде, через которую проходят все обращения к БД, а любое обращение полностью описывается (содержит все параметры запроса) в некоторой структуре $options, можно использовать следующий ключ:

$key = md5(serialize($options))

Такой ключ удовлетворяет первому условию% при изменении $options будет обязательно изменен $key, но и второе условие будет соблюдаться, если мы будем все типы данных в $options использовать «канонически», т.е. не допускать строки "1" вместо числа 1. Функция md5 используется для «сжатия» данных.

Инвалидация кэша

Инвалидация кэша

Cache miss

Cache miss

Дополнительные материалы