Struchkov Mark
c11b66b2e0
Some checks reported errors
continuous-integration/drone/push Build was killed
147 lines
17 KiB
Markdown
147 lines
17 KiB
Markdown
---
|
||
aliases:
|
||
- UUID
|
||
tags:
|
||
- maturity/🌱
|
||
date: 2023-11-12
|
||
zero-link:
|
||
parents:
|
||
linked:
|
||
---
|
||
**UUID (Universal Unique IDentifier)** — это 128-битный идентификатор, представленный в виде строки. Однако для пользовательских данных доступно только 122 бита, так как 6 бит зарезервировано:
|
||
- 4 бита используются для указания версии UUID;
|
||
- 2 бита определяют вариант UUID.
|
||
|
||
![](../meta/files/images/Pasted%20image%2020231112132644.png)
|
||
|
||
**Заполнение 122 бит зависит от версии UUID:**
|
||
- **Специальные UUID**:
|
||
- **Nil UUID** — все биты равны 0.
|
||
- **Max UUID** — все биты равны 1 (или “f” в шестнадцатеричной записи).
|
||
- **Стандартные версии UUID** (по спецификации RFC 4122) — всего 5 версий.
|
||
- **Новые версии** — три дополнительных варианта, не описанных в RFC 4122.
|
||
## UUID V1
|
||
![](../meta/files/images/Pasted%20image%2020231112133236.png)
|
||
|
||
UUID версии 1 использует текущее время по григорианскому календарю и имеет следующие особенности:
|
||
- Время записывается в обратном порядке, что делает невозможной сортировку UUID по времени создания.
|
||
- Включает случайную компоненту для увеличения уникальности.
|
||
- Node ID привязан к сетевому оборудованию (обычно к MAC-адресу). Это значение рекомендуется подменять на псевдослучайное для повышения конфиденциальности.
|
||
|
||
**Недостатки:**
|
||
- Не подходит для сортировки по времени.
|
||
|
||
**Преимущества:**
|
||
- Быстрая вставка в базу данных, независимо от размера данных.
|
||
- UUID сложно перебрать за счет высокой энтропии.
|
||
- Возможность извлечь метку времени из идентификатора.
|
||
## UUID V3
|
||
![](../meta/files/images/Pasted%20image%2020231112133916.png)
|
||
|
||
UUID версии 3 (V3) — это идентификатор, основанный на алгоритме хеширования [[cryptography/MD5|MD5]]. В отличие от UUID версии 1, который использует текущее время, UUID V3 генерируется на основе имени (строки) и пространства имен (namespace). Основная идея заключается в том, что при использовании одинаковых имени и пространства имен результатом всегда будет один и тот же UUID.
|
||
|
||
**Пример использования:** Когда нужно сгенерировать уникальный идентификатор для имени домена в сети, применяется UUID V3 с пространством имен **DNS** и строкой, содержащей доменное имя. Например:
|
||
|
||
```
|
||
UUID(DNS, "example.com") → 5df41881-3aed-3515-88a7-2f4a814cf09e
|
||
```
|
||
|
||
**Преимущества:**
|
||
- **Детерминированность**: один и тот же вход (имя + пространство имен) всегда генерирует одинаковый UUID, что удобно, если требуется уникальный идентификатор для конкретного объекта, который может быть повторно создан.
|
||
|
||
**Недостатки:**
|
||
- **Зависимость от MD5**: Алгоритм [[cryptography/MD5|MD5]] считается криптографически уязвимым, что делает UUID V3 неподходящим для использования в приложениях, требующих высокой безопасности.
|
||
- **Не случайный**: В отличие от UUID версии 1 или 4, UUID V3 предсказуем, так как основывается на статическом входе.
|
||
## UUID V4
|
||
![](../meta/files/images/Pasted%20image%2020231112133824.png)
|
||
|
||
UUID версии 4 (V4) — это случайный идентификатор, где большинство битов генерируются случайным образом. Вся структура UUID V4 почти полностью случайна, за исключением 6 бит, зарезервированных для указания версии и варианта.
|
||
|
||
**Преимущества:**
|
||
- **Сложность перебора**: Из-за случайной природы UUID V4 крайне сложно предугадать следующий идентификатор или перебрать все возможные значения. Всего существует 2^{122} возможных вариантов UUID V4, что делает их практически уникальными в реальных условиях.
|
||
- **Простота генерации**: Процесс создания UUID V4 не требует внешних данных (время, имя или пространство имен), что делает его проще в реализации и использовании.
|
||
- **Конфиденциальность**: Поскольку в UUID V4 нет привязки к времени или аппаратному обеспечению (в отличие от V1), он не раскрывает никакой дополнительной информации, такой как метка времени или MAC-адрес устройства.
|
||
|
||
**Недостатки:**
|
||
- **Не сортируемый**: UUID V4 нельзя отсортировать по времени или другим критериям, так как он полностью основан на случайных данных.
|
||
- **Замедленная вставка в БД**: В больших базах данных, по мере увеличения количества записей, время вставки новых записей с UUID V4 может расти. Это связано с тем, что случайные значения распределяются неравномерно, что может вызывать фрагментацию [[../../../_inbox/Индекс в БД|индексов]], особенно при использовании кластеризованных индексов.
|
||
- **Не содержит полезной информации**: В отличие от UUID версий 1 и 3, UUID V4 не хранит никаких дополнительных данных (например, метку времени или привязку к конкретному объекту).
|
||
## UUID V5
|
||
![](../meta/files/images/Pasted%20image%2020231112134012.png)
|
||
|
||
UUID версии 5 (V5) очень похож на UUID версии 3 (V3), с той лишь разницей, что вместо [[cryptography/Хеш-функция|хеш-функции]] [[cryptography/MD5|MD5]] используется более современная и безопасная [[cryptography/Хеш-функция|хеш-функция]] SHA-1. Как и в случае с V3, UUID V5 генерируется на основе входных данных — имени и пространства имен (namespace).
|
||
|
||
**Преимущества:**
|
||
- **Детерминированность**: Как и UUID V3, версия 5 всегда генерирует один и тот же UUID для одного и того же сочетания имени и пространства имен.
|
||
- **Современная хеш-функция**: В отличие от устаревшего и криптографически слабого [[cryptography/MD5|MD5]], SHA-1 обеспечивает более высокую безопасность, хотя и не является идеальной для криптографических приложений в наше время.
|
||
- **Уникальность в пределах пространства имен**: Гарантирует уникальность идентификаторов при использовании различных пространств имен.
|
||
|
||
**Недостатки:**
|
||
- **Время вставки в базу данных**: В больших базах данных с увеличением количества записей может увеличиваться время вставки, особенно если UUID используется как индекс. Это связано с неравномерностью распределения случайных значений.
|
||
- **Не сортируемый**: Как и UUID V4, идентификаторы версии 5 не могут быть отсортированы по времени или другим логическим критериям, поскольку они зависят от хеширования входных данных.
|
||
- **Не хранит полезной информации**: UUID V5 не содержит дополнительных данных, таких как метка времени, информация о хосте или устройстве.
|
||
## UUID V6
|
||
![](../meta/files/images/Pasted%20image%2020231112133512.png)
|
||
|
||
UUID версии 6 (V6) был разработан для устранения одного из ключевых недостатков UUID версии 1 (V1) — невозможности сортировки. UUID V6 сохраняет идею использования времени для генерации идентификатора, но изменяет порядок записи временной метки, что позволяет идентификаторам быть сортируемыми по времени.
|
||
|
||
**Преимущества:**
|
||
- **Сортируемость**: Главное отличие UUID V6 от V1 — это возможность сортировки идентификаторов по времени их создания. UUID V6 можно отсортировать по времени.
|
||
- **Метка времени**: UUID V6 сохраняет возможность извлечения метки времени из идентификатора, что полезно для некоторых приложений, где важно отслеживать время создания записи.
|
||
- **Конфиденциальность**: Как и в V1, UUID V6 может включать привязку к оборудованию (например, MAC-адрес), но рекомендуется использовать псевдослучайные данные для повышения конфиденциальности.
|
||
|
||
**Недостатки:**
|
||
- **Сложность в использовании с кластеризованными индексами**: Хотя UUID V6 улучшает сортировку, время вставки в базу данных может увеличиваться при большом количестве записей, особенно если используется кластеризованный индекс, который требует поддержания порядка.
|
||
- **Не случайный**: В отличие от UUID V4, версия 6 не является полностью случайной, что может быть недостатком в сценариях, где важна непредсказуемость.
|
||
## UUID V7
|
||
![](Pasted%20image%2020231112133651.png)
|
||
|
||
UUID версии 7 (V7) представляет собой новую версию UUID, которая использует Unix-время вместо григорианского, применяемого в UUID версии 1 (V1). Такой подход делает UUID V7 более компактным и эффективным для хранения временных меток, поскольку Unix-время занимает меньше места по сравнению с григорианским временем.
|
||
|
||
**Преимущества:**
|
||
- **Сортируемость**: UUID V7 сохраняет временные метки в формате Unix, что делает его естественно сортируемым по времени создания. Это полезно для реляционных баз данных, где важен порядок записей.
|
||
- **Константное время вставки**: Поскольку UUID V7 монотонно увеличивается со временем и включает случайные данные, вставка в базу данных происходит с постоянным временем.
|
||
- **Метка времени**: UUID V7 сохраняет метку времени, что позволяет извлечь момент создания идентификатора.
|
||
- **Сложность перебора**: UUID V7 сохраняет высокий уровень уникальности за счет случайных битов, что делает его труднопредсказуемым и сложным для перебора.
|
||
|
||
**Недостатки:**
|
||
- **Меньшая случайность в начальной части**: Поскольку первые биты связаны с временной меткой, это снижает уровень случайности в первой части UUID. Однако это компенсируется случайной частью идентификатора.
|
||
|
||
UUID V7 может иметь несколько типов генерации, в зависимости от требуемого уровня случайности и последовательности.
|
||
1. **Тип 1 (по умолчанию)**: `UuidCreator.getTimeOrderedEpoch();`
|
||
- **Плюсы**: Сортируемый, достаточно быстрый, подходит для большинства приложений, где важна как уникальность, так и последовательность.
|
||
- **Минусы**: Более низкий уровень случайности по сравнению с другими типами.
|
||
2. **Тип 2 (плюс 1)**: `UuidCreator.getTimeOrderedEpochPlus1();`
|
||
- Обеспечивает более высокую уникальность и последовательность за счет монотонного увеличения.
|
||
- **Плюсы**: Подходит для приложений, требующих строгого соблюдения порядка идентификаторов.
|
||
- **Минусы**: Менее случаен, чем Тип 3.
|
||
- **Производительность**: Генерируется в 20 раз быстрее, чем `UUID.randomUUID()`.
|
||
3. **Тип 3 (плюс n)**: `UuidCreator.getTimeOrderedEpochPlusN()`;
|
||
- **Особенности**: Максимальная уникальность за счет случайного увеличения.`
|
||
- **Плюсы**: Подходит для сценариев, требующих высокой уникальности без строгих требований к последовательности.
|
||
- **Минусы**: Меньшая предсказуемость и последовательность по сравнению с Типами 1 и 2.
|
||
- **Производительность**: Генерируется в два раза быстрее, чем `UUID.randomUUID()`.
|
||
## Производительность
|
||
Генерируем по 200000 идентификаторов в цикле, после чего вставляем эти данные.
|
||
|
||
![](../meta/files/images/Pasted%20image%2020231112141139.png)
|
||
|
||
Массовое чтение, через IN
|
||
![](../meta/files/images/Pasted%20image%2020231112141352.png)
|
||
|
||
![](../meta/files/images/Pasted%20image%2020231112141530.png)
|
||
|
||
***
|
||
## Мета информация
|
||
**Область**:: [[../meta/zero/00 Разработка|00 Разработка]]
|
||
**Родитель**::
|
||
**Источник**::
|
||
**Автор**::
|
||
**Создана**::
|
||
### Дополнительные материалы
|
||
- [ID-баттл: UUID vs автоинкремент / Валентин Удальцов - YouTube](https://www.youtube.com/watch?v=Xr_SNd9LIng&t=1762s)
|
||
- [Библиотека для генерации UUID в Java. Все версии](https://github.com/f4b6a3/uuid-creator)
|
||
- [[../../../_inbox/Автоинкремент|Автоинкремент]]
|
||
### Дочерние заметки
|
||
<!-- QueryToSerialize: LIST FROM [[]] WHERE contains(Родитель, this.file.link) or contains(parents, this.file.link) -->
|