生成唯一 ID 的可能方法?
創建唯一 id 的不同方法:
自增ID
與 GUID 相比,自增Id 往往占用更少的空間更容易索引。它是一個很好的聚集索引,随着新記錄的有序保存,碎片更少,這更容易連接表。如果我們使用數據庫提供的自動生成的增量 id,那麼查詢和查找數據會變得更快,因為是有序的。但是這種方法可能不是最适合分布式系統,因為 2 個數據庫可以生成相同的 id,存在ID碰撞。
GUID
GUID 的唯一性取決于用于生成它的算法。
GUID 會重複嗎?
GUID 是一個128 位整數(16 個字節),可以在需要唯一标識符的所有計算機和網絡中使用。
GUID 隻是微軟對 UUID 的實現,UUID/GUID 的問題是尺寸比較大,所以索引不好。因此查詢性能會受到影響。
MongoDB 的ObjectId
Objectid 的長度為 12 字節,由以下部分組成:
- 以秒為單位的 4 字節的時間戳,
- 一個 3 字節的機器标識符,
- 一個 2 字節的進程 ID,以及
- 一個 3 字節的計數器,從一個随機值開始。
與類似 sql 的數據庫的自增ID相比,它的長度仍然更長。
數據庫唯一ID
這種方法使用一個額外的數據庫,其主要目的是創建唯一的 id,調用集中數據庫創建一個唯一的id。這種方法的問題是我們需要一個額外的數據庫,并且性能受限數據庫的性能,
Twitter雪花
Snowflake 是一種算法服務,可大規模生成唯一 ID 号,并提供一些簡單的保證。ID 為 64 位長。
id 由以下部分組成:
- 時間 — 41 位
- 配置的機器 id — 10 位 — 最多 1024 台機器
- 序列号 — 12 位
ID 緊湊而簡短(與 GUID 和 ObjectId 相比),且有序的。
補充:也可以了解百度 美團的分布式ID算法實現,大同小異;同時也可以基于雪花自定義擴展等
結論
在需要唯一ID的情況下,首先要弄清楚的是想要的數據庫架構類型——分布式/分片或單一數據庫。
,