以下是要求:
必须是字母数字,8-10个字符,以便用户友好。这些将作为唯一密钥存储在数据库中。我使用Guids作为主键,所以最好选择使用GUID来生成这些唯一的ID。
我正在思考一个base-n转换器的行,它采用Guid并转换为一个8个字符的唯一字符串。
短的、轻量级的算法是首选,因为它通常被称为。
8 characters - perfectly random - 36^8 = 2,821,109,907,456 combinations
10 characters - perfectly random - 36^10 = 3,656,158,440,062,976 combinations
GUID's - statistically unique* - 2^128 = 340,000,000,000,000,000,000,000,000,000,000,000,000 combinations
*GUID在所有情况下都是唯一的吗?[stackoverflow]
GUID->字符转换的问题;虽然GUID在统计上是唯一的,但通过取任意子集,可以减少随机性并增加冲突的几率。你当然不想创建非不合格的SKU。
解决方案1:
使用与对象和业务规则相关的数据创建SKU。
即可能存在使对象唯一的属性的小组合(自然键)。组合自然键的元素,对它们进行编码和压缩以创建SKU。通常,您只需要一个日期-时间字段(即CreationDate)和一些其他属性即可实现这一点。在创建sku时可能会有很多漏洞,但sku与用户更相关。
假设:
Wholesaler, product name, product version, sku
Amazon, IPod Nano, 2.2, AMIPDNN22
BestBuy, Vaio, 3.2, BEVAIO32
解决方案2:
一种方法,它保留一系列数字,然后按顺序释放它们,并且从不两次返回相同的数字。你仍然可以在这个范围内找到洞。尽管您可能不需要生成足够的sku,但请确保您的需求允许这样做。
一种实现是在具有计数器的数据库中具有key
表。计数器在事务中递增。重要的一点是,软件中的方法不是递增1,而是抓取一个块。伪c#代码如下。
-- what the key table may look like
CREATE TABLE Keys(Name VARCHAR(10) primary key, NextID INT)
INSERT INTO Keys Values('sku',1)
// some elements of the class
public static SkuKeyGenerator
{
private static syncObject = new object();
private static int nextID = 0;
private static int maxID = 0;
private const int amountToReserve = 100;
public static int NextKey()
{
lock( syncObject )
{
if( nextID == maxID )
{
ReserveIds();
}
return nextID++;
}
}
private static void ReserveIds()
{
// pseudocode - in reality I'd do this with a stored procedure inside a transaction,
// We reserve some predefined number of keys from Keys where Name = 'sku'
// need to run the select and update in the same transaction because this isn't the only
// method that can use this table.
using( Transaction trans = new Transaction() ) // pseudocode.
{
int currentTableValue = db.Execute(trans, "SELECT NextID FROM Keys WHERE Name = 'sku'");
int newMaxID = currentTableValue + amountToReserve;
db.Execute(trans, "UPDATE Keys SET NextID = @1 WHERE Name = 'sku'", newMaxID);
trans.Commit();
nextID = currentTableValue;
maxID = newMaxID;
}
}
这里的想法是保留足够的密钥,这样代码就不会经常进入数据库,因为获取密钥范围是一项昂贵的操作。您需要清楚需要保留的密钥数量,以平衡密钥丢失(应用程序重新启动)与过快耗尽密钥并返回数据库之间的关系。这种简单的实现无法重用丢失的密钥。
因为此实现依赖于数据库和事务,所以您可以让应用程序同时运行,并且所有应用程序都生成唯一的密钥,而无需经常访问数据库。
请注意,以上内容大致基于企业应用程序架构模式(Fowler)第222页的key table
。该方法通常用于在不需要数据库标识列的情况下生成主键,但您可以看到如何根据自己的目的进行调整。
您可以考虑基数36。因为它可以做字母和数字。考虑从你的集合中删除I(眼睛)和O(哦),这样它们就不会与1(一)和0(零)混淆。有些人可能也会抱怨2和Z。
如果你想寻找"用户友好型",你可能想尝试使用整个单词,而不是简单地使其变短/字母数字,因此,类似于:
words = [s.strip().lower() for s in open('/usr/share/dict/canadian-english') if "'" not in s]
mod = len(words)
def main(script, guid):
guid = hash(guid)
print "+".join(words[(guid ** e) % mod] for e in (53, 61, 71))
if __name__ == "__main__":
import sys
main(*sys.argv)
其输出类似于:
oranjestad+compressing+wellspring
padlock+discommoded+blazons
pt+olenek+renews
这很有趣。否则,只需获取guid的前8-10个字符或guid的sha1/md5哈希可能是最好的选择。
最简单的方法是每次需要值时都会增加一个计数器。八位(左零填充)数字可以为您提供一亿个可能的值00000000到99999999(尽管您可能会插入空格或连字符以提高可读性,如000-000-00)。
如果您需要超过1亿个值,您可以增加长度或在其他位置使用字母。使用A0A0A0到Z9Z9Z9可以为您提供超过45亿个可能的价值(456976000)。取一个长整数并产生这样的编码(最右边的数字用mod 10,最右边的字母用div乘以10,然后用mod 26,等等)是一个微不足道的代码。如果你有足够的内存,最快的方法是将计数器转换为mod 260数组,并使用每个mod 260值作为两个字符串数组("A0"、"A1"、"A2"等,通过"A9"、"B0"one_answers"B1"等,到"Z9")的索引。
碱基36(在另一个回复中提到)的问题是,你不仅要担心读者混淆类似的字符(一个与I,零个与O,两个与Z,五个与S),还要担心读者可能认为拼写令人反感或淫秽的单词或缩写的相邻字母的组合。
您可能需要尝试CRC32哈希算法。CRC32生成一个8个字符的字符串。
http://en.wikipedia.org/wiki/Cyclic_redundancy_check
http://textop.us/Hashing/CRC