在ruby中哈希URL的最佳方法是什么?

时间:2020-03-05 18:54:47  来源:igfitidea点击:

我正在写一个指向外部链接的Web应用程序。我正在为我可以在URL中使用的每个文档创建一个非顺序,不可猜测的ID。我做了一件很明显的事情:将url作为字符串并在其上进行str#crypt处理,但这似乎使任何非字母数字的字符(例如,斜杠,点和下划线)都感到窒息。

对解决此问题的最佳方法有何建议?

谢谢!

解决方案

回答

使用Ruby标准库中的Digest :: MD5:

Digest::MD5.hexdigest(my_url)

回答

根据我们希望的字符串长度,可以使用以下几种替代方法:

require 'digest'
Digest.hexencode('http://foo-bar.com/yay/?foo=bar&a=22')
# "687474703a2f2f666f6f2d6261722e636f6d2f7961792f3f666f6f3d62617226613d3232"

require 'digest/md5'
Digest::MD5.hexdigest('http://foo-bar.com/yay/?foo=bar&a=22')
# "43facc5eb5ce09fd41a6b55dba3fe2fe"

require 'digest/sha1'
Digest::SHA1.hexdigest('http://foo-bar.com/yay/?foo=bar&a=22')
# "2aba83b05dc9c2d9db7e5d34e69787d0a5e28fc5"

require 'digest/sha2'
Digest::SHA2.hexdigest('http://foo-bar.com/yay/?foo=bar&a=22')
# "e78f3d17c1c0f8d8c4f6bd91f175287516ecf78a4027d627ebcacfca822574b2"

请注意,这并非不可能,我们可能必须将其与其他(秘密但静态的)数据组合以对字符串加盐:

salt = 'foobar'
Digest::SHA1.hexdigest(salt + 'http://foo-bar.com/yay/?foo=bar&a=22')
# "dbf43aff5e808ae471aa1893c6ec992088219bbb"

现在,为不知道原始内容并且无法访问源代码的人生成此哈希值变得更加困难。

回答

我还建议我们查看摘要名称空间中的不同算法。为了更容易猜测,而不是(或者除了)使用秘密密码加盐之外,还可以使用精确的时间转储:

require 'digest/md5'
def hash_url(url)
  Digest::MD5.hexdigest("#{Time.now.to_f}--#{url}")
end

由于不能保证任何哈希算法的结果都是唯一的,因此在假定哈希可用之前,请不要忘记根据先前生成的哈希检查结果的唯一性。使用Time.now使得重试很容易实现,因为我们只需要调用直到生成唯一的哈希即可。