假设你想生成一个介于 1 到 10 亿之间的随机数:
rand(1..1_000_000_000)
Ruby 会在每次调用这行代码时从该范围创建一个数组吗?
Rubocop建议这种方法超过rand(1_000_000_000)+1
但似乎有潜在的痛苦。
Ruby的文档是这样说的:
# When +max+ is a Range, +rand+ returns a random number where
# range.member?(number) == true.
传递给rand
的参数+max+
,但它没有说明它如何获得number
参数。我也不确定在范围内调用.member?
是否具有性能。
有什么想法吗?
我可以使用基准测试,但仍然对这里的内部工作原理感到好奇。
不,Ruby 不会从该范围创建数组,除非您在Range
对象上显式调用.to_a
方法。事实上,rand()
不适用于数组 -.sample
是从数组返回随机元素的方法。
Range
类包含Enumerable
因此您可以获取 Numerable 的迭代方法,而无需将范围转换为数组。范围的下限和上限是(-Float::INFINITY..Float::INFINITY)
,尽管如果将其传递到rand
,将导致Numerical argument out of domain
错误。
至于.member?
,该方法只是调用一个名为range_cover
的C函数,该函数调用另一个名为r_cover_p
的函数,该函数检查一个值是否在两个数字或字符串之间。
要测试将范围传递到rand
与在数组上调用sample
之间的速度差异,可以执行以下测试:
require 'benchmark'
puts Benchmark.measure { rand(0..10_000_000) }
=> 0.000000 0.000000 0.000000 ( 0.000009)
puts Benchmark.measure { (0..10_000_000).to_a.sample }
=> 0.300000 0.030000 0.330000 ( 0.347752)
正如您在第一个示例中所看到的,将range
作为参数传递给rand
非常快。
相反,在某个范围内调用.to_a.sample
相当慢。这是由于数组创建过程需要将适当的数据分配到内存中。.sample
方法应该相对较快,因为它只是将随机且唯一的索引传递到数组中并返回该元素。
要查看range
的代码,请查看此处。