为什么 ActiveSupport::JSON.encode 这么慢?



JRuby 9.2, Rails 4.2

我一直在读取/转储大型 JSON 对象,100+MB 文件,这些文件通常会挂起几分钟,然后在写出它们时耗尽内存。

我注意到它特别发生在使用to_json时。下面是一个 4MB 的文件,因此它实际上完成了:

pry(main)> f = File.open('nvdcve-1.0-recent.json'){|f| JSON.load(f) }
pry(main)> puts Benchmark.measure{ JSON.dump(f) }
0.230000   0.010000   0.240000 (  0.081894)
=> nil
pry(main)> puts Benchmark.measure{ f.to_json }
1.020000   0.020000   1.040000 (  0.820851)
=> nil

问题的根源是ActiveSupport在一堆事情上覆盖了to_json

pry(main)> f.method(:to_json)
=> #<Method: Hash#to_json(to_json_with_active_support_encoder)>
pry(main)> puts Benchmark.measure{ f.to_json_without_active_support_encoder }
0.040000   0.000000   0.040000 (  0.035408)
pry(main)> puts Benchmark.measure{ f.to_json_with_active_support_encoder }
1.170000   0.010000   1.180000 (  0.812674)

看这里: https://apidock.com/rails/Object/to_json_with_active_support_encoder

那么,ActiveSupport::JSON.encode与 JSON gem 的to_json究竟有什么不同,导致它的速度如此之慢,即使在一开始就从 JSON 文件加载的不起眼的 JSON 文件上也是如此?

如果我覆盖to_json而不使用ActiveSupport变体,我会破坏任何Rails功能吗?

tl;大卫ActiveSupport::JSON#encode正在做三件额外的事情。

  1. 调用as_json要求每个对象提供适合序列化的数据结构。
  2. 将数据"jsonization"为JSON原语并处理递归。
  3. 转义字符串中的 HTML。

JSON.dump决定事情将如何变成 JSON,你无法控制。as_json回调允许您准确控制对象的转储方式。对于简单对象,这会增加一些开销。对于其他所有事情,这都非常重要。

jsonify使倾倒对象更容易。它咀嚼的时间约为29%。

这允许开发人员实现 #as_json,而不必担心允许他们返回哪些基本类型的对象,也不必担心以递归方式调用 #as_json。

转义 HTML 允许人们将 JSON 放入 HTML 页面。这大约是38%的时间。这对于咀嚼这么多时间的用处有限。不幸的是,它不能轻易关闭。这可能是一个值得的补丁。

只有 10% 花费在真正的 JSON 编码器中。这与我的基准测试结果大致一致。

[12] pry(main)> puts Benchmark.measure{ ActiveSupport::JSON.encode(h) }
1.241299   0.009459   1.250758 (  1.253938)
=> nil
[13] pry(main)> puts Benchmark.measure{ JSON.dump(h) }
0.117118   0.003333   0.120451 (  0.120881)

注意:这是Ruby 2.6.3和Rails 5.2.3。这就是我所拥有的,旧版本的性能问题不太有趣。您可以自己运行它们,我希望它大致相同。

ruby-prof运行它,我们可以看到JSON.dump将所有时间都花在了几个函数上。

$ rails -e 'require "json"; require "ruby-prof"; h = File.open("nvdcve-1.0-recent.json"){|f| JSON.load(f) }; result = RubyProf.profile { JSON.dump(h) }; printer = RubyProf::GraphPrinter.new(result); printer.print(STDOUT, {})' > json.prof
------------------------------------------------------------------------------------------------------------------------------------------------------
0.275      0.134      0.000      0.141              1/1     <Module::JSON>#generate
99.98%  48.78%      0.275      0.134      0.000      0.141                1     JSON::Ext::Generator::State#generate 
0.097      0.097      0.000      0.000    401143/401143     String#encode
0.021      0.021      0.000      0.000    101047/101047     Hash#keys
0.021      0.021      0.000      0.000    213358/213358     String#to_s
0.001      0.001      0.000      0.000        2058/2058     Float#to_s
------------------------------------------------------------------------------------------------------------------------------------------------------
0.097      0.097      0.000      0.000    401143/401143     JSON::Ext::Generator::State#generate
35.26%  35.26%      0.097      0.097      0.000      0.000           401143     String#encode                  
------------------------------------------------------------------------------------------------------------------------------------------------------
0.021      0.021      0.000      0.000    101047/101047     JSON::Ext::Generator::State#generate
7.79%   7.79%      0.021      0.021      0.000      0.000           101047     Hash#keys                      
------------------------------------------------------------------------------------------------------------------------------------------------------
0.021      0.021      0.000      0.000    213358/213358     JSON::Ext::Generator::State#generate
7.77%   7.77%      0.021      0.021      0.000      0.000           213358     String#to_s                    
------------------------------------------------------------------------------------------------------------------------------------------------------
  • 49% 实际生成 JSON。
  • 8% 迭代哈希键。
  • 35% 在String#encode,大概是为了确保所有字符串都按要求UTF-8
  • 8%串化的东西。

现在有了ActiveSupport::JSON.encode(h).出于某种原因,h.to_json不会从命令行encode,但它会在控制台中完成。

$ rails -e 'require "json"; require "ruby-prof"; h = File.open("nvdcve-1.0-recent.json"){|f| JSON.load(f) }; result = RubyProf.profile { ActiveSupport::JSON.encode(h) }; printer = RubyProf::GraphPrinter.new(result); printer.print(STDOUT, {})' > as.prof

它的配置文件更复杂。从顶部开始。

------------------------------------------------------------------------------------------------------------------------------------------------------
3.020      0.000      0.000      3.020              1/1     <Module::ActiveSupport::JSON>#encode
96.58%   0.00%      3.020      0.000      0.000      3.020                1     ActiveSupport::JSON::Encoding::JSONGemEncoder#encode /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/json/encoding.rb:34
1.483      0.000      0.000      1.483              1/1     ActiveSupport::JSON::Encoding::JSONGemEncoder#stringify
0.894      0.000      0.000      0.894         1/519065     ActiveSupport::JSON::Encoding::JSONGemEncoder#jsonify
0.643      0.000      0.000      0.643         1/101047     Hash#as_json
0.000      0.000      0.000      0.000         1/305710     Kernel#dup
------------------------------------------------------------------------------------------------------------------------------------------------------

它花费了95%的时间ActiveSupport::JSON::Encoding::JSONGemEncoder#encode

def encode(value)
stringify jsonify value.as_json(options.dup)
end

value.as_json要求值返回它希望序列化为 JSON 的数据结构。这分散在不同的方法中。

这些本身不会占用很多时间,但它们确实会占用总时间的 21%。

------------------------------------------------------------------------------------------------------------------------------------------------------
0.634      0.009      0.000      0.625      9800/101047     Hash#each
0.642      0.075      0.000      0.567     91246/101047     Array#map
0.643      0.000      0.000      0.643         1/101047     ActiveSupport::JSON::Encoding::JSONGemEncoder#encode
20.56%   2.69%      0.643      0.084      0.000      0.559           101047    *Hash#as_json                   /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/core_ext/object/json.rb:157
0.643      0.031      0.000      0.612    101047/202094     Enumerable#map
0.036      0.036      0.000      0.000    101047/202094     <Class::Hash>#[]
------------------------------------------------------------------------------------------------------------------------------------------------------
0.643      0.003      0.000      0.639      10311/10311     Hash#each
20.56%   0.11%      0.643      0.003      0.000      0.639            10311    *Array#as_json                  /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/core_ext/object/json.rb:151
0.643      0.051      0.000      0.592      10311/20623     Array#map
------------------------------------------------------------------------------------------------------------------------------------------------------
0.000      0.000      0.000      0.000      1102/187785     Array#map
0.033      0.033      0.000      0.000    186683/187785     Hash#each
1.05%   1.05%      0.033      0.033      0.000      0.000           187785     String#as_json                 /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/core_ext/object/json.rb:86
------------------------------------------------------------------------------------------------------------------------------------------------------
0.001      0.001      0.000      0.000        2058/4116     Hash#each
0.001      0.001      0.000      0.000        2058/4116     ActiveSupport::JSON::Encoding::JSONGemEncoder#jsonify
0.05%   0.04%      0.002      0.001      0.000      0.000             4116     Float#as_json                  /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/core_ext/object/json.rb:106
0.000      0.000      0.000      0.000        4116/4116     Float#finite?
------------------------------------------------------------------------------------------------------------------------------------------------------

jsonifyas_json结构转换为 JSON 基元。"这允许开发人员实现#as_json,而不必担心允许他们返回哪些基本类型的对象,也不必担心必须记住递归调用#as_json。 这占用了大约 29% 的总时间。

------------------------------------------------------------------------------------------------------------------------------------------------------
0.894      0.107      0.000      0.787     92348/519065     Array#map
0.894      0.224      0.000      0.670    426716/519065     Hash#each
0.894      0.000      0.000      0.894         1/519065     ActiveSupport::JSON::Encoding::JSONGemEncoder#encode
28.60%  10.59%      0.894      0.331      0.000      0.563           519065    *ActiveSupport::JSON::Encoding::JSONGemEncoder#jsonify /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/json/encoding.rb:85
0.894      0.036      0.000      0.858    101047/202094     Enumerable#map
0.894      0.029      0.000      0.866      10311/20623     Array#map
0.193      0.129      0.000      0.064    401143/401153     Class#new
0.130      0.130      0.000      0.000  1104275/1104283     Module#===
0.031      0.031      0.000      0.000    101047/202094     <Class::Hash>#[]
0.001      0.001      0.000      0.000        2058/4116     Float#as_json
0.001      0.001      0.000      0.000        2533/5066     FalseClass#as_json
0.000      0.000      0.000      0.000        1973/3946     TrueClass#as_json
------------------------------------------------------------------------------------------------------------------------------------------------------
  • stringify把这一切都交给JSON.generate.
------------------------------------------------------------------------------------------------------------------------------------------------------
1.483      0.000      0.000      1.483              1/1     ActiveSupport::JSON::Encoding::JSONGemEncoder#encode
47.42%   0.00%      1.483      0.000      0.000      1.483                1     ActiveSupport::JSON::Encoding::JSONGemEncoder#stringify /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/json/encoding.rb:101
1.483      0.000      0.000      1.483              1/1     <Module::JSON>#generate
------------------------------------------------------------------------------------------------------------------------------------------------------

JSON.generate呼叫JSON::Ext::Generator::State#generate占总时间的47%。 但是38%花在ActiveSupport::JSON::Encoding::JSONGemEncoder::EscapedString#to_json上,这种方法转义了HTML。 这意味着实际生成 JSON 所花费的时间仅为运行时间的 10%。这与基准测试结果相吻合。

------------------------------------------------------------------------------------------------------------------------------------------------------
1.483      0.228      0.000      1.254              1/1     <Module::JSON>#generate
47.42%   7.31%      1.483      0.228      0.000      1.254                1     JSON::Ext::Generator::State#generate 
1.176      0.271      0.000      0.905    401143/401143     ActiveSupport::JSON::Encoding::JSONGemEncoder::EscapedString#to_json
0.040      0.040      0.000      0.000    213358/213358     ActiveSupport::JSON::Encoding::JSONGemEncoder::EscapedString#to_s
0.037      0.037      0.000      0.000    101047/101047     Hash#keys
0.001      0.001      0.000      0.000        2058/2058     Float#to_s
------------------------------------------------------------------------------------------------------------------------------------------------------
1.176      0.271      0.000      0.905    401143/401143     JSON::Ext::Generator::State#generate
37.63%   8.68%      1.176      0.271      0.000      0.905           401143     ActiveSupport::JSON::Encoding::JSONGemEncoder::EscapedString#to_json /Users/schwern/.rvm/gems/ruby-2.6.3/gems/activesupport-5.2.3/lib/active_support/json/encoding.rb:55
0.614      0.209      0.000      0.405    401143/401143     ActiveSupport::ToJsonWithActiveSupportEncoder#to_json
0.292      0.292      0.000      0.000    401143/401143     String#gsub
------------------------------------------------------------------------------------------------------------------------------------------------------```

根据来源 ActiveSupport::JSON 几乎只是 JSON gem 之上的附加层 - 它实际上完成了大部分繁重的工作。它主要做的是:

转义一些在某些浏览器中可能会出现问题的附加字符。

ESCAPED_CHARS = {
"u2028" => 'u2028',
"u2029" => 'u2029',
">"      => 'u003e',
"<"      => 'u003c',
"&"      => 'u0026',
}

评论没有说明有问题的浏览器是哪些,这对于现代浏览器来说可能完全不是问题。

将对象强制转换为合适的 JSON 表示形式:

# Convert an object into a "JSON-ready" representation composed of
# primitives like Hash, Array, String, Numeric,
# and +true+/+false+/+nil+.
# Recursively calls #as_json to the object to recursively build a
# fully JSON-ready object.
#
# This allows developers to implement #as_json without having to
# worry about what base types of objects they are allowed to return
# or having to remember to call #as_json recursively.
#
# Note: the +options+ hash passed to +object.to_json+ is only passed
# to +object.as_json+, not any of this method's recursive +#as_json+
# calls.
def jsonify(value)
case value
when String
EscapedString.new(value)
when Numeric, NilClass, TrueClass, FalseClass
value.as_json
when Hash
Hash[value.map { |k, v| [jsonify(k), jsonify(v)] }]
when Array
value.map { |v| jsonify(v) }
else
jsonify value.as_json
end
end

这可能是最重要的部分,因为#as_json几乎是模型如何将自己呈现为 JSON 的关键。它还处理强制转换日期和时间戳以及其他非基元(ActiveSupport 为这些提供了#as_json方法)。删除它很可能会破坏很多东西。

根据您的用例,您也许可以从模型对象手动创建 ruby 对象(数组、哈希等)并使用JSON.generate(data)- 我不确定它的性能会更好。

相关内容

  • 没有找到相关文章

最新更新