我正在处理一个CSV文件,我想使用showcols检查该文件中每列中是否缺少值,但Julia Repl抛出了一个错误。我应该为使用任何包装吗
showcols
似乎在很长一段时间前就曾是DataFrames
中的一个函数(我可以在DataFrames v0.11的文档中找到它的提及-当前版本是v0.22(
假设您的数据确实在DataFrame中,则可以使用describe
来获取摘要统计信息,包括丢失值的数量。
julia> using DataFrames
julia> df = DataFrame(rand(2, 3), :auto);
julia> describe(df)
3×7 DataFrame
Row │ variable mean min median max nmissing eltype
│ Symbol Float64 Float64 Float64 Float64 Int64 DataType
─────┼──────────────────────────────────────────────────────────────────────
1 │ x1 0.614285 0.301365 0.614285 0.927204 0 Float64
2 │ x2 0.635276 0.588937 0.635276 0.681614 0 Float64
3 │ x3 0.235452 0.231867 0.235452 0.239037 0 Float64
此外,对于DataFrame和许多其他表,您可以迭代列,并通过例如进行来检查是否遗漏
julia> (sum ∘ (x -> ismissing.(x))).(eachcol(df))
3-element Vector{Int64}:
0
0
0