问题
我有一个数据框(~15000行,90列),其中包含NA的列。在SO上,我发现了多个关于用另一个df或正态分布的值填充NA的问题。但这些答案将破坏专栏本身的当前分布。例子:
Var2NA NA3NANA3
在R进制中:
set.seed(5)
data.frame(lapply(df,(x)replace(x,is.na(x),sample(na.omit(x),sum(is.na(x))))))
Person_ID Var1 Var2
1 A 1 3
2 B 1 2
3 C 2 1
4 D 1 4
5 E 1 3
6 F 1 1
7 G 1 3
8 H 1 1
9 I 2 2
10 J 1 1
11 K 1 3
12 L 2 4
为了保持值的比例,除了@onyambu的建议外,在生成样本时建议包含值的概率。
df[,-1] <- data.frame(apply(df[,-1],
2,
function(x)
replace(x, is.na(x),
sample(sort(unique(na.omit(x))),
sum(is.na(x)),
replace = TRUE,
prob = prop.table(table(x))))))
输出:
> df
Person_ID Var1 Var2
1 A 1 4
2 B 1 2
3 C 2 2
4 D 1 4
5 E 1 3
6 F 1 1
7 G 1 3
8 H 1 1
9 I 2 2
10 J 1 4
11 K 1 3
12 L 1 4
相关内容
- r语言 - left_join,但将NA作为通配符匹配
- r语言 - 将NA替换为行中位数和列中位数的最小值
- 发现R中的单词分布
- r语言 - 从相关矩阵生成数据:二元分布的情况
- r语言 - 删除独占NA的行
- 字符和NA值在r中没有重复和交换的排列
- 将大量数据分布在多行上
- 在多个列之间滚动相关性,有些列带有NA
- 根据r中的条件将所选列的0值替换为NA
- 将默认NA从逻辑更改为字符
- vscode - 无法使用 Gradle 分布'https://services.gradle.org/distributions/gradle-7.2-bin.zip'获取类型 'Gradle
- c# MathNet Gamma分布抽样不匹配
- 将多个列(带NA条件)中的值合并为新列
- 用r中特定分布生成的随机数填充NA值
- r语言 - 替换数据框中的NA,保持列值分布不变
- 根据R中所有变量的性别分布类型,替换NA
- 根据R中的性别分布类型替换NA
- r - 使用带有重复标识符的分布给出具有 NA 的稀疏矩阵
- R-根据因子的分布填充Na值(对于因子值列)
- 在多个条件下合并 R 中的数据库,缺失值 (NA) 分布在整个过程中
最新更新
- Textarea Label in Form: Error: Label元素的for属性的值必须是一个非隐藏表单控件的I
- 如何在没有源文件的情况下使用XSL创建XML
- 通过指针在实例上实现类型的调用函数
- 在批处理脚本中替换而不是添加前缀
- 如果类没有初始化,c++编译器会生成一个defctor吗?
- 在我的代码中没有得到任何方程的答案,我的按钮进入我的字段
- vsto Outlook插件在Outlook 2016和Office 365中的行为不同
- npm install不会在我的React项目中安装任何node模块
- 用两次检查遍历两个列表
- 将图像转换为RGB格式的文本文件,格式为三逗号分隔
- 我正试图找到一种方法将TimeSpan变量转换为秒的整数量
- FCM云消息传递验证令牌
- C多重间接
- 显示数组中元素的倒计时。setInterval 不会导致延迟。最后一个元素立即显示
- sveltekit:等待来自+服务器的数据.t加载函数
- JQuery是:检查每次点击返回两个值
- RxJS中具有共享结果的请求队列
- Beautifulsoup如何添加一些东西到列,如果元素没有显示
- 在Jekyll blog中按2D位置(距离)搜索
- Robocopy在复制过程中向文件名添加日期
- c -间接递归的用例
- 如何将日期对象转换为格式(DD-MM-YYYY)
- 如何从没有使用python硒链接的网站下载文件?
- 用错误处理循环捕获用户输入的最佳方法
- 如何使用内部连接在php发送值从下拉菜单到数据库的两个不同的表
- 我如何得到一个状态的IISreset - true,如果它是启动和false,如果它是停止
- 如何复制列标题"Testing"的列
- 读取文件夹中的多个DOCX文件到多个dataframe时出错
- 无法下载InceptionV3 Keras
- 如何打印数据在模板django的一个不同的表由外键连接?
热门标签:
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium