如何使'head'自动应用于输出?

  • 本文关键字:应用于 输出 何使 head r
  • 更新时间 :
  • 英文 :


我有很多大数据框架,因此每次我想显示它们时,我都必须使用head

head( blahblah(somedata) )

在前几百次之后,打字始终变老了,因此,如果可能的话,我希望一种简单的方法。与Java相比,关于R的很酷的事情之一是,如果您知道秘密咒语,通常会很容易。

我在选项中进行了搜索,并找到了max.print,几乎有效,但现在有时间延迟。

head( blahblah(somedata) )

....是瞬时的(在我的感知的范围内)

options(max.print=100)
blahblah(somedata)

....大约需要3秒钟,所以比键入head

更长

在打印大数据结构时会自动应用head吗?

一个复制此行为的代码:

long_dataset = data.frame(a = runif(10e5), 
                          b = runif(10e5), 
                          c = runif(10e5))
system.time(head(long_dataset))
options(max.print = 6)
system.time(print(long_dataset))

使用data.table软件包(和data.table不是data.frame对象)将我的评论放在答案中行)

library(data.table)
DT <- data.table(long_data)
DT
      1: 0.19613138 0.88714284 0.25715067
      2: 0.25405787 0.76544909 0.75632468
      3: 0.24841384 0.22095875 0.52588596
      4: 0.72766161 0.79696771 0.88802759
      5: 0.02448372 0.77885568 0.38199993
     ---                                 
 999996: 0.28230967 0.09410921 0.84420162
 999997: 0.73598931 0.86043537 0.30147089
 999998: 0.86314546 0.90334347 0.08545391
 999999: 0.85507851 0.46621131 0.23892566
1000000: 0.33172155 0.43060483 0.44173400

data.table常见问题解答2.11显式处理。


编辑以处理您不想转换的现有data.frame对象。

如果您犹豫不决将现有的data.frame对象转换为data.table对象,则可以简单地将print.data.frame定义为data.table:::print.data.table

print.data.frame <- data.table:::print.data.table
long_dataset
      1: 0.19613138 0.88714284 0.25715067
      2: 0.25405787 0.76544909 0.75632468
      3: 0.24841384 0.22095875 0.52588596
      4: 0.72766161 0.79696771 0.88802759
      5: 0.02448372 0.77885568 0.38199993
     ---                                 
 999996: 0.28230967 0.09410921 0.84420162
 999997: 0.73598931 0.86043537 0.30147089
 999998: 0.86314546 0.90334347 0.08545391
 999999: 0.85507851 0.46621131 0.23892566
1000000: 0.33172155 0.43060483 0.44173400

我会随 @thelatemail的建议,即重新定义print.data.frame

print.data.frame <- function(df) {
   if (nrow(df) > 10) {
      base::print.data.frame(head(df, 5))
      cat("----n")
      base::print.data.frame(tail(df, 5))
   } else {
      base::print.data.frame(df)
   }
}
data.frame(x=1:100, y=1:100)
#   x y
# 1 1 1
# 2 2 2
# 3 3 3
# 4 4 4
# 5 5 5
# ----
#       x   y
# 96   96  96
# 97   97  97
# 98   98  98
# 99   99  99
# 100 100 100

更精致的版本可以将所有内容排成一行,避免重复的标头,但是您明白了。

您可以将这种功能放在.RprofileRprofile.site文件中(请参阅?Startup),因此每次开始R会话时都会在那里。

最新更新