小贝子编程

使用GNU并行提高awk性能

本文关键字：awk 性能 GNU 并行使用 awk parallel-processing gnu-parallel
更新时间 : 2023-09-20
英文 : Boost awk performance using GNU parallel

我有一些包含.csv.gz文件的子目录。使用awk，我可以根据第1列和第2列中的值筛选文件，并将结果转储到单个.csv.gz文件中。

pigz -rdc /path/to/dir/ | awk -F, '{ if(($1>100) && ($2>100)) {print} }' | pigz > output.csv.gz

得益于pigz，bash管道的前端和端部可以从并行处理中获益。我想知道如何使用GNU并行工具并行执行awk作业。

doit() {
pigz -dc "$1" | awk -F, '{ if(($1>100) && ($2>100)) {print} }'
}
export -f doit
find /path/to/dir -name '*.gz' | parallel doit | pigz > output.csv.gz

最新更新

当axios在React中请求时，Ruby on Rails不包括头部的授权令牌，但它可以与Postman一起工作.&l
为什么我在使用pylab制作条形图时收到此错误
如何在应用程序中设置代理URI.Quarkus, Camel和AMQ的性质
没有原始sql查询的DRF嵌套序列化
Test-NetConnection -AsJob?
将api响应操作为对象键/值对列表
尝试将列表向右移动的次数，用列表的第一个值填充左侧
python asyncio cancel run_in_executor阻塞主线程
如何在visual basic中根据用户输入声明变量
为什么我的Django数据库刷新命令不起作用
在html和angular上使用canvas的动态id
如何制作合适的函数包装器
Regex显示字符串中的第一组数字
Python:对文本页面(文件)中的脚注重新编号的算法
AuthClient 不是一个类型，因此它不能用作类型参数 - Dart 包googleapis_auth
如何在mysql查询中格式化unix时间戳并剥离后缀?
表示Last_Name + First_Name有一条特定值的记录
Django Form这么多字段
Default如何将create_function更改为匿名函数?
Pandas组按行数百分比排序
从Word文档转换为PDF，显示错误的标题
UE4 -对特定角色施加伤害
堆栈中的帧指针是什么?这个框架到底是什么?(汇编中的堆栈)
如何使string.strip()剥离多个字符?
Git 连接问题。 "fatal: unable to connect to github.com....."
使用SingleStore连接两个带有整数字符串的表
将用户输入的值替换为React中由状态分配的值
如何从JSchema获取父对象名称/映射JsonObjects到新的父对象
为pandas数据框架列添加字符串，其中包含多个逗号分隔值
我试图在python中创建一个虚拟环境，但我得到错误:未能找到内置解释器python_spec=python3.5的发现

使用GNU并行提高awk性能

相关内容

最新更新

热门标签：