小贝子编程

zgrep in hadoop streaming

本文关键字：streaming hadoop in zgrep amazon-web-services hadoop amazon-s3
更新时间 : 2023-09-10
英文 : zgrep in hadoop streaming

我试图在S3/AWS＆amp;将输出写入具有相同文件名的新位置

我在S3上使用以下使用，这是编写First Cat Command到HDFS输出的流量输出的正确方法吗？

hadoop fs -cat s3://analytics/LZ/2017/03/03/test_20170303-000000.tar.gz | zgrep -a -E '*word_1*|*word_2*|word_3|word_4' | hadoop fs -put - s3://prod/project/test/test_20170303-000000.tar.gz

鉴于您正在使用Hadoop，为什么不在集群中运行代码？扫描.gzip文件中的字符串很常见，尽管我不知道.tar文件。
我会亲自使用-copyToLocal和-copyFromLocal命令将其复制到本地FS并在此处工作。诸如-cat之类的问题是在Hadoop客户端代码上记录了很多东西，因此管道可能会捡起太多的外部crufft，

最新更新

如何在WrapPanel中获得元素的坐标?
如何检查webpack.config.js中的监视模式?
如何创建动态正则表达式生成器?
ActorReferences作为Akka中其他角色的成员变量
我不知道有什么区别
文字SQL工作：数组值必须以"{"或维度信息开头
Go-使函数与外观相似的结构切片一起工作的惯用方法
在一个弹出窗口中管理多个输入的焦点
r语言 - 进行单向方差分析
当应用程序保持打开状态时，标识会话超时
在cmake中使用PUBLIC/PRIVATE/INTERFACE的例子
不能将反射字段强制转换为映射
return NULL for whois python3
Sequelize如何将日期格式设置为YYYY-MM-DD HH:mm:ss并将列保持蛇形大小写 &
如何从给定字符串中删除字符?(python中的字符串操作)
WMI wbemtest错误0x80070005访问被拒绝
如何从Android应用程序发送数据到Node.js
单元格列表与LazyVGrid有时消失
flutter stripe付款错误尚未初始化付款单
在使用@ pip安装需求时，部署到heroku失败
setTimeout结束后如何填充元素?
如何在pandas中插入和填充计算值的行?
你如何找到一台PC上的gpu数量?
使用client_states作为状态的自定义聚合器
带相关函数的Numba提前(AOT)编译
Azure Function SQL输入绑定在AddAsync上失败
Net:: HTTP.HTTPS Headers get失败
如何清除fileInput数据和相应的对象在R Shiny?
salesforce获取闪电组件中的帐户id
如何使用SQLite设置和访问Shopify会话?

zgrep in hadoop streaming

相关内容

最新更新

热门标签：