我正在尝试将几个大型机数据集拉入HDFS。sqoop中有一个支持大型机连接的选项。我遇到的问题是,很少有大型机文件包含打包的十进制(comp-3)和二进制(comp)字段。
我的问题是:
-
Sqoop使用大型机插件完成将EBCDIC转换为ASCII的工作。但是,它是否默认支持转换打包的十进制字段?
-
如果没有,我如何完成这个并加载到HDFS ?任何开源实用程序都可以完成此工作。
-
是否可以通过sqoop命令传递主机文件的元数据(copybook) ?
谢谢,Vinoth
- 没有
- 我还没有测试过,但看起来很有希望http://rbheemana.github.io/Cobol-to-Hive/ 为了做到这一点,copybook必须通过主机的ftp可见。