信息:平面文件读取问题



我需要从包含自由文本数据的平面文件中读取数据(即每列的列长度为 32000,文件中有 8-9 列(。由于列具有自由文本数据,因此如果我在 informatica 映射中定义分隔符,用户可以在数据中添加任何可能违反分隔符的值。此外,由于源代码级别的字段长度很大,因此使用固定宽度属性并不容易。

可以请有人在这里帮我吗,有什么方法可以在固定宽度属性中定义分隔符???

数据示例:

专栏1|自由文本字段1|自由文本字段2|约翰|你几岁了?你住在哪里?|性别 男|女性, 在职 : 是|否

在您提供的示例中,您首先将管道作为分量计,然后有人决定使用管道来指定替代值......这使您可以选择开发复杂的代码解决方法以适应这些异常(例如,在将平面文件读入 Informatica 之前标记已知异常,然后在稍后的映射中取消标记它们(,或者从设计空间获得同意的政治任务,以避免使用管道来表示替代选择(可以使用/代替(并对自由文本输入字段进行验证以禁止管道字符(也有一些修改现有模板以防止输入这些模板(

一种方法是使用复杂的多字符分隔符。我不确定您是否可以在源头强制执行。

你有 9 列,每列大小为 32000, 您的固定文件定义应具有 1-32000|32001-64002|......|, 加载平面文件后,应截断右侧或左侧空格。

固定平面文件将具有固定的列长度,您不能以固定格式指定任何分隔符,如果这样做,则它不再是固定文件格式。

谢谢米克里希南

最新更新