我在 S3 中有一个结构化的分隔文本文件,有两列,冒号作为分隔符,如下所示:
joe@gmail.com:abc
mary@yahoo.com:def
我有一个带有此 grok 表达式的自定义分类器:%{NOTSPACE:email}:%{NOTSPACE:data}
此表达式适用于 grok 表达式测试器:https://grokdebug.herokuapp.com/
但是当我在我的爬虫中运行它时,表被创建,但它有一个空的架构,没有数据。 有什么建议吗? 谢谢。
不得不使用 %{DATA:email}:
%{WORD:data}