我有一个要求,如果给出了 DataInputStream
,我将把句柄返回到另一个 DataInputstream
,从而可以过滤出具有特定text-patterns的内容(与匹配的内容相匹配的内容正则表达式)。
有人可以为我提供有关如何解决问题的任何指针吗?有库可以执行此操作吗?
根据建议编辑。
我想在org.apache.hadoop.fs.fs.fsdatainputstream上构建过滤流。此类(FSDATAINPUTSTREAM)是Apache Hadoop-Common项目的一部分。目的是提供FSDATAINPUTSTREAM的手柄,该手柄还将正则表达式应用于流。我知道FSDATAINPUTSTREAM是字节流(如果不是这样,请纠正我),我们需要在使用过滤器之前转换为字符流。
标准库提供了FilterInputStream(请参阅https://docs.oracle.com/javase/7/docs/api/java/io/filterinputstream.html)
这个想法是在将数据返回给呼叫者之前,将此类别分类并覆盖方法并滤除正则表达式。
由于它扩展了InputStream,因此可以在预期输入流的任何地方使用。