小贝子编程

如何使用来自文件系统输入的 Spark 流

本文关键字：Spark 文件系统何使用 apache-spark spark-streaming
更新时间 : 2023-09-06
英文 : How to use spark streaming from a file system input

我想使用Spark流并从文件系统（例如HDFS）提供输入。我将如何做

例如

，当使用JavaStreamingContext时，有适当的方法方法，例如 textFileStream()读取任何文本文件，fileStream()从与Hadoop兼容的文件系统读取文件。将监视作为 API 参数传递的目录是否有更改。如果您要将任何文件移动到那里，它将由流应用程序根据批处理间隔拾取。

请查看我在github上的简单示例，以从Twitter或文件系统读取数据。

希望这会有所帮助。

最新更新

android WebView:复制到剪贴板[https://poe.com]
为什么我的web scraper将所有内容写在一行中?
无法获取…的applicationId项目类型:PROJECT_TYPE_LIBRARY
实例化prefab内部的对象
如何在html文本区的左上角放置按钮?
如何使用Nodejs API获取数据
为什么"需要'原生'"在 opalrb 中抛出异常？
c -结构体中char指针的内存分配
Azure功能应用程序与自托管集成运行时相结合
类型 'String' 不是类型转换中 'List<String>' 类型的子类型？
__init__是一个类属性吗?
如何格式化LocalDateTime yyyy-MM-dd HH:mm到dd-MM-yyyy HH:mm作为字符串的整个
为什么客户端组件不工作- NextJS 13.3.0实验特性
跨行扩展字典，维护其他列- python
如何将open()加载的数据编码为UTF-8?
这个Golang程序中的同步问题
如何使用Caliburn在MVVM中重用新视图.微观和微观
如何np.用张量连接列表?
基于文件名移动文件
Toast消息不显示当我点击按钮
r语言 - 如何在环境中运行任意表达式，并将所有结果存储在环境中?
Picutre 未显示在警报对话框中
如何在SQL Server中赋予用户CREATE DATABASE的权限?
选项importsNotUsedAsValues已弃用
在c# WinForms中不维护更改鼠标指针
Rust执行类型转换在运行时或在编译静态?
我如何在log4net中指定一个绝对文件路径，使用datePattern?
如何在服务端使用pubnub w/ nodejs作为服务，并从不同的客户端连接到该nodejs服务器
用下划线替换其中任意一个字符
Typescript在访问映射的Proxy对象时丢失了键类型的特定性

如何使用来自文件系统输入的 Spark 流

相关内容

最新更新

热门标签：