我正在尝试建立一个Apache Samza和Kafka环境。我在尝试运行模块时遇到一些问题。
我让 Kafka 正常工作,但我无法使 Samza 工作。我已经安装了两个 Debian Jeesy AMD64 盒子,并按照 Samza 文档的说明进行操作:
apt-get install openjdk-7-jdk openjdk-7-jre git maven
git clone http://git-wip-us.apache.org/repos/asf/samza.git
cd samza
./gradlew clean build
当我尝试启动应该使用 Samza 提供的脚本启动 Yarn AppMaster 的脚本时:
/opt/samza/samza-shell/src/main/bash/run-am.sh
我收到此错误:
Error: Main class org.apache.samza.job.yarn.SamzaAppMaster has not been found or loaded
如果我尝试使用 run-job.sh 脚本运行测试作业
./run-job.sh --config-factory=org.apache.samza.config.factories.PropertiesConfigFactory --config-path=file://$PWD/deploy/samza/config/wikipedia-feed.properties
我在引用org.apache.samza.job.JobRunner类时遇到类似的错误。
我认为我有一个 java 配置问题,但我找不到太多帮助或参考。
有谁知道我做错了什么?
仍然不工作,但我已经领先一步。当从路径执行 Samza 提供的脚本时,它们希望位于/bin/文件夹中,并且它们需要有一个/lib/一个,所有 samza .jar 文件都应该位于该文件夹中。
我仍然有一些依赖项问题,但存在不同的问题。