如果您有任何想法,请提供帮助: 我正在尝试将 Hortonworks hadoop集群 livy 服务器与 jupyter 连接,连接时出现 401 错误
是否可以将 Sparkmagic 连接到 kerberized spark livy 服务器? 如果是,那么我想我在 sparkmagic 配置 json 中有一些配置错误。 用户名和密码是运行服务器的技术用户,当我登录 Jupyterhub 时,在 Hadoop 集群中拥有冒充权(代理用户(而不是实际用户名
它是我的config.json的一部分:
"kernel_python_credentials" : {
"username": "username",
"password": "password",
"url": "http://mylivy.server:8999",
"auth": "Kerberos"
}
"logging_config": {
"version": 1,
"formatters": {
"magicsFormatter": {
"format": "%(asctime)st%(levelname)st%(message)s",
"datefmt": ""
}
},
"handlers": {
"magicsHandler": {
"class": "hdijupyterutils.filehandler.MagicsFileHandler",
"formatter": "magicsFormatter",
"home_path": "~/.sparkmagic"
}
},
"loggers": {
"magicsLogger": {
"handlers": ["magicsHandler"],
"level": "DEBUG",
"propagate": 0
}
}
},
"wait_for_idle_timeout_seconds": 15,
"livy_session_startup_timeout_seconds": 600,
............等。。。。。。。。。。。。。。。。。。。。。。。。。。。。
当我在 Spark 或 pyspark 笔记本或 Jupyter 中的 shell 中尝试一些"hello world"时,这是错误消息:
打印("你好世界"(
由于致命错误,代码失败:状态代码"401"无效 从具有错误有效负载的 http://mylivy.server:8999/sessions: 错误 401
HTTP 错误:401
访问时出现问题/会话。原因:
需要身份验证<小时 />由 Jetty://提供技术支持 9.3.24.v20180605
.可以尝试的一些方法: a( 确保 Spark 有足够的可用资源 让 Jupyter 创建一个 Spark 上下文。b( 联系您的 Jupyter 管理员确保 Spark 魔法库已配置 正确。c( 重新启动内核。
(更新( 我刚刚找到了发生错误的原因:问题是启动笔记本应用程序的系统上没有票证,kinit 命令解决了问题。附言在config.json中使用kerberos时也不需要用户名和密码