我正在使用此快速启动指南(https://github.com/aws-quickstart/quickstart-hail)与sagemaker一起设置EMR时。
由于安全要求,我不得不启用kerberos(EMR集群中的本地KDC(,并参考了本指南(https://aws.amazon.com/blogs/machine-learning/securing-data-analytics-with-an-amazon-sagemaker-notebook-instance-and-kerberized-amazon-emr-cluster/)用于Kerberos设置。
除了由于访问限制,散焦图无法保存外,一切都很顺利。(
我试图通过sagemaker笔记本(通过sparkmagic+livy(运行ls -la /
,但绘图路径/plots
和/var/www/html/plots
没有显示,也无法访问。
但是,当使用ssh对主节点运行ls -la
时,我能够看到这些文件夹路径。使用chmod -R 777 /var/www
更改权限也无法解决此问题。
知道是否有kerberos/livy设置可以对经过kerberos身份验证的用户隐藏/保护某些文件路径吗?
我找到了发生这种情况的原因。
当对EMR使用Kerberos身份验证时,sparkmagic在core node
而不是master node
中启动一个spark上下文。因此,它们是两个独立的文件系统,因此我看不到在master node
上创建的路径,但看不到core node