我想了解安全访问Hadoop集群的最佳方法。
我一直在参考以下链接:
- http://hortonworks.com/hadoop-tutorial/integrating-hadoop-cluster-microsoft-active-directory-authentication/
- http://hortonworks.com/blog/hadoop-groupmapping-ldap-integration/
我想知道哪种方法更好?支持kerberos的集群有什么优势?安全LDAP就足够了吗?
安全性是Hadoop集群中的一个重要课题。有几种方法可以保证Hadoop集群的安全,但所有的方法最终都取决于需求的类型,并且可以根据需求来决定安全方面。
基于Hadoop kerberos的身份验证目前得到了广泛的应用。这是通常被称为Hadoop安全。当启用Hadoop Security时,它需要用户通过Kerberos进行身份验证,以便在HDFS中读写数据或提交和管理MapReduce作业,并且所有Hadoop服务都使用Kerberos进行身份验证。
虽然Hadoop Security提供Kerberos身份验证,但它不保护通过网络传输的数据。如果您的Hadoop集群保存敏感信息(财务数据、信用卡交易、医疗保健信息等),则可能需要确保数据在运行时也受到保护通过网络传输(以避免窃听和中间人攻击)。这与使用安全连接(使用HTTPS)访问银行网站没有什么不同。为了解决这些用例,网络加密被添加到Hadoop中,并且可以使用。
这个链接将有助于理解Hadoop集群的网络加密。
http://blog.cloudera.com/blog/2013/03/how-to-set-up-a-hadoop-cluster-with-network-encryption/