以编程方式确定不需要导入的JRE类的列表



我需要通过编程找出哪些JRE类可以在编译单元中引用,而无需导入(用于静态代码分析)。我们可以忽略包本地类。根据JLS,包java.lang中的类是隐式导入的。输出应该是一个二进制类名列表。该解决方案应该与普通Java 5及以上版本(没有Guava、Reflections等)一起工作,并且与供应商无关。

欢迎任何可靠的基于Java的解决方案。


以下是我迄今为止尝试的一些注意事项:

乍一看,这个问题似乎可以归结为"如何从一个包加载所有类?",这当然实际上是不可能的,尽管存在一些变通方法(例如这个和这个,以及链接到那里的博客文章)。但我的情况要简单得多,因为不存在多个类加载器的问题。java.lang的东西总是可以由system/bootstrap类加载器加载,并且您不能在该包中创建自己的类。问题是,系统类加载器不会泄露其类路径,而链接的appoach依赖于该路径。

到目前为止,我还没有设法访问系统类加载器的类路径,因为在我使用的HotSpot VM上,Object.class.getClassLoader()返回nullThread.currentThread().getContextClassLoader()可以通过委托加载java.lang.Object,但本身不包括类路径。所以像这样的解决方案对我不起作用。此外,有保证的系统属性列表不包括具有此类类路径信息的属性(如sun.boot.class.path)。

如果我根本不需要假设有rt.jar,而是扫描系统类加载器使用的资源列表,那就太好了。相对于特定于供应商的JRE实现,这种方法将更安全。

编译后的类似乎包含可读的java/lang文本。所以我写了一点代码,看看这些导入是否可以提取。这是一个破解,因此不可靠,但假设您可以提取/列出jar文件中的所有类,这可能是一个起点。
import java.io.ByteArrayOutputStream;
import java.io.InputStream;
import java.net.URL;
import java.net.URLClassLoader;
import java.nio.charset.StandardCharsets;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.ArrayList;
import java.util.Collections;
import java.util.HashSet;
public class Q21102294 {
public static final String EXTERNAL_JAR = "resources/appboot-1.1.1.jar";
public static final String SAMPLE_CLASS_NAME = "com/descartes/appboot/AppBoot.class";
public static HashSet<String> usedLangClasses = new HashSet<String>();
public static void main(String[] args) {
try {
Path f = Paths.get(EXTERNAL_JAR);
if (!Files.exists(f)) {
throw new RuntimeException("Could not find file " + f);
}
URLClassLoader loader = new URLClassLoader(new URL[] { f.toUri().toURL() }, null);
findLangClasses(loader, SAMPLE_CLASS_NAME);
ArrayList<String> sortedClasses = new ArrayList<String>();
sortedClasses.addAll(usedLangClasses);
Collections.sort(sortedClasses);
System.out.println("Loaded classes: ");
for (String s : sortedClasses) {
System.out.println(s);
}
} catch (Exception e) {
e.printStackTrace();
}
}
public static void findLangClasses(URLClassLoader loader, String classResource) throws Exception {
URL curl = loader.getResource(classResource);
if (curl != null) {
System.out.println("Got class as resource.");
} else {
throw new RuntimeException("Can't open resource.");
}
ByteArrayOutputStream bout = new ByteArrayOutputStream();
InputStream in = curl.openStream();
try { 
byte[] buf = new byte[8192];
int l = 0;
while ((l = in.read(buf)) > -1) {
bout.write(buf, 0, l);
}
} finally {
in.close();
}
String ctext = new String(bout.toByteArray(), StandardCharsets.UTF_8);
int offSet = -1;
while ((offSet = ctext.indexOf("java/lang/", offSet)) > -1) {
int beginIndex = offSet;
offSet += "java/lang/".length();
char cnext = ctext.charAt(offSet);
while (cnext != ';' && (cnext == '/' || Character.isAlphabetic(cnext))) {
offSet += 1;
cnext = ctext.charAt(offSet);
}
String langClass = ctext.substring(beginIndex, offSet);
//System.out.println("adding class " + langClass);
usedLangClasses.add(langClass);
}
}
}

给出以下输出:

Got class as resource.
Loaded classes: 
java/lang/Class
java/lang/ClassLoader
java/lang/Exception
java/lang/Object
java/lang/RuntimeException
java/lang/String
java/lang/StringBuilder
java/lang/System
java/lang/Thread
java/lang/Throwable
java/lang/reflect/Method

此处提供所用编译类的源代码。

好吧,我误解了这个问题。检查JLS,我只看到:

每个编译单元都隐式地导入预定义包java.lang中声明的每个公共类型名称,就好像声明import java.lang.*;出现在每个编译单元的开头,紧接在任何包语句之后。因此,所有这些类型的名称在每个编译单元中都可以作为简单名称使用。

(http://docs.oracle.com/javase/specs/jls/se7/html/jls-7.html)

如果你想知道其中包括哪些类型,Java的版本会有所不同。。。

最新更新