如何从网址中提取id?谷歌表格

我有以下网址。

https://docs.google.com/spreadsheets/d/1mrsetjgfZI2BIypz7SGHMOfHGv6kTKTzY0xOM5c6TXY/edit#gid=1842172258
https://docs.google.com/a/example.com/spreadsheets/d/1mrsetjgfZI2BIypz7SGHMOfHGv6PTKTzY0xOM5c6TXY/edit#gid=1842172258
https://docs.google.com/spreadsheets/d/1mrsetjgfZI2BIypz7SGHMOfHGv6kTKTzY0xOM5c6TXY

对于每个网址，我需要将工作表 id：1mrsetjgfZI2BIypz7SGHMOfHGv6PTKTzY0xOM5c6TXY提取到 java 字符串中。

我正在考虑使用拆分，但它不能适用于所有测试用例：

String string = "https://docs.google.com/spreadsheets/d/1mrsetjgfZI2BIypz7SGHMOfHGv6kTKTzY0xOM5c6TXY/edit#gid=1842172258";
String[] parts = string.split("/");
String res = parts[parts.length-2];
Log.d("hello res",res );

我怎么可能呢？

您可以使用正则表达式/d/(.*?)(/|$)(正则表达式演示(来解决您的问题，如果您仔细观察，您可以看到 ID 存在于d/和/或end of line之间，为此您可以获得两者之间的所有内容，请查看此代码演示：

String[] urls = new String[]{
"https://docs.google.com/spreadsheets/d/1mrsetjgfZI2BIypz7SGHMOfHGv6kTKTzY0xOM5c6TXY/edit#gid=1842172258",
"https://docs.google.com/a/example.com/spreadsheets/d/1mrsetjgfZI2BIypz7SGHMOfHGv6PTKTzY0xOM5c6TXY/edit#gid=1842172258",
"https://docs.google.com/spreadsheets/d/1mrsetjgfZI2BIypz7SGHMOfHGv6kTKTzY0xOM5c6TXY"
};
String regex = "\/d\/(.*?)(\/|$)";
Pattern pattern = Pattern.compile(regex);
for (String url : urls) {
Matcher matcher = pattern.matcher(url);
while (matcher.find()) {
System.out.println(matcher.group(1));
}
}

输出

1mrsetjgfZI2BIypz7SGHMOfHGv6kTKTzY0xOM5c6TXY
1mrsetjgfZI2BIypz7SGHMOfHGv6PTKTzY0xOM5c6TXY
1mrsetjgfZI2BIypz7SGHMOfHGv6kTKTzY0xOM5c6TXY

看起来您要查找的 ID 始终遵循"/电子表格/d/"，如果是这种情况，您可以将代码更新为该

String string = "https://docs.google.com/spreadsheets/d/1mrsetjgfZI2BIypz7SGHMOfHGv6kTKTzY0xOM5c6TXY/edit#gid=1842172258";
String[] parts = string.split("spreadsheets/d/");
String result;
if(parts[1].contains("/")){
String[] parts2 = parts[1].split("/");
result = parts2[0];
}
else{
result=parts[1];
}
System.out.println("hello "+ result);

使用正则表达式

Pattern pattern = Pattern.compile("(?<=\/d\/)[^\/]*");
Matcher matcher = pattern.matcher(url);
System.out.println(matcher.group(1));

使用爪哇

String result = url.substring(url.indexOf("/d/") + 3);
int slash = result.indexOf("/");
result =  slash == -1 ? result
: result.substring(0, slash);
System.out.println(result);

Google使用固定长度的字符作为其 ID，在您的情况下，它们是 44 个字符，这些是 Google 使用的字符：字母数字、- 和 _，因此您可以使用以下正则表达式：

regex = "([w-]){44}"
match = re.search(regex,url)

相关内容

最新更新

热门标签：