在字符之前获取子字符串的一部分



我有一个url,如下所示:

https://www.example.com/exampletitle21sep11oct2020/index.html

我需要的部分位于最后一个和倒数第二个'/'字符之间。但我不需要整个部分,我特别需要最后一个"/"字符之前的最后一个日期。正如您所看到的,有两个日期紧挨着,它们之间没有分隔符,因此很难使用substringindexOf方法。更困难的是,第一个日期只包含日期和月份,而最后一个日期包含整个日期。

我有没有办法从这个url中提取最后一个"/"字符之前的最后一个日期?

使用Regex可以获得第二个日期,如下所示:

const regex = //(?:.*?(d{1,2}w{3}d{0,4}))/.*?$/;
const [, date] = regex.exec("https://www.example.com/exampletitle21sep11oct2020/index.html");
console.log({ date })

const regex = //(?:.*?(d{1,2}w{3}d{0,4}))/.*?$/;
const [, date] = regex.exec("https://www.example.com/exampletitle21sep9oct2020/index.html");
console.log({ date });
console.log(regex.exec("https://www.example.com/exampletitle21sep9oct/index.html")[1])

您可以找到并解析包含以下模式的路径:

^         Line start
.+        One or more of anything
(d{2})   2-digit date
(w{3})   3-letter month (lowercase)
(d{2})   2-digit date
(w{3})   3-letter month (lowercase)
(d{4})   4-digit year
$         Line end

示例

我利用时间来分析日期。

const expression = /^.+(d{2})(w{3})(d{2})(w{3})(d{4})$/;
const format = 'DD MMM YYYY';
const toTitleCase = (str) => str.charAt(0).toUpperCase() + str.slice(1);
const parseDates = (path) => {
const url    = new URL(path),
tokens = url.pathname.split('/'),
found  = tokens.find(token => token.match(expression));
if (!found) return null;
const [
, startDate, startMonth, endDate, endMonth, year
] = found.match(expression);
return {
start : moment(`${startDate} ${toTitleCase(startMonth)} ${year}`, format),
end   : moment(`${endDate} ${toTitleCase(endMonth)} ${year}`, format)
};
};
const dates = parseDates('https://www.example.com/exampletitle21sep11oct2020/index.html');
console.log(dates);
<script src="https://cdnjs.cloudflare.com/ajax/libs/moment.js/2.29.1/moment.min.js"></script>

尝试此更新的

const url = "https://www.example.com/exampletitle21sep11oct2020/index.html";
const urlData = url.split('/');
const datePart = urlData[urlData.length-2];
const res = datePart.slice(-9); <-- this will give you "11oct2020" -->

只使用一个regexp表达式,一切都会简单得多:

var url = 'https://www.example.com/exampletitle21sep11oct2020/index.html'
var res = url.match( /.*?(d+[a-z]+d{4})/.*?$/i );
// res === [ "https://www.example.com/exampletitle21sep11oct2020/index.html", "11oct2020" ]
var endDate = res[1];
// endDate === "11oct2020"

或(但"示例"不能以数字结尾(:

var res = url.match( /.*?(d+[a-z]+)(d+[a-z]+)(d{4})/.*?$/i );
// [ "https://www.example.com/exampletitle21sep11oct2020/index.html", "21sep", "11oct", "2020" ]

或:

var res = url.match( /.*?(d+)([a-z]+)(d+)([a-z]+)(d{4})/.*?$/i );
// [ "https://www.example.com/exampletitle21sep11oct2020/index.html", "21", "sep", "11", "oct", "2020" ]

但是,如果你知道,一个日期总是2位数(总是"01",而不是"1"(;示例";可以是任何字符串:

var res = url.match( /.*?(d{2}[a-z]+d{4})/.*?$/i );
var res = url.match( /.*?(d{2}[a-z]+)(d+[a-z]+)(d{4})/.*?$/i );
var res = url.match( /.*?(d{2})([a-z]+)(d+)([a-z]+)(d{4})/.*?$/i );

最新更新