根据字符比较字符串



我正在尝试将字符串的输入与香草JS进行比较,我需要按字符以字符进行比较。然后将字符串添加到数组中,如果字符串被关闭,而不是说5个字符。对于更简单的解释,我想比较这些字符串:

  • 嵌入式系统第1部分
  • 经济学第1部分
  • 嵌入式系统第2部分
  • 经济学第2部分
  • 嵌入式系统劳动

并且由于我以角色为基础比较它们,因此在比较所有4个字符串之后,在此示例中我的数组看起来像这样:

array = [
         "Embedded Systems Part 1",
         "Economics Part 1",
         "Embedded Systems Laboration
         ]

所以我已经尝试了此代码:

let inputLines = inputArea.value.split("n")
let summaryArray = []
let differenceVar = 0
for(let inputLine of inputLines) {
    if (summaryArray.length == 0)   
        // Pushes the first input line, so that's in the array                   
        summaryArray.push(inputLine)
    }
    // Using this kind of loop because I want to push to the array
    // in this loop and then compare that newly pushed string to
    // the rest of the strings as well
    for (let i = 0; i < summaryArray.length; i++) {
        const arrayLine = summaryArray[i]
        for (let j = 0; j < arrayLine.length; j++) {
            const arrayChar = arrayLine[j]                       
            const inputChar = inputLine[j]
            if (arrayChar != inputChar) {
                differenceVar++
            }
        }
        if (differenceVar > 5) {
            differenceVar = 0
            summaryArray.push(inputLine)
        }
    }
}

我最终以此数组:

array = ["SUMMARY:Embedded Systems Part 1",
         "SUMMARY:Economics Part 1",
         "SUMMARY:Embedded Systems Part 2",
         "SUMMARY:Economics Part 2",
         "SUMMARY:Economics Part 2",
         "SUMMARY:Embedded Systems Laboration",
         "SUMMARY:Embedded Systems Laboration",
         "SUMMARY:Embedded Systems Laboration"]

我理解为什么会发生这种情况,因为它检查了数组中的所有字符串,而不仅仅是相似的字符串。

我尝试使用indexOf()进行此操作,但是它不起作用,因为只有每次(几乎),所以它总是返回-1 ...

关于我应该如何看待这个问题的任何帮助!

编辑:因此,我的例子可能不是最好的例子,尽管我有关于如何解决问题的预感。但是我的输入线实际上是这样的:

array = [
         "SUMMARY:Kurs.grp: Inbyggda system för civilingenjörer Inbyggda system för civilingenjörer Sign: fni Moment: Ibs Program: Civilingenjör datateknik åk 3-",
         "SUMMARY:Kurs.grp: Ekonomi för civilingenjörer Entreprenörskap och företagande för ingenjörer Sign: msbk Moment: Fl 8 Program: Byggingenjörsprogrammet åk 3 Civilingenjör datateknik åk 3- Dataingenjörsprogrammet åk 3 Högskoleingenjör - Ind design och produktutv åk 1- Högskoleingenjör - Industriell ekonomi åk 1- Högskoleingenjör - Maskinteknik åk 1-",
         "SUMMARY:Kurs.grp: Inbyggda system för civilingenjörer Inbyggda system för civilingenjörer Sign: fni Moment: Ibs - Övning grupp 1 Program: Civilingenjör datateknik åk 3-",
         "SUMMARY:Kurs.grp: Inbyggda system för civilingenjörer Inbyggda system för civilingenjörer Sign: fni Moment: Ibs - Övning grupp 2 Program: Civilingenjör datateknik åk 3-",
         "SUMMARY:Kurs.grp: Ekonomi för civilingenjörer Entreprenörskap och företagande för ingenjörer Sign: msbk Moment: Fl 9 Program: Byggingenjörsprogrammet åk 3 Civilingenjör datateknik åk 3- Dataingenjörsprogrammet åk 3 Högskoleingenjör - Ind design och produktutv åk 1- Högskoleingenjör - Industriell ekonomi åk 1- Högskoleingenjör - Maskinteknik åk 1-",
        ]

这持续了将近40行..

,从这些输入线我希望输出数组看起来像:

outputArray = [
               "Inbyggda system för civilingenjörer Inbyggda system för civilingenjörer",
               "Ekonomi för civilingenjörer Entreprenörskap och företagande för ingenjörer",
              ]

编辑:

根据您的问题编辑,似乎您需要分析每行以获取文本的特定部分,然后过滤结果数组以删除重复。这样做的一种方法是使用Regex。如果您仍然需要排除与原始问题相似的重复项附近的,则可以添加"匹配项"。从下面的原始答案中的阵列步骤。

例如:

const arr = ["SUMMARY:Kurs.grp: Inbyggda system för civilingenjörer Inbyggda system för civilingenjörer Sign: fni Moment: Ibs Program: Civilingenjör datateknik åk 3-", "SUMMARY:Kurs.grp: Ekonomi för civilingenjörer Entreprenörskap och företagande för ingenjörer Sign: msbk Moment: Fl 8 Program: Byggingenjörsprogrammet åk 3 Civilingenjör datateknik åk 3- Dataingenjörsprogrammet åk 3 Högskoleingenjör - Ind design och produktutv åk 1- Högskoleingenjör - Industriell ekonomi åk 1- Högskoleingenjör - Maskinteknik åk 1-", "SUMMARY:Kurs.grp: Inbyggda system för civilingenjörer Inbyggda system för civilingenjörer Sign: fni Moment: Ibs - Övning grupp 1 Program: Civilingenjör datateknik åk 3-", "SUMMARY:Kurs.grp: Inbyggda system för civilingenjörer Inbyggda system för civilingenjörer Sign: fni Moment: Ibs - Övning grupp 2 Program: Civilingenjör datateknik åk 3-", "SUMMARY:Kurs.grp: Ekonomi för civilingenjörer Entreprenörskap och företagande för ingenjörer Sign: msbk Moment: Fl 9 Program: Byggingenjörsprogrammet åk 3 Civilingenjör datateknik åk 3- Dataingenjörsprogrammet åk 3 Högskoleingenjör - Ind design och produktutv åk 1- Högskoleingenjör - Industriell ekonomi åk 1- Högskoleingenjör - Maskinteknik åk 1-"];
const lines = arr.map(line => line.match(/(?:SUMMARY:Kurs.grp:)(.+)(?:Sign:)/)[1]);
const results = lines.filter((line, i) => {
  if (!lines.slice(0, i).includes(line)) {
    return true;
  }
  
  return false;
});
console.log(results);
// [" Inbyggda system för civilingenjörer Inbyggda system för civilingenjörer ", " Ekonomi för civilingenjörer Entreprenörskap och företagande för ingenjörer "]

原始:

看来,您正在尝试根据它们是否从与数组中的先前字符串相同的字符序列开始,从而从数组中删除字符串。如果这是您目标的准确摘要,那么以下是您可以使用的方法。

  • split()线路结尾的输入文本
  • map()生成的数组到相应的"匹配"阵列。每行是小写的地方并且从末尾删除了所需的字符数字符串(在这种情况下为5)
  • filter()数组通过检查是否a当前行的小写/切片版本在任何以前的比赛数组中的索引

例如:

const text = `Embedded Systems part 1
Economics part 1
Embedded Systems part 2
Economics Part 2
Embedded Systems Laboration`;
  
const lines = text.split('n');
const matches = lines.map(line => line.toLowerCase().slice(0, -5));
const results = lines.filter((line, i) => {
  if (!matches.slice(0, i).includes(line.toLowerCase().slice(0, -5))) {
    return true;
  }
  
  return false;
});
console.log(results);
// ["Embedded Systems part 1", "Economics part 1", "Embedded Systems Laboration"]

相关内容

  • 没有找到相关文章

最新更新