问题: 我有一个字符串数组,我正在尝试找到与提供的字符串最接近的匹配项。我在下面进行了一些尝试,并检查了其他一些解决方案,例如 Levenshtein 距离 这似乎只有在所有字符串大小相似时才有效。
出品: 如果我使用"两个更好"作为匹配字符串,它将与"两个比一个好"匹配。
思想: 我想知道将有空格的字符串分开,然后查看字符串到匹配字符串的每个部分是否在数组的当前迭代中找到(arrayOfStrings[i](会有所帮助吗?
// Test array and string to search
string[] arrayOfStrings = new string[] { "A hot potato", "Two are better than one", "Best of both worlds", "Curiosity killed the cat", "Devil's Advocate", "It takes two to tango", "a twofer" };
string stringToMatch = "two are better";
// Contains attempt
List<string> likeNames = new List<string>();
for (int i = 0; i < arrayOfStrings.Count(); i++)
{
if (arrayOfStrings[i].Contains(stringToMatch))
{
Console.WriteLine("Hit1");
likeNames.Add(arrayOfStrings[i]);
}
if (stringToMatch.Contains(arrayOfStrings[i]))
{
Console.WriteLine("Hit2");
likeNames.Add(arrayOfStrings[i]);
}
}
// StringComparison attempt
var matches = arrayOfStrings.Where(s => s.Equals(stringToMatch, StringComparison.InvariantCultureIgnoreCase)).ToList();
// Display matched array items
Console.WriteLine("List likeNames");
likeNames.ForEach(Console.WriteLine);
Console.WriteLine("n");
Console.WriteLine("var matches");
matches.ForEach(Console.WriteLine);
你可以试试下面的代码。
我根据您的
stringToMatch
创建了List<string>
,并检查strings
array
字符串是否包含toMatch
中存在的每个字符串,如果是,则将该字符串选择到match
中。
List<string> toMatch = stringToMatch.Split(' ').ToList();
List<string> match = arrayOfStrings.Where(x =>
!toMatch.Any(ele => !x.ToLower()
.Contains(ele.ToLower())))
.ToList();
对于您的实现,我已经拆分了 stringToMatch,然后进行了匹配计数。
下面的代码将为您提供带有计数的订单列表,其中排序为最高字符串匹配计数。
string[] arrayOfStrings = new string[] { "A hot potato", "Two are better than one", "Best of both worlds", "Curiosity killed the cat", "Devil's Advocate", "It takes two to tango", "a twofer" };
string stringToMatch = "two are better";
var matches = arrayOfStrings
.Select(s =>
{
int count = 0;
foreach (var item in stringToMatch.Split(' '))
{
if (s.Contains(item))
count++;
}
return new { count, s };
}).OrderByDescending(d => d.count);
我使用了非常简单的字符串比较来验证。算法可以根据确切的要求而变化(如匹配字符串的顺序等(