我正在尝试计算输入字符串和给定字符串集合之间的百分比相似性。 我见过使用汉明距离和列文施泰因距离的例子。但这些只考虑了两个刺痛。
我的问题:是否可以一次计算多个刺痛的上述内容?(我有一组存储的字符串,我得到了一个新的输入刺痛,我想找出旧的刺痛与新的刺痛有多相似,或者匹配的刺痛说 90%)。我相信汉明距离是合适的,因为所有的琴弦都是相等的。
例如:假设输入:A T T A C G C T
Existing: A A T T G T C
A C T T G T C
C A T T G T C
虽然有许多类似的问题得到了回答,但我无法找到一个考虑到这一点的问题。也许有人可以帮忙。
提前感谢!
你可以使用这个: levenshtein
检查文档以获取示例,希望对您有所帮助。