SPSS比较字符串功能



我有一个由许多字符串组成的文件。对于每个字符串,我想创建长度为 4 的子字符串,然后将每个子字符串与另一个 SPSS 文件中的单词字典进行比较。例如,如果我有字符串"transport",我想创建一个 4 个字母的字符串列表(例如,"tran"、"rans"、"ansp"等)。对于这 4 个字母字符串中的每一个,我想知道它是否存在于另一个包含一长串单词的文件中。这是我在SPSS中的语法:

*rawNonword是我第一个文件中字符串的名称。

计算字符 = 字符长度(原始非字)。

琴弦支架 (A50)。

循环 #i = 1 到 chars-4。

compute holder = char.substr(rawNonword, #i, 4).

*在这里,我想将持有人与另一个文件中的字符串进行比较。

结束循环。

执行。

我意识到合并和匹配函数通常在 SPSS 中使用,但似乎我不能在循环中使用它们。我相信这个问题在python中相当容易,但我需要在SPSS中完成这项任务。SPSS 中是否有一个简单的函数,如果另一个文件中存在 4 个字母的字符串,它将返回值 1 或 true?

使用带有extendedTransforms.vlookup函数的Python插件当然更容易,但是在传统语法中,您可以创建一个包含所有四个字母片段的变量,对两个文件进行排序,并使用TABLE匹配和使用该变量作为键的MATCH FILES。

最新更新