我有两个文本文件:
stoplist = importdata('stoplist.txt');
vocab = importdata('vocabulary.txt');
我正在尝试创建一个向量,其中每个元素是stoplist
中每个单词中的vocab
中的行号(可以保证vocab
包含stoplist
中的所有单词加上更多单词)。这是如何工作的?
我真的没有MATLAB中的字符串经验
使用[~, posVocab, posStoplist] = intersect(vocab, stoplist);
然后决定如何对这些职位列表进行排序。https://www.mathworks.com/help/matlab/ref/intersect.html您还应该检查参考文献中的"字符向量的单元格数" - 尾部空间意味着字符串不同。