我想从给定的一组数据序列(即点击流数据)中估计一阶马尔可夫链的转移概率矩阵。可能是在java中,否则Matlab也可以。
我把每个序列都放在一个不同的文件中(但当然我可以把所有的东西合并到一个文件中),其中一个问题是我没有序列的标准长度。我知道状态空间,我只对状态转换感兴趣。
我读过:在MATLAB中用不同的状态序列长度估计马尔可夫链转移矩阵,但我不确定它是否适合我的问题。我还想知道是否有Java库可以处理这个问题。如果是的话,我没能找到他们。
您必须创建一个计算转换的矩阵。
对于1,4,4,6,7
行
你必须设置
M(1,4)=M(1,4)+1
M(4,4)=M(4,4)+1
M(4,6)=M(4,6)+1
M(6,7)=M(4,7)+1
最后将每一行归一化为和1。
更新:使用字符索引。Matlab可以使用double('A')
将每个字符转换为一个数字,因此它是简单的索引移位。
char2index=@(x)(double(x)-'A'+1)
index2char=@(x)(char(x+'A'-1))
M(char2index('A'),char2index('B'))=M(char2index('A'),char2index('B'))+1
第二个函数index2char
将索引转换回字符。