我正在尝试创建一个HMM,我想创建我的过渡矩阵,但我不确定如何创建。 我有一本带有转换的字典以及这些转换发生的概率,如下所示(只是更大(:
{(1, 2): 0.0035842293906810036, (2, 3): 0.0035842293906810036, (3, 4): 0.0035842293906810036, (4, 5): 0.0035842293906810036, (5, 6): 0.0035842293906810036, (6, 7): 0.0035842293906810036, (7, 8)}
我定义如下:
# create a list of bigrams
bigrams = []
for i in range(len(integer_list)):
if i+1 in range(len(integer_list)):
bigrams.append((integer_list[i], integer_list[i+1]))
# Create a dictionary containing the counts each bigram occurs in the dataset
bigrams_dict = Counter(bigrams)
values = bigrams_dict.values()
# create a dictionary containing the probability of a word occurring. <- initial probs
frequencies = {key:float(value)/sum(counts_dict.values()) for (key,value) in counts_dict.items()}
frequency_list = []
for value in frequencies.values():
frequency_list.append(value)
现在我想用这个做一个过渡矩阵,这将是一个多维数组,但我不确定如何做到这一点。谁能帮帮我。
转移矩阵的示例如下所示(当然只有更多状态(:
0 1/3 2/3
0 2/3 1/3
1 0 0
一般过程只是预定义一个具有正确尺寸的零矩阵,然后一次填充一个元素。不要想太多这种任务。
例如,如果你知道你正好有 8 个状态,你可以像这样构造矩阵,使用frequencies
字典:
import numpy as np
n_states = 8
transitions = np.zeroes((n_states, n_states), dtype=np.float)
for (state1, state2), probability in frequencies.items():
transitions[state1, state2] = probability
对于非常多的状态,这可能需要一段时间,具体取决于计算机的速度。
如果您不知道状态的总数,则可以通过计算数据中最大的状态数来估计它:
from itertools import chain
n_states = max(chain.from_iterable(frequencies.keys()))