我想知道ELBO是否应该随着变分参数q_I的每次更新而单调增加?我知道它应该在每次迭代中增加,但在每次q_I的一次迭代中也是这样吗?
是的,这也是真的。认为这是一种坐标上升方法:
q_i^t = argmax_{q_i} cal{L}(q_1^{t}, ...,q_{i-1}^{t}, q_i, q_{i+1}^{t-1}, ..., q_n^{t-1}).
所以你总是在最大化。