如何在使用实例化数组时最小化 glVertexAttribPointer 调用



我有一个OpenGL代码,对所有模型数据使用一个VAO和两个VCO。第一个用于标准顶点属性,如位置和法线,第二个用于模型矩阵。我正在使用实例化绘制,所以我将模型矩阵加载为实例化数组(基本上是顶点属性)。

首先,我将标准顶点属性加载到 VBO 并使用 glVertexAttribPointer 设置所有内容一次。然后我将模型矩阵加载到另一个 VBO 中。现在我必须在绘制循环中调用glVertexAttribPointer。我可以以某种方式防止这种情况吗?

代码如下所示:

// vertex data of all models in one array
GLfloat myvertexdata[myvertexdatasize];
// matrix data of all models in one array
// (one model can have multiple matrices)
GLfloat mymatrixdata[mymatrixsize];
GLuint vao;
glGenVertexArrays(1, &vao);
glBindVertexArray(vao);
GLuint vbo;
glGenBuffers(1, &vbo);
glBindBuffer(GL_ARRAY_BUFFER, vbo);
glBufferData(GL_ARRAY_BUFFER, myvertexdatasize*sizeof(GLfloat), myvertexdata, GL_STATIC_DRAW);
glVertexAttribPointer(
          glGetAttribLocation(myprogram, "position"),
          3,
          GL_FLOAT,
          GL_FALSE,
          24,
          (GLvoid*)0
);
glEnableVertexAttribArray(glGetAttribLocation(myprogram, "position"));
glVertexAttribPointer(
          glGetAttribLocation(myprogram, "normal"),
          3,
          GL_FLOAT,
          GL_FALSE,
          24,
          (GLvoid*)12
);
glEnableVertexAttribArray(glGetAttribLocation(myprogram, "normal"));
GLuint matrixbuffer;
glGenBuffers(1, &matrixbuffer);
glBindBuffer(GL_ARRAY_BUFFER, matrixbuffer);
glBufferData(GL_ARRAY_BUFFER, mymatrixsize*sizeof(GLfloat), mymatrixdata, GL_STATIC_DRAW);
glUseProgram(myprogram);

draw loop:
    int vertices_offset = 0;
    int matrices_offset = 0;
    for each model i:
        GLuint loc = glGetAttribLocation(myprogram, "model_matrix_column_1");
        GLsizei matrixbytes = 4*4*sizeof(GLfloat);
        GLsizei columnbytes = 4*sizeof(GLfloat);
        glVertexAttribPointer(
              loc, 
              4, 
              GL_FLOAT, 
              GL_FALSE, 
              matrixbytes,
              (GLvoid*) (matrices_offset*matrixbytes + 0*columnbytes)
        );
        glEnableVertexAttribArray(loc);
        glVertexAttribDivisor(loc, 1); // matrices are in instanced array
        // do this for the other 3 columns too...
        glDrawArraysInstanced(GL_TRIANGLES, vertices_offset, models[i]->num_vertices(), models[i]->num_instances());
        vertices_offset += models[i]->num_vertices();
        matrices_offset += models[i]->num_matrices();

我想到了将顶点数据和矩阵存储在一个 VBO 中的方法。那么问题是如何正确设置步幅。我想不出解决方案。

任何帮助将不胜感激。

如果您有权访问基本实例渲染(需要 GL 4.2 或 ARB_base_instance),那么您可以这样做。将实例化属性内容与非实例化属性内容一起放入设置中:

GLuint loc = glGetAttribLocation(myprogram, "model_matrix_column_1");
for(int count = 0; count < 4; ++count, ++loc)
{
    GLsizei matrixbytes = 4*4*sizeof(GLfloat);
    GLsizei columnbytes = 4*sizeof(GLfloat);
    glVertexAttribPointer(
          loc, 
          4, 
          GL_FLOAT, 
          GL_FALSE, 
          matrixbytes,
          (GLvoid*) (count*columnbytes)
    );
    glEnableVertexAttribArray(loc);
    glVertexAttribDivisor(loc, 1); // matrices are in instanced array
}

然后,您只需在准备好渲染这些模型时绑定 VAO。您的抽奖电话变为:

glDrawArraysInstancedBaseInstance​(GL_TRIANGLES, vertices_offset, models[i]->num_vertices(), models[i]->num_instances(), matrix_offset);

此功能出人意料地广泛可用,即使在 GL 4.x 之前的硬件上也是如此(只要它有最新的驱动程序)。

但是,如果没有基本实例渲染,您将无能为力。您必须为要渲染的每组新实例调整实例指针。事实上,这就是基本实例呈现存在的原因

最新更新