NV路径渲染字体最佳实现



我正在使用NV路径渲染,而读取开始使用Mark Kilgard

的NV路径渲染

我的实现基于NVIDIA图形样本的Tiger3DES项目中的render_font示例。

此实现似乎比普通的基于纹理的字体解决方案慢,所以我想知道它是否存在缺陷?NVIDIA State NV路径渲染速度比替代方案要快,但我的性能限制要比预期的要快得多。

我有一个带有1000个"消息"的场景。我的FPS在Quadro K4200上非常差。如果我将文本组合到单个消息中,则没有性能问题,但是不可能单独格式化消息。如果我将消息数减少到100,我会得到一个不错的帧速率(200 解锁)。

呼叫模具,封面和封面昂贵?

这是代码段...

init fontface:

/* Create a range of path objects corresponding to Latin-1 character codes. */
m_glyphBase = glGenPathsNV(numChars);
glPathGlyphRangeNV(m_glyphBase,
    target,
    name.c_str(),
    style,
    0,
    numChars,
    GL_USE_MISSING_GLYPH_NV,
    pathParamTemplate,
    GLfloat(emScale)
);
/* Load base character set for unsupported glyphs. */
glPathGlyphRangeNV(m_glyphBase,
    GL_STANDARD_FONT_NAME_NV,
    "Sans",
    style,
    0,
    numChars,
    GL_USE_MISSING_GLYPH_NV,
    pathParamTemplate,
    GLfloat(emScale)
);
/* Query font and glyph metrics. */
GLfloat fontData[4];
glGetPathMetricRangeNV(GL_FONT_Y_MIN_BOUNDS_BIT_NV | GL_FONT_Y_MAX_BOUNDS_BIT_NV |
    GL_FONT_UNDERLINE_POSITION_BIT_NV | GL_FONT_UNDERLINE_THICKNESS_BIT_NV,
    m_glyphBase + ' ',
    /*count*/1,
    4 * sizeof(GLfloat),
    fontData
);
m_yMin = fontData[0];
m_yMax = fontData[1];
m_underlinePosition = fontData[2];
m_underlineThickness = fontData[3];
glGetPathMetricRangeNV(GL_GLYPH_HORIZONTAL_BEARING_ADVANCE_BIT_NV,
    m_glyphBase,
    numChars,
    0, /* stride of zero means sizeof(GLfloat) since 1 bit in mask */
    &m_horizontalAdvance[0]
);

初始消息:

glGetPathSpacingNV(GL_ACCUM_ADJACENT_PAIRS_NV,
    (GLsizei)message.size(),
    GL_UNSIGNED_BYTE,
    message.c_str(),
    m_font->glyphBase(),
    1.0, 1.0,
    GL_TRANSLATE_X_NV,
    &m_xtranslate[1]
);
/* Total advance is accumulated spacing plus horizontal advance of
the last glyph */
m_totalAdvance = m_xtranslate[m_messageLength - 1] +
    m_font->horizontalAdvance(uint32(message[m_messageLength - 1]));

绘制消息:

glStencilStrokePathInstancedNV((GLsizei)m_messageLength,
        GL_UNSIGNED_BYTE,
        message().c_str(),
        font()->glyphBase(),
        1, ~0U,  /* Use all stencil bits */
        GL_TRANSLATE_X_NV,
        &m_xtranslate[0]
    );
glColor3f(m_colour.r, m_colour.g, m_colour.b);
glCoverStrokePathInstancedNV((GLsizei)m_messageLength,
        GL_UNSIGNED_BYTE,
        message().c_str(),
        font()->glyphBase(),
        GL_BOUNDING_BOX_OF_BOUNDING_BOXES_NV,
        GL_TRANSLATE_X_NV,
        &m_xtranslate[0]
    );
glStencilFillPathInstancedNV((GLsizei)m_messageLength,
        GL_UNSIGNED_BYTE,
        message().c_str(),
        font()->glyphBase(),
        GL_PATH_FILL_MODE_NV,
        ~0U,  /* Use all stencil bits */
        GL_TRANSLATE_X_NV,
        &m_xtranslate[0]
    );
glCoverFillPathInstancedNV((GLsizei)m_messageLength,
        GL_UNSIGNED_BYTE,
        message().c_str(),
        font()->glyphBase(),
        GL_BOUNDING_BOX_OF_BOUNDING_BOXES_NV,
        GL_TRANSLATE_X_NV,
        &m_xtranslate[0]
    );

i找到了缓慢的原因,它与上述引用的功能无关。删除有问题的代码后,这些功能的表现非常出色。全面披露 - 我正在使用STD ::堆栈作为场景中使用的矩阵,并打电话给堆栈上的弹出式弹出量很昂贵。因此,在回答NVIDIA PATH的问题时,文本的渲染非常快,模板,封面和封面很便宜。

最新更新