使用lucene的高光笔和完整性问题



现在我遇到了一个问题。以下是我写的索引内容,

was written for a formula, it's written as this, indeed.[latxt]$$ left( {a + b} right)left( {{1 over a} + {1 over b}} right) ge left( {a cdot {1 over a} + b cdot {1 over b}} right)^2  = 4 $$[/latxt] was written for a formula, it's written as this, indeed.

当我搜索1 /b时,使用荧光笔的SimpleFragmenter来控制荧光笔内容的长度。结果只是部分代码。

   {1 over a} + b cdot {<em>1 over b</em>}} right)^2

但我真正想要的是[text]标记的全部内容,然后编译成一张图片。

我考虑的方法如下:

  • 如果有[latxt]标记,不要使用荧光笔,直接编译成图片,然后根据term的偏移量,得到一些句号。但是这种方法不够精确。
  • 要自己实现Fragmenter,全部处理有[latxt]标记的内容,因为我还不能掌握Fragmenter,可能这种方法不太可能选择。

所以,我真的希望你能告诉我一些其他更方便、更容易完成的方法。

您将需要使用TermVectors的位置和偏移量。

最新更新