如何使用SQL Server来确定全文索引varbinary字段的长度?



我在SQL Server表中存储了一些二进制文件。我在该表上创建了一个全文索引,该索引还索引包含文档的二进制字段。我安装了适当的过滤器,这样SQL Server也可以读取。doc,。docx和。pdf文件。

使用函数DATALENGTH我可以检索完整文档的长度/大小,但这也包括布局和其他无用的信息。我想知道文档文本的长度。

使用过滤器SQL Server是能够检索只有这样的"复杂"文档的文本,但它也可以用来确定只是文本的长度?

据我所知(这并不多),没有办法通过FTS查询文档属性。我会在将文档插入数据库之前获得单词计数,然后将单词计数与文档一起插入到表中的另一列中。对于Word文档,你可以使用document .Word . count属性;我不知道PDF文档的等效机制是什么

最新更新