我需要一个SQL查询来获取两个句子之间的常用词。例如:
句子1:这个网站很有帮助
第2句:我需要一个有用的网站
结果应该是:网站有帮助
另外,如果我需要将句子 1 与表字段记录进行比较,以获得包含句子 1 最常见单词的记录,我该怎么办?
你的问题标题说MSQL,所以我把你的问题当作一个SQL服务器问题。
- 拆分功能
根据 SQL Server 版本/服务器配置,您需要一个拆分函数,该函数可以在所选分隔符上拆分字符串。 这是这样一个函数。
CREATE FUNCTION [dbo].[fnSplit](@data NVARCHAR(MAX), @delimiter NVARCHAR(5))
RETURNS @t TABLE (rowNum int IDENTITY(1,1), data NVARCHAR(max), descriptor varchar(255) NULL)
AS
BEGIN
DECLARE @textXML XML;
SELECT @textXML = CAST('<d>' + REPLACE(@data, @delimiter, '</d><d>') + '</d>' AS XML);
INSERT INTO @t(data)
SELECT RTRIM(LTRIM(T.split.value('.', 'nvarchar(max)'))) AS data
FROM @textXML.nodes('/d') T(split)
RETURN
END
- 使用拆分函数查询常用词(有很多方法可以做到这一点,这里有一种)。
SELECT sentence1.data FROM dbo.fnSplit('This site is very helpful',' ') sentence1 INNER JOIN dbo.fnSplit('I need a helpful site',' ') sentence2 ON sentence1.data = sentence2.data