我创建了一个PHP代码,用于从文本文件中提取有效单词:
$pspell_link = pspell_new("en");
$handle = fopen("list.txt", "r");
if ($handle) {
while (($line = fgets($handle)) !== false) {
$line = str_replace(' ', '', $line);
$line = preg_replace('/s+/', '', $line);
if (pspell_check($pspell_link, $line))
{
echo $line."<br>";
}
}
}
假设列表.txt包含
呜菲吉你好你好那里
上面的代码只会打印:你好
我想做的是打印 Hellothere,它包含两个有效的单词 Hello 和那里
(已编辑)
您可以尝试将常量PSPELL_RUN_TOGETHER
作为选项传递:
$pspell_link = pspell_new( "en", Null, Null, Null, PSPELL_RUN_TOGETHER );
来自 PHP 文档:
mode 参数是拼写检查器工作的模式。有几种模式可用:
PSPELL_FAST - 快速模式(最少的建议数量)
PSPELL_NORMAL - 正常模式(更多建议)
PSPELL_BAD_SPELLERS - 慢速模式(很多建议)
PSPELL_RUN_TOGETHER - 将连续词视为法律复合词。也就是说,"thecat"将是一个合法的复合体,尽管这两个词之间应该有一个空格。更改此设置仅影响 pspell_check() 返回的结果;pspell_suggest() 仍将返回建议。
此外,替换line
中的所有空格,您将像"ghghfghyHelloHellothere"这样的字符串传递给pspell_check()
尝试爆炸:
(...)
$words = explode( ' ', $line );
foreach($words as $word)
{
if (pspell_check($pspell_link, $word))
{
echo "---> ".$word.PHP_EOL;
}
}
(...)