从单词列表中获取特定长度的随机单词



我正在编写一个简单的PHP函数,它将访问单词列表.txt并随机提取一个单词(单词由新行分隔)。此单词的最大长度需要为 $maxlength。我写它的方式,它会拉动单词,如果长度太长,那么它会不断得到一个新单词,直到它小于或等于$maxlength。我遇到的问题是脚本在最大执行时间内返回致命错误。这是代码:

function GetWord($maxlength) {
    $file_content = file('word-list.txt');
    $nword = $file_content[array_rand($file_content)];
    while(mb_strlen($nword) > $maxlength) {
        $nword = $file_content[array_rand($file_content)];
    }
    return $nword;
}

我能想到的唯一选择是将单词列表放入数据库中,并有一个包含每个相应单词长度的列。这将允许我根据单词的长度选择单词。但是,我试图避免使用数据库,因此我想找出我的脚本出了什么问题。任何帮助将不胜感激。谢谢!

下面的类在实例化时会进行一些排序,但是每次查找随机单词只需要 O(1) 时间:

class RandomWord {
    private $words;
    private $boundaries;
    private static function sort($a, $b){
        return strlen($a) - strlen($b);
    }
    function __construct($file_name) {
        $this->words = file($file_name, FILE_IGNORE_NEW_LINES | FILE_SKIP_EMPTY_LINES);
        // Sort the words by their lenghts
        usort($this->words, array('RandomWord', 'sort'));
        // Mark the length boundaries
        $last = strlen($this->words[0]);
        foreach($this->words as $key => $word) {
            $length = strlen($word);
            if ($length > $last) {
                for($i = $last; $i < $length; $i++) {
                    // In case the lengths are not continuous
                    //    we need to mark the intermediate values as well
                    $this->boundaries[$i] = $key - 1;
                }
                $last = $length;
            }
        }
    }
    public function get($max_length) {
        if (isset($this->boundaries[$max_length])) {
            return $this->words[rand(0, $this->boundaries[$max_length])];
        }
        return $this->words[array_rand($this->words)];
    }
}

像这样使用它:

$r = new RandomWord("word-list.txt");
$word1 = $r->get(6);
$word2 = $r->get(3);
$word3 = $r->get(7);
...

更新:现在我已经测试了它并工作。

我认为问题来自过于复杂的事情。

你可以爆炸内容

$content_array = explode("n", $file_content);

随机播放数组

shuffle($content_array)

然后搜索给定长度的第一个单词。

foreach($content_array as $word) {
    if(strlen($word) == $word_length)
        return $word;
}

不过,我个人会把所有东西都放在数据库中。

使用随机索引重试确实效率低下。

您可以按长度条件过滤行,以便只剩下有效的行,然后翻转这些行,使它们成为键。然后array_rand可以用来从中选择一个随机键。所有这些都可以通过函数式编程方式完成:

function GetWord($maxlength) {
    return array_rand(array_flip(array_filter(file('word-list.txt'), 
        function($line) use ($maxlength) {
            return mb_strlen($line) <= $maxlength;
        })));
}

相关内容

  • 没有找到相关文章

最新更新