当场创建对象vs变量声明



我有以下代码(将字符串拆分为向量),在for_each循环的第二次迭代时产生段错误:

std::string command = "Something something something";
std::sregex_token_iterator splitter {command.begin(), command.end(), std::regex{"\s+"}, -1};
std::sregex_token_iterator splitter_end;
std::for_each(splitter, splitter_end, [&](std::ssub_match sm) {
    cmd.push_back(sm.str());
});

试图理解发生了什么,我分离正则表达式的声明作为一个命名变量,它开始工作:

std::string command = "Something something something";
std::regex rx {"\s+"};
std::sregex_token_iterator splitter {command.begin(), command.end(), rx, -1};
std::sregex_token_iterator splitter_end;
std::for_each(splitter, splitter_end, [&](std::ssub_match sm) {
    cmd.push_back(sm.str());
});
谁能给我解释一下这个?
我知道答案,但我不喜欢它。我想这可能是clang的一个缺陷。

std::sregex_token_iterator保存指向正则表达式的指针。

在第一个版本中,匿名std::regex对象在splitter被构造之后被销毁。这使得splitter指向内存中一个未分配的空间。

在第二个版本中,rx将一直存在到块结束。这使得splitter指向一个合适的对象。


std::regex_token_iterator构造器

template <class _BidirectionalIterator, class _CharT, class _Traits>
regex_token_iterator<_BidirectionalIterator, _CharT, _Traits>::
regex_token_iterator(_BidirectionalIterator __a, _BidirectionalIterator __b,
                     const regex_type& __re, int __submatch,
                     regex_constants::match_flag_type __m)
: __position_(__a, __b, __re, __m),
_N_(0),
__subs_(1, __submatch)
{
    __init(__a, __b);
}

构建std::regex_iterator类型的__position_:

template <class _BidirectionalIterator, class _CharT, class _Traits>
regex_iterator<_BidirectionalIterator, _CharT, _Traits>::
regex_iterator(_BidirectionalIterator __a, _BidirectionalIterator __b,
               const regex_type& __re, regex_constants::match_flag_type __m)
: __begin_(__a),
__end_(__b),
__pregex_(&__re),
__flags_(__m)
{
    _VSTD::regex_search(__begin_, __end_, __match_, *__pregex_, __flags_);
}

这是将__re的地址存储为指针。一旦__re超出作用域,__re将被销毁,__position_将留下一个悬空指针。


以下作品:

std::string command = "Something something something";
std::for_each(std::sregex_token_iterator{command.begin(), command.end(), std::regex{"\s+"}, -1},
              std::sregex_token_iterator{},
              [&](std::ssub_match sm) {
    cmd.push_back(sm.str());
});

这是因为匿名std::regex对象的生存期与匿名std::sregex_token_iterator对象相同。

最新更新