我有以下代码(将字符串拆分为向量),在for_each循环的第二次迭代时产生段错误:
std::string command = "Something something something";
std::sregex_token_iterator splitter {command.begin(), command.end(), std::regex{"\s+"}, -1};
std::sregex_token_iterator splitter_end;
std::for_each(splitter, splitter_end, [&](std::ssub_match sm) {
cmd.push_back(sm.str());
});
试图理解发生了什么,我分离正则表达式的声明作为一个命名变量,它开始工作:
std::string command = "Something something something";
std::regex rx {"\s+"};
std::sregex_token_iterator splitter {command.begin(), command.end(), rx, -1};
std::sregex_token_iterator splitter_end;
std::for_each(splitter, splitter_end, [&](std::ssub_match sm) {
cmd.push_back(sm.str());
});
谁能给我解释一下这个? std::sregex_token_iterator
保存指向正则表达式的指针。
在第一个版本中,匿名std::regex
对象在splitter
被构造之后被销毁。这使得splitter
指向内存中一个未分配的空间。
在第二个版本中,rx
将一直存在到块结束。这使得splitter
指向一个合适的对象。
std::regex_token_iterator
构造器
template <class _BidirectionalIterator, class _CharT, class _Traits>
regex_token_iterator<_BidirectionalIterator, _CharT, _Traits>::
regex_token_iterator(_BidirectionalIterator __a, _BidirectionalIterator __b,
const regex_type& __re, int __submatch,
regex_constants::match_flag_type __m)
: __position_(__a, __b, __re, __m),
_N_(0),
__subs_(1, __submatch)
{
__init(__a, __b);
}
构建std::regex_iterator
类型的__position_
:
template <class _BidirectionalIterator, class _CharT, class _Traits>
regex_iterator<_BidirectionalIterator, _CharT, _Traits>::
regex_iterator(_BidirectionalIterator __a, _BidirectionalIterator __b,
const regex_type& __re, regex_constants::match_flag_type __m)
: __begin_(__a),
__end_(__b),
__pregex_(&__re),
__flags_(__m)
{
_VSTD::regex_search(__begin_, __end_, __match_, *__pregex_, __flags_);
}
这是将__re
的地址存储为指针。一旦__re
超出作用域,__re
将被销毁,__position_
将留下一个悬空指针。
以下作品:
std::string command = "Something something something";
std::for_each(std::sregex_token_iterator{command.begin(), command.end(), std::regex{"\s+"}, -1},
std::sregex_token_iterator{},
[&](std::ssub_match sm) {
cmd.push_back(sm.str());
});
这是因为匿名std::regex
对象的生存期与匿名std::sregex_token_iterator
对象相同。