矢量<bool>访问

我使用gprof分析了我的代码，从报告中可以看出，前20项中的大部分（如果不是全部的话）都是关于矢量的

Flat profile:
Each sample counts as 0.01 seconds.
  %   cumulative   self              self     total           
 time   seconds   seconds    calls  ms/call  ms/call  name    
 14.71      0.05     0.05  3870399     0.00     0.00  std::vector<bool, std::allocator<bool> >::size() const
 11.76      0.09     0.04 10552897     0.00     0.00  std::_Bit_reference::_Bit_reference(unsigned long*, unsigned long)
 11.76      0.13     0.04  7890323     0.00     0.00  std::_Bit_const_iterator::_Bit_const_iterator(std::_Bit_iterator const&)
  5.88      0.15     0.02 10089215     0.00     0.00  std::_Bit_iterator::operator*() const
  5.88      0.17     0.02  6083600     0.00     0.00  std::vector<bool, std::allocator<bool> >::operator[](unsigned int)
  5.88      0.19     0.02  3912611     0.00     0.00  std::vector<bool, std::allocator<bool> >::end() const
  5.88      0.21     0.02                             std::istreambuf_iterator<char, std::char_traits<char> > std::num_get<char, std::istreambuf_iterator<char, std::char_traits<char> > >::_M_extract_int<unsigned long long>(std::istreambuf_iterator<char, std::char_traits<char> >, std::istreambuf_iterator<char, std::char_traits<char> >, std::ios_base&, std::_Ios_Iostate&, unsigned long long&) const
  2.94      0.22     0.01  6523499     0.00     0.00  std::_Bit_reference::operator bool() const
  2.94      0.23     0.01  3940406     0.00     0.00  std::vector<bool, std::allocator<bool> >::begin() const
  2.94      0.24     0.01  2807828     0.00     0.00  std::_Bit_iterator::operator++()
  2.94      0.25     0.01   146917     0.00     0.00  std::_Bit_iterator_base::_M_incr(int)
  2.94      0.26     0.01   121706     0.00     0.00  std::__miter_base<unsigned long*, false>::__b(unsigned long*)
  2.94      0.27     0.01    46008     0.00     0.00  std::_Bvector_base<std::allocator<bool> >::~_Bvector_base()
  2.94      0.28     0.01    22596     0.00     0.00  std::_Bit_iterator std::__copy_move<false, false, std::random_access_iterator_tag>::__copy_m<std::_Bit_iterator, std::_Bit_iterator>(std::_Bit_iterator, std::_Bit_iterator, std::_Bit_iterator)
  2.94      0.29     0.01     4525     0.00     0.05  integer::operator+(integer)
  2.94      0.30     0.01     1382     0.01     0.01  void std::_Destroy<unsigned int*, unsigned int>(unsigned int*, unsigned int*, std::allocator<unsigned int>&)
  2.94      0.31     0.01                             std::string::size() const
  2.94      0.32     0.01                             std::basic_string<char, std::char_traits<char>, std::allocator<char> >::~basic_string()
  2.94      0.33     0.01                             std::locale::locale()
  2.94      0.34     0.01                             __dynamic_cast

这是一个好兆头，因为这意味着我的其他函数非常有效，或者从向量<bool>真的很慢吗？

im使用gcc-std=c++0x 编译

vector<bool>不存储bools。它基本上是一个位字段。您正在为修改单个值所花费的时间而付费。

如果要考虑运行时性能，请考虑vector<char>或deque<bool>。

因为这意味着我的其他函数非常有效，或者从向量中访问值真的很慢？

由于"慢"one_answers"有效"是相对值，这本质上是一种毫无意义的区别。解释报告最客观的方法是：

由于std:：vector'操作占用了最大量的时间，因此应该从这一点开始，使代码更快。

注意，std::vector<bool>通常比std::vector<int>慢一点，因为它不存储真实的bools，而是存储一组比特掩码（即，理想情况下，每个条目只需要一个比特）。这样可以节省空间，但速度较慢。如果您需要更快，请尝试使用std::vector<int>（或char，..，具体取决于您的需要）。

我怀疑std::vector<bool>可能会在调试构建中受到很大影响，所以如果您还没有这样做，请尝试一些优化标志（您总是应该进行评测）。

vector<bool>实际上是一个模板专用化，其中每个bool值都存储为一个位。然而，不可能像使用int或仅使用"正常"bool那样直接使用单个位。因此，vector<bool>中使用的算法与"普通"vector<>非常不同，为了尽可能多地维护vector接口，它可能会返回在调用operator[]等函数时操纵位的代理对象。这可能会导致gprof报告中的结果，具体取决于编译器的配置方式和有问题的代码。

我会说它很臭，因为14.71%的时间都花在了做vector<bool>::size()上！？！尺寸可能是既定的。

尝试减少对size（）的调用次数，或者如果事先知道大小，则使用固定大小的向量：bitset

阅读问题更新后编辑：

强制更改：g++ --std=c++0x -g -O3（这是两个拼写错误和优化标志，重新编译！）；模板类大量使用内联，这反过来又实现了大量其他优化。加速的顺序很容易是的10倍

它说明了您的程序吗？除了vector<bool>业务，它基本上什么都没告诉你。

您可以直接看到gprof的问题。

假设你知道某个函数有很高的"自时间"，这意味着程序计数器在其中被采样了很多次，但它不是你编写或可以修改的函数。

你唯一能做的就是尽量少调用它，或者尽量少调用调用它的例程，或者尝试少调用那个例程，你只能猜测它在哪里。

gprof试图通过猜测例程的包含的时间是多少、调用了多少次以及调用图来帮助您。如果没有递归，并且只有十几个函数，并且没有进行任何I/O，这可能会有所帮助。

有一种稍微不同的方法，体现在Zoom这样的评测器中。与其只对程序计数器进行采样，不如对整个调用堆栈进行采样。为什么？因为在那段时间里，负责花费时间的代码行在堆栈上，只是要求引起注意。

探查器在墙上的时钟时间对调用堆栈进行采样，并告诉您大多数时间在堆栈上可以找到哪些代码行，这是最有效的。更有效的是，如果您可以查看堆栈的单个样本，因为这也会"告诉"您调用这些行的原因，而不仅仅是调用了多少，所以很容易判断您是否真的不需要它们。

相关内容

最新更新

热门标签：