为什么 std::string_view 比常量字符*快?

还是我在测量别的东西？

在此代码中，我有一堆标签(integers(。每个标签都有一个字符串表示形式(const char*或std::string_view(。在循环堆栈中，值将转换为相应的字符串值。这些值将追加到预分配的字符串或分配给数组元素。

结果表明，带std::string_view的版本比带const char*的版本略快。

法典：

#include <array>
#include <iostream>
#include <chrono>
#include <stack>
#include <string_view>
using namespace std;
int main()
{
enum Tag : int { TAG_A, TAG_B, TAG_C, TAG_D, TAG_E, TAG_F };
constexpr const char* tag_value[] = 
{ "AAA", "BBB", "CCC", "DDD", "EEE", "FFF" };
constexpr std::string_view tag_values[] =
{ "AAA", "BBB", "CCC", "DDD", "EEE", "FFF" };
const size_t iterations = 10000;
std::stack<Tag> stack_tag;
std::string out;
std::chrono::steady_clock::time_point begin;
std::chrono::steady_clock::time_point end;
auto prepareForBecnhmark = [&stack_tag, &out](){
for(size_t i=0; i<iterations; i++)
stack_tag.push(static_cast<Tag>(i%6));
out.clear();
out.reserve(iterations*10);
};
// Append to string
prepareForBecnhmark();
begin = std::chrono::steady_clock::now();
for(size_t i=0; i<iterations; i++) {
out.append(tag_value[stack_tag.top()]);
stack_tag.pop();
}
end = std::chrono::steady_clock::now();
std::cout << out[100] << "append string const char* = " << std::chrono::duration_cast<std::chrono::microseconds>(end - begin).count() << "[µs]" << std::endl;
prepareForBecnhmark();
begin = std::chrono::steady_clock::now();
for(size_t i=0; i<iterations; i++) {
out.append(tag_values[stack_tag.top()]);
stack_tag.pop();
}
end = std::chrono::steady_clock::now();
std::cout << out[100] << "append string string_view= " << std::chrono::duration_cast<std::chrono::microseconds>(end - begin).count() << "[µs]" << std::endl;
// Add to array
prepareForBecnhmark();
std::array<const char*, iterations> cca;
begin = std::chrono::steady_clock::now();
for(size_t i=0; i<iterations; i++) {
cca[i] = tag_value[stack_tag.top()];
stack_tag.pop();
}
end = std::chrono::steady_clock::now();
std::cout << "fill array const char* = " << std::chrono::duration_cast<std::chrono::microseconds>(end - begin).count() << "[µs]" << std::endl;
prepareForBecnhmark();
std::array<std::string_view, iterations> ccsv;
begin = std::chrono::steady_clock::now();
for(size_t i=0; i<iterations; i++) {
ccsv[i] = tag_values[stack_tag.top()];
stack_tag.pop();
}
end = std::chrono::steady_clock::now();
std::cout << "fill array string_view = " << std::chrono::duration_cast<std::chrono::microseconds>(end - begin).count() << "[µs]" << std::endl;
std::cout << ccsv[ccsv.size()-1] << cca[cca.size()-1] << std::endl;
return 0;
}

我的机器上的结果是：

Aappend string const char* = 97[µs]
Aappend string string_view= 72[µs]
fill array const char* = 35[µs]
fill array string_view = 18[µs]

Godbolt 编译器资源管理器网址：https://godbolt.org/z/SMrevx

UPD：更准确的基准测试(500 次运行 300000 次迭代(后的结果：

Caverage append string const char* = 2636[µs]
Caverage append string string_view= 2096[µs]
average fill array const char* = 526[µs]
average fill array string_view = 568[µs]

Godbolt 网址： https://godbolt.org/z/aU7zL_

因此，在第二种情况下const char*比预期更快。第一个案例在答案中得到了解释。

仅仅是因为有了std::string_view，你传递了长度，并且你不必在你想要一个新字符串时插入空字符。char*每次都必须搜索结尾，如果你想要一个子字符串，你可能必须复制，因为你需要在子字符串的末尾有一个空字符。

出于实际目的std::string_view归结为：

{
const char* __data_;
size_t __size_;
}

该标准实际上在第 24.4.2 节中指定这是一个指针和大小。它还指定某些操作如何使用字符串视图。最值得注意的是，每当您与std::string交互时，您都会调用也将大小作为输入的重载。因此，当您调用 append 时，这归结为两个不同的调用：str.append(sv)转换为str.append(sv.data(), sv.size())。

显着的区别在于您现在知道append后字符串的大小，这意味着您还知道是否必须重新分配内部缓冲区，以及必须使其大小。如果您事先不知道大小，您可以开始复制，但std::string为append提供了强有力的保证，因此出于实际目的，大多数库在char*重载中预先计算长度，尽管从技术上讲，如果您没有成功完成，也可以只记住旧大小并擦除所有内容(怀疑有人这样做，尽管这可能是字符串的局部优化，因为销毁是微不足道的(。

这可能是由于string_view具有字符串值的大小。"const char*"没有关于大小的信息，必须定义它。

相关内容

最新更新

热门标签：