如何使用boost/beast从HTTP POST请求中解析和提取有效负载?



我正在尝试了解如何使用Boost Beast库处理HTTP POST请求的内容。 我稍微修改了Boost Beast高级服务器示例以处理事情。

我在示例中的 handle_request(( 方法中添加了以下行(就在第 155 行之前(:

if ( req.method() == http::verb::post)
{
std::cout << req << std::endl;
}

我创建了一个名为foobar的简单测试文件.dat其中包含以下内容:

This is a test!

我使用此 curl 命令将其发送到服务器:

curl -F 'test=@foobar.dat' http://localhost:8080

这将导致服务器产生以下输出:

POST / HTTP/1.1Host: localhost:8080
User-Agent: curl/7.58.0
Accept: */*
Content-Length: 218
Content-Type: multipart/form-data; boundary=------------------------9c747f078ebbe880
--------------------------9c747f078ebbe880
Content-Disposition: form-data; name="test"; filename="foobar.dat"
Content-Type: application/octet-stream
This is a test!
--------------------------9c747f078ebbe880--

因此,我让服务器接收到预期的消息。

如果我将测试稍微修改为以下内容,我可以单独提取标头字段以及一个大缓冲区中的正文。

if ( req.method() == http::verb::post)
{
std::cout << "Fields:" << std::endl;
int field_count = 0;
for(auto const& field : req)
std::cout << "Field#"
<< ++field_count << " : " << field.name() << " = " << field.value() << std::endl;
std::cout << "Body:" << std::endl;
int body_count = 0;
for(auto it = boost::asio::buffer_sequence_begin(req.body().data());
it != boost::asio::buffer_sequence_end(req.body().data()); ++it)
{
// This is the next buffer in the sequence
boost::asio::const_buffer const buffer = *it;
std::string body(boost::asio::buffer_cast<const char*>(buffer));
std::cout << "Buffer#" << ++body_count << " = " << body << std::endl;
}
}

生成以下输出:

Fields:
Field#1 : Host = localhost:8080
Field#2 : User-Agent = curl/7.58.0
Field#3 : Accept = */*
Field#4 : Content-Length = 218
Field#5 : Content-Type = multipart/form-data; boundary=------------------------5510ea3ec81b8585
Body:
Buffer#1 = --------------------------5510ea3ec81b8585
Content-Disposition: form-data; name="test"; filename="foobar.dat"
Content-Type: application/octet-stream
This is a test!
--------------------------5510ea3ec81b8585--

我找到的大多数示例都演示了如何使用 Boost Beast 创建响应和请求,但我找不到任何明确的例子来解析内容并分离消息的各个组件。

具体来说,如何使用 Boost Beast 从正文中提取和分离名称("test"(、文件名("foobar.dat"(和文件内容("这是一个测试!"(,以便进一步处理消息? 或者,此时,是否有必要自己解析消息正文中的数据?

这超出了Boost::Beast的范围。无论您寻求的信息是存在于领域还是身体中,您都必须自己完成。我会推荐一个方便的字符串操作工具/实用程序/库,例如 Boost::Algorithm::String 或 Abseil (absl::StrSplit(。

旁注:您可以像以前一样访问字段或直接访问字段

auto field = req["<field_name>"];
// or
auto it = req.find("<field_name>");
it->name_string();

HTML 正文中的行由回车符和新行rn分隔。正文从标题由双rn.您可以通过编写花哨的、优化的解析器或使用可用的实用程序之一来访问各个行。沿行拆分,沿冒号拆分,沿分号拆分以访问namefilename最后沿等号拆分以取出数据。使用 Abseil 的示例,因为我不确定 boost 是否可以沿着完整的字符串 (string_view( 拆分:

std::vector<std::string_view> lines = absl::StrSplit(req.body(), "rn");
std::vector<std::string_view> headers = absl::StrSplit(line, ':', absl::SkipWhitespace());
// or possibly (never tried it myself but abseil is a great library so I assume this should work)
std::array<std::string_view, 2> headers = absl::StrSplit(line, ':', absl::SkipWhitespace());
std::vector<std::string_view> items = absl::StrSplit(header, ';', absl::SkipWhitespace());
std::vector<std::string_view> values = absl::StrSplit(item, '=', absl::SkipWhitespace());
// or possibly again using array

最新更新