为什么 HTML 表元素有制表符和换行符,这只是为了可读性



我正在尝试读取/解析网页。 某些表元素似乎有许多制表符和换行符。

很好奇为什么几个单词前面有制表符/换行符。

这是为了可读性和可维护性。它有助于识别块级别和容器元素,并确保开始标记具有结束标记。基本上,这是为了让开发人员的生活更轻松,因为浏览器不关心缩进。

您可能会

看到如下标记:

<table id="stuff">
  <tbody>
    <tr>
      <td>
        Hello World!
      </td>
    </tr>
  </tbody>
</table>
doc = Nokogiri.HTML(some_string)
p doc.at('#stuff td').text
#=> "nttttHello World!nttt"

如您所见,这实际上是该单元格的文本内容。

最新更新