给定如下函数:
def _extract_row(self, rnumber, rcontent):
number = rnumber.find('p').text.strip()
p = rcontent.find('p')
dloms = p.find_all('a')
docs = {}
for d in dloms:
docs[d.text.strip()] = DOMAIN + d['href']
ems = p.find_all('em')
for e in ems:
name = e.text.strip()
if not docs.get(name):
docs[name] = None
ldocs = []
for name, link in docs.iteritems():
ldocs.append({'name': name,
'link': link})
return {'number': number,
'docs': ldocs}
其中rnumber和rcontent是BS4或Beautifulsoup对象,是将BS4安装为测试依赖项并正常测试功能更好,还是模拟BS4更好?
我是这样做的:
@patch("agc_law.bs4.BeautifulSoup")
def test_law_pages_private_extract_row(self, mock_bs4):
"""Test asserting correct calls are made in _extract_row"""
agc_law.DOMAIN = "http://example.com"
mock_rnumber = mock_bs4
mock_rcontent = mock_bs4
result = self.lp._extract_row(mock_rnumber, mock_rcontent)
for item in [call.find('p'),
call.find().text.strip(),
call.find('p'),
call.find().find_all('a'),
call.find().find_all('em')]:
self.assertIn(item, mock_rcontent.mock_calls)
for item in [call.find('p'),
call.find().text.strip(),
call.find('p'),
call.find().find_all('a'),
call.find().find_all('em')]:
self.assertIn(item, mock_rnumber.mock_calls)
将重视注释。
您的代码与BeautifulSoup和正在解析的文档紧密耦合。如果你的文档结构改变了,你将不得不重构你的被测代码和你的测试。
此外,如果您想找到一种更有效的使用BeautifulSoup的方法(例如,通过使用CSS选择器),您就不可能重构被测代码,而不必再次完全更改测试以匹配。
在这种情况下,你最好使用一个真实的文档,它反映了当前的结构;这样,您就可以测试代码的结果,而不是测试它是如何实现结果的。