素描引擎 API 搜索查询:如何获取频率?



有人熟悉Python Sketch Engine API吗,可以告诉我们如何获取n-gram的频率?

到目前为止,我们有这个(来自网站的示例(:

import requests
base_url = 'https://api.sketchengine.co.uk/bonito/run.cgi'
data = {
'corpname': 'bnc2',
'format': 'json',
'lemma': 'book',
'lpos': '-v',
'username': '...',
'api_key': '...'
# get it here: https://the.sketchengine.co.uk/auth/api_access/
}
d = requests.get(base_url + '/wsketch', params=data).json()
print("frequency=", d['freq'])

这给了我们引理的频率,但不是n-gram。

端点/wsketch仅接受单个引理作为输入。要使用 n 元语法,应使用不同的端点,例如/view

import requests
base_url = 'https://api.sketchengine.co.uk/bonito/run.cgi'
data = {
'corpname': 'bnc2',
'format': 'json',
'q': 'q[lemma="read"][lemma="book"]',
'username': '...',
'api_key': '...'
# get it here: https://the.sketchengine.co.uk/auth/api_access/
}
d = requests.get(base_url + '/view', params=data).json()
print("frequency=", d['relsize'])

这里的'relsize'是指每百万的频率。

最新更新