从GDELT查询中提取主题或文本的URL



我正试图从GDELT中提取与加密货币相关的新闻。我正在使用以下查询:

select date(_partitiontime) date, count(theme) occurences
from `gdelt-bq.gdeltv2.gkg_partitioned`, unnest(split(themes,';')) as theme 
where lower(theme) like "%bitcoin%"
group by date
-- order by date 

我不仅想提取比特币这个词出现了多少次,还想提取新闻文章或文本。

我也试过:

select Date,SourceCommonName,Themes,Persons,DocumentIdentifier 
from gdelt-bq.gdeltv2.gkg_partitioned, unnest(split(themes,';')) as theme
where theme like "%bitcoin%"
limit 100

但此查询返回0个结果。我似乎错过了一些与比特币相关的新闻URL。

任何帮助都将不胜感激。谢谢

您应该在第二个查询的where子句中使用lower(theme)

最新更新