我应该如何处理json/dataframe格式的数据,以便适合rasa聊天机器人



我是NLP和rasa-api的新手。我正在努力准备数据,以便将其用作意图识别的训练数据。我尝试使用的功能是:

from rasa_nlu.training_data import load_data   #Import function
train_data_rasa=load_data('/content/data_file.json') #Json file

然而,下一个错误弹出:

AttributeError: 'str' object has no attribute 'get'

json文件是使用pandas.to_json((函数的结果。原始数据集是ATIS飞行意图数据帧,其中有两列:文本和意图。以下是json文件的预览:

{"Intent":{"0":"atis_flight","1":"atis_flight_time","2":"atis_airfare","3":"atis_airfare","4":"atis_flight","5":"atis_aircraft","6" ........

我真的不知道发生了什么,因为数据集似乎很干净。我还尝试了多种替代方案,例如markdown(md(类型的文件,但似乎不起作用。

提前感谢!!

我建议尝试rasa数据转换命令(将训练数据从json转换为yml格式(,然后尝试训练数据(使用cli中的命令rasa train(,看看是否出现相同的错误。此外,文档中的"培训数据格式"页面可能是一个有用的资源,因为它解释了培训数据的类型及其预期结构。另一个想法是在Rasa论坛上发布你的问题,那里可能会有更多的人遇到类似的错误。这样,你可能会对如何解决你的问题有更多的想法,或者更多的人会加入进来并提供帮助。

最新更新