如何从头开始训练通用句子编码器



我想使用通用句子编码器,但问题是谷歌的预训练版本不支持我的语言(甚至不支持多语言版本:https://tfhub.dev/google/universal-sentence-encoder-multilingual/3(

是否有任何教程或方法如何使用自己的语料库从头开始训练我自己的通用句子编码器?

根据这里打开的问题(https://github.com/tensorflow/hub/issues/36(,该模型似乎没有发布到开源。您需要自己构建它或根据特定任务进行微调。

最新更新