我需要为一种自然语言创建特殊的形态学词汇表。每个单词应该包含一组特征。PostgreSQL 9。在这种情况下帮忙?我的意思是,我应该从头开始创建表还是有一些预定义的方法?
您正在寻找的东西远远超出了PostgreSQL的典型解决方案的设计构建。最好的办法是构建自己的自定义表。
现在,我只是一个对语言学主题感兴趣的读者,但是对于形态学分析,我怀疑你会遇到不同语言有根本不同的形态学系统的问题。例如,南岛语、印欧语和阿萨巴斯坎语的形态学概念(我所知道的所有这些概念都是危险的)对我来说并不是非常有助于建立单一的关系模型。例如,在IE中,我们可能有不同的动词时态形态,但其他两种都没有。南岛语中的重复增加了一点曲线球(特别是在处理前缀/后缀/中缀组合时),而阿萨巴斯坎语的槽并不符合其他两种语言对词性的期望。
所以我认为你不太可能找到很多通用的变形数据库模式。事情可能是特定于语言和特定于目的的。例如,建立一个数据库来寻找中古英语和现代英语之间的词法变化,这与仅仅分析推文中当前词法的设计是完全不同的。