我有一个关于环境变量的非常基本的问题。我试图与之合作的Tika Python库提到以下内容:
tika_server_endpoint:将运行的tika服务器jar
设置为主机(本地或远程(
我从此处下载了服务器jar
,并使用java -jar jarname.jar
运行了它,我试图将环境变量设置为Localhost,但我不确定该如何确切地做到这一点。我尝试了以下内容:
TIKA_SERVER_ENDPOINT=http://localhost:9998
,但这仅导致404
, Network Error (dns_unresolved_hostname), Your host cannot be resolved by the DNS
,
我还运行了ps aux | grep java
来检查jar
文件是否正在运行,并发现它在端口9998
上运行..... I.E:
java -cp /tmp/tika-server.jar org.apache.tika.server.TikaServerCLi -- port 9998 --host localhost
我在这里的环境变量到底做错了什么?我只是对jar
文件和环境变量的烦恼非常陌生,因此,任何帮助都将不胜感激,谢谢!
我也有类似的问题,并且能够通过简单地从apache下载页面下载最新的服务器罐,然后从bash上启动服务器,然后从bash上启动服务器:
java -jar tika-server -x.x.jar --port xxxx
启动了Tika服务器。然后,我能够通过以下方式访问python的tika:
from tika import parser
parser.from_file('path_to_file')
也许Java安装不正确。您可以在此处检查Java安装
安装(带PIP(
pip install tika
安装(无pip(
python setup.py build
python setup.py install
环境变量
当Tika/tika.py最初加载并在此之后使用时,这些都会读一次。
。 TIKA_VERSION
-设置为版本字符串,例如1.12或默认为当前的tika版本。 TIKA_SERVER_JAR
-将整个URL设置为远程Tika服务器罐以下载和缓存。 TIKA_SERVER_ENDPOINT
-将运行Tika服务器JAR的主机设置为主机(本地或远程(。 TIKA_CLIENT_ONLY
-如果设置为true,则忽略TIKA_SERVER_JAR
,并依赖TIKA_SERVER_ENDPOINT
的值,并像对待Tika一样对待Tika。 TIKA_TRANSLATOR
-设置为Tika Translator实现的完全合格的类名(默认为Lingo24(。 TIKA_SERVER_CLASSPATH
-设置为字符串(每次路径的界定':'(,以预到Tika Server Jar Path。 TIKA_LOG_PATH
-将Write权限和Tika.log和Tika -server.log文件设置为目录。
更多信息您可以到达这里。