GridFS put 命令在事务中使用时会从 pymongo 挂起



我正在使用GridFS在我的数据库中存储一些视频文件。我已经更新到MongoDB 4.0并尝试使用多集合事务模型。我面临的问题是put()命令 gridfs 挂起系统。我使用它的方式如下:

client = pymongo.MongoClient(mongo_url) 
db = client[db_name]
fs = gridfs.GridFS(db)

现在我尝试使用事务模型,如下所示:

with db.client.start_session() as session:
    try:
        file_path = "video.mp4"  
        session.start_transaction()
        with open(file_path, 'rb') as f:
            fid = self.fs.put(f, metadata={'sequence_id': '0001'})
        session.commit_transaction()
    except Exception as e:
        raise
    finally:
        session.end_session()

问题是 put 命令挂起大约一分钟。然后它返回,但提交失败。我有一种感觉,这是因为会话对象没有传递给 put 命令,但我在将会话作为输入的帮助中没有看到任何参数。挂起后,测试失败,并显示以下堆栈:

回溯(最近一次调用(:

    session.commit_transaction()
  File "/Users/xargon/anaconda/envs/deep/lib/python3.6/site-packages/pymongo/client_session.py", line 393, in commit_transaction
    self._finish_transaction_with_retry("commitTransaction")
  File "/Users/xargon/anaconda/envs/deep/lib/python3.6/site-packages/pymongo/client_session.py", line 457, in _finish_transaction_with_retry
    return self._finish_transaction(command_name)
  File "/Users/xargon/anaconda/envs/deep/lib/python3.6/site-packages/pymongo/client_session.py", line 452, in _finish_transaction
    parse_write_concern_error=True)
  File "/Users/xargon/anaconda/envs/deep/lib/python3.6/site-packages/pymongo/database.py", line 514, in _command
    client=self.__client)
  File "/Users/xargon/anaconda/envs/deep/lib/python3.6/site-packages/pymongo/pool.py", line 579, in command
    unacknowledged=unacknowledged)
  File "/Users/xargon/anaconda/envs/deep/lib/python3.6/site-packages/pymongo/network.py", line 150, in command
    parse_write_concern_error=parse_write_concern_error)
  File "/Users/xargon/anaconda/envs/deep/lib/python3.6/site-packages/pymongo/helpers.py", line 155, in _check_command_response
    raise OperationFailure(msg % errmsg, code, response)
pymongo.errors.OperationFailure: Transaction 1 has been aborted.

编辑

我尝试将放置块替换为:

try:
   gf = self.fs.new_file(metadata={'sequence_id': '0000'})
   gf.write(f)
finally:
   gf.close()

但是,挂起再次发生在gf.close()

我还尝试直接实例化GridIn,以便我可以提供会话对象,但失败如下:

gin = gridfs.GridIn(root_collection=self.db["fs.files"], session=session)
gin.write(f)
gin.close()

此操作失败,并显示错误消息:

It is illegal to provide a txnNumber for command createIndexes

问题是 put 命令挂起大约一分钟

self.fs.put()的第一次尝试实际上并没有使用事务,只是上传文件需要一段时间。

然后,在尝试提交(空(事务时完成上传后,不幸的是,由于上传所花费的时间,事务达到了最大生存期限制。请参阅事务生命周期限制秒。默认限制已设置为 60 秒,以设置最大事务运行时间。

如果您正在考虑提高此限制,请记住,在创建事务快照后,当写入量进入MongoDB时,WiredTiger缓存压力会增加。此缓存压力只能在事务提交后释放。这就是 60 秒默认限制背后的原因。

为命令创建索引提供 txnNumber 是非法的

首先,在多文档事务中不允许影响数据库目录的操作,例如创建或删除集合或索引。

PyMongo GridFS 的代码正在尝试为 GridFS 集合创建索引,当与事务会话一起使用时,服务器上禁止这样做(您可以使用会话,但不能使用事务(。

我已经更新到MongoDB 4.0并尝试使用多集合事务模型

我建议对 GridFS 使用正常的数据库操作。MongoDB多文档事务旨在用于多文档原子性。我认为在文件上传的情况下没有必要。

最新更新