我一直在使用pycrypto模块进行RSA密钥对和算法的加密和解密。问题是当我尝试加密大文件(10kB 的文本文件)时,我在读取文件并加密时采用 32 字节的块大小
>>> f = open('10kb','rb')
>>> p = open('enc','wb')
>>> while True:
data = f.read(32)
if not data:
break
enc_data = public_key.encrypt(data,32)
p.write(enc_data[0])
p.close()
f.close()
它给出输出:
128
128
.......and the many 128 blocks it is writing
当我尝试解密加密文件时,我需要用 128 字节块读取它,以便返回 32 字节块,
>>> f = open('enc','rb')
>>> p = open('dec','wb')
>>> while True:
data = f.read(128)
if not data:
break
dec_data = private_key.decrypt(data)
p.write(dec_data)
p.close()
f.close()
它给出输出:
32
32
.....so many 32 byte blocks it is decrypting, then
128
128
128
128
Traceback (most recent call last):
File "<pyshell#251>", line 5, in <module>
enc_data = private_key.decrypt(data)
File "/usr/lib/python3/dist-packages/Crypto/PublicKey/RSA.py", line 174, in decrypt
return pubkey.pubkey.decrypt(self, ciphertext)
File "/usr/lib/python3/dist-packages/Crypto/PublicKey/pubkey.py", line 93, in decrypt
plaintext=self._decrypt(ciphertext)
File "/usr/lib/python3/dist-packages/Crypto/PublicKey/RSA.py", line 237, in _decrypt
cp = self.key._blind(ciphertext, r)
ValueError: Message too large
当它输出 32 的块大小时,它正在正确解密,但在它以 128 开头的地方,它搞砸了。为什么说消息大小太大?有没有更好,更快速的方法可以使用pycrypto模块解密大型文本文件?
部分答案即将到来...
RSA处理数字。只有在序列化这些长整数时,才能从中获取字节。由于这些数字没有固定大小,因此它们使用尽可能多的字节进行序列化,但不会更多。
RSA 加密 c = me mod n 可能会导致密文,这些密文比 n 小得多,以至于并非所有字节都被填充,因为数字的前导零不必序列化。
有时(取决于模数和明文)可能会发生您在加密期间写入 127 字节块而不是 128 字节块的情况,但您始终在解密期间读取 128 字节块。这意味着,你从下一个块中拿走了一个字节。当对齐中断时,您可能会遇到各种随机行为,例如块大于模数,因此不是有效的密文。
有两种方法可以解决这个问题:
-
始终在其前面写入密文块的长度。
加密:
data = f.read(readsize) if not data: break i += 1 enc_data = public_key.encrypt(data, 32)[0] p.write(chr(len(enc_data))) p.write(enc_data)
解密:
length = f.read(1) if not length: break data = f.read(ord(length)) print(length, len(data)) j += 1 dec_data = private_key.decrypt(data) p.write(dec_data[:readsize])
最后,您必须将密文减小到原始明文大小,因为您在没有 PKCS#1 v1.5 填充或 OAEP 的情况下工作。
-
填充加密期间缺少的零字节。
加密:
data = f.read(readsize) if not data: break i += 1 enc_data = public_key.encrypt(data, 32)[0] while len(enc_data) < writesize: enc_data = "x00" + enc_data p.write(enc_data)
解密:
data = f.read(writesize) if not data: break j += 1 dec_data = private_key.decrypt(data) p.write(dec_data[:readsize])
请注意,readsize = 127
和writesize = 128
.以下是两种变体的完整源代码。
现在,这是一个部分答案,因为这仍然会导致文件损坏,这些文件也太短了,但至少它修复了 OP 的错误。