Python Pandas没有导入.csv.错误:pandas.errors.EmptyDataError:没有要从文件



我正在将信息写入2个.csv文件(2列,以逗号分隔)。我使用time.sleep()确保在pandas尝试将信息加载到数据框架之前,我的桌面有足够的时间将所有数据写入文件。似乎问题仍然与archorg.csv,因为我试图扭转导入文件的顺序和pacman.csv没有给出一个错误,但archorg.csv仍然有。

onlinedf = pd.read_csv('/home/kia/Code/update/data/archorg.csv')
pacmandf = pd.read_csv('/home/kia/Code/update/data/pacman.csv')

当我尝试运行这个时,我得到以下错误:

Traceback (most recent call last):
File "/home/kia/Code/update/main.py", line 28, in <module>
ugh = main()
File "/home/kia/Code/update/main.py", line 20, in __init__
filemgr.loadfiles()
File "/home/kia/Code/update/files.py", line 10, in loadfiles
onlinedf = pd.read_csv('/home/kia/Code/update/data/archorg.csv')
File "/usr/lib/python3.10/site-packages/pandas/util/_decorators.py", line 311, in wrapper
return func(*args, **kwargs)
File "/usr/lib/python3.10/site-packages/pandas/io/parsers/readers.py", line 680, in read_csv
return _read(filepath_or_buffer, kwds)
File "/usr/lib/python3.10/site-packages/pandas/io/parsers/readers.py", line 575, in _read
parser = TextFileReader(filepath_or_buffer, **kwds)
File "/usr/lib/python3.10/site-packages/pandas/io/parsers/readers.py", line 934, in __init__
self._engine = self._make_engine(f, self.engine)
File "/usr/lib/python3.10/site-packages/pandas/io/parsers/readers.py", line 1236, in _make_engine
return mapping[engine](f, **self.options)
File "/usr/lib/python3.10/site-packages/pandas/io/parsers/c_parser_wrapper.py", line 75, in __init__
self._reader = parsers.TextReader(src, **kwds)
File "pandas/_libs/parsers.pyx", line 551, in pandas._libs.parsers.TextReader.__cinit__
pandas.errors.EmptyDataError: No columns to parse from file

最后,我找到了解释器,逐行输入如下内容:

>>> import pandas as pd
>>> pd.read_csv('/home/kia/Code/update/data/archorg.csv')
package     version
0          python-dulwich   0.20.45-1
1              sqlite-tcl    3.39.1-1
2              sqlite-doc    3.39.1-1
3         sqlite-analyzer    3.39.1-1
4                  sqlite    3.39.1-1
..                    ...         ...
223     python-voluptuous    0.13.1-1
224     python-tldextract     3.3.1-1
225    perl-file-mimeinfo      0.33-1
226  perl-crypt-passwdmd5      1.42-1
227      perl-test-simple  1.302191-1
[228 rows x 2 columns]

似乎可以毫无问题地完成工作。我还发布了下面的csv文件的一部分,以防有问题,虽然我已经检查了额外的逗号/空白等。

package,version
python-dulwich,0.20.45-1
sqlite-tcl,3.39.1-1
sqlite-doc,3.39.1-1
sqlite-analyzer,3.39.1-1
sqlite,3.39.1-1
lemon,3.39.1-1
tp_smapi-lts,0.43-254
r8168-lts,8.050.03-9
acpi_call-lts,1.2.2-58
nvidia-lts,1:515.57-6
linux-lts-headers,5.15.55-1
linux-lts-docs,5.15.55-1
linux-lts,5.15.55-1
mattermost,7.1.1-1
node-gyp,9.1.0-1
trivy,0.30.0-1
sile,0.13.3-1

编辑:为全面审查添加了repo。

编辑2:使用sep=而不是delim_whitespace使其工作,然后用csv模块而不是串接字符串写入文件,以消除csv格式错误的任何可能性。所有文件在repo中显示供参考。

您的csv示例对我来说工作得很好,令人困惑的部分是您的其他文件工作得很好。我建议你试一试,我希望它能工作

import pandas as pd
df = pd.read_csv("filepath", delim_whitespace=True)
df[['Package', 'Version']] = df['package,version'].str.split(',', expand=True)
df.drop(columns = "package,version", inplace=True)