Blaze Data 字段映射抛出类型错误

我最近开始将数据探索代码集从pandas移动到blaze。我遇到了以下问题。

假设：

from blaze import *
s = Data([(1, 'Alice', 100),
...           (2, 'Bob', -200),
...           (3, 'Charlie', 300),
...           (4, 'Denis', 400),
...           (5, 'Edith', -500)],
...          fields=['id', 'name', 'balance'])

我们可以通过into轻松使用pandas.DataFrame来计算以下内容：

into(pd.DataFrame,s).balance.apply(abs)

但是，我在尝试执行以下操作时遇到了严重困难：

s.balance.map(abs,schema='{b: int64}')

抛出TypeError: a bytes-like object is required, not 'int'等。

这个问题似乎与将函数应用于列

或通过将函数应用于另一个列来创建新列的最佳方法有关？这是关闭的，所以我不确定该转向哪里。

PS：如果您觉得这是微不足道的，并想标记问题，请同时提供完整的工作答案。

尝试将'int64'作为datashape传递，而不是传入schema的值。这是第二个关键字参数，因此您无需为其命名。以下：

from blaze import *
s = Data([(1, 'Alice', 100),
          (2, 'Bob', -200),
          (3, 'Charlie', 300),
          (4, 'Denis', 400),
          (5, 'Edith', -500)],
          fields=['id', 'name', 'balance'])
s.balance.map(abs, 'int64')

为我工作，并产生：

附言虽然从 blaze 导入所有东西似乎正在用 blaze.expr.abs 破坏内置abs，但我认为这并不重要。

相关内容

最新更新

热门标签：