想知道是否有一种快速的方法可以使用pyvips/libvips返回ome tiff文件的给定通道的特定像素范围。crop
不允许使用通道专用。
我的OME Tiff很大(10 GB+(,所以我不想把整个图像加载到内存中。
对任何建议和/或其他工作流开放。
pyvips支持多页文档作为"卫生卷";图片(抱歉(。您将n=-1
设置为加载所有页面,这些页面将显示为非常高、非常薄的图像,页面将垂直堆叠。元数据项page-height
给出了每张纸的以像素为单位的高度。
此处的文档:
https://libvips.github.io/libvips/API/current/VipsForeignSave.html#vips-tiffload
例如:
$ vipsheader -a multi-channel-z-series.ome.tif
multi-channel-z-series.ome.tif: 439x167 char, 1 band, b-w, tiffload
width: 439
height: 167
bands: 1
format: char
coding: none
interpretation: b-w
xoffset: 0
yoffset: 0
xres: 0
yres: 0
filename: multi-channel-z-series.ome.tif
vips-loader: tiffload
n-pages: 15
image-description: <?xml version="1.0" encoding="UTF-8"?><!-- Warning: this comment is an OME-XML metadata block, which contains crucial dimensional parameters and other important metadata. Please edit cautiously (if at all), and back up the original data before doing so...
resolution-unit: cm
orientation: 1
您可以看到这是一个15页的OME图像。pyvips将默认加载页面0,每个页面为439乘167像素。您可以在image-description
中获取XML以查看完整的OME频道元数据。
$ vipsheader -f image-description multi-channel-z-series.ome.tif
<?xml version="1.0" encoding="UTF-8"?>
<!--- ... etc.
在Python中你可以做:
$ python3
Python 3.8.5 (default, Jul 28 2020, 12:59:40)
[GCC 9.3.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import pyvips
>>> x = pyvips.Image.new_from_file("multi-channel-z-series.ome.tif", n=-1)
>>> x.size
>>> x.width
439
>>> x.height
2505
>>> x.get("page-height")
167
>>> x.height / x.get("page-height")
15.0
因此,您可以使用crop
以显而易见的方式从通道中获取rect。
您是否计划为ML培训生成补丁?如果是的话,对于小补丁,fetch
可能比crop
快得多。这个问题有示例代码和一些基准测试——在这个例子中,crop
需要41秒才能制作12000个32x32补丁,但fetch
只需要0.5秒