如何从文本文件中提取数据集



在Unix领域是很新的,我目前正在尝试从文本文件中提取数据集。我尝试使用 sed、grep、awk,但它似乎仅适用于提取行,但我想提取整个数据集......这是一个文件示例,我想从中提取 2 个数据集("R.Time 强度"行后面的数字)

[Header]
Application Name    LabSolutions
Version 5.87
Data File Name  C:LabSolutionsDataAntoine170921_AC_FluoSpectra69_WT3a derivatized lignin LiCl 430_GPC_FOREVER_430_049.lcd
Output Date 2017-10-12
Output Time 12:07:32
[Configuration]
Instrument Name BOTAN127-Instrument1
Instrument #    1
Line #  1
# of Detectors  3
Detector ID Detector A  Detector B  PDA
Detector Name   Detector A  Detector B  PDA
# of Channels   1   1   2
[LC Chromatogram(Detector A-Ch1)]
Interval(msec)  500
# of Points 9603
Start Time(min) 0,000
End Time(min)   80,017
Intensity Units mV
Intensity Multiplier    0,001
Ex. Wavelength(nm)  405
Em. Wavelength(nm)  430
R.Time (min)    Intensity
0,00000 -709779
0,00833 -709779
0,01667 17
0,02500 3
0,03333 7
0,04167 19
0,05000 9
0,05833 5
0,06667 2
0,07500 24
0,08333 48
[LC Chromatogram(Detector B-Ch1)]
Interval(msec)  500
# of Points 9603
Start Time(min) 0,000
End Time(min)   80,017
Intensity Units mV
Intensity Multiplier    0,001
R.Time (min)    Intensity
0,00000 149
0,00833 149
0,01667 -1

我将非常感谢任何想法。提前谢谢。安东尼

awk '/^[^0-9]/&&d{d=0} /R.Time/{d=1}d' file

简要说明,

  • d设置为标志以确定是否打印行
  • /^[^0-9]/&&d{d=0}:如果正则表达式^[^0-9]匹配 &&&d==1 ,则禁用d
  • /R.Time/{d=1}:如果搜索字符串"R.Time",则启用d
 awk '/R.Time/,/LC/' file|grep -v -E "R.Time|LC"

grep 部分将删除作为 awk 输出一部分的 R.Time 和 LC 行

我认为这是sed的工作。

sed '/R.Time/!d;:A;N;/n$/!bA' infile

最新更新