所以我首先要说这是一门课程,我想如果 cmp 返回一些奇怪的东西,教授不会真正关心它们是相同的。我正在尝试将名为 uout 的代码的输出与文件 correct0 中的正确输出进行比较。然而,问题是它返回"cmp:uout 上的 EOF"。从一点点挖掘中,我发现EOF表明它们在较短文件的末尾是相同的,较短的文件是以EOF命名的文件,所以我从中收集到的是,在uout结束之前它们是相同的。然而,问题是,它绝对不会结束。在文本编辑器中打开并手动检查空格、行号和列号等时,一切都是完全匹配的。
为了说明我的观点,这里是使用 ctrl-a + ctrl-v 直接复制的文件:
正确0 http://pastebin.com/Bx7SM7rA
优特 http://pastebin.com/epMFtFpM
如果有人知道出了什么问题并且可以简单地解释它,我将不胜感激。我已经检查了多次,找不到任何问题。也许这很简单,我只是看不到它,但到目前为止我所看到的一切似乎都表明,在"较短的文件"结束之前,这些文件是相同的,奇怪的是,即使我将执行从
cmp correct0 uout
自
cmp uout correct0
两个实例最终都会返回
cmp: EOF on uout
您上传的文件是相同的。这可能是行结束问题。DOS/Windows 使用"\r"作为行尾,但 Unix/Linux 只使用""。
Linux 机器上用于检查问题所在的最佳实用程序是"od"(八进制转储)或任何其他用于以二进制格式显示文件的命令。那是:
$ od -c uout.txt
0000000 E n t e r t h e n u m b e r
0000020 s f r o m 1 t o 1 6 i
0000040 n a n y o r d e r , s e p
0000060 a r a t e d b y s p a c e s
0000100 : r n r n 1 6 3 2 1
0000120 3 r n 5 1 0 1 1 8 r
0000140 n 9 6 7 1 2 r n
0000160 4 1 5 1 4 1 r n r n R
0000200 o w s u m s : 3 4 3 4 3
0000220 4 3 4 r n C o l u m n s u m
0000240 s : 3 4 3 4 3 4 3 4 r n
0000260 D i a g o n a l s u m s : 3
0000300 4 3 4 r n r n T h e m a t r
0000320 i x i s a m a g i c s q
0000340 u a r e
0000344
如您所见,此处的行尾为 \r。由于您已打开并复制粘贴文件,因此这代表您的机器首选项,而不是实际的 fiels 行结尾。您也可以尝试dos2unix实用程序来转换行尾。
如果文件是人类可读的,我会改用diff
工具。它有办法忽略行尾(请参阅--ignore-space-change
和--strip-trailing-cr
和--ignore-blank-lines
)。
diff -u --ignore-space-change --strip-trailing-cr --ignore-blank-lines test_cases/correct0 test_cases/uout0