Python中莎士比亚文本的解析



这是我想要解析的源文本:

1.从我们渴望增加的最公平的生物,这样美丽的玫瑰就永远不会死,但随着时间的流逝,成熟的人应该会死去,他温柔的继承人也许会记住他:但你却对自己明亮的眼睛收缩着,给你的光的火焰注入自我充实的燃料,在富足的地方制造饥荒,你的自己是你的敌人,对你甜美的自己太残忍了:你现在是世界上的新装饰,只预示着华而不实的春天,在你自己的芽中埋葬你的内容,温柔的搅拌在琐碎中浪费:可怜这个世界,否则这个贪吃的人,在坟墓和你的旁边,吃掉世界上应得的。2.当四十个冬天将包围你的额头,在你美丽的田野里挖深沟,你年轻时那傲人的制服现在如此凝视,将是一株价值不大的破烂杂草:然后被问到,你所有的美丽都在哪里,在哪里,所有的财富,你的好色的日子;在你深陷的眼睛里说,是一种吃得饱的耻辱,是一种节俭的赞美。你的美丽值得更多的赞美,如果你能回答"我的这个漂亮孩子"我会总结我的计数,并提出我以前的借口继承你的,证明他的美丽。这是在你老的时候新做的,当你感到寒冷的时候,看看你的血液是温暖的。3.看着你的镜子,告诉你所看到的脸,现在是脸应该形成另一张脸的时候了,如果你现在不更新它的新修复,你欺骗了世界,欺骗了某个母亲。她在哪里如此美丽蔑视你耕种的土地吗?或者他如此喜欢的人会成为坟墓,他的自爱阻止了后人?你是你母亲的玻璃,她在你身上回想她风华正茂的四月,这样,你就可以透过年龄的窗户看到,尽管有皱纹,这是你的黄金时期。但是,如果你活着,记住了不是,孤独地死去,你的形象也随之消逝。

我想把它解析成这样的块:

第一个区块应该是:

从我们渴望增加的最公平的生物,这样美丽的玫瑰就永远不会死,但随着时间的流逝,成熟的人应该会死去,他温柔的继承人也许会记住他:但你却对自己明亮的眼睛收缩着,给你的光的火焰注入自我充实的燃料,在富足的地方制造饥荒,你的自己是你的敌人,对你甜美的自己太残忍了:你现在是世界上的新装饰,只预示着华而不实的春天,在你自己的芽中埋葬你的内容,温柔的搅拌在琐碎中浪费:可怜这个世界,否则这个贪吃的人,在坟墓和你的旁边,吃掉世界上应得的。

第二:

当四十个冬天将包围你的额头,在你美丽的田野里挖深沟,你年轻时那傲人的制服现在如此凝视,将是一株价值不大的破旧杂草:
然后被问到,你所有的美丽都在哪里,在哪里,所有的财富,你的好色的日子;在你深陷的眼睛里说,是一种吃得饱的耻辱,是一种节俭的赞美。

第三:

你的美丽值得更多的赞美,如果你能回答"我的这个漂亮孩子"我会总结我的计数,并提出我以前的借口继承你的,证明他的美丽。这是在你老的时候新做的,当你感到寒冷的时候,看看你的血液是温暖的。

…等等。每次一个句子以.结尾时,我都希望那个部分是一个新的块。

我怎么能这样解析?我想要一些指导方针,以明确和有效的方式来做到这一点。我不想逐个字符进行检查…

感谢

您可能可以使用以下方法来拆分它:

re.split(r"(?:^|(?:[^Sn]*n){2}(?m)^)[ t]+d+[ t]+[rn]+", text)

如果您不想逐个字符进行检查,而这正是您所拥有的源,您可以逐行检查,并搜索空的。

根据执行情况,我不确定这样做是否会更有效率。可能恰恰相反。

最新更新