从非结构化文本数据中读取第一行



data="Amitabh Bachchan先生生于1942年10月11日,是一名印度电影演员、电影制片人、电视主持人、偶尔播放的歌手和前政治家。20世纪70年代初,他因《赞吉尔》、《迪瓦尔》和《肖莱》等电影而首次走红,并被称为印度的"传奇人物";愤怒的年轻人;他在印地语电影中的银幕角色。他被称为宝莱坞的沙欣沙(指他1988年的电影《沙欣沙》(、萨迪·卡·马哈纳亚克(印地语中"本世纪最伟大的演员"的意思(、千禧之星或大B,在50多年的职业生涯中,他出演了200多部印度电影。Bachchan被认为是印度电影史上最伟大的演员之一">

输出:";Amitabh Bachchan先生生于1942年10月11日,是一名印度电影演员、电影制片人、电视主持人、偶尔播放的歌手和前政治家">

从这个非结构化字符串中,我只想读取第一行我尝试过使用readlines((和splitlines(,(函数,但没有成功。我有多个带有非结构化数据的段落,我只想读取该段落的第一行。请帮忙。

如果变量中已经有文本,则可以按句点分割文本并获得第一个元素:

x = "your text..."
first_line = x.split('.')[0]

这将按句点(.(将文本拆分为一个数组,并获得数组的第一个元素,从而获得第一个句子。

最新更新