我正在尝试操作我所做的web抓取的文本输出。我想要一个正则表达式函数,它只适用于包含符号"的字符串-"删除每个字符串中位于其后的单词。
函数's*(.*)(?=-)'
起作用,但会从没有此表示法的字符串中删除所有文本。
我怎样才能写出一个只影响字符串的函数呢-"符号
为了提供上下文,我正在挖掘房地产代理信息,一些条目(不是全部(包括使用"-">
然而,对于全国范围的统计分析,我不想要特定分支机构的名称,因为这会使数据更难有效格式化。
附件是详细说明输入/期望输出的屏幕截图。在此处输入图像描述
您可以使用-.*$
正则表达式来查找包含连字符的行以及之后的一些文本,并将所有这些替换为空字符串。
查看此演示
让我知道这是否适合你。