用于结论的正则表达式



我想创建一个regex函数,它只通过标题的数量来遍查整个文本,然后告诉python在没有数字时停止。有人能帮我一下吗?这是文本:1介绍人均收入或基尼指数等综合指标在显示经济增长方面存在严重局限性经济的全貌。他们无法描述是哪些个人或家庭他们中有多少人在经历了繁荣与萧条、危机与危机之后过得更好或更糟回收率(Berman 2018a)。对于一定的收入增长和收入分配,我们可以考虑一下大部分人是受益者的情况,或者大多数人是输家的情况以及许多中间情况(参见表1中的一个简单示例)。绝对intragenerational收入流动性,定义为实际人均收入较高的家庭所占比例在一个时期的结束和开始时比较,可以回答这个问题。相对流动性指标显示的是收入排名中较富裕的百分比,而不是绝对收入。代际流动性研究表明,孩子的生活状况比他们的父母。长期以来,人们对不同国家的相对流动性进行了研究。例如,参见Corak(2020)、Lee和Solon(2009)的相对代际流动性,以及Silvia等人(2013)和Parrado(2005)的相对代际流动性。此外,在Chetty et al.(2017)之前,文献中记录的绝对流动性不是收入,而是职业地位(Arrow et al. 2018)和受教育程度(Duncan and Murnane 2011)。Chetty et al.(2017)首次展示了绝对收入流动性趋势。

2的流动性我们需要在一段时间内跟踪家庭或个人的收入,以估计绝对的代际收入流动性。面板数据调查,如PSID1或行政数据集如Chetty et al.(2014)在美国使用的联邦所得税记录。

我想创建一个模式,python根据每个标题的编号为我找到所有部分的内容。那么我可以为正则表达式写哪些代码呢?例如,我想通过编写代码来涵盖介绍和移动性的部分。

^[^dn] [^n]*

解释:

  • 取所有内容,只要没有行返回:[^n]*
  • 但必须以非数字开头:^[^dn](我还过滤掉了行返回)
  • 注意,我在两个语句
  • 之间放了一个空格

最新更新