如何用大写字母分隔字符串



我目前在ABAP中有一个代码,其中包含一个字符串,该字符串具有多个以大写字母/大写字母开头的单词,并且中间没有空格。

我必须将其分成一个内部表,如下所示:

输入:

NameAgeAddress

输出:

Name
Age
Address

这是我能找到的最短代码,它使用正则表达式与SPLIT相结合:

SPLIT replace( val = 'NameAgeAddress' regex = `(?!^.)u` with = ` $0` occ = 0 ) 
      AT ` ` 
      INTO TABLE itab.

因此,replace将"NameAgeAddress"转换为"Name Age Address",SPLIT将这3个单词放入内部表中。

详:

  • (?!^.)说要查找的下一个字符 (\u( 不应该是第一个字符
  • u是任何大写字母
  • $0将找到的字符串 ($0( 替换为前面的空格字符
  • occ = 0替换所有匹配项

不幸的是,ABAP 中的 SPLIT 语句不允许正则表达式作为分隔符表达式。因此,我们必须使用渐进式匹配,这在ABAP中有点尴尬:

report zz_test_split_capital.
parameters: p_input type string default 'NameAgeAddress' lower case.
data: output type stringtab,
      off    type i,
      moff   type i,
      mlen   type i.
while off < strlen( p_input ).
  find regex '[A-Z][^A-Z]*' 
    in section offset off of p_input 
    match offset moff match length mlen.
  if sy-subrc eq 0.
    append substring( val = p_input off = moff len = mlen ) to output.
    off = moff + mlen.
  else.
    exit.
  endif.
endwhile.
cl_demo_output=>display_data( output ).

只是为了比较,下面的语句可以在Perl中完成这项工作:

my $input = "NameAgeAddress";
my @output = split /(?=[A-Z])/, $input; 
# gives @output = ('Name','Age','Address') 

使用正则表达式很容易。解决方案可能如下所示。

REPORT ZZZ.
DATA: g_string TYPE string VALUE `NameAgeAddress`.
DATA(gcl_regex) = NEW cl_abap_regex( pattern = `[A-Z]{1}[a-z]+` ).
DATA(gcl_matcher) = gcl_regex->create_matcher( text = g_string ).
WHILE gcl_matcher->find_next( ).
  DATA(g_match_result) = gcl_matcher->get_match( ).
  WRITE / g_string+g_match_result-offset(g_match_result-length).
ENDWHILE.

因为当正则表达式只是矫枉过正并且普通的旧 ABAP 可以:

DATA(str) = 'NameAgeAddress'.
IF str CA sy-abcde.
  DATA(off) = 0.
  DO.
    data(tailstart) = off + 1.
    IF str+tailstart CA sy-abcde.
      DATA(len) = sy-fdpos + 1.
      WRITE: / str+off(len).
      add len to off.
    ELSE.
      EXIT.
    ENDIF.
  ENDDO.
  write / str+off.
ENDIF.

如果您不想使用或无法使用正则表达式,这里有另一个解决方案:

DATA: lf_input             TYPE string VALUE 'NameAgeAddress',
      lf_offset            TYPE i,
      lf_current_letter    TYPE char1,
      lf_letter_in_capital TYPE char1,
      lf_word              TYPE string,
      lt_word              LIKE TABLE OF lf_word.
DO strlen( lf_input ) TIMES.
  lf_offset = sy-index - 1.
  lf_current_letter = lf_input+lf_offset(1).
  lf_letter_in_capital = to_upper( lf_current_letter ).
  IF lf_current_letter = lf_letter_in_capital.
    APPEND INITIAL LINE TO lt_word ASSIGNING FIELD-SYMBOL(<ls_word>).
  ENDIF.
  IF <ls_word> IS ASSIGNED. "if input string does not start with capital letter
    <ls_word> = <ls_word> && lf_current_letter.
  ENDIF.
ENDDO.

最新更新