如何用大写字母分隔字符串

我目前在ABAP中有一个代码，其中包含一个字符串，该字符串具有多个以大写字母/大写字母开头的单词，并且中间没有空格。

我必须将其分成一个内部表，如下所示：

输入：

NameAgeAddress

输出：

Name
Age
Address

这是我能找到的最短代码，它使用正则表达式与SPLIT相结合：

SPLIT replace( val = 'NameAgeAddress' regex = `(?!^.)u` with = ` $0` occ = 0 ) 
      AT ` ` 
      INTO TABLE itab.

因此，replace将"NameAgeAddress"转换为"Name Age Address"，SPLIT将这3个单词放入内部表中。

详：

(?!^.)说要查找的下一个字符 (\u( 不应该是第一个字符
u是任何大写字母
$0将找到的字符串 ($0( 替换为前面的空格字符
occ = 0替换所有匹配项

不幸的是，ABAP 中的 SPLIT 语句不允许正则表达式作为分隔符表达式。因此，我们必须使用渐进式匹配，这在ABAP中有点尴尬：

report zz_test_split_capital.
parameters: p_input type string default 'NameAgeAddress' lower case.
data: output type stringtab,
      off    type i,
      moff   type i,
      mlen   type i.
while off < strlen( p_input ).
  find regex '[A-Z][^A-Z]*' 
    in section offset off of p_input 
    match offset moff match length mlen.
  if sy-subrc eq 0.
    append substring( val = p_input off = moff len = mlen ) to output.
    off = moff + mlen.
  else.
    exit.
  endif.
endwhile.
cl_demo_output=>display_data( output ).

只是为了比较，下面的语句可以在Perl中完成这项工作：

my $input = "NameAgeAddress";
my @output = split /(?=[A-Z])/, $input; 
# gives @output = ('Name','Age','Address')

使用正则表达式很容易。解决方案可能如下所示。

REPORT ZZZ.
DATA: g_string TYPE string VALUE `NameAgeAddress`.
DATA(gcl_regex) = NEW cl_abap_regex( pattern = `[A-Z]{1}[a-z]+` ).
DATA(gcl_matcher) = gcl_regex->create_matcher( text = g_string ).
WHILE gcl_matcher->find_next( ).
  DATA(g_match_result) = gcl_matcher->get_match( ).
  WRITE / g_string+g_match_result-offset(g_match_result-length).
ENDWHILE.

因为当正则表达式只是矫枉过正并且普通的旧 ABAP 可以：

DATA(str) = 'NameAgeAddress'.
IF str CA sy-abcde.
  DATA(off) = 0.
  DO.
    data(tailstart) = off + 1.
    IF str+tailstart CA sy-abcde.
      DATA(len) = sy-fdpos + 1.
      WRITE: / str+off(len).
      add len to off.
    ELSE.
      EXIT.
    ENDIF.
  ENDDO.
  write / str+off.
ENDIF.

如果您不想使用或无法使用正则表达式，这里有另一个解决方案：

DATA: lf_input             TYPE string VALUE 'NameAgeAddress',
      lf_offset            TYPE i,
      lf_current_letter    TYPE char1,
      lf_letter_in_capital TYPE char1,
      lf_word              TYPE string,
      lt_word              LIKE TABLE OF lf_word.
DO strlen( lf_input ) TIMES.
  lf_offset = sy-index - 1.
  lf_current_letter = lf_input+lf_offset(1).
  lf_letter_in_capital = to_upper( lf_current_letter ).
  IF lf_current_letter = lf_letter_in_capital.
    APPEND INITIAL LINE TO lt_word ASSIGNING FIELD-SYMBOL(<ls_word>).
  ENDIF.
  IF <ls_word> IS ASSIGNED. "if input string does not start with capital letter
    <ls_word> = <ls_word> && lf_current_letter.
  ENDIF.
ENDDO.

相关内容

最新更新

热门标签：