Excel VBA单词边界(替换介词)



我需要做的是在单元格中的每个介词之前添加一个+ +号?由于某种原因,b对我不起作用。

在JavaScript中,它应该可以正常工作:

(bofb|batb)
//change with
+$1

但是在Excel中使用相同的正则表达式的VBA脚本将不匹配任何内容。

的例子:

И отдохнуть от них было для него спасением от мук.

结果应该是:

И отдохнуть +от них было +для него спасением +от мук.

注意"отдохнуть"一词有"от"。

代码本身(取自此处某处):

Sub ReplaceWithRe()
Dim re As Object 'RegExp
Dim rng As Range, cl As Range
Dim sh As Worksheet
Dim wb As Workbook
Dim sReplace As String
Dim aReplace(0 To 1, 0 To 1) As String
Dim i As Long
Set wb = ActiveWorkbook
Set re = CreateObject("vbscript.regexp") ' New RegExp
re.Global = True
re.IgnoreCase = False
re.MultiLine = True
' Load array of patterns and replacements
aReplace(0, 0) = "(bотb|bдляb)"
aReplace(0, 1) = "+$1"
For Each sh In wb.Worksheets
    On Error Resume Next
    Set rng = sh.UsedRange.SpecialCells(xlCellTypeConstants)
    If Err.Number <> 0 Then
        Err.Clear
    Else
        On Error GoTo 0
        For Each cl In rng
            sReplace = cl.Value
            ' Test each cell for each pattern, replace when found
            For i = 0 To UBound(aReplace, 1)
                re.Pattern = aReplace(i, 0)
                If re.Test(sReplace) Then
                    sReplace = re.Replace(sReplace, aReplace(i, 1))
                End If
            Next
            cl.Value = sReplace
        Next
    End If
Next
End Sub
我想我得到了一个提示。看起来这个正则表达式可以很好地处理拉丁字符,但是对于西里尔字符,它不返回匹配项。

对于西里尔字符,您应该知道,根据Regular-expressions.info, VBScript regex有

不支持Unicode,除非与

匹配单个字符

所以,b匹配在非单词边界和西里尔字母是非单词的VBScript regex引擎!

唯一的出路是像这样展开b,例如:

strPattern = "(s|^)(от|для)(s|$)" 
str = "Отдохнуть от них было для него спасением от мук и прекрасным отдыхом."
strReplace = "$1+$2$3"

我认为我们可以安全地使用空格作为分隔符,因为介词通常不后跟标点符号。你可以在第一部分添加标点符号(以防万一):

strPattern = "([s,:;]|^)(от|для)(s|$)" 
输出:

Отдохнуть +от них было +для него спасением +от мук и прекрасным отдыхом.

最新更新