我需要做的是在单元格中的每个介词之前添加一个+ +
号?由于某种原因,b
对我不起作用。
在JavaScript中,它应该可以正常工作:
(bofb|batb)
//change with
+$1
但是在Excel中使用相同的正则表达式的VBA脚本将不匹配任何内容。
的例子:
И отдохнуть от них было для него спасением от мук.
结果应该是:
И отдохнуть +от них было +для него спасением +от мук.
注意"отдохнуть"一词有"от"。
代码本身(取自此处某处):
Sub ReplaceWithRe()
Dim re As Object 'RegExp
Dim rng As Range, cl As Range
Dim sh As Worksheet
Dim wb As Workbook
Dim sReplace As String
Dim aReplace(0 To 1, 0 To 1) As String
Dim i As Long
Set wb = ActiveWorkbook
Set re = CreateObject("vbscript.regexp") ' New RegExp
re.Global = True
re.IgnoreCase = False
re.MultiLine = True
' Load array of patterns and replacements
aReplace(0, 0) = "(bотb|bдляb)"
aReplace(0, 1) = "+$1"
For Each sh In wb.Worksheets
On Error Resume Next
Set rng = sh.UsedRange.SpecialCells(xlCellTypeConstants)
If Err.Number <> 0 Then
Err.Clear
Else
On Error GoTo 0
For Each cl In rng
sReplace = cl.Value
' Test each cell for each pattern, replace when found
For i = 0 To UBound(aReplace, 1)
re.Pattern = aReplace(i, 0)
If re.Test(sReplace) Then
sReplace = re.Replace(sReplace, aReplace(i, 1))
End If
Next
cl.Value = sReplace
Next
End If
Next
End Sub
我想我得到了一个提示。看起来这个正则表达式可以很好地处理拉丁字符,但是对于西里尔字符,它不返回匹配项。
对于西里尔字符,您应该知道,根据Regular-expressions.info, VBScript regex有
不支持Unicode,除非与
匹配单个字符
所以,b
匹配在非单词边界和西里尔字母是非单词的VBScript regex引擎!
唯一的出路是像这样展开b
,例如:
strPattern = "(s|^)(от|для)(s|$)"
str = "Отдохнуть от них было для него спасением от мук и прекрасным отдыхом."
strReplace = "$1+$2$3"
我认为我们可以安全地使用空格作为分隔符,因为介词通常不后跟标点符号。你可以在第一部分添加标点符号(以防万一):
strPattern = "([s,:;]|^)(от|для)(s|$)"
输出:Отдохнуть +от них было +для него спасением +от мук и прекрасным отдыхом.