泰米尔unicode字符串的最后一个字符



如何获取unicode泰米尔字符串的最后一个字符。例如,我有一个字符串列表,如"சுதீப்", "செய்தியை", "கொள்ளாதது", "வில்லன்"

如果我对上面的字符串使用mystring.Last()我得到

"சுதீப்" = ""்"""செய்தியை" = "ை"கொள்ளாதது" = ""ு"""வில்லன்" = ""்""

但是我需要得到

"சுதீப்" = ""ப்"""செய்தியை" = ""யை"""கொள்ளாதது" = ""து"""வில்லன்" = ""ன்""

我建议您创建一个辅助函数,在其中循环遍历每个字符并检查UnicodeCategory。

<<p> 扩展/strong>
<System.Runtime.CompilerServices.Extension()> _
Public Module StringExtensions
    <System.Runtime.CompilerServices.Extension()> _
    Public Function Split(str As String, category As UnicodeCategory) As IList(Of String)
        Dim list As New List(Of String)
        If ((Not str Is Nothing) AndAlso (str.Length > 0)) Then
            Dim item As String = Nothing
            Dim chr As Char = Nothing
            For Each chr In str
                If (Char.GetUnicodeCategory(chr) = category) Then
                    If ((Not item Is Nothing) AndAlso (item.Length > 0)) Then
                        list.Add(item)
                    End If
                    item = chr
                Else
                    item += chr
                End If
            Next
            If ((Not item Is Nothing) AndAlso (item.Length > 0)) Then
                list.Add(item)
            End If
        End If
        Return list
    End Function
End Module
使用

Imports [your_namespace].StringExtensions
Dim values As String() = {"சுதீப்", "செய்தியை", "கொள்ளாதது", "வில்லன்"}
Dim builder As New System.Text.StringBuilder()
For Each item As String In values
    builder.AppendLine(String.Concat(item, " : ", item.Split(UnicodeCategory.OtherLetter).Last()))
Next
MessageBox.Show(builder.ToString())

சுதீப் : ப்
செய்தியை : யை
கொள்ளாதது : து
வில்லன் : ன்

最新更新