计算翻译重复



我已经在网络上查找了标准公式,以计算要翻译的文档中的重复。我还没有找到它。对于那些不知道翻译中的重复的人,这给出了很好的描述。

我首先尝试了类似的东西

using System;
using System.Collection.Generic;
using System.Text.RegularExpressions;
using System.Linq;
<snip>
Dictionary<string, int> _dict = new Dictionary<string, int>();
int CalculateRepetitions(string plainTextDoc) {
    foreach (string item in Regex.Split(plainTextDoc, "\P{L}+"))
        if (_dict.ContainsKey(item))
            _dict[item]++;
        else
            _dict.Add(item, 0);
    return _dict.Where((key, value) => value > 0).Count();
}

但这与同一文档的trados的样本号不接近,无论如何是重复的错误定义。有人有一个很好的示例来计算翻译重复吗?我不希望只有C#答案,我也对Java和C 答案很好。

gmx/v标准可能是您的答案,似乎有一个C#实现。

最新更新