删除标点符号,然后使用替换在相同的索引处添加标点符号



我正在尝试将一个包含汉字的句子转换为拼音。

Aka: 你好, 吗? => ni hao, ma?

我想一开始去掉句子标点符号,这样我就不需要浪费循环来检查字典中的标点符号是否相等,但最终我想保留标点符号的位置,并将它们添加回翻译中。

我得到了从中文到拼音的转换,并且能够在末尾的?中添加回来,但不确定如何替换新句子中的逗号。

/*
  Remove spaces periods, commas, and question marks
*/
function removePunctuation (str) {
  return str.replace(/[.,? ]/g, '');
}
function convertToPinyin () {
  var cn = chinese_sentence; //你好, 吗?
  var cn2 = removePunctuation(cn); //你好吗
  var cn3 = cn2.split(''); //['你', '好', '吗']
  var pinyin = [];
  for (var i = 0; i < cn3.length; i++) {
    if (cn3[i] in dictionary_json) {
      pinyin.push(dictionary_json[cn3[i]].pinyin);
    }
  }
  // cn = 你好, 吗?
  // replace '你好吗' with 'ni hao ma'
  // get 'ni hao, ma?'
  return cn.replace(cn2, pinyin.join(' '));
}
var pinyin = convertToPinyin();
console.log('pinyin', pinyin); //ni hao ma?
//should get 'ni hao, ma?'

您可以简单地删除空白并将其作为普通字符,而不是删除标点符号,然后在字典检查过程中,首先查看所查看的字符是否不是标点符号:

function convertToPinyin () {
  var cn = '你好, 吗?'; //你好, 吗?
  var cn2 = cn.replace(/s/g, ''); //你好,吗?  
  var cn3 = cn2.split(''); //['你', ',', '好', '吗', '?']
  var pinyin = [];
  for (var i = 0; i < cn3.length; i++) {
    if(!/[.,? ]/.test(cn3[i])) // If not punctuation 
    { 
        if (cn3[i] in dictionary_json) // Then convert
            pinyin.push(dictionary_json[cn3[i]].pinyin);
    } else {
        pinyin.push(cn3[i]);
    }
  } 
  return cn.replace(cn2, pinyin.join(' '));
}

这样你就可以保存标点符号的位置,同时转换项目,如果它不是汉字,也不会检查字典。

最新更新