我正在尝试将一个包含汉字的句子转换为拼音。
Aka: 你好, 吗? => ni hao, ma?
我想一开始去掉句子标点符号,这样我就不需要浪费循环来检查字典中的标点符号是否相等,但最终我想保留标点符号的位置,并将它们添加回翻译中。
我得到了从中文到拼音的转换,并且能够在末尾的?
中添加回来,但不确定如何替换新句子中的逗号。
/*
Remove spaces periods, commas, and question marks
*/
function removePunctuation (str) {
return str.replace(/[.,? ]/g, '');
}
function convertToPinyin () {
var cn = chinese_sentence; //你好, 吗?
var cn2 = removePunctuation(cn); //你好吗
var cn3 = cn2.split(''); //['你', '好', '吗']
var pinyin = [];
for (var i = 0; i < cn3.length; i++) {
if (cn3[i] in dictionary_json) {
pinyin.push(dictionary_json[cn3[i]].pinyin);
}
}
// cn = 你好, 吗?
// replace '你好吗' with 'ni hao ma'
// get 'ni hao, ma?'
return cn.replace(cn2, pinyin.join(' '));
}
var pinyin = convertToPinyin();
console.log('pinyin', pinyin); //ni hao ma?
//should get 'ni hao, ma?'
您可以简单地删除空白并将其作为普通字符,而不是删除标点符号,然后在字典检查过程中,首先查看所查看的字符是否不是标点符号:
function convertToPinyin () {
var cn = '你好, 吗?'; //你好, 吗?
var cn2 = cn.replace(/s/g, ''); //你好,吗?
var cn3 = cn2.split(''); //['你', ',', '好', '吗', '?']
var pinyin = [];
for (var i = 0; i < cn3.length; i++) {
if(!/[.,? ]/.test(cn3[i])) // If not punctuation
{
if (cn3[i] in dictionary_json) // Then convert
pinyin.push(dictionary_json[cn3[i]].pinyin);
} else {
pinyin.push(cn3[i]);
}
}
return cn.replace(cn2, pinyin.join(' '));
}
这样你就可以保存标点符号的位置,同时转换项目,如果它不是汉字,也不会检查字典。