使用splice的文本替换不适用于smile(或多字节字符)



我有一个复杂的替换算法的问题。最后,我将问题简化为以下代码:

const input="test 🙄 hello test world"
let start = 0
let output = [...input]
const replacements = []
for (let end = 0; end <= input.length; end++) {
const c = input[end]
if (c == ' ') {
if (start !== end) {
const word = input.substring(start, end).toLowerCase()
if (word == 'test') {
replacements.push({start, length:(end - start), text:'REPLACEMENT'})
}
}
start = end + 1
}
}
for(let i=replacements.length-1;i>=0;i--) {
output.splice(replacements[i].start, replacements[i].length, replacements[i].text)
}
console.log(output.join(''))

我的输入是"test 🙄 hello test world",期望的输出是"REPLACEMENT 🙄 hello REPLACEMENT world",但实际上是"REPLACEMENT 🙄 hello tREPLACEMENTworld"。我记得在Twitter API中,JavaScript有一种奇怪的方式来处理字节位置和字符索引。所以这个问题是由笑脸符号引起的。

我如何修复我的代码,使替换工作如预期?还有一个问题,为什么会这样?

真够快的:

const input="test 🙄 hello test world"
let start = 0
let output = [...input]
const replacements = []
for (let end = 0; end <= output.length; end++) {
const c = output[end]
if (c == ' ') {
if (start !== end) {
const word = output.slice(start, end).join('').toLowerCase()
if (word == 'test') {
replacements.push({start, length:(end - start), text:'REPLACEMENT'})
}
}
start = end + 1
}
}
for(let i=replacements.length-1;i>=0;i--) {
output.splice(replacements[i].start, replacements[i].length, replacements[i].text)
}
console.log(output.join(''))

当我使用输出数组作为输入时,索引按预期工作,我的替换再次工作。但是,我将给任何可以解释为什么需要更改的人提供可接受的状态。

相关内容

  • 没有找到相关文章

最新更新