我使用Jtidy来提供新闻信息,当新闻信息中有TM时,页面源将其显示为
'â„¢'无效…
下面是我的代码:InputStream is = new ByteArrayInputStream(description.getBytes());输出流os=new ByteArrayOutputStream();
Tidy tidy = new Tidy();
tidy.setPrintBodyOnly(true);
//tidy.setEscapeCdata(true);
//tidy.setAsciiChars(false);
知道如何用TM代替这个编码字符....吗或者如何设置(ISO-8859-1)为Tidy?
对此有一个HTML实体,不太奇怪,称为™
-参见例如http://www.w3.org/TR/WD-entities-961125
通过在Tidy…上设置setInputEncoding()和setOutputEncoding()解决