如何将 HTML 代码转换为 Confluence 样式的 Wiki 标记



Mylyn Wikitext的API文档具有将Wiki标记转换为HTML的功能,但是我找不到将HTML代码转换/解析为Wiki标记的函数。 类 MarkupParser 有方法 parseToHTML ,但我在哪里可以找到相反的方法?

试试Wikifier。

并没有完全按照你想要的方式做,但你可能会发现它做得足够了,或者是一个有用的起点。

Wikifier将Confluence 4 XML存储格式的片段(即由Confluence Source Editor插件呈现,没有单个文档根元素)转换为Confluence 3 wiki标记。

为什么这与你的问题完全相关?Confluence 4 XML 存储格式包括一些与 XHTML 元素和属性同名的元素和属性。

欲了解更多信息,请单击维基人网页上的帮助链接。

注意:Wikifier网页使用的XSLT样式表比与相关架构包捆绑在一起的XSLT样式表稍新。

这是后来添加的:Wikifier RT更接近你想要的。

以下是您在Mylyn中使用WikiText Standalone的方法。 用适当的DocumentBuilder替换所需的 Wiki 标记(您必须检查 API 以查看可用的内容; TextileDocumentBuilder也存在)。

文件转换为汇合.java

package com.stackoverflow.mylyn;
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.StringWriter;
import org.eclipse.mylyn.internal.wikitext.confluence.core.ConfluenceDocumentBuilder;
import org.eclipse.mylyn.wikitext.core.parser.HtmlParser;
import org.xml.sax.InputSource;
public class ConvertToConfluence {
    public static String convertHTML(File htmlFile) {
        InputStream in = null;
        try {
            in = new FileInputStream(htmlFile);
        } catch (Exception ex) {
            // TODO: handle or re-throw file exception
        }
        InputSource inputSource = new InputSource(new InputStreamReader(in));
        StringWriter writer = new StringWriter();
        ConfluenceDocumentBuilder builder = new ConfluenceDocumentBuilder(writer);
        HtmlParser parser = new HtmlParser();
        try {
            parser.parse(inputSource, builder);
        } catch (Exception ex) {
            // TODO: handle or re-throw parsing exception
        }
        return writer.toString();       
    }   
    public static void main(String args[]) {
        File file = new File("c:\filename.html");
        System.out.println(convertHTML(file));
    }
}

文件名.html

<HTML>
<BODY>
<p>This is <b>bold text</b> and some <i>italic text</i>.<br/><br/>TEST!</p>
</BODY>
</HTML>

产生汇合输出:

This is *bold text* and some _italic text_.
\TEST!

我能够使用 Atlassian 自己的 Java 库中的DefaultWysiwygConverter实现 HTML 到 Confluence 风格的 WikiMarkup。下面是一个简化的单元测试:

import com.atlassian.renderer.wysiwyg.converter.DefaultWysiwygConverter;
String htmlString = "This is <em>emphasized</em> and <b>bold</b>";
DefaultWysiwygConverter converter = new DefaultWysiwygConverter();
String wikiMarkupString = converter.convertXHtmlToWikiMarkup(htmlString);
Assert.assertEquals("This is _emphasized_ and *bold*", wikiMarkupString);

POM 必须包含正确的存储库和依赖项

    <dependency>
        <groupId>com.atlassian.renderer</groupId>
        <artifactId>atlassian-renderer</artifactId>
        <version>8.0.5</version>
        <exclusions>
            <exclusion>
                <!-- This exclusion is necessary if you are in a situation which 
                     it conflicts, EG: using spring-boot -->
                <groupId>javax.servlet</groupId>
                <artifactId>servlet-api</artifactId>
            </exclusion>
        </exclusions>
    </dependency>
    <repositories>
        <repository>
            <!-- https://developer.atlassian.com/docs/advanced-topics/working-with-maven/atlassian-maven-repositories -->
            <id>atlassian-public</id>
            <url>https://packages.atlassian.com/maven/repository/public</url>
            <snapshots>
                <enabled>true</enabled>
                <updatePolicy>never</updatePolicy>
                <checksumPolicy>warn</checksumPolicy>
            </snapshots>
            <releases>
                <enabled>true</enabled>
                <checksumPolicy>warn</checksumPolicy>
            </releases>
        </repository>
    </repositories>

据我所知,没有办法将HTML转换为Confluence wiki标记。由于 Atlassian 在 Confluence 4.x 中停止使用 textile 作为 wiki 标记,因此无需进行转换。页面格式是XHTML。

相关内容

  • 没有找到相关文章

最新更新