一尘不染

在Java中以编程方式将Word doc转换为HTML

html

我需要将Word文档转换为Java中的HTML文件。该函数将输入一个Word文档,而输出将是基于Word文档的页数的html文件,即如果word文档具有3页,则将生成3个具有所需分页符的html文件。

我搜索了可以将doc转换为html但没有结果的开源/非商业API。曾经做过此类工作的任何人都请帮助。

谢谢


阅读 292

收藏
2020-05-10

共2个答案

一尘不染

我们使用tm-extractors,然后回到商业Aspose。两者都有本机Java
API。

2020-05-10
一尘不染

我建议使用JODConverter,它利用了OpenOffice,可以为当今可用的OpenDocument和Microsoft Office格式提供最佳的导入/导出过滤器。

JODConverter有很多文档,脚本和教程可以帮助您。

2020-05-18