怎么将html转换为word,java html转word
写爬虫互联网协议(互联网协议)被封了怎么解决?立即使用
代码:
公共静态void main(String[] args)引发异常{
字符串文件路径= C:/用户/管理员/桌面/92个诊疗方案及临床路径/;
文件文件=新文件(文件路径);
file[]files=file。列出文件();
字符串名称=空
对于(文件文件2:文件){
线程。睡眠(500);
name=file2.getName().substring(0,file2.getName().lastIndexOf( . ));
系统。出去。println(文件2。getname());
if (file2.getName().endsWith(.docx) file2.getName().endsWith(.DOCX)) {
CaseHtm.docx(filePath,file2.getName(),Name .htm’);
}否则{
CaseHtm.dox(filePath,file2.getName(),Name .htm’);
}
}
}
/**
* 转换文档
* @param filePath
* @param文件名
* @param htmlName
* @抛出异常
*/
公共静态void docx(字符串文件路径,字符串文件名,字符串超文本标记语言名称)引发异常{
最终字符串file=filePath文件名
文件f=新文件(文件);
//) 加载单词文档生成xwpf文档对象
InputStream in=新文件InputStream(f);
xwpf文档document=新的xwpf文档(in);
//) 解析可扩展的超文本标记语言配置(这里设置IURIResolver来设置图片存放的目录)
文件图像文件夹文件=新文件(文件路径);
XHTML选项选项=XHTML选项。创建().URIResolver(新fileurresolver(imageFolderFile));
选项。设置提取器(新文件图像提取器(imageFolderFile));
选项。setignorestylesifunused(false);
选项。设置片段(真);
//) 将xwpf文档转换成可扩展的超文本标记语言
输出流out=新文件输出流(新文件(文件路径html名称));
XHTMLConverter.getInstance().转换(文档、输出、选项);
}
/**
* 转换文件
* @param filePath
* @param文件名
* @param htmlName
* @抛出异常
*/
公共静态void dox(字符串文件路径,字符串文件名,字符串超文本标记语言名称)引发异常{
最终字符串file=filePath文件名
InputStream input=新文件InputStream(新文件(文件));
HWPFDocument word document=new HWPFDocument(输入);
WordToHtmlConverter WordToHtmlConverter=new WordToHtmlConverter(documentbuilderfactory。新实例().newDocumentBuilder().新建文档());
//解析单词文档
wordtohtmlconverter。流程文档(word文档);
文档html document=wordtohtmlconverter。获取文档();
文件html文件=新文件(文件路径html名称);
output stream out stream=新文件输出流(html文件);
DOM source DOM source=新的DOM源(html文档);
流结果流结果=新的流结果(out stream);
变压器厂。新实例();
变压器串行器=工厂。新变压器();
序列化程序。setoutputproperty(输出键.编码,‘utf-8’);
序列化程序。setoutputproperty(输出键.缩进,是);
序列化程序。setoutputproperty(输出键.方法,“html”);
serializer.transform(domSource,stream result);
逆流而上。close();
}pom.xml配置:
属国
groupIdfr.opensagres.xdocreport/groupId
artifactIdfr.opensagres.xdocreport.document/artifactId
版本1 .0 .5/版本
/依赖关系
属国
groupIdfr.opensagres.xdocreport/groupId
artifactIdorg.apache.poi.xwpf.converter.xhtml/artifactId
版本1 .0 .5/版本
/依赖关系
属国
groupIdorg.apache.poi/groupId
artifactIdpoi/artifactId
版本3.12/版本
/依赖关系
属国
groupIdorg.apache.poi/groupId
人工制品草稿栏/artifactId
版本3.12/版本
/依赖关系以上就是爪哇岛将单词转换为html(代码)的详细内容,更多请关注我们其它相关文章!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。