使用wkhtmltopdf把网页转换为pdf的经验总结
使⽤wkhtmltopdf把⽹页转换为pdf的经验总结
最近项⽬上需要做⼀个在线合同的功能,合同有电⼦版,需要把⽹页版的合同直接⽣产pdf,要求样式不能乱,有页码有页眉页脚等等,在⽹上搜索⼀段时间后,到了⼀个⼯具叫: wkhtmltopdf ,这应该是国外的⼀款免费软件,有Windows,mac,linux版,直接在命令⾏调⽤,这⼏天完成了⼀个demo,顺便总结⼀下。
// 2017年3⽉7⽇15:49:58 好像这个⼯具⽆法解析angularjs……
先贴上demo代码:
调⽤类:
package WkHtmlToPDF;
import java.io.File;
import java.util.Date;
/**
* Created by Jerry on 2017/2/13.
* God Bless Me
*/
public class wkhtmltopdf {
//wkhtmltopdf 在系统中的路径
private static final String toPdfTool = "C:\\Program Files\\wkhtmltopdf\\bin\\";
public static void main(String[] args) {
Date date = new Date();
String fileName = String.Time()) + ".pdf";
convert("www.jianshu/p/74e3a6ee4ae8", "D:\\PDF\\" + fileName);
}
/
**
* html转pdf
*
* @param srcPath  html路径,可以是硬盘上的路径,也可以是⽹络路径
* @param destPath pdf保存路径
* @return转换成功返回true
*/
public static boolean convert(String srcPath, String destPath) {
File file = new File(destPath);
File parent = ParentFile();
//如果pdf保存路径不存在,则创建路径
if (!ists()) {
parent.mkdirs();
}
StringBuilder cmd = getFormal();
//html路径即⽬标⽹页路径
cmd.append(" ");
cmd.append(srcPath);
cmd.append(" ");
//pdf保存路径
cmd.append(destPath);
boolean result = true;
try {
Process proc = Runtime().String());
HtmlToPdfInterceptor error = new ErrorStream());
HtmlToPdfInterceptor output = new InputStream());
error.start();
output.start();
proc.waitFor();
} catch (Exception e) {
} catch (Exception e) {
result = false;
e.printStackTrace();
}
return result;
}
/**
* 标准格式
*
* @return
*/
public static StringBuilder getFormal() {
StringBuilder cmd = new StringBuilder();
//wkhtmltopdf 在系统中的路径
cmd.append(toPdfTool);
cmd.append(" ");
cmd.append(" --header-line");//页眉下⾯的线
//      cmd.append("  --footer-line");//页脚上⾯的线
cmd.append("  --footer-center [page]/[topage]"); //在页脚中⼼放置页码
//      cmd.append("  --header-right 这⾥是我们系统的页眉"); //页眉中间放置⽂字
cmd.append("  --header-html localhost:8090/myheader.html"); //页眉中间放置图⽚        cmd.append("  --header-spacing 5 ");// (设置页眉和内容的距离,默认0 )
cmd.append("  --margin-top 20mm  "); //设置页⾯上边距 (default 10mm)
cmd.append(" cover localhost:8090/firstPage.html ");
return cmd;
}
public static StringBuilder test1() {
StringBuilder cmd = new StringBuilder();
//wkhtmltopdf 在系统中的路径
cmd.append(toPdfTool);
//      cmd.append(" --cover localhost:8090/firstPage.html");
cmd.append(" -T 15mm");
cmd.append(" --header-spacing 5");
cmd.append(" --outline");
cmd.append(" cover image.baidu");
cmd.append(" ");
return cmd;
}
}
⼯具类:
package WkHtmlToPDF;
/**
* Created by Jerry on 2017/2/13.
* God Bless Me
*/
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
张良的故事>手机用路由器上网import java.io.InputStreamReader;
/**
* 当java调⽤wkhtmltopdf时,⽤于获取wkhtmltopdf返回的内容
*/
public class HtmlToPdfInterceptor extends Thread {
private InputStream is;
public HtmlToPdfInterceptor(InputStream is){
this.is = is;
}
public void run(){
try{
InputStreamReader isr = new InputStreamReader(is, "utf-8");
BufferedReader br = new BufferedReader(isr);
String line = null;
while ((line = br.readLine()) != null) {
System.out.String()); //输出内容
}
}catch (IOException e){
e.printStackTrace();
}
}
}
基本上你复制这两个类,安装完这个⼯具,就可以直接跑起来了。
这⾥有⼏点我⾃⼰探索的经验:
1. 虽然我看的⼏篇资料⾥⾯都没有说命令执⾏有先后的区别,但很明显,在⽣成⾸页的时候,必须把
cmd.append(" cover localhost:8090/firstPage.html ");
写在最后,不然就会报错。
2. 还有⼀点容易忽略的,是每个命令的最后⼀定要加空格,不然会出现命令粘连的问题,很基础,很难发现。
附上常⽤命令表;
Linux:wkhtmltopdf [OPTIONS]… [More input files]
windows: [OPTIONS]… [More input files]
常规选项
–allow 允许加载从指定的⽂件夹中的⽂件或⽂件(可重复)
–book* 设置⼀会打印⼀本书的时候,通常设置的选项
–collate 打印多份副本时整理
–cookie 设置⼀个额外的cookie(可重复)
–cookie-jar 读取和写⼊的Cookie,并在提供的cookie jar⽂件
–copies 复印打印成pdf⽂件数(默认为1)
–cover* 使⽤HTML⽂件作为封⾯。它会带页眉和页脚的TOC之前插⼊
–custom-header 设置⼀个附加的HTTP头(可重复)
–debug-JavaScript 显⽰的javascript调试输出
–default-header* 添加⼀个缺省的头部,与页⾯的左边的名称,页⾯数到右边,例如: –header-left ‘[webpage]’ –header-right ‘[page]/[toPage]’ –header-line –disable-external-links* 禁⽌⽣成链接到远程⽹页
–disable-internal-links* 禁⽌使⽤本地链接
–disable-javascript 禁⽌让⽹页执⾏JavaScript
–disable-pdf-compression* 禁⽌在PDF对象使⽤⽆损压缩
刘鑫江歌案–disable-pdf-compression* 禁⽌在PDF对象使⽤⽆损压缩
–disable-smart-shrinking* 禁⽌使⽤WebKit的智能战略收缩,使像素/ DPI⽐没有不变
–disallow-local-file-access 禁⽌允许转换的本地⽂件读取其他本地⽂件,除⾮explecitily允许⽤ –allow
–dpi 显式更改DPI(这对基于X11的系统没有任何影响)
–enable-plugins 启⽤已安装的插件(如Flash
–encoding 设置默认的⽂字编码
–extended-help 显⽰更⼴泛的帮助,详细介绍了不常见的命令开关
–forms* 打开HTML表单字段转换为PDF表单域
–grayscale PDF格式将在灰阶产⽣
–help Display help
–htmldoc 输出程序HTML帮助
–ignore-load-errors 忽略claimes加载过程中已经遇到了⼀个错误页⾯
–lowquality 产⽣低品质的PDF/ PS。有⽤缩⼩结果⽂档的空间
–manpage 输出程序⼿册页
–margin-bottom 设置页⾯下边距 (default10mm)
–margin-left将左边页边距 (default10mm)
–margin-right设置页⾯右边距 (default10mm)
–margin-top 设置页⾯上边距 (default10mm)
柩–minimum-font-size最⼩字体⼤⼩ (default5)
–no-background 不打印背景
–orientation 设置⽅向为横向或纵向
–page-height 页⾯⾼度 (default unit millimeter)
–page-offset* 设置起始页码 (default1)
–page-size设置纸张⼤⼩: A4, Letter, etc.
–page-width 页⾯宽度 (default unit millimeter)
–password HTTP验证密码
–post Add an additional post field (repeatable)
–post-file Post an aditional file (repeatable)
–print-media-type* 使⽤的打印介质类型,⽽不是屏幕
–proxy 使⽤代理
–quiet Be less verbose
–read-args-from-stdin 读取标准输⼊的命令⾏参数
–readme 输出程序⾃述
–redirect-delay 等待⼏毫秒为JS-重定向(default200)
–replace* 替换名称,值的页眉和页脚(可重复)
–stop-slow-scripts 停⽌运⾏缓慢的JavaScripts
–title ⽣成的PDF⽂件的标题(第⼀个⽂档的标题使⽤,如果没有指定)
–toc* 插⼊的内容的表中的⽂件的开头
–use-xserver* 使⽤X服务器(⼀些插件和其他的东西没有X11可能⽆法正常⼯作)
–user-style-sheet 指定⽤户的样式表,加载在每⼀页中
–username HTTP认证的⽤户名
食品商标注册–version 输出版本信息退出
–zoom 使⽤这个缩放因⼦ (default1)
页眉和页脚选项
–header-center* (设置在中⼼位置的页眉内容)
–header-font-name* (default Arial) (设置页眉的字体名称)
–header-font-size* (设置页眉的字体⼤⼩)
–header-html* (添加⼀个HTML页眉,后⾯是⽹址)
–header-left* (左对齐的页眉⽂本)
–header-line* (显⽰⼀条线在页眉下)
–header-right* (右对齐页眉⽂本)
–header-spacing* (设置页眉和内容的距离,默认0)
–footer-center* (设置在中⼼位置的页脚内容)
–footer-font-name* (设置页脚的字体名称)
–footer-font-size* (设置页脚的字体⼤⼩default11)
–footer-html* (添加⼀个HTML页脚,后⾯是⽹址)
–footer-left* (左对齐的页脚⽂本)
–footer-line* 显⽰⼀条线在页脚内容上)
–footer-right* (右对齐页脚⽂本)
–footer-spacing* (设置页脚和内容的距离)
./wkhtmltopdf –footer-right ‘[page]/[topage]’ www.baidu baidu.pdf
./wkhtmltopdf –header-center ‘报表’ –header-line –margin-top 2cm –header-line 192.168.212.139/oma/ oma.pdf 表内容选项中
–toc-depth* Set the depth of the toc (default3)
–toc-disable-back-links* Do not link from section header to toc
–toc-disable-back-links* Do not link from section header to toc
–toc-disable-links* Do not link from toc to sections
–toc-font-name* Set the font used for the toc (default Arial)
–toc-header-font-name* The font of the toc header (if unset use –toc-font-name) –toc-header-font-size* The font size of the toc header (default15)
–toc-header-text* The header text of the toc (default Table Of Contents)
–toc-l1-font-size* Set the font size on level1of the toc (default12)
–toc-l1-indentation* Set indentation on level1of the toc (default0)
–toc-l2-font-size* Set the font size on level2of the toc (default10)
–toc-l2-indentation* Set indentation on level2of the toc (default20)
–toc-l3-font-size* Set the font size on level3of the toc (default8)
–toc-l3-indentation* Set indentation on level3of the toc (default40)
–toc-l4-font-size* Set the font size on level4of the toc (default6)
–toc-l4-indentation* Set indentation on level4of the toc (default60)
–toc-l5-font-size* Set the font size on level5of the toc (default4)
–toc-l5-indentation* Set indentation on level5of the toc (default80)
–toc-l6-font-size* Set the font size on level6of the toc (default2)
–toc-l6-indentation* Set indentation on level6of the toc (default100)
–toc-l7-font-size* Set the font size on level7of the toc (default0)
–toc-l7-indentation* Set indentation on level7of the toc (default120)
–toc-no-dots* Do not use dots, in the toc
轮廓选项
–dump-outline 转储⽬录到⼀个⽂件
–outline 显⽰⽬录(⽂章中h1,h2来定)
–outline-depth 设置⽬录的深度(默认为4)
页脚和页眉
* [page] 由当前正在打印的页的数⽬代替
* [frompage] 由要打印的第⼀页的数量取代
* [topage] 由最后⼀页要打印的数量取代
* [webpage] 通过正在打印的页⾯的URL替换
陪伴 作文600字
* [section] 由当前节的名称替换
* [subsection] 由当前⼩节的名称替换
* [date] 由当前⽇期系统的本地格式取代
* [time] 由当前时间,系统的本地格式取代
欢迎留⾔探讨。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。