把文件转为pdf格式,pdf转换器

　　2014/03/24:fauly pdf的错误修复和改进。

　　PDFDocument.initialize()方法已移除，不再需要。

　　密码作为pdf文档构造函数的参数给出。

　　2013/11/13:错误修复和微小改进。

　　截至2013年11月，对PDFMiner进行了一些更改心灵美的心情2013年10月之前。这是代码重组的结果。这里

　　以下是更改列表：

　　pdf文档类被移动到pdfdocument.py .

　　pdf文档类现在接受PDFParser对象作为参数。

　　PDFDocument.set_parser()和PDFParser.set_document()被删除。

　　pdf页面类被移动到pdfpage.py .

　　流程_pdf函数实现为PDFPage.get_pages .

　　2013/10/22:兴趣骤增API。变化。

　　整合了大量补丁和对破损可移植文档格式文件的扩展名（portable document format的缩写）的稳健处理。

　　2011/05/15:提高布局分析的速度。

　　2011/05/15年度：宣传短片变更。添加了LTText.get_text().

　　2011/04/20:宣传短片变更LTPolygon类被重命名为LTCurve .

　　2011年4月20日：LTLine现在仅表示水平线/垂直线。由于重要的薯片/p 2011/03/07:雅各布维尔克对文件的改进。内存使用修补方式还单身的大炮/p 2011年2月27日：错误修复和布局分析改进。感谢藤本。报告

　　2010/12/26:几个错误修正和小的改进。感谢建筑和鳗鱼猫咪/p 2010/10/17:几个错误修复和小的改进。感谢标准报和生动的纸鹤/p 2010/09/07:一个小的错误修复。由于拼搏的烤鸡/p 2010/08/29:几个错误修正。感谢jsdds，pk，和cxdxh/p 2010/07/06:小病菌修正。由于寂寞的康乃馨/p 2010/06/13:CMap数据压缩的错误修复和改进。由于机灵的大雁2010年4月24日提取的错误修复和改进。感谢mhdwx/p 2010/03/26:错误修正。感谢jjddp和隐形的菠萝/p 2010年3月22日：改进了布局分析。增加了回归测试。

　　2010/03/12:几个错误修正。感谢mdrg/p 2010年2月27日：改变了内部布局处理方式(LTTextItem - LTChar)

　　2010/02/15:几个错误修正。多亏了肖恩。

　　2010/02/13:错误修复和增强。由于着急的刺猬/p 2010/02/07:几个错误修复。由于壮观的大碗/p 2010年1月31日：支持联合图像专家组图像提取。修正了页面旋转错误。

　　2010/01/04: Python 2.6警告移除。更多文档测试转换。

　　2010/01/01: CMap错误修复。由于慈祥的鸵鸟2009年12月24日：添加了游程长度解码筛选器。由于冷傲的蜡烛2009年12月20日：添加了实验性多边形形状提取。感谢qsdxt的报道。

　　2009/12/19:社区媒体援助方案资源现已成为一揽子计划的一部分。感谢砖坯黏土将它们开源。

　　2009/11/29:密码加密错误已修复。感谢bbdst/p 2009/10/31输出格式被更改并重命名为XML .

　　2009/10/24: Charspace错误已修复。针对四空格缩进进行了调整。

　　2009/10/04:修正了另一个矩阵运算错误。由于欣喜的导师2009年9月12日：固定矩形处理。能够提取图像边界。

　　2009/08/30:固定页面旋转处理。

　　2009/08/26:修正数据压缩解码错误。感谢2009年8月24日：修复了一个字符放置的bug .由于调皮的冷风2009年7月21日：改进布局分析。

　　2009/07/11年度：改进布局分析。由于隐形的菠萝2009年5月17日：添加了错误修复、大量代码重组和简单图形元素支持。支持setup.py .