如何 使用PHP 从PDF文档中提取文本?
(我不能使用其他工具,我没有root用户访问权限)
我发现一些函数可用于纯文本,但是它们不能很好地处理Unicode字符:
http://www.hashbangcode.com/blog/zend-lucene-and-pdf-documents-part-2-pdf- data-extraction-437.html
下载 class.pdf2text.php @ https://pastebin.com/dvwySU1a或http://www.phpclasses.org/browse/file/31030.html(需要注册)
码:
include('class.pdf2text.php'); $a = new PDF2Text(); $a->setFilename('filename.pdf'); $a->decodePDF(); echo $a->output();
class.pdf2text.php 项目首页
class.pdf2text.php
pdf2textclass不适用于我测试过的所有PDF,如果不适用于您,请尝试使用PDF Parser
pdf2textclass