首页 > 贝壳 > Linux中批量查找(grep)pdf文件中字符串

Linux中批量查找(grep)pdf文件中字符串

2011年12月14日 sigma 发表评论 阅读评论

有时候,我们想在很多pdf中查找某个特定的字符串。一个很笨的方法就是一个一个文件打开,然后用类似Ctrl+F的方法查找。

但是,这种方法太低效了,今天不小心发现了有个pdftotext的工具,可以把pdf转化成txt,之后即可以用grep了。下面给出一个批量查找某目录下所有pdf文件中含有某字符串的方法:

find . -iname "*.pdf" | while read pdf;
do
    echo "========================================================================================="
    echo $pdf
    pdftotext "$pdf" -| grep somewords -nr
done

本文作者: Sigma    在新浪微博关注SigmaSigmaWeibo    RSS订阅本博客
本文链接: http://mblog.sigma.me/2011/12/14/grep-for-pdf-in-linux.html
本博客采用知识共享署名—非商业性-禁止演绎使用3.0协议进行许可,转载请保留作者和原文链接。

分类: 贝壳 标签: , , ,

  1. 本文目前尚无任何评论.
  1. 本文目前尚无任何 trackbacks 和 pingbacks.

无觅相关文章插件,快速提升流量