Menü Schließen

Debian mittels PDFGrep PDF Dokumenten durchsuchen

Unix Shell

Ich möchte aus der Konsole unter Debian Wheezy nach einem bestimmten Wort innerhalb mehrerer PDF Dokumente suchen. Als Tool werde ich PDFGrep verwenden.

PDFGrep

Ist ein Tool für die Befehlszeilen. Es erlaubt das durchsuchen einer oder mehrerer PDF Dokumente. Neben einzelnen Dateien kann auch ein Ordner, der viele PDF Dokumente enthält, angegeben werden. Dafür kann ein Wort oder gar ein Suchmuster verwendet werden. Die Suchtreffer können zudem farblich hervorgehoben werden. Ein weiteres Feature ist die Ausgabe der Seite auf der der Treffer erreicht wurde. Ebenso kann Groß- und Kleinschreibung ignoriert werden. Das Konsolentool PDFGrep arbeitet dabei ähnlich dem bekannten Grep, jedoch nicht zeilenbasiert, sondern auf Seitenbasis.

Installation

aptitude install pdfgrep

Manual zu PDFGrep

SYNOPSIS
pdfgrep [OPTION…]  PATTERN FILE…

DESCRIPTION
Search for PATTERN in each FILE. PATTERN is an extended regular expression.

pdfgrep works much like grep, with one distinction: It operates on pages and not on lines.

1 Beispiel – in PDF-Dok1 und PDF-Dok2 nach Taste suchen

pdfgrep Taste PDF-Dok1.pdf PDF-Dok2.pdf

2. Beispiel – in allen Dateien mit der Endung .pdf nach Taste suchen, wobei Groß- und Kleinschreibung (-i) egal ist

pdfgrep -i Taste *.pdf

3. Beispiel – in allen Verzeichnissen inkl. Unterverzeichnis (-r) nach Taste suchen, egal ob Groß- oder Kleinschreibung inkl. Rückgabe des Dateinamen und der Seitenummer (-n)

pdfgrep -rni Taste *.pdf

4. Beispiel – wie in Punkt 3 jedoch werden lediglich die Anzahl der Treffer je Dokument angezeigt

pdfgrep -ric Taste *.pdf

5. Beispiel – sucht nach Taste in allen Verzeichnissen, egal ob Groß- oder Kleinschreibung, jedoch nicht in den Dateien die „abc“ im Namen haben oder datei-taste-1.pdf heißen (-exclude)

pdfgrep -ri –exclude=datei-taste-1.pdf –exclude=’*abc*‘ Taste *

 

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert