SharePointCommunity
Die deutschsprachige Community für SharePoint, Microsoft 365, Teams, Yammer und mit Azure

Sponsored by

Willkommen im Forum Archiv.
Einträge sind hier nicht mehr möglich, aber der Bestand von 12 Jahren SharePoint-Wissen ist hier recherchierbar.




PDF aus Excel 2010 wird nicht indiziert

Unbeantwortet Dieser Beitrag hat 7 Antworten

Ohne Rang
53 Beiträge
Fisch erstellt 8 Feb. 2013 10:23
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Hallo,

wir haben im Sharepoint mehrere Dateien liegen, welche über die Funktion "Speichern unter" von Excel 2010 erstellt wurden.

Diese werden bei der nächtlichen Indizierung nicht (erfolgreich) durchsucht. Dementsprechend werden auch bei der Sharepoint-Suche keine Treffer bei der Suche nach Begriffen in den Dokumenten angezeigt.

Woran kann das liegen?

Alle Antworten

Ohne Rang
611 Beiträge
Florian Adler Als Antwort am 8 Feb. 2013 11:25
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Was sagt denn der Crawlerbericht dazu? Wirft der Fehler oder Warnungen bei diesen Dateien?

Wird die Datei denn überhaupt nicht gefunden oder wird der Inhalt der Dokumente nicht gefunden? Wenn Letzteres: Habt ihr einen iFilter auf dem Server installiert? PDF werden OOTB nicht vom SharePoint indexiert. Jedenfalls nicht im SP2010. Der 2013er kommt, glaube ich, nativ mit einem PDF-iFilter daher.

Ich bin wieder (sporadisch) hier!

Ohne Rang
53 Beiträge
Fisch Als Antwort am 8 Feb. 2013 12:19
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Soweit ich unseren Dienstleister verstanden habe, werden keine Fehler oder Warnungen geworfen, das hätte ich gehört.

Es ist vor allem so, dass einige andere PDFs im selben Verzeichnis durchsucht werden. Diese wurden allerdings nicht mit Excel2010 und "Speichern unter", sondern mit dem Drucker "FreePDF" erstellt. Vom "Header" her (oder so) sagt unser Dienstleister, dass die Dateien gleich aussehen.

Ohne Rang
19231 Beiträge
Andi Fandrich Als Antwort am 8 Feb. 2013 12:24
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Der Dienstleister sollte im Crawl-Log nach den Dateien suchen. Dort steht ob sie überhaupt gefunden wurden und warum sie ggf. nicht indiziert wurden.

Es gibt verschiedene iFilter für PDF. Der kostenlose von Adobe ist dabei nicht wirklich zu empfehlen, weil er viele PDFs als unbrauchbar ablehnt, die von anderen problemlos indiziert werden. Und langsam ist er auch.

Viele Grüße
Andi
af @ evocom de
Blog
Ohne Rang
611 Beiträge
Florian Adler Als Antwort am 8 Feb. 2013 12:34
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Jezt nur für mein Verständnis: Ihr habt PDF-Dateien, die unterschiedlich erstellt wurden. Einmal per PDF-Drucker und einmal per Office-Export-Funktion.

Die durch den Drucker erstellten Dateien werden erst im lokalen Speicher abgelegt und dann per Browser in die Bibliotheken hochgeladen, richtig? Diese sind dann nur per Dateiname oder auch per Volltext auffindbar?

Wichtig für mich wäre jetzt noch, wie ihr die Dateien per Export-Funktion ablegt. Werden die auch vorher auf der lokalen Festplatte abgelegt und dann manuell hochgeladen oder direkt aus Office heraus auf dem SharePoint abgelegt?
Ich habe es jetzt schon mehrfach erlebt, dass beim Hochladen per WebDAV die Dateien gar nicht auf dem SharePoint sichtbar sind, obwohl man genau die Zielbibliothek ausgewählt hat.

Ich bin wieder (sporadisch) hier!

Ohne Rang
53 Beiträge
Fisch Als Antwort am 12 Feb. 2013 09:46
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Aaaalso, beim Crawler sieht nach unserem Dienstleister nichts seltsam aus, also gehe ich davon aus, dass die Datei "normal" gefunden wird.

Wir haben in der Dokbib zwei Sorten von PDFs:

Sorte 1 wird von dem Anwender über den Drucker FreePDF lokal erzeugt und dann über die Hochladen-Funktion hochgeladen.
Diese Version wird korrekt mit Volltext durchsucht.

Sorte 2 wird folgendermaßen erzeugt: Die xls-Datei wird mit Excel geöffnet, dann wird bei "Speichern unter" der Typ "PDF" ausgewählt und die Datei in einer anderem Bibliothek in Sharepoint gespeichert.
DANACH geht die Anwenderin in die Zielbibliothek und geht dort auf "hochladen" um die Datei aus dem anderen Verzeichnis noch in dieses Verzeichnis zu kopieren.
Die Datei wird zwar als Datei gefunden, jedoch nicht Volltext durchsucht.

Ohne Rang
19231 Beiträge
Andi Fandrich Als Antwort am 12 Feb. 2013 10:14
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Mal eine Frage vorweg: ist die Datei eingecheckt und für andere Benutzer im Browser sichtbar?

Falls ja, solltest Ihr Eurem Dienstleister nochmal auf die Füße treten. Er soll Euch mal eine Kopie oder einen Screenshot des Crawl-Logs schicken, aus dem ersichtlich ist, was genau mit einem solchen PDF passiert. Wenn dort wirklich steht, daß die Datei erfolgreich indiziert wurde, muß das Problem irgendwo anders liegen. Es könnte z.B. ein falscher Standard-Scope für die Suche eingestellt sein, der eben diese Dateien nicht enthält.

Viele Grüße
Andi
af @ evocom de
Blog
Ohne Rang
53 Beiträge
Fisch Als Antwort am 25 Apr. 2013 12:19
SchlechtSchlechtIn OrdnungIn OrdnungDurchschnittDurchschnittGutGutSehr gutSehr gut

Aaalso, um die Sache zumindest abzurunden: Wir haben nicht herausgefunden, warum die Dateien aus Office 2010 nicht indiziert werden. Wir werden jetzt den FoxIt iFilter kaufen. Mit diesem klappt das nach ersten Tests.