File Index mit Apache

Alles, was den Apache betrifft, kann hier besprochen werden.

File Index mit Apache

Postby Trawell » 03. June 2014 17:44

Hallo zusammen

ich möchte gerne Files die über ein Upload Forum hochgeladen werden (Word, Excel und PDF), mit einem Keyword durchsuchen

Wie macht man sowas ?

Über eine deutschsprachige Anleitung wie man so ein Index Job macht (den man täglich nachts laufen lassen kann), und was es sonst noch so alles dazu braucht, wäre ich dankbar.

Im Internet habe ich bisher nichts deutschsprachiges gefunden (allerdings auch nur ganz kurz gesucht, Asche über mein Haupt)

Gruss, Traw
Trawell
 
Posts: 4
Joined: 03. June 2014 17:40
Operating System: Linux

Re: File Index mit Apache

Postby Nobbie » 03. June 2014 20:49

Trawell wrote:Hallo zusammen

ich möchte gerne Files die über ein Upload Forum hochgeladen werden (Word, Excel und PDF), mit einem Keyword durchsuchen

Wie macht man sowas ?


In diesem speziellen Fall möglicherweise gar nicht, denn sämtliche von Dir genannten Dateitypen sind keine Textdateien (die man - dem Begriff entsprechend - nach Text durchsuchen kann), sondern sog. "Binärdateien". Da sind komplexe Format- und Grafikanweisungen inkludiert, weswegen es keine standardisierte Möglichkeit gibt, Texte aus diesen Dateien herauszuziehen.

Andererseits sind die Texte teilweise natürlich drin und zumindest PDF Dateien werden auch von Google gespidert.

Trawell wrote:Über eine deutschsprachige Anleitung wie man so ein Index Job macht (den man täglich nachts laufen lassen kann), und was es sonst noch so alles dazu braucht, wäre ich dankbar.


Das wirst Du hier nicht bekommen. Das hat überhaupt nichts mit dem Thema des Forums zu tun.

Trawell wrote:Im Internet habe ich bisher nichts deutschsprachiges gefunden (allerdings auch nur ganz kurz gesucht, Asche über mein Haupt)


Das macht doch nichts. Dann suchst Du eben ab jetzt mehr, hier bekommst Du den wertvollen Tip, dass das über eigene Scripts eher schwierig bis sehr schwieirg ist (wenn Du keine fertige Lösung findest, dann müßtest Du das selbst programmieren inkl. Erstellung eines intelligenten Algorithmus zur Indexverwaltung der Treffer, eine sehr anspruchsvolle Aufgabe), weswegen Du dich besser an Google orientieren solltest. denn Google bietet die Möglichkeit an, eine Suche auf eine bestimmte Domain (Homepage) zu beschränken. Dann hättest Du als Suchmaschine die Macht von Google, musst es aber nicht selbst ausprogrammieren.

In diese Richtung würde ich an Deiner Stelle (nun verstärkt) suchen, möglicherweise findest Du eine befriedigende Lösung.
Nobbie
 
Posts: 13170
Joined: 09. March 2008 13:04


Return to Apache

Who is online

Users browsing this forum: No registered users and 33 guests