<< Lucene eLecture [47/117] >>

Lucene eLecture


Startseite / Projekte / Lucene eLecture

Weg

Lucene eLecture



Entwicklung eines Suchframeworks für das eLecture-Portal (http://electures.informatik.uni-freiburg.de/catalog/courses.do) des Instituts für Informatik (http://www.informatik.uni-freiburg.de/) an der Albert-Ludwigs-Universität Freiburg (http://www.uni-freiburg.de/).
Basierend auf Lucene (http://lucene.apache.org/) (von Jakarta (http://jakarta.apache.org/)) wurde ein Suchframework erstellt.
Das zu indizierende Datenvolumen beträgt insgesamt etwa 360GB und besteht im wesentlichen aus folgenden Dateiformaten:
- PDF (Portable Document Format)
- PPT (Microsoft Office PowerPoint)
- LPD (Lecturnity-Aufzeichnungen)
- LPD mit Video (Lecturnity-Aufzeichnungen mit Video)
- Flash (Macromedia)
- AVI (Audio-Video-Interleave)

Zur Indizierung dieser Formate wurden entsprechende Parser recherchiert und angewendet, wie z.B. PDFBox (http://www.pdfbox.org/) (PDF) und Jakarta-POI (http://jakarta.apache.org/poi/hslf/index.html) (PPT). Für die Indizierung der AVI-Dateien wurde ein bereits vorhandener Index der Suchmaschine AVISearch (http://ira.informatik.uni-freiburg.de/cgi-bin/avisearch/avisearch.cgi) verwendet.
Die fertige Suchmaschine ist unter http://electures.informatik.uni-freiburg.de/search/init.do (http://electures.informatik.uni-freiburg.de/search/init.do) (http://electures.informatik.uni-freiburg.de:8484/search/) erreichbar.  


Konzeption
- Wolfgang Hürst (http://ad.informatik.uni-freiburg.de/~huerst/
- Stephan Trahasch (http://ad.informatik.uni-freiburg.de/~trahasch/
Entwicklung
- Markus Krebs 
- Hua Zhang (struts


Details

Programmiersprache(n)JAVA
TechnologienJSP, Servlets, Struts, mySQL, Lucene
Zu lösende AufgabenEinarbeitung in Lucene, Recherche nutch (http://lucene.apache.org/nutch/) und Red-Piranha (http://red-piranha.sourceforge.net/), Indizierung von PDF, PPT, LPD (Lecturnity) und AVI, Erstellung eines Crawlers für den File-Server, Aktualisierung des Indexes bei neuen Daten, Erstellen eines Front-Ends in JSP auf Apache Tomcat (http://jakarta.apache.org/tomcat/), diverse Datenbankanfragen, Datenbankzugriff über Tomcat-DataSource
Statusfertiggestellt und öffentlich verfügbar
Erstellungszeitraum15.07.2005 bis 08.02.2006

Visitors PageClicks Valid XHTML 1.0! Valid CSS!

CanciÜber michSite-MapRechtlichesKontaktJSWins (JavaScript-Desktop-System)© 2004-2013 by Markus Krebs