Thema: Suchmaschinen und Discovery-Systeme

Leider konnte ich bei diesem Termin nicht die ganze Vorlesung teilnehmen und schreibe nun meinen Lerntagebucheintrag etwas später. Vorteil ich muss mir das Ganze nochmals genauer ansehen, da seit diesem Termin auch schon einiges an Zeit vergangen ist.


Nachtrag Metadaten modellieren und Schnittstellen nutzen


Ich schaue mir das Interview mit Frau Kirsten Jeude an um einen Einblick in die alltägliche Praxis von Metadaten Management zu bekommen. Oftmals frage ich mich, was man mit einem Wissen über Metadaten genau anstellen / arbeiten kann.

sie bezeichnet sich selbst als Datenübersetzerin und erklärt, wie auch dieses neue spezifische Berufsfeld Möglichkeiten und Anreize bietet. Ein sehr spannendes und sympathisches Interview.


andere Tools


Ich kenne keines dieser Tools richtig gut, ausser MarcEdit etwas, welches wir im Kurs angeschaut hatten. Für mich ist das Ganze etwas schwer zu fassen, da ich keinerlei Anhaltspunkte im Berufsleben dazu habe.. Dennoch schaue ich mir mal «Catmandu» an, da mich der Name anspricht. Dort werden «LibreCat» und «Catmandu» kurz vorgestellt. Ich schaue mir die Github Page von «Catmandu» noch etwas an. Das Projekt scheint immer noch aktuell zu sein, da die letzten Änderungen am 14.12.21 vorgenommen wurden.

Bild1

Ich kann mir vorstellen, dass Metadaten Management in Zukunft immer wichtiger werden wird. Dies auch ausserhalb von Forschung und Bibliotheken. Deshalb ist es sicherlich von Vorteil, wenn man verschiedene Werkzeuge zum Metadaten verwalten und aufbereiten kennt.

witzig finde ich, dass MARC21 und Python bereits auch verbunden wurden. Python ist mir seit einem vergangen Lehrgang kein Fremdwort mehr und die Programmierung hatte Spass gemacht.


Suchmaschinen und Discovery-Systeme


Nun zum Hauptthema. Wie die Installation von VuFind und dem Auftrag lief, kann man gerne in meinem letzten Beitrag nachlesen. AHA-Effekt: Ruhig bleiben und die Befehle von Linux genau studieren. So kommt man oft ans Ziel.


Suchmaschine, Solr


Um einen Einstieg in Solr zu finden, google ich kurz nach einer einfachen Erklärung. Denn was ist Solr genau?

  • Such-Server von Apache
  • basiert auf Java
  • eignet sich für vertikale Suchmaschinen [Netflix und Ebay als Beispiele]

Ich schaue mir einmal die verlinkten Oberflächen an. Alle Links scheinen zu funktionieren.

Bild2


Übung: Suche in VuFind vs. Suche in Solr

Ich gehe gemäss Beschreibung vor und schaue mir die Resultate in VuFind und Solr an. Meine Shell produziert auch nach längerer Wartezeit leider keine Ergebnisse.

Bild3

Mir fällt auch auf, dass beide VuFind und Solr die gleichen Ergebnisse ausgeben. Bei VuFind ist für den Laien schneller erkennbar, dass es sich um drei Einträge handelt, wohin man bei Solr den Code genau durchlesen muss. Bei Solr werden durch die Code Form jedoch mehr Daten ausgegeben und sind ohne weitere Klicks einsehbar.

Spannend ist auch wenn man die Querytime vergleich. In meinem Fall war VuFind bei 0.2s und Solr bei 5. Ob dies in Sekunden oder Millisekunden zu lesen ist, wurde leider nicht angegeben.


Übung: Datenintegration

Wir sollen die Beispieldaten aus dem ZIP Format entpacken und dann einspeisen. Ich lade die ZIP Datei also herunter und extrahiere alles in den Downloads Ordner. Klappt alles wunderbar.

Bild4

Nachdem ich im «marc_local.properties» die Institution auf «DSpace» umgeschrieben hatte, versuche ich den Import für die erste Datenquelle zu starten.

Bild5

Im Script steht, dass der Import von DSpace fehlschlagen wird.. Bei mir ist die Shell immer noch ihre Befehle am Abarbeiten. Er kann zwar einen Record lesen und indexieren, aber es scheint als wäre der Export zu Solr fehlerhaft.

Bild6

Dann versuchen wir es noch mit einer Datenquelle, die gemäss Script funktioniert:

Bild7 Bild8

Hier funktioniert der Export zu Solr. Wenn ich dann bei VuFind eine leere Suche starte, wird mir ein Datensatz zurückgegeben, dies war folgender:

Bild9 es deckt sich also mit dem Ergebnis von Gruppe 2.

Warum der Import von ArchiveSpace und Dspace nicht funktioniert, kann ich nicht genau sagen. In der Shell werden zum Import von Dspace folgende Fehlermeldungen angezeigt. Irgendwie wird die ID mit «null» bezeichnet, bedeutet er kann sie nicht lesen oder vielleicht das dieses Feld nicht vorhanden ist und deshalb mit «null» ausgefüllt wird? Das wäre auch in der letzten Zeile zu entnehmen «missing mandatory uniqueKey field: id».

Bild10


Das wäre für diese Vorlesung dann einmal alles. Schön, dass es bei diesem Lerntagebucheintrag keinen Frust gab und ich deshalb auch mehr Lust und Zeit hatte die Dinge eingehender nachzuschauen. Ich fand es auch spannend im Code Fehler zu suchen. Ob mein Ergebnis stimmt, weiss ich leider nicht, dennoch ein positives Erlebnis : ) Mit neuem Elan dann zur bereits letzten Vorlesung!

Sasquatch over