Thema: Metadaten modellieren und Schnittstellen nutzen (2/2)


OpenRefine


Hiess früher noch «Google Refine» und ist ein Werkzeug für die Handhabung von unstrukturierten Daten. Es können unterschiedliche Handlungen vorgenommen werden wie Bereinigung, Transformation von Formaten und Erweiterung um Webdienste.

aus der Homepage: https://openrefine.org/

  • wird statistisch gesehen vor allem für die Bereinigung von Daten genutzt (Rechtschreibfehler beheben)
  • wird statistisch gesehen am Meisten von Bibliothekaren/innen genutzt

Installation von OpenRefine


Die Installation von OpenRefine hatte während der Unterrichtszeit problemlos geklappt. Da dieser Blogbeitrag nun aber einige Tage später erscheint, prüfe ich nochmals nach, ob ich immernoch Zugriff auf den localhost:333 habe. Beim ersten Versuch funktioniert es leider nicht und ich kriege eine Fehlermeldung. Alsu rufe ich den “refine” Befehl nochmals in der Shell auf. Und dann klappt es auch im Internetbrowser :) —

Übung: CSV nach MARCXML mit OpenRefine


1. Aufgabe: Soweit alles klar. Nun geht es daran die Übung durchzuführen. Zuerst lösche ich hier alle Daten raus:

1

Und füge ein was im Script vermerkt wurde. Danach exportiere ich die Datei in eine Texte Datei. Sehr vielsagen sieht das Ganze leider nicht aus. Ich vergleiche kurz mit den Erkentnissen der Gruppenarbeiten und schliesse mich Gruppe 3 an. Für mich ersichtlich ist die Reihenfolge der Felder, die ausgegeben werden. Was genau die split, slice und anderen Funktionen genau trennen, ist sich mir leider nicht ersichtlich.

alles was nicht in {} steht wird ausgegeben. Die {} umschliessen immer die Funktionen split, escape, replace etc.

2. Aufgabe: wurde übersprungen. Aber vom Dozenten noch vorgezeigt.

  • 6XX: Subject Access Fields-General Information
  • 650 Spezifikation anschauen
  • Subjects -> edit cells -> transform Danach wird mit der split Funktion gearbeitet, da die Ausgangsdaten zusammenhängend aufgeführt sind und getrennt werden sollen. Der senkrechte Strich trennt die einzelnen Elemente in diesem Beispiel.

2

Damit die Werte nacheinander ausgegeben werden schreiben wir noch ein ForEach an den Anfang unserer Expression. Nach der Split Funktion wird der identifyer Teil aus den vorherigen Textblöcken einkopiert und ein Zeilenumbruch mit ** + ‘\n’ ** eingefügt. Das Ergebnis soll am Schluss wieder zusammengeführt werden, also schreiben wir am Schluss wieder ein join .

3

3. Aufgabe: Wir sollen also die Daten in MARCXML exportieren. Dazu werden nochmals dieselben Prefix und Suffixe wie bereits angegeben und der Row Hauptblock aus der Lösung reinkopiert. Die Text Datei gehe ich dann im Downloads Ordner auf XML umbenennen und starte nachher meine Shell nochmals auf und gebe alle Befehle ein.

4

Hier ein kleiner Ausschnitt aus meiner Shell. Es scheint alles geklappt zu haben. Der oberste Befehl war vermutlich ein Kopierfehler meinerseits als ich dies in OpenRefine eingeben wollte.

Ergebnis war zufriedenstellend : )

Übung: To Do’s fürs nächste Mal

  • Lerntagebucheintrag schreiben
  • Installation Vu Find
  • Übung “Konfiguration Suche und Facetten” (siehe unten) und dazu einen Beitrag im Lerntagebuch verfassen

Installation Vu Find

Wir installieren hier also das DEB Package. Dieses benötigen wir für Ubuntu und Debian. Doch was ist Debian?

eine kurze Recherche ergibt, dass Debian ein gemeinschaftlich entwickeltes freies Betriebssystem ist. Auf ihrer eigenen Homepage wird Debian als freie, stabile und sichere Software bezeichnet.

Die Installation des DEB Package hat einwandfrei funktioniert. Nun zum MariaDB Passwort für root eingeben. Ich habe mich an die Abfolge im Skript gehalten aber kein neues PW eingeben müssen.. Anstelle dessen, habe ich einfach «Enter» gedrückt.. Mal schauen was dabei rauskommt. Dann vergeben wir nun den Zugriff von MariaDB. Dies scheint auch mit fehlendem PW zu funktionieren? Ich gebe die letzte Zeile ein und mein Terminalname wird «weiss». Ob das richtig so ist, weiss ich leider nicht, aber fahre mal fort.

5

Das Konfigurieren und Starten von VuFind scheint geklappt zu habe. Immerhin ist auf der Browser Webseite unter Localhost eine Seite aufgerufen worden.

6

7

Der ILS Code wurde umgeschrieben. Wenn ich dann aber den Testimport starten möchte, scheint es leider nicht mehr zu funktionieren.. Es steht die Seite stehe momentan unter Wartung, was ich bezweifle.

8

  • Fehlermeldung!

Vermutlich liegts am MariaDB PW. Also schaue ich mir die Anleitung an, dies zurückzusetzen.

Suche nach dem MariaDB PW

9

Die Installation von MariaDB hat also schon mal geklappt. Dann gehen wir weiter. Und schon bahnt sich das nächste Problem an.. Ich habe MariaDB zwar gestoppt so wie im Tutorial angegeben aber das PW neu vergeben kann ich nicht. Generell wird jetzt kein Befehl von der Shell mehr entgegengenommen..

10

Woran das liegt, weiss ich leider auch nicht… Aber auf der Seite von VuFind steht, dass immer noch Wartungsarbeiten durchgeführt werden.. Vielleicht warte ich ein paar Tage und versuche es dann nochmals. seufz

Sasquatch over