Metadaten anzapfen mit metha

Metha ist ein Open-Source-Werk­zeug für die Kom­man­do­zei­le, mit dem sich Meta­da­ten über das OAI-PMH-Pro­to­koll her­un­ter­la­den las­sen. Metha ist im Rah­men des finc-Pro­jek­tes an der Uni­ver­si­täts­bi­blio­thek Leip­zig ent­stan­den und wur­de in Go imple­men­tiert. Wir haben dem Ent­wick­ler, Mar­tin Czy­gan, eini­ge Fra­gen dazu gestellt:

Wie ist die Idee zu metha entstanden?

Der Kata­log der UB Leip­zig setzt sich aus einer Viel­zahl von klei­ne­ren und grö­ße­ren Daten­quel­len zusam­men: Ver­bün­de, Biblio­the­ken, Ver­la­ge, Archi­ve und Netz­quel­len. Ein Weg (neben vie­len ande­ren), wie Insti­tu­tio­nen ihre Daten ande­ren zur Ver­fü­gung stel­len, ist das OAI-PMH-Pro­to­koll. Die ers­te Ver­si­on von OAI-PMH wur­de bereits 2002 ent­wi­ckelt. Daher gibt es heu­te tau­sen­de Ein­rich­tun­gen, die die­ses Pro­to­koll ver­wen­den. Mit metha kann man Meta­da­ten über das OAI-PMH Pro­to­koll her­un­ter­la­den. Es gibt vie­le Werk­zeu­ge in die­sem Bereich und metha ist nur eines davon. Der Schwer­punkt von metha liegt in der ein­fa­chen Bedie­nung für Entwickler*innen.

Kurz: Die Idee ent­stand aus der Not­wen­dig­keit her­aus, Daten für den Kata­log der UB Leip­zig zu bezie­hen und dem Wunsch, dies auf eine unkom­pli­zier­te Art machen zu kön­nen.

Wer sollte metha benutzen?

Wer sich für Meta­da­ten von For­schungs­pu­bli­ka­tio­nen inter­es­siert, die­se inde­xie­ren oder ana­ly­sie­ren will und sich etwas mit Linux oder der Kom­man­do­zei­le aus­kennt, kann metha ver­wen­den. Es gibt z. B. For­schen­de, die sich die Meta­da­ten von Arxiv.org — einem gro­ßen Pre­print-Publi­ka­ti­ons­ser­ver — anse­hen wol­len und die­se mit metha rela­tiv unkom­pli­ziert bezie­hen kön­nen.

Wie funktioniert metha?

Metha ist ein spe­zi­el­ler Down­loa­der und imple­men­tiert das OAI-PMH Pro­to­koll. Statt Vide­os oder Musik lädt es biblio­gra­phi­sche Meta­da­ten her­un­ter, die ver­schie­de­ne Ein­rich­tun­gen bereit­stel­len. Das kann eine Natio­nal­bi­blio­thek aber auch eine Zeit­schrift eines klei­nen Ver­eins sein, der tech­nisch ver­siert ist. Die Betrei­ber sol­cher End­punk­te für Meta­da­ten kön­nen so Inter­es­sier­te über ihren aktu­el­len Bestand infor­mie­ren. Was mit den Meta­da­ten dann geschieht, ist nicht fest­ge­legt: Sie kön­nen inde­xiert, archi­viert oder auch ana­ly­siert wer­den.

metha in 120 Sekun­den:

Welche weiteren Entwicklungen sind geplant?

Im Moment weni­ge. Inter­es­san­ter als das Tool sind sicher die Daten, die damit her­un­ter­ge­la­den wer­den.

metha kann über das Git­Hub-Repo­si­to­ry der UB Leip­zig bezo­gen wer­den. In der dort hin­ter­leg­ten Read­me fin­den sich Anlei­tun­gen zu Instal­la­ti­on und Nut­zung des Werk­zeu­ges. Und falls einem bei der Arbeit mit metha die Lan­ge­wei­le über­kommt, fin­det sich in der Read­me auch der Hin­weis auf metha-for­tu­ne, ein Meta­da­ten-Rou­let­te, wel­ches die Beschrei­bung eines zufäl­lig aus­ge­wähl­ten Arti­kels anzeigt.

Autor: Mar­tin Czy­gan

 

Dark Mode
Kon­takt
Für Fra­gen und Anre­gun­gen zum The­ma wen­den Sie Sich bit­te an die Ansprech­part­ner des UBLabs.