{"id":1277,"date":"2020-08-03T08:00:16","date_gmt":"2020-08-03T06:00:16","guid":{"rendered":"https:\/\/lab.ub.uni-leipzig.de\/?p=1277"},"modified":"2020-08-03T12:41:41","modified_gmt":"2020-08-03T10:41:41","slug":"provit","status":"publish","type":"post","link":"https:\/\/lab.ub.uni-leipzig.de\/en\/provit\/","title":{"rendered":"provit \u2014 Ein Tool f\u00fcr den Herkunftsnachweis von Forschungsdaten"},"content":{"rendered":"<p><a href=\"https:\/\/github.com\/diggr\/provit\">pro\u00advit<\/a> ist ein Werk\u00adzeug zur Anno\u00adta\u00adti\u00adon und Doku\u00admen\u00adta\u00adti\u00adon von Daten und ihrer Her\u00adkunft (Pro\u00adve\u00adni\u00adenz). Es bie\u00adtet ver\u00adschie\u00adde\u00adne Funk\u00adtio\u00adnen zum Erstel\u00adlen und Abru\u00adfen von Pro\u00adve\u00adni\u00aden\u00adz\u00adin\u00adfor\u00adma\u00adtio\u00adnen f\u00fcr in Datei\u00aden gespei\u00adcher\u00adte Daten. Die Ver\u00adfol\u00adgung von Quel\u00adlen, \u00c4nde\u00adrun\u00adgen und Zusam\u00admen\u00adf\u00fch\u00adrun\u00adgen erm\u00f6g\u00adlicht es dem Benut\u00adzer, ein Pro\u00adto\u00adkoll aller \u00c4nde\u00adrun\u00adgen zu f\u00fch\u00adren. Dies ist beson\u00adders n\u00fctz\u00adlich f\u00fcr Daten\u00ads\u00e4t\u00adze, auf die regel\u00adm\u00e4\u00ad\u00dfig und durch meh\u00adre\u00adre Per\u00adso\u00adnen zuge\u00adgrif\u00adfen wird oder die Teil eines lang lau\u00adfen\u00adden Work\u00adflows sind (z.B. f\u00fcr eine wis\u00adsen\u00adschaft\u00adli\u00adche Arbeit). Dar\u00ad\u00fcber hin\u00adaus k\u00f6n\u00adnen Pro\u00adve\u00adni\u00adenz\u00adda\u00adten, die neben den Daten in einem Archiv gespei\u00adchert sind, ande\u00adren hel\u00adfen, Qua\u00adli\u00adt\u00e4t, Wert und Aktua\u00adli\u00adt\u00e4t der Daten und damit des durch\u00adlau\u00adfe\u00adnen For\u00adschungs\u00adpro\u00adzes\u00adses zu erken\u00adnen. Einer der Ent\u00adwick\u00adler von pro\u00advit, <a href=\"https:\/\/github.com\/olf42\">Flo\u00adri\u00adan R\u00e4misch<\/a>, hat mit uns \u00fcber die Soft\u00adware und deren Anwen\u00addung gesprochen.<\/p>\n<h2>Idee und Anforderungen<\/h2>\n<p>W\u00e4h\u00adrend unse\u00adrer daten\u00adba\u00adsier\u00adten For\u00adschung zur Video\u00adspiel\u00adkul\u00adtur im von der DFG finan\u00adzier\u00adten <a href=\"http:\/\/diggr.link\/\">Pro\u00adjekt dig\u00adgr<\/a> haben wir eine Viel\u00adzahl von hete\u00adro\u00adge\u00adnen Daten\u00adquel\u00adlen erschlos\u00adsen. Zur Beant\u00adwor\u00adtung unse\u00adrer For\u00adschungs\u00adfra\u00adgen war es not\u00adwen\u00addig, die Infor\u00adma\u00adtio\u00adnen und Inhal\u00adte die\u00adser Quel\u00adlen auf ver\u00adschie\u00adde\u00adnen Ebe\u00adnen zu ver\u00adei\u00adnen, anzu\u00adrei\u00adchern und neu zusam\u00admen\u00adzu\u00adstel\u00adlen. Die\u00adse Pro\u00adzes\u00adse waren z.T. zeit\u00adin\u00adten\u00adsiv, erfor\u00adder\u00adten Bear\u00adbei\u00adtung durch ver\u00adschie\u00adde\u00adne Men\u00adschen und Pro\u00adgram\u00adme. Anfang 2018 began\u00adnen wir nach einer M\u00f6g\u00adlich\u00adkeit zu suchen, die\u00adse Bear\u00adbei\u00adtungs\u00adschrit\u00adte struk\u00adtu\u00adriert und nach\u00advoll\u00adzieh\u00adbar zu doku\u00admen\u00adtie\u00adren. Es soll\u00adte also zu jedem For\u00adschungs\u00adda\u00adten\u00adsatz den wir erstellt hat\u00adten jeder\u00adzeit nach\u00advoll\u00adzieh\u00adbar&nbsp;sein:<\/p>\n<ol>\n<li>Wie aktu\u00adell sind die zugrun\u00adde lie\u00adgen\u00adden Rohdaten?<\/li>\n<li>Wann und wie wur\u00adden die\u00adse akquiriert?<\/li>\n<li>Wel\u00adche wei\u00adte\u00adren Bear\u00adbei\u00adtungs\u00adschrit\u00adte wur\u00adden wann und in wel\u00adcher Rei\u00adhen\u00adfol\u00adge durchgef\u00fchrt?<\/li>\n<\/ol>\n<p>Pro\u00adven\u00adan\u00adce Manage\u00adment Sys\u00adte\u00adme sind nichts neu\u00ades, es gab bereits eini\u00adge Tools mit unter\u00adschied\u00adli\u00adchen Aus\u00adrich\u00adtun\u00adgen. Unse\u00adren Anfor\u00adde\u00adrun\u00adgen ent\u00adsprach aller\u00addings kei\u00adnes. Wir haben ein Sys\u00adtem mit fol\u00adgen\u00adden Eigen\u00adschaf\u00adten gesucht:<\/p>\n<ol>\n<li>Kei\u00adne zen\u00adtra\u00adle Infrastruktur\/Datenbank,<\/li>\n<li>Infor\u00adma\u00adti\u00adons\u00adspei\u00adche\u00adrung m\u00f6g\u00adlichst dateibasiert,<\/li>\n<li>Basie\u00adrend auf einem eta\u00adblier\u00adten und inter\u00adope\u00adra\u00adblen Datenformat,<\/li>\n<li>M\u00f6g\u00adlich\u00adkeit der ein\u00adfa\u00adchen Inte\u00adgra\u00adti\u00adon in bestehen\u00adde <abbr lang=\"en\" title=\"extract, transform and load\"><a href=\"https:\/\/de.wikipedia.org\/wiki\/ETL-Prozess\">ETL<\/a><\/abbr>-Pipe\u00adline,<\/li>\n<li>Nutz\u00adbar\u00adkeit durch Forscher*innen ohne Programmierkenntnisse.<\/li>\n<\/ol>\n<p>Das von uns ent\u00adwi\u00adckel\u00adte Tool pro\u00advit ist ein ers\u00adter Ver\u00adsuch die\u00adsen Anfor\u00adde\u00adrun\u00adgen so gut es geht gerecht zu wer\u00adden und die\u00adse auf ihre Pra\u00adxis\u00adtaug\u00adlich\u00adkeit zu testen.<\/p>\n<h2>Zielgruppe<\/h2>\n<p>Die Ziel\u00adgrup\u00adpe von pro\u00advit sind Forscher*innen und wis\u00adsen\u00adschaft\u00adli\u00adche Softwareentwickler*innen, die allein oder in klei\u00adnen Grup\u00adpen \u00fcber l\u00e4n\u00adge\u00adre Zeit\u00adr\u00e4u\u00adme mit Daten arbei\u00adten. Daten, die ins\u00adbe\u00adson\u00adde\u00adre vie\u00adle Zwi\u00adschen\u00adbe\u00adar\u00adbei\u00adtun\u00adgen (Berei\u00adni\u00adgung, Zusam\u00admen\u00adf\u00fch\u00adrung, etc.) erfor\u00addern, bevor sie zur Beant\u00adwor\u00adtung von For\u00adschungs\u00adfra\u00adgen genutzt wer\u00adden k\u00f6nnen.<\/p>\n<h2>Funktionsweise<\/h2>\n<h3>F\u00fcr Forscher*innen<\/h3>\n<p>Forscher*innen k\u00f6n\u00adnen mit\u00adhil\u00adfe einer brow\u00adser\u00adba\u00adsier\u00adten gra\u00adfi\u00adschen Benut\u00adzer\u00adober\u00adfl\u00e4\u00adche oder per Kom\u00adman\u00addo\u00adzei\u00adle mit pro\u00advit inter\u00adagie\u00adren. Die gra\u00adfi\u00adsche Benut\u00adzer\u00adober\u00adfl\u00e4\u00adche erm\u00f6g\u00adlicht es auch auf ein\u00adfa\u00adche Wei\u00adse vor\u00adhan\u00adde\u00adne Pro\u00adven\u00adan\u00adce-Infor\u00adma\u00adtio\u00adnen von Datei\u00aden anzu\u00adschau\u00aden und zu erkun\u00adden, sowie wei\u00adte\u00adre Punk\u00adte hinzuzuf\u00fcgen.<\/p>\n<div style=\"width: 1086px\" class=\"wp-caption alignnone\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/provit.readthedocs.io\/en\/latest\/_images\/provit_browser_detail.png\" alt=\"provit Browserschnittstelle\" width=\"1076\" height=\"900\"><p class=\"wp-caption-text\">Die Brow\u00adser\u00adschnitt\u00adstel\u00adle von provit<\/p><\/div>\n<h3>F\u00fcr Entwickler*innen<\/h3>\n<p>Entwickler*innen k\u00f6n\u00adnen pro\u00advit sehr leicht in ihre bestehen\u00adden python\u00adba\u00adsier\u00adten ETL-Pipe\u00adlines inte\u00adgrie\u00adren. Daf\u00fcr kann man aus dem <a href=\"https:\/\/pip.pypa.io\">Python Packa\u00adge Index<\/a> (also direkt per <code>pip install provit<\/code>) das Pro\u00adgramm instal\u00adlie\u00adren und dann ent\u00adspre\u00adchend der <a href=\"https:\/\/provit.readthedocs.io\">Anlei\u00adtung<\/a> benutzen.<\/p>\n<div style=\"width: 823px\" class=\"wp-caption alignnone\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/provit.readthedocs.io\/en\/latest\/_images\/provit_demo_001.gif\" alt=\"provit CLI-Schnittstelle\" width=\"813\" height=\"540\"><p class=\"wp-caption-text\">pro\u00advit auf der Kommandozeile<\/p><\/div>\n<h2>Weitere Entwicklungen<\/h2>\n<p>Unser For\u00adschungs\u00adpro\u00adjekt endet im Juli 2020, daher wird die Wei\u00adter\u00adent\u00adwick\u00adlung, sofern sich kei\u00adne Maintainer*in fin\u00addet, ver\u00admut\u00adlich zu die\u00adsem Zeit\u00adpunkt eingestellt.<\/p>\n<h2>Danksagung<\/h2>\n<p>Pro\u00advit wur\u00adde im Rah\u00admen des DFG-For\u00adschungs\u00adpro\u00adjek\u00adtes \u201eDaten\u00adba\u00adsier\u00adte Spu\u00adren\u00adsu\u00adche glo\u00adba\u00adler Ein\u00adfl\u00fcs\u00adse japa\u00adni\u00adscher Video\u00adspiel\u00adkul\u00adtur\u201c (DFG Pro\u00adjekt\u00adnum\u00admer <a href=\"https:\/\/gepris.dfg.de\/gepris\/projekt\/316697723?context=projekt&amp;task=showDetail&amp;id=316697723\">316697723<\/a>) an der Uni\u00adver\u00adsi\u00adt\u00e4ts\u00adbi\u00adblio\u00adthek Leip\u00adzig in Koope\u00adra\u00adti\u00adon mit der Japa\u00adno\u00adlo\u00adgie des Ost\u00adasia\u00adti\u00adschen Insti\u00adtuts der Uni\u00adver\u00adsi\u00adt\u00e4t Leip\u00adzig entwickelt.<\/p>\n<p><strong>Autor<\/strong>: <a href=\"https:\/\/github.com\/olf42\">Flo\u00adri\u00adan R\u00e4misch&nbsp;<\/a><br>\n<strong>Repo\u00adsi\u00adto\u00adry<\/strong>: <a href=\"https:\/\/github.com\/diggr\/provit\">https:\/\/github.com\/diggr\/provit<\/a><\/p>\n<div class=\"su-box su-box-style-default\" id style=\"border-color:#00000a;border-radius:3px;\"><div class=\"su-box-title\" style=\"background-color:#02133d;color:#FFFFFF;border-top-left-radius:1px;border-top-right-radius:1px\">Kon\u00adtakt<\/div><div class=\"su-box-content su-u-clearfix su-u-trim\" style=\"border-bottom-left-radius:1px;border-bottom-right-radius:1px\">F\u00fcr Fra\u00adgen und Anre\u00adgun\u00adgen zum The\u00adma wen\u00adden Sie Sich bit\u00adte an die <a href=\"https:\/\/lab.ub.uni-leipzig.de\/team\/\">Ansprech\u00adpart\u00adner<\/a> des UBLabs.<\/div><\/div>\n<div class=\"shariff shariff-align-flex-start shariff-widget-align-flex-start\" style=\"display:none\"><ul class=\"shariff-buttons theme-grey orientation-horizontal buttonsize-small\"><li class=\"shariff-button twitter shariff-nocustomcolor\" style=\"background-color:#595959\"><a href=\"https:\/\/twitter.com\/share?url=https%3A%2F%2Flab.ub.uni-leipzig.de%2Fen%2Fprovit%2F&amp;text=provit%20%E2%80%94%20Ein%20Tool%20f%C3%BCr%20den%20Herkunftsnachweis%20von%20Forschungsdaten&amp;via=ubleipzig\" title=\"Share on X\" aria-label=\"Share on X\" role=\"button\" rel=\"noopener nofollow\" class=\"shariff-link\" style=\"; background-color:#000; color:#fff\" target=\"_blank\"><span class=\"shariff-icon\" style><svg width=\"32px\" height=\"20px\" viewBox=\"0 0 24 24\"><path fill=\"#000\" d=\"M14.258 10.152L23.176 0h-2.113l-7.747 8.813L7.133 0H0l9.352 13.328L0 23.973h2.113l8.176-9.309 6.531 9.309h7.133zm-2.895 3.293l-.949-1.328L2.875 1.56h3.246l6.086 8.523.945 1.328 7.91 11.078h-3.246zm0 0\" \/><\/svg><\/span><span class=\"shariff-text\">share<\/span>&nbsp;<\/a><\/li><li class=\"shariff-button facebook shariff-nocustomcolor\" style=\"background-color:#4273c8\"><a href=\"https:\/\/www.facebook.com\/sharer\/sharer.php?u=https%3A%2F%2Flab.ub.uni-leipzig.de%2Fen%2Fprovit%2F\" title=\"Share on Facebook\" aria-label=\"Share on Facebook\" role=\"button\" rel=\"nofollow\" class=\"shariff-link\" style=\"; background-color:#3b5998; color:#fff\" target=\"_blank\"><span class=\"shariff-icon\" style><svg width=\"32px\" height=\"20px\" viewBox=\"0 0 18 32\"><path fill=\"#3b5998\" d=\"M17.1 0.2v4.7h-2.8q-1.5 0-2.1 0.6t-0.5 1.9v3.4h5.2l-0.7 5.3h-4.5v13.6h-5.5v-13.6h-4.5v-5.3h4.5v-3.9q0-3.3 1.9-5.2t5-1.8q2.6 0 4.1 0.2z\" \/><\/svg><\/span><span class=\"shariff-text\">share<\/span>&nbsp;<\/a><\/li><li class=\"shariff-button rss shariff-nocustomcolor\" style=\"background-color:#ff8c00\"><a href=\"https:\/\/lab.ub.uni-leipzig.de\/feed\/rss\" title=\"RSS feed\" aria-label=\"RSS feed\" role=\"button\" class=\"shariff-link\" style=\"; background-color:#fe9312; color:#fff\" target=\"_blank\"><span class=\"shariff-icon\" style><svg width=\"32px\" height=\"20px\" viewBox=\"0 0 32 32\"><path fill=\"#fe9312\" d=\"M4.3 23.5c-2.3 0-4.3 1.9-4.3 4.3 0 2.3 1.9 4.2 4.3 4.2 2.4 0 4.3-1.9 4.3-4.2 0-2.3-1.9-4.3-4.3-4.3zM0 10.9v6.1c4 0 7.7 1.6 10.6 4.4 2.8 2.8 4.4 6.6 4.4 10.6h6.2c0-11.7-9.5-21.1-21.1-21.1zM0 0v6.1c14.2 0 25.8 11.6 25.8 25.9h6.2c0-17.6-14.4-32-32-32z\" \/><\/svg><\/span><span class=\"shariff-text\">RSS feed<\/span>&nbsp;<\/a><\/li><li class=\"shariff-button info shariff-nocustomcolor\" style=\"background-color:#a8a8a8\"><a href=\"http:\/\/ct.de\/-2467514\" title=\"More information\" aria-label=\"More information\" role=\"button\" rel=\"noopener \" class=\"shariff-link\" style=\"; background-color:#999; color:#fff\" target=\"_blank\"><span class=\"shariff-icon\" style><svg width=\"32px\" height=\"20px\" viewBox=\"0 0 11 32\"><path fill=\"#999\" d=\"M11.4 24v2.3q0 0.5-0.3 0.8t-0.8 0.4h-9.1q-0.5 0-0.8-0.4t-0.4-0.8v-2.3q0-0.5 0.4-0.8t0.8-0.4h1.1v-6.8h-1.1q-0.5 0-0.8-0.4t-0.4-0.8v-2.3q0-0.5 0.4-0.8t0.8-0.4h6.8q0.5 0 0.8 0.4t0.4 0.8v10.3h1.1q0.5 0 0.8 0.4t0.3 0.8zM9.2 3.4v3.4q0 0.5-0.4 0.8t-0.8 0.4h-4.6q-0.4 0-0.8-0.4t-0.4-0.8v-3.4q0-0.4 0.4-0.8t0.8-0.4h4.6q0.5 0 0.8 0.4t0.4 0.8z\" \/><\/svg><\/span><\/a><\/li><\/ul><\/div>","protected":false},"excerpt":{"rendered":"<p>pro\u00advit ist ein Werk\u00adzeug zur Anno\u00adta\u00adti\u00adon und Doku\u00admen\u00adta\u00adti\u00adon von Daten und ihrer Her\u00adkunft (Pro\u00adve\u00adni\u00adenz). Es bie\u00adtet ver\u00adschie\u00adde\u00adne Funk\u00adtio\u00adnen zum Erstel\u00adlen und Abru\u00adfen von Pro\u00adve\u00adni\u00aden\u00adz\u00adin\u00adfor\u00adma\u00adtio\u00adnen f\u00fcr in Datei\u00aden gespei\u00adcher\u00adte Daten. Die Ver\u00adfol\u00adgung von Quel\u00adlen, \u00c4nde\u00adrun\u00adgen und Zusam\u00admen\u00adf\u00fch\u00adrun\u00adgen erm\u00f6g\u00adlicht es dem Benut\u00adzer, ein Pro\u00adto\u00adkoll aller \u00c4nde\u00adrun\u00adgen zu f\u00fch\u00adren. Dies ist beson\u00adders n\u00fctz\u00adlich f\u00fcr Daten\u00ads\u00e4t\u00adze, auf die regel\u00adm\u00e4\u00ad\u00dfig und durch meh\u00adre\u00adre Per\u00adso\u00adnen zuge\u00adgrif\u00adfen wird oder die Teil eines lang lau\u00adfen\u00adden Work\u00adflows sind (z.B.\u2026 <br><a class=\"moretag\" href=\"https:\/\/lab.ub.uni-leipzig.de\/en\/provit\/\">Con\u00adti\u00adnue reading\u2026<\/a><\/p>","protected":false},"author":2,"featured_media":1282,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"wp_typography_post_enhancements_disabled":false,"footnotes":""},"categories":[53,56,44],"tags":[],"class_list":["post-1277","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-forschungsdaten","category-forschungssoftware","category-software"],"_links":{"self":[{"href":"https:\/\/lab.ub.uni-leipzig.de\/en\/wp-json\/wp\/v2\/posts\/1277","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/lab.ub.uni-leipzig.de\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/lab.ub.uni-leipzig.de\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/lab.ub.uni-leipzig.de\/en\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/lab.ub.uni-leipzig.de\/en\/wp-json\/wp\/v2\/comments?post=1277"}],"version-history":[{"count":29,"href":"https:\/\/lab.ub.uni-leipzig.de\/en\/wp-json\/wp\/v2\/posts\/1277\/revisions"}],"predecessor-version":[{"id":1510,"href":"https:\/\/lab.ub.uni-leipzig.de\/en\/wp-json\/wp\/v2\/posts\/1277\/revisions\/1510"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/lab.ub.uni-leipzig.de\/en\/wp-json\/wp\/v2\/media\/1282"}],"wp:attachment":[{"href":"https:\/\/lab.ub.uni-leipzig.de\/en\/wp-json\/wp\/v2\/media?parent=1277"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/lab.ub.uni-leipzig.de\/en\/wp-json\/wp\/v2\/categories?post=1277"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/lab.ub.uni-leipzig.de\/en\/wp-json\/wp\/v2\/tags?post=1277"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}