Allgemeines
Architekturarchive
Archivbau
Archivbibliotheken
Archive in der Zukunft
Archive von unten
Archivgeschichte
Archivpaedagogik
Archivrecht
Archivsoftware
Ausbildungsfragen
Bestandserhaltung
Bewertung
Bibliothekswesen
Bildquellen
Datenschutz
... weitere
Profil
Abmelden
Weblog abonnieren
null

 
Auch nach Jahren bemerkt man wenig Besserung im Virtuellen Skriptorium St. Matthias.
Dass im Projekt spannende Überlieferungsträger einer interessierten Öffentlichkeit zugänglich gemacht werden ist unbestritten. Aber Wie?!
Offenbar erfolgt die komplette menschenlesbare Erschließung der Handschriften in TYPO3 (v. 4.5, 2011!), bei geflissentlicher Aussperrung externer Suchmaschinen:
vgl: http://zimks68.uni-trier.de/robots.txt

Daher ist man für die Recherche auf die Seiten-interne Suche zurückgeworfen, die ihre Möglichkeiten aber nicht erklärt. (kann sie unscharf Suchen mit Levenshtein-Distanz? Wildcards? oder begnügt sie sich mit den Mysql-üblichen Stringvergleichen? ) Was nützt eine Einschränkung nach Bibliotheksorten, wenn sich anstelle einer Liste alle Bibliotheksorte nur Forschungsprosa findet ("Hierbei handelt es sich um eine Zahl von ca. 500 Kodizes, die weltweit auf etwa 25 Standorte verteilt sind." ) Bei einem solchen Bestand kann die "Volltextsuche" immer nur komplementär zu einem intellektuellen Ordnungssystem angelegt sein!

Durch einen "da war wohl der Admin pinkeln" - Umstand lässt sich aber aus einem sql-Dump ( http://zimks68.uni-trier.de/stmatthias/stmatthias.sql )
ableiten, dass mindestens folgende Orte sinnvolle Ergebnisse liefern sollten, denn leider ist die Datei 4 Jahre alt:

Bernkastel-Kues
Bonn
Brüssel
Darmstadt
Den Haag
Dresden
Edinburgh
Florenz
Frankfurt (welches?)
Genf
Gent
Gotha
Koblenz
Kopenhagen
Köln
London
Manchester
München
New York
Providence
Rom
Trier
Wien

Seit HTML2 (1995) gibt es für diesen Zweck "Optionen"
http://de.selfhtml.org/html/formulare/auswahl.htm
die den Formularbediener, der den Bestand nicht kennt, nicht im Regen stehen lassen. Königsweg wäre ein Tagging der Orte mit GND-Nummern (Schreibvarianten, Internationalisierung ) die über OAI-Schnittstelle den Bestand für die Interessierte Öffentlichkeit (Europeana, DDB) sichtbar machen. Aber die projektierte und abgebildete "Öffentlichkeit" ist wohl größtenteils analog: http://stmatthias.uni-trier.de/index.php?id=27

Unkomfortabel wenngleich maschinenlesbar ist die Ordnerstruktur unter http://zimks68.uni-trier.de/stmatthias/ Die XML-Dateien bieten eine beeindruckende Erschließungstiefe, warum aber speisen diese Daten nicht das Suchformular?

Der Handschriftencensus (außer demnächst ist jemand fleissig) kennt die Digitalisate übrigens weitgehend nicht.

Kein letzter Lichtblick
Mindestens die PR läuft gut: http://zimks68.uni-trier.de/stmatthias/embach.flv - (Was für ein Piano!) Wie geeignet ein 45-Minüter für einen Erstzugangzugang zu einer Überlieferung ist, mag ich nicht beurteilen. Die oben beschriebene schlechte Bedienbarkeit macht ernshaft grübeln, worin die von Michael Embach beschworene "intermediäre, kustodische Funktion" in ihrer Staurophylax-ähnlichen Bewacherrolle besteht - welche Effekte sie hier zeitigt ist nicht schön.
clausscheffer meinte am 2015/02/15 16:22:
Virtuelles Skriptorium St. Matthias
Wäre es möglich, diesen Artikel auch für nicht .sql-Leser verständlich zu machen? 
l33t hax0r (Gast) antwortete am 2015/02/15 18:29:
Das war der Versuch einer teilweise satirischen Kritik, die daran scheitert dass sowohl der Rezesent als auch das Fachpublikum n00bs sind und keine Ahnung von dem haben, was sie da schreiben oder lesen.

Die Kritik besteht aus mehreren Punkten:
1. Die Seite ist durch die Einstellungen in der robots.txt nicht für Suchmaschinen indizierbar.
2. Die Seite baut auf einer veralteten Version von TYPO3 auf.
3. Die Bibliothekorte in der erweiterten Suche sind nur über ein Freitextfeld durchsuchbar. Er meint, hier hätte man lieber ein Auswahlfeld nehmen sollen, dass die verfügbaren Orte in einer Liste anzeigt.
4. Ausserdem prangert er an, man solle doch die XMLs der Öffentlichkeit zur Verfügung stellen, denn diese böten eine "außerordentliche Erschließungstiefe".
XML ist ein Dateiformat, was ähnlich einer Datenbank, Daten in hierarchischer und strukturierter Weise speichern kann.

Eigentlich wollte er aber nur sagen, dass er ein kleiner Pseudohacker ist, der wegen diverser Sicherheitslücken Dateien sehen kann, die eigentlich gesperrt sein sollten. Du bist ganz, ganz toll, Bob!

Zu seiner Kritik ist folgendes zu sagen:
1.) Ist unnötig, aber auch nicht sonderlich schlimm.
2.) Die Version von TYPO3, dem Content Management System ist alt, aber das ist für die Darstellung der Inhalte egal und sagt über die Qualität der Seite nichts, schon gar nichts über die Qualität der Erschließung.
3.) Dass man die Orte in einem Freitext suchen muss, ist nicht unbedingt benutzerfreundlich (zumal es andere Felder im Suchformular gibt, die eben das bieten). Das heißt in Fachkreisen übrigend nicht "Optionen", sondern wahlweise Auswahlfeld oder SELECT. Die .sql-Datei, die er anspricht und aus der er die Ortsnamen hat, ist ein 4 Jahre altes Abbild der kompletten Datenbank.
4.) Dieser Punkt ist völliger Unsinn. In den XMLs, die wohl nur zur Darstellung der Digitalisate im DFG-Viewer dienen, steht nichts von Belang drin. Da steht die Signatur und die Dateinamen der Bilder der Einzelseiten drin.

Happy hacking, ihr n00bs.
Euer l33t hax0r! 
b4574rd 0p3r470r fr0m h3ll (Gast) antwortete am 2015/02/15 20:14:
cool. der Admin ist vom Klo zurück. 
KommentarTrollAusÜberzeugung (Gast) antwortete am 2015/02/15 22:25:
Übesetzung gut, der Rest so lala
Die Kritikpunkte kann man auch so deuten.

1.) Es ist egal egal ob man über Suchmaschinen gefunden wird.

2.) In vier Jahren wird technisch und was die Suche angeht nicht so viel an einer Software tun - bis März '15 läuft der Support fürs alte TYPO 3 ja ohnehin noch, dann kommen wohl richtige Hacker. Mit den Inhalten hat das nichts zu tun, aber mit ihrer Zugänglichkeit.

3.) Benutzerfreundlichkeit wird überschätzt, man ist ja Bücher gewöhnt - und die Liste der Bibliotheken kann man sich auch aus den Publikationen raussuchen.

4.) Zum Glück steht in den XML-Dateien etwas mehr drin, sonst hätte Hanne Grießmann sich die viele Mühe mit Axel Mante, Konrad Ameln und Walther Lipphardt umsonst gemacht und der Dfgviewer im rechten Panel nichts zum anzeigen. ( http://dfg-viewer.de/show/?tx_dlf%5Bpage%5D=117&tx_dlf%5Bid%5D=http%3A%2F%2Fzimks68.uni-trier.de%2Fstmatthias%2FMedinger%2520Hss%2FTBA0528_neu_fertig%2FTBA0528-digitalisat.xml&tx_dlf%5Bdouble%5D=0 )

Der Umgangston zeigt wieder einmal, wie der getroffene Hund bellt. Vorwärtsverteidgung! 
AS (Gast) antwortete am 2015/02/16 07:22:
Zu 4.) des "Profi" - irgendwas mit IT - "Hackers":
In der XML ist auch die Paginierungssequenz enthalten. Diese Information kann nur bei der Erschliessung des Digitalisates entstanden sein. Der DFG-Viewer zeigt diese Information nicht an. Graf bemängelt dies vollkommen zu Recht. Hinweise zu fehlenden Seiten werden wohl (scheinbar) auch nicht aus der XML in den Viewer übernommen? 
AS (Gast) antwortete am 2015/02/16 07:31:
Wenn das wirklich der admin ist, sollte ihm mal jemand eine neue Tastatur schenken. Irgendwie sind da wohl einige Tasten defekt. "n00bs" oder "l33t hax0r" sehen zumindest verdächtig nach Schreibdurchfall aus. Aber der admin von heute kann ja nicht in Hardware... 
Dietmar Bartz antwortete am 2015/02/16 09:47:
BOFH
Komputergeschichte: https://de.wikipedia.org/wiki/Bastard_Operator_From_Hell 
clausscheffer meinte am 2015/02/16 13:22:
Virtuelles Skriptorium St. Matthias
Die Sache interessiert doch, nicht die Selbstbefriedigung einiger nerds . . . 
KlausGraf antwortete am 2015/02/16 15:40:
Trollparade am Wochende
Wie man selbst bei oberflächlicher Lektüre von Archivalia hätte wissen können, war ich das ganze WE bei einer Bloggerreise in Basel (teste Twitter). Gern hätte ich die entsprechenden Fachkenntnisse, was aber nicht der Fall ist. Besonders idiotisch wird die Annahme der Autorschaft, wenn man mir unterstellt, mangelnde Sichtbarkeit digitaler Bibliotheken durch Aussperren von Suchmaschinen via robots.txt sei nicht weiter schlimm. 
l33t hax0r (Gast) antwortete am 2015/02/16 18:06:
Die Sache
Die Sache interessiert, aber schon der Artikel ist ja nicht sachlich. Die größte Unverschämtheit an der Kritik ist es, eine Sicherheitslücke nicht umgehend beim Betreiber zu melden, sondern hier in einem Blogpost zu veröffentlichen.
Nicht unbedingt unverschämt, aber unhöflich finde ich es, nicht mal eben nachzufragen, was das mit der robots.txt soll. Ist auch konstruktiver, weil man das dann in Trier vielleicht einfach löscht und gut ist.
Drittens weiß jawohl jeder, der schonmal was in den Geisteswissenschaften mit IT zu tun hatte, dass das Budget dort nicht gerade hoch ist und viel entweder vom Systemadministrator nebenbei gemacht werden soll oder es wird ein Student für 6 Monate eingestellt, der das zwar gerne macht, aber eben kein Fachmann ist.
Viertens muss ich mich ein wenig korrigieren.
Ja, in den xmls steht mehr drin.
Schade, dass die nicht durchsuchbar sind. Und ja, dann ist es auch doof, dass die Seite nicht durchsuchbar ist.

Und ich bin weder der Systemadministrator noch Klaus Graf. 
bobgoehler antwortete am 2015/02/16 21:43:
schön das sich was tut
Das Trier Center for Digital Humanities hat unterdessen mitgeteilt, eine Überarbeitung sei schon länger in Gange, die zugegeben etwas schnodderige Kritik bewegt vielleicht etwas.

Wichtig wäre mir mehr praktisches Verständnis für den Unterschied zwischen einem Suchfeld und einem transparenten intellektuellen Ordnungssystem ("Browsen im Bestand"). Beides brauchen solche Portale, sonst sind sie Im Netz unsichtbar. Für Beides sind die Daten ja schon vorbereitet.
In Bibliotheken sind seit Hunderten von Jahren zu diesem Zweck Kataloge üblich, im St. Mathias-Projekt fehlen sie schlicht (ich hätte sie unter "Skriptorium" vermutet). Daran könnte sich dann auch ein Suchmaschinenrobot "entlanghangeln".

@l33t hax0r
Apache mod_dir per se ist keine ist keine Sicherheitslücke sondern ein Standardmodul, gleichwohl glaube auch ich, das Browsen in den Quelldaten nicht vorgesehen war (ist ja auch eine alternative URL).
Sonst hätte ich das anders gelöst.
Dies gilt sinngleich für den SQL-Dump, wenngleich sich niemand gern in die Datenstrukturen gucken lässt. Deshalb ist diese Datei (zumindest unter der original-URL) nicht mehr abrufbar (und die Ortsnamen stehen nun nur noch hier).
Die Reaktion in Trier (SQL-Datei löschen, Browsen weiterhin ermöglichen), scheint diese Einschätzung zu teilen/bestätigen. 
bobgoehler meinte am 2015/08/03 19:37:
upgrades!!
siehe auch http://archiv.twoday.net/stories/1022464462/ 
 

twoday.net AGB

xml version of this page

powered by Antville powered by Helma