DLI - Download Impossible?
Obwohl die Digital Library of India (kurz: DLI) einen reichhaltigen Vorrat an Digitalisaten vorhält, sind die meisten Nutzer mit der Benutzeroberfläche und den Download-Möglichkeiten unzufrieden. Von der Tatsache einmal abgesehen, daß nicht alle DLI-Server gleichermaßen verfügbar sind und einige Einträge ins Leere führen. Welche DLI-Server gibt es?
- DLI Hyderabad: http://dli.iiit.ac.in/
- DLI Bangalore: http://www.new.dli.ernet.in/ (die Startseite ist fehlerhaft konfiguriert und führt nicht zu den Inhalten). Es funktionieren (halbwegs):
- DLI Noida: http://www.dli.cdacnoida.in/ (die Inhalte sind nicht mehr verfügbar, laut Mitteilung auf der Webseite werden sie nach DLI Bangalore transferiert)
- Die "Universal Digital Library" ist ein (womöglich unvollständiger) Spiegel von DLI-Materialien: http://www.ulib.org/ (der Host ist die Carnegie Mellon-Universität in Pittsburgh, USA)
Listen mit Sanskrit- und Marathi-Titeln werden von Sanskritdocuments.org zur Verfügung gestellt.
Es wurden bereits mehrere Wege beschrieben, wie man – mit mehr oder weniger großem Aufwand – die DLI-Oberfläche übergehen kann, um an die Digitalisate zu gelangen. Hier einige Beispiele:
Komandozeilen-Programme
- Hari Prasad Nadig bietet ein recht elaboriertes Bash-Script an, URL: hpnadig.net (von mir nicht getestet). Laut Beschreibung muß man dem Script den Download-Link sowie die ermittelte Seitenzahl als Argument übergeben, welches dann unter Benutzung von wget die Tiff-Dateien seitenweise herunterlädt.
- Es gab in den Beiträgen der Mailing-Liste "Indology" im Mai 2010 einige Vorschläge. Recht Erfolg versprechend sieht die Lösung von Patrick McAllister (Indology, 19. Mai 2010) aus, der cURL benutzt (für nähere Informationen zum Programm siehe die offizielle cURL-Seite).
- Ein einfaches Bash-Script präsentiert Adrian Cirstei in Sanskrit Struggles [Nicht mehr verfügbar]. Es setzt auf wget und fragt drei Parameter ab: 1. DLI-URL, 2. Anzahl der physischen Seiten, 3. lokales Verzeichnis.
- Somadeva Vasudeva zeigt einen Weg auf, wie man ein Shell-Script (mit wget oder cURL) aus BBEdit (einem Texteditor unter MacOS) starten kann.
- Ein Script, mit dem man die Seiten von den DLI-Servern herunterlädt und nachträglich zu einer DJVU zusammenfügt, präsentiert Tarhuntaš (nach einem Hinweis in Granthinām). Es ist allerdings recht voraussetzungsreich: man benötigt wget und zusätzlich ein installiertes DJVuLIbre (für mehr Information darüber siehe die DJVuLibre Homepage auf Sourceforge).
Bei allen Kommandozeilen-Lösungen ermittelt man zuerst die tatsächliche Adresse (URL), z.B.
http://www.new.dli.ernet.in/data_copy/upload/0073/502/PTIFF/00000001.tif
für den Scan der ersten physischen Seite des Werks. In diesem Falle von "Damayantikatha athwa Nalchampu.., 1999990073497. Bhat, Vikaram.. 1885. sanskrit. Literature. 292 pgs." (so der Eintrag in der Suchseite von DLI Bangalore). Laut Angaben haben wir hier 292 physische Seiten, es wären also Tiff-Dateien von 00000001.tif bis 00000292.tif zu erwarten. Somit hätte man alle Parameter für den Download zusammen. Nach erfolgreichem Herunterladen erhält man 292 Einzeldateien.
Programme mit graphischer Oberfläche
- Der @ABS DLI-Downloader, eine Java-Applikation von Alok Shukla. URL: alokshukla.wordpress.com. Lädt Titel nur von DLI Bangalore.
- DLI Downloader für Windows. URL: Sanskritdocuments.org (von mir nicht getestet). Laut Beschreibung lädt das Programm Dateien sowohl von DLI Bangalore als auch von DLI Hyderabad.
Diese Lösungen sind sicherlich etwas einfacher im Umgang, wenn vielleicht auch weniger flexibel. Beim @ABS DLI Downloader, den ich getestet habe (vor allem weil er auch unter MacOS funktioniert), gibt man die Barcode-Nummer aus den DLI-Metadaten ein, zum Beispiel 1999990073497 für die genannte Ausgabe des Nalacampū. Danach lädt das Programm die einzelnen Seiten herunter und erzeugt automatisch eine PDF-Datei daraus. Der andere DLI-Downloader funktioniert nach der Beschreibung genauso und stellt noch einige weitere Optionen zur Verfügung.
Nachtrag
Der DLI-Server Bangalore ist jetzt nach Pune gewandert. Beim Aufruf von http://www.new.dli.ernet.in/ (bzw. von http://202.41.82.144/) landet man in Pune.