Skrypt importujący publikacje na licencji Fair Use w formacie DJVU z zasobów Wielkopolskiej Biblioteki Cyfrowej
- Python 3.6+
- curl + ungzip
djvutxt
z pakietudjvulibre-bin
sudo apt-get install djvulibre-bin python3-lxml
virtualenv --system-site-packages env3 -p python3
source env3/bin/activate
pip install -U -e .
fetch [--no-fetch] <ID publikacji>
- publications/
- <ID publikacji>/
- index.json
- issues/
- <rocznik>
- <ID numeru>.txt
Aby wygenerować plik dla źródła SphinxSE xmlpipe2
:
generate_xml 106644 | gzip -c > 106644.xml.gz
generate_xml 106644,142333 | gzip -c > kronika_gazeta_wielkiego_ksiestwa.xml.gz