Archive.org oprócz archiwizacji stron internetowych jest również biblioteką. Niektóre książki są chronione prawem autorskim i można je wypożyczyć na jedną godzinę lub 14 dni. Takich książek nie da się bezpośrednio pobrać.
Na stronie https://github.com/MiniGlome/Archive.org-Downloader znajduje się repozytorium do skryptu pobierającego książki. Polecam utworzyć wirtualne środowisko python (.venv), aby nie instalować globalnie zależności.
Na dzień 19.01.2025 r. występuje problem z biblioteką img2pdf i nie tworzone są pliki pdf z poziomu skryptu (przynajmniej na moim komputerze – win11). Biblioteka wywołana z osobnego skryptu działa. Skrypt img2pdf do scalania plików graficznych do pdf:
import img2pdf
image_paths = r"Lokalizacja folderu z plikami"
pdf_path = "Nazwa pliku.pdf"
with open(pdf_path, "wb") as f:
f.write(img2pdf.convert(image_paths))
W „” zmień wartości:
- image_paths – ścieżka do folderu z plikami książki,
- pdf_path – nazwa wyjściowego pliku pdf.
Zapisz plik pod dowolną nazwą np. convert.py.
Dodaj komentarz