Potrzebuję renderować lub pobierać wszystkie obrazy z określonego pliku PDF. Jak mogę to osiągnąć za pomocą Ghostscript lub ImageMagick?Jak wyodrębnić obrazy z plików PDF za pomocą Ghostscript lub ImageMagick?
Odpowiedz
Z pewnością nie można tego zrobić w Ghostscript, bez kodowania się urządzeniem Ghostscript.
Wątpię, czy możesz to zrobić również za pomocą ImageMagick.
Czy spojrzałeś na PDFtk?
Jeśli jesteś na systemie Windows, a następnie szybkie Google zamienia się:
http://www.somepdf.com/some-pdf-image-extract.html
oraz na systemie Linux:
https://askubuntu.com/questions/150100/extracting-images-from-a-pdf
nie można zrobić go z Ghostscript, ale można to zrobić za pomocą narzędzi wiersza Poppler lub XPDF o nazwie pdfimages
:
pdfimages -j some.pdf subdir/image-prefix
Wszystkie obrazy będą teraz znajdować się w subdir/
nazwie image-prefix-0001.jpg
, image-prefix-0002.jpg
...
Parametr -j
uczyni polecenia spróbować bezpośrednio wyodrębnić JPEG. Niezastosowanie się do tworzenia JPEG, stworzy PNMs lub PPMS, który zawsze można konwertować za pomocą ImageMagick:
convert subdir/image-prefix-0033.ppm subdir/image-prefix-0033.jpeg
Chcę zrobić coś podobnego, ale chcę całkowicie usunąć wszystkie obrazy z pliku pdf, to znaczy plik PDF powinien zawierać tylko tekst/czcionkę, ale bez obrazów, czy można to zrobić? pls pomoc. – codin
@codin: Komentarze nie są przeznaczone do omawiania zupełnie nowego tematu. Zadaj nowe pytanie, oznacz to jako '[ghostscript]' + '[pdf]', a ja postaram się odpowiedzieć na nie najlepiej jak potrafię. Proszę również podać, jaki jest cel twojego wniosku. Oszczędzasz na filesize? Usunąć informacje zawarte w obrazach? Lub? –
przykład wydobywania 1 strona:
gs -q -dBATCH -dNOPAUSE -sDEVICE=pnggray -d300 -dFirstPage=1 -dLastPage=1 -sOutputFile=1.tiff in.pdf
To nie wyodrębnia oryginalnych obrazów. Wykonuje obraz oparty na wyglądzie strony. Na przykład, jeśli na obrazie zostanie nałożony tekst, dostaniesz go również w renderowanym obrazie. – mlissner
powodem chcę używać GS lub obrazu magia że używają skryptu, który mogę uruchomić przez Javę, czy polecasz jakieś narzędzie PDF, które używa poleceń wiersza poleceń lub skryptów, aby to osiągnąć? – user1283633
Niestety, nie ...... – KenS
pdftk może wyodrębnić załączniki, ale nie wydaje się wyodrębniać obrazów. – bonh