Wie konvertiert man Word (doc) in PDF unter Linux?
Ich habe eine Reihe von Dateien im .doc-Format, die in das .pdf-Format konvertiert werden müssen. Ich verwende Ubuntu-Linux.
Ich habe eine Reihe von Dateien im .doc-Format, die in das .pdf-Format konvertiert werden müssen. Ich verwende Ubuntu-Linux.
Alternative 1)
sudo apt-get install cups-pdf
Navigieren Sie dann zu System > Verwaltung > Drucken und erstellen Sie einen neuen Drucker, legen Sie ihn als PDF-Dateidrucker fest und benennen Sie ihn mit “pdf”.
Führen Sie dann aus:
oowriter -pt pdf your_word_file.doc
Jetzt finden Sie Ihre .pdf-Datei in ~/PDF.
Alternative 2)
sudo apt-get install wv tetex-extra ghostscript
wvPDF test.doc test.pdf
Wenn das tetex-extra-Paket nicht mit Ihrer Distribution verfügbar ist, versuchen Sie texlive-base plus texlive-latex-base:
sudo apt-get install wv texlive-base texlive-latex-base ghostscript
wvPDF test.doc test.pdf
Sie können verwenden:
oowriter -convert-to pdf:writer_pdf_Export doc_file.doc
Wenn Sie X verwenden, können Sie es über Open Office machen. Da Sie sich dagegen sträuben, es manuell zu machen, denken Sie daran, dass es einige nette Makro-Skripte in Open Office gibt, mit denen Sie es automatisieren können. Sie können etwas ähnliches mit AbiWord machen (AbiWord –to=pdf).
Wenn Sie kein X haben, dann gibt es antiword, aber das extrahiert nur den Text - macht keine Formatierungen oder Grafiken. Es gibt auch wvWare , das ich benutzt habe, um Bilder aus Doc-Dateien zu extrahieren, aber ich habe nie versucht, es zum Konvertieren von Doc-Dateien in PDFs zu benutzen.
Oh, und .docx-Dateien benötigen vielleicht etwas anderes, aber da es sich nur um gezippte xml-Dateien handelt, sollte es nicht allzu schwierig sein, etwas Nützliches mit ihnen zu machen. Um Bilder massenhaft zu extrahieren, entpacken Sie sie einfach und kopieren das Bilderverzeichnis, aber ich musste sie unter Linux noch nie konvertieren.
Beim Drucken in PDF gehen viele Metadaten des Dokuments verloren (Titel, Autorenschaft, der Überschriftenbaum, der zur Navigation verwendet wird, usw.).
Installieren unoconv , konvertieren mit: unoconv -fpdf file1.doc file2.doc…
Ich würde versuchen, für Linux
$ /opt/openoffice.org3.1/program/python DocumentConverter.py test.odt test.pdf
Für Windows zu verwenden:
"C:\Program Files\OpenOffice.org 3.1\program\python" DocumentConverter.py test.odt test.pdf
PyODConverter erfordert, dass OpenOffice.org als Dienst läuft und auf Port (standardmäßig) 8100 lauscht; der einfachste Weg, OpenOffice.org als Dienst zu starten, ist über die Kommandozeile:
"C:\Program Files\OpenOffice.org 3.1\program\soffice" -accept="socket,port=8100;urp;"
Open Office ist ein guter Weg nach vorne, aber die Konvertierungstreue ist nicht immer ganz richtig.
Wenn Sie eine 100%ige Linux-Lösung anstreben, dann ist das der beste Weg nach vorne. Wenn Sie jedoch nichts gegen eine einzelne Windows-Box haben und ein wenig Code schreiben, um sie von Ihrem Linux-System aus anzusteuern, dann werfen Sie einen Blick auf diesen Beitrag .
Ich habe diesen Beitrag geschrieben, also gelten die üblichen Haftungsausschlüsse.
dopdf
im virtuellen Windows dopdf
als Standarddrucker während der Installation.*.doc
im virtuellen Office und drucken Sie es auf dem virtuellen dopdf
-Drucker.*.pdf
-Datei erscheint im My Documents
-Ordner des virtuellen Windows