Kako koristiti Linux za otvaranje Word dokumenata

Dijeljenje dokumenata između nekoliko operativnih sistema i programa je tipičan problem u kancelarijskom ili proizvodnom okruženju.
Možete koristiti LibreOffice Writer ili AbiWord na Linuxu za generiranje, otvaranje i uređivanje Microsoft Word dokumenata.
Oba su sposobni procesori teksta koji mogu čitati i proizvoditi dokumente u Word .doc i .docx formatima.

Antiword (.doc datoteke) i docx2txt (.docx) su korisne aplikacije koje možete koristiti ako želite uslužne programe komandne linije koji izdvajaju tekst iz Word datoteka.

U ovom članku ćemo pogledati ove četiri aplikacije i kako ih koristiti.
Na nekim od najčešće korištenih distribucija Linuxa, uključujući Debian, Ubuntu, Fedora, OpenSUSE, CentOS i Arch Linux, proći ćemo kroz njihovu instalaciju.
Na vašoj Linux mašini, takođe ćemo vam pomoći da instalirate određene osnovne Microsoft TrueType fontove.

LibreOffice

Microsoft Office programi, kao što je Microsoft Word, kompatibilni su s LibreOfficeom, besplatnim uredskim paketom za produktivnost otvorenog koda koji se aktivno održava i stalno ažurira.
Vaši LibreOffice Writer dokumenti mogu biti sačuvani u .doc ili .docx formatu, a jedan od njih će se tada uspješno otvoriti u programu Microsoft Word.

Postavljanje LibreOfficea

LibreOffice možete instalirati pomoću svog upravitelja paketa.
Otvorite terminal i unesite naredbu koja je prikladna za vaš operativni sistem da biste ga instalirali:

Debian 8, Ubuntu 15
sudo apt-get update && sudo apt-get install LibreOffice

Fedora 23
sudo dnf update && sudo dnf install LibreOffice

OpenSUSE 10
sudo zypper refresh && sudo zypper install LibreOffice

Arch Linux 2016
sudo pacman -Sy libreoffice-fresh

CentOS 7
sudo yum update && sudo yum install libreoffice

Nakon instalacije, LibreOffice bi se trebao pojaviti u meniju aplikacija vašeg GUI-ja.
Pokrenite ga i preko terminala koristeći sljedeću naredbu:
libreoffice

AbiWord

Još jedan besplatni program za obradu teksta otvorenog koda je AbiWord.
Nudi sučelje lako za korištenje koje je razvijano otprilike 20 godina.
Može otvarati, uređivati ​​i čuvati Microsoft Word .doc i .docx datoteke baš kao LibreOffice.
Abiword ne uključuje kompletan uredski paket kao LibreOffice, stoga zauzima manje prostora i koristi manje sistemskih resursa.

Postavljanje AbiWorda

Debian 8, Ubuntu 15
sudo apt-get upgrade && sudo apt-get install abiword

Fedora 23
sudo dnf update && sudo dnf install abiword

OpenSUSE 10
sudo zypper refresh && sudo zypper install abiword

Arch Linux 2016
pacman -Sy abiword

CentOS 7
sudo yum update && sudo yum install abiword

Antiword

Uslužni program komandne linije pod nazivom Antiword pretvara sadržaj .doc datoteke u običan tekst.

Korištenje Antiworda

Običan tekst datoteke se upisuje u standardni izlaz kada se antiword pokrene sa Word .doc datotekom.

Kada je u pitanju oblikovanje tabela, Antiword je odličan.
Također može izlaziti u PDF i sadržavati fotografije kao PostScript objekte.

Izlaz se može usmjeriti na tekstualnu datoteku:
antiword file.doc > file.txt

Alternativno, možete kopirati sadržaj u vim i otvoriti ga direktno u uređivaču teksta:
antiword file.doc | vim –

Pico:
antiword file.doc | pico –

Postavljanje Antiworda

Debian 8, Ubuntu 15
sudo apt-get update && sudo apt-get install antiword

Fedora 23
sudo dnf update && sudo dnf install antiword

OpenSUSE 10
sudo zypper refresh && sudo zypper install antiword

Docx2txt
sudo pacman -Sy antiword

CentOS 7
sudo yum update && sudo yum install antiword

Docx2txt

Program komandne linije pod nazivom Docx2txt pretvara .docx datoteke u običan tekst. .doc fajlovi se ne konvertuju.

Pozovite docx2txt i unesite crticu kao naziv izlazne datoteke da biste ispisali sadržaj .docx datoteke na ekranu terminala ili u datoteku.

Koristite sljedeći obrazac naredbe za transformaciju .docx datoteke i ispišite je kao tekstualnu datoteku:
docx2txt file.docx file.txt

Ili:
docx2txt file.docx – > file.txt

Koristite sljedeći obrazac naredbe u vim-u da otvorite .docx tekstualnu datoteku:
docx2txt file.docx – | vim –

Otvorite ga u nano na:
docx2txt file.docx – | nano –

Slijedite upute u nastavku za vašu konkretnu verziju Linuxa da instalirate doc2txt:

Debian 8
sudo apt-get update && sudo apt-get install docx2txt

Ubuntu 15
sudo apt-get update && sudo apt-get install docx2txt

Arch Linux 2016
sudo pacman -Sy docx2txt

Fedora 23

Ne postoji paket za docx2txt u Fedora spremištu, ali ga možete ručno instalirati:

Posjetite stranicu docx2txt na SourceForgeu da preuzmete izvor.
Izdvojite arhivu:
tar xzvf docx2txt-1.4.tgz

Instaliranje ili nadogradnja ovih paketa je neophodna kako biste osigurali da vaš sistem ima instaliran Perl, Unzip i Make:
sudo dnf update && sudo dnf install perl unzip make

Pokrenite make kao root nakon toga da instalirate:
sudo make

Od sada, docx2txt je postavljen kao docx2txt.sh.
Možete koristiti sljedeću naredbu da pretvorite word-dokument .docx datoteku u tekstualnu datoteku:
docx2txt.sh word-document.docx

Automatski, konvertovani tekstualni fajl se pohranjuje kao word-dokument.txt.

OpenSUSE

Paket docx2txt nije dostupan u SUSE spremištu, ali ga možete dobiti sa docx2txt web stranice na SourceForge-u.
Izdvojite arhivu:
tar xzvf docx2txt-1.4.tgz

Instaliranje ili nadogradnja ovih paketa je neophodna da bi se osiguralo da vaš sistem ima instaliran Perl, Unzip i Make:
sudo zypper update && sudo zypper install perl unzip make

Pokrenite make kao root nakon toga da instalirate:
sudo make

Od sada, docx2txt je postavljen kao docx2txt.sh.
Možete koristiti sljedeću naredbu da pretvorite word-document .docx datoteku u tekstualnu datoteku:
docx2txt.sh word-document.docx

Automatski, konvertovani tekstualni fajl se pohranjuje kao word-document.txt.

CentOS 7

Paket docx2txt nije dostupan u CentOS spremištu, ali ga možete dobiti od SourceForgea.
Izdvojite arhivu:
tar xzvf docx2txt-1.4.tgz

Instaliranje ili nadogradnja ovih paketa je neophodna kako biste osigurali da vaš sistem ima instaliran Perl, Unzip i Make:
sudo yum update && sudo yum install perl unzip make

Pokrenite make kao root nakon toga da instalirate:
sudo make

Od sada, docx2txt je postavljen kao docx2txt.sh.
Možete koristiti sljedeću naredbu da pretvorite datoteku word-document.docx u tekstualnu datoteku:
docx2txt.sh word-document.docx

Automatski, konvertovani tekstualni fajl se pohranjuje kao word-document.txt.

Instaliranje fontova kompatibilnih s Microsoftom

Microsoft fontovi su dostupni na Linuxu.
Ako planirate da radite sa Microsoft Word datotekama, posebno onima koje su proizvedene na Windows računaru, instalirajte ih.
Osnovni fontovi se sastoje od:

  • Andale Mono
  • Arial Black
  • Arial
  • Calabri
  • Comic
  • Cambria
  • Courier
  • Impact
  • Trebuchet
  • Times
  • Verdana
  • Webdings

Poduzmite sljedeće radnje da ih instalirate:

Fedora 32

Nabavite SourceForge RPM paket za instaliranje msttcore.

Instalirajte potrebne softverske pakete:
sudo dnf update && sudo dnf install curl cabextract xorg-x11-font-utils fontconfig

Sledeće instalirajte RPM paket:
sudo dnf install msttcore-fonts-installer-2.6-1.noarch.rpm

OpenSUSE 10

Preuzmite SourceForge RPM paket za instalaciju msttcore.

Instalirajte potrebne softverske pakete:
sudo zypper update && sudo zypper install curl cabextract xorg-x11-font-utils fontconfig

Sledeće instalirajte RPM paket:
sudo zypper install msttcore-fonts-installer-2.6-1.noarch.rpm

CentOS 7

Preuzmite SourceForge RPM paket za instalaciju msttcore.

Instalirajte potrebne softverske pakete:
sudo yum update && sudo yum install curl cabextract xorg-x11-font-utils fontconfig

Sledeće instalirajte regionalni RPM paket:
sudo yum install msttcore-fonts-installer-2.6-1.noarch.rpm

Arch Linux 2016

Preuzmite SourceForge RPM paket za instalaciju msttcore.

Instalirajte potrebne softverske pakete:
pacman -Sy rpmextract x11-font-utils fontconfig

Izdvojite sadržaj lokalnog RPM paketa:
rpmextract.sh msttcore-fonts-installer-2.6-1.noarch.rpm

Ova komanda kreira dva foldera, etc i usr, koji odgovaraju vašim direktorijumima /etc i /usr, i izdvaja sirovi sadržaj RPM datoteke.
usr/share/fonts/msttcore je mjesto gdje možete dobiti same datoteke fontova.