©
Thomas Gramstad 2001
Dette dokumentet er tilgjengelig under
GNU Free Documentation License.
LINUXmagasinet nr. 5 2001
Denne artikkelen er både for Windows-brukere og for Linux-brukere som vil vite hvordan de skal forholde seg til Word-formatet. Altså Word-dokumenter i formatet .doc, enten sendt som vedlegg i epost, eller brukt som lagringsmedium for dokumenter.
Mange mennesker både sender og mottar/åpner nærmest automatisk og helt ukritisk slike Word-vedlegg de mottar i epost (eller de greier ikke å åpne dem, noe jeg kommer tilbake til nedenfor). Men det å sende og å åpne Word-vedlegg er en dårlig vane som kan og vil skape problemer for deg selv og andre. Kanskje du har vært heldig og unngått problemene til nå, men vært trygg, de kommer - spesielt hvis du åpner dem på Windows-plattformen.
Hva er det egentlig som er så problematisk med Word-formatet?
Følgende 5 forholdsregler eller tommelfingerregler for epost vil spare deg for en rekke problemer og gjøre din datahverdag mye greiere:
Hvis du følger disse tommelfingerreglene, vil du oppleve at din datahverdag blir mye tryggere og enklere. Plutselig bestemmer du selv over maskinen din, istedenfor å være prisgitt alle slags plutselige ulykker og ødeleggelser som ellers oppstår utenfor din kontroll! Etter å ha fulgt disse tommelfingerreglene en stund vil du plutselig oppdage at du ikke eller sjelden opplever alle de problemene som de av dine venner som ikke følger dem stadig klager over. Kanskje du til og med får status som den lokale dataeksperten fordi du nesten aldri har problemer lenger.
Word .doc? Mener du Word 2.0, Word 6.0, Word-for-Mac (hvilken versjon?), Word 97, Word XP, eller noe annet? Word er som sagt ikke ett format men mange, og når avsender og mottaker bruker forskjellige versjoner av Word, så blir det som oftest problemer. Spesielt finnes det ikke foroverkompatibilitet: nye versjoner av Word-dokumenter kan ikke leses av gamle versjoner av Word. Dette er bevisst prispolitikk fra Microsofts side for å presse alle til å oppgradere og kjøpe (eller leie) ny dyr programvare fra Microsoft. Men også den andre veien, å lese gamle Word-dokumenter inn i en nyere versjon, kan være problematisk. Word er altså en haug av flyktige, hemmelige og inkompatible formater. Dette gjør at Word-formatet er helt uegnet som lagringsmedium for dokumenter.
Poenget med dataformater for lagring av data er jo å ha eller lett kunne skaffe seg tilgang til dataene sine senere, i fremtiden. Da må man kunne grave frem en spesifikasjon og skrive ny programvare som kan lese formatet senere, når formatet ikke er i vanlig bruk lenger. Slik fungerer det med åpne dataformater. Men Microsoft har aldri vært interessert i dette. De har utelukkende vært interessert i at folk skal klare å trykke trykksverte på papir. Velspesifiserte dataformater strider helt klart mot dette ønsket. Effektiv datakommunikasjon strider også mot dette ønsket. Å langtidslagre et dokument som er produsert med Word tar faktisk mindre plass om man skriver det ut og tar bilde av det enn om man tar vare på den elektroniske "teksten". Telefaxen ble i sin tid popularisert fordi det var for mye jobb å kommunisere japanske skrifttegn med andre midler - folk foretrakk rett og slett å skrive for hånd, og da måtte man sende bilder av dokumentene deres - telefacsimile. En kunne spørre seg om det er bedre å lagre tekstlige dokumenter på denne måten med høy kontrast og fin oppløsning enn å lagre dem elektronisk søkbare; folk i en fjern fremtid vil alltids finne ut av og reprodusere våre bilder, mens all den magiske kodingen vi gjør med tekst kan komme til å gå tapt. Derfor er ikke dette som har blitt beskrevet som 'halv-steganografiske dokument-"formater"' fra Microsoft noen god idé når man skal lagre informasjon.
Hva med reverse engineering av Word-formatene for å kunne kikke på sine egne gamle data? (Reverse Engineering betyr å ta noe fra hverandre for å se hvordan det virker, og deretter sette det sammen igjen, kanskje på en litt annen eller bedre fungerende måte. Man kan i prinsippet 'reverse engineere' alle slags maskiner og oppfinnelser, og uttrykket er vanlig i IT-bransjen, der det ofte brukes om programvare: ut fra hvordan et dataprogram virker, kan man finne ut hvordan det er oppbygd. Reverse engineering er altså mekking med programvare.) Ett ord: DMCA. Digital Millenium Copyright Act, den amerikanske loven som forbyr og gjør straffbart reverse engineering. Tilsvarende lover er vedtatt i EU, og overnasjonale lover og samarbeid gjør disse lovene gjeldende i flere og flere land. Og copyright-eierne har aggressivt begynt å håndheve disse lovene. Du risikerer dermed streng straff for reverse engineering, selv om formålet kun er å få tilgang til dine egne data!
Vi kan også tenke oss at Microsoft faktisk går nedenom en eller annen gang i en ikke alt for fjern framtid, og at Word 2031 var siste frigitte versjon. Etter det er det ikke lenger noen som vedlikeholder Word. Etterhvert som nye og bedre CPUer kommer på markedet forsvinner også datamaskiner som kan kjøre Word 2031 fra arkivene rundt om. Dessuten er det ikke en gang sikkert at Word-programmet lar seg kjøre etter at bobestyrereren har avsluttet jobben sin og skrudd av lisensserverne.
Hvordan skal du nå få lest langtidslagrede dokumenter som du har lagret i .doc-formatet knyttet til Word 2031? Siden formatet er proprietært, lukket og hemmelig, og dessuten antagelig kryptert, har det aldri eksistert noen dokumentasjon som du kan ta fram for å mekke ett tredjepartsleseprogram. Dermed er dokumentene tapt.
Hva om du sitter på Linux (eller en annen Unix-variant) og mottar et Word-dokument? Pussig nok er problemene med Word-vedlegg mindre på Linux enn de er under Windows! Det er to grunner til dette. Den ene er at Words muligheter for å gjøre skade (f.eks. pga. virus-angrep, scripts etc.) er mindre på Linux. Dette skyldes dels inkompatibilitet mellom systemene, og dels at sikkerheten på Linux generelt er bedre, både gjennom en mer modularisert arkitektur og ved at prosessers adgangsrettigheter vanligvis er satt opp på en fornuftig måte på Linux. Den andre grunnen er at det er utviklet en del programvare for Linux for nettopp å kunne konvertere Word-vedlegg til et åpent, leselig format, f.eks. plain text, eller rich text. Et kjent slikt program er Antiword. De forskjellige Office-pakkene som finnes på Linux kan også importere og konvertere Word-dokumenter, f.eks. Abiword og KOffice. Spesielt Suns Staroffice, nå også som OpenOffice, kan anbefales. Den kan importere og åpne flere Word-formater enn Word selv kan, og den kan også lagre dokumenter i Word-format (hvis du av en eller annen grunn skulle ønske dette). Alle disse programmene og Officepakkene kan lastes ned fritt fra nettet fra sine respektive nettsteder.
Selv foretrekker jeg likevel å sende et standardbrev (se under Kilder nedenfor) tilbake til avsender der jeg ber om å få tilsendt dokumentet på nytt, i et åpent format, og henviser til grunnene nevnt ovenfor om hvorfor Word-vedlegg bør unngås i epost. Jeg bruker sjelden (les: aldri) Office-programmer, da jeg synes at hele Office-konseptet er feil eller unødvendig, og jeg vil ikke tvinges til å fyre opp en svær Office-pakke, eller et annet spesialprogram, bare for å kunne lese en enkelt epostmelding. Jeg ser det også som en god gjerning og viktig utdanningsoppgave å fortelle folk hvordan de kan klare å holde seg borte fra det stygge mangehodete trollet som Word og dets mange innbyrdes inkompatible formater og alle dets øvrige utallige vederstyggeligheter utgjør. Dette er også den linjen jeg vil anbefale deg å følge, enten du er på Linux eller Windows, selv om det altså finnes noen verktøy og muligheter for å åpne Word-vedlegg begge steder. For deg på Windows er argumentet enkelt: ved å ikke åpne Word-vedlegg du ikke har bedt om å få, og helst ikke i det hele tatt, sparer du deg selv for en rekke alvorlige angrep på og trusler mot maskinen din. For deg på Linux er argumentet at du slipper merarbeid med å lagre, konvertere og åpne dokumenter som er beregnet for et annet programvaremiljø, og du slår et lite slag mot Microsofts dominans og monopolisme samt den dårlige sikkerheten på desktopen, som i så stor grad opprettholdes ved hjelp av at Microsoft fremelsker bevisstløshet hos brukerne.
La ikke Brave New Word-trollet herse med deg! Husk: Word is a four-letter Word. Lykke til!
Til slutt vil jeg anbefale artiklene og dokumentene nedenfor for ytterligere informasjon og til fri bruk.
Word-dokument? Nei takk!
https://home.nuug.no/~thomas/word-neitakk.html
Et standardformular du kan bruke når noen sender deg et
Word-vedlegg.
Les også Børre Ludvigsens svarbrev (både norsk
og engelsk versjon):
https://abdallah.hiof.no/~borrel/msword.txt
Skikk og bruk med elektronisk post av Bjørn
Ness:
https://www.usit.uio.no/it/avis/nr3-2000/skikkogbruk.html
Dette dokumentet er retningsgivende for Universitetet i Oslo og de
gode tipsene og rådene som gis her kan med fordel brukes
andre steder også.
Her kan du lese et opprop fra aksjonen for åpne formater
og standarder 21. mai 2001:
Microsoft! Stopp hærverket på nettet!
https://people.opera.com/howcome/2001/msft/seddel.html
Internett slik du vil ha det, av Gisle Hannemyr:
https://hjem.sol.no/gisle/ms01.html
Hvem skal eie formatene? av Thomas Gramstad
https://www.efn.no/hvem-eier-formatet.html
INTERFACE: 'Forced upgrading' in the World of Word by
Zeid Nasser
https://archives.star.arabia.com/980820/TE1.html
Dette dokumentets adresse:
https://home.nuug.no/~thomas/fri/brave-new-word.html
Forfatterens adresse:
thomas@gramstad.no
Sist oppdatert av Thomas Gramstad 3. mai 2002.