Formato propietario DOCX

En una conversación de hace algunos días, me pedían unos documentos que estaban originalmente en formato DOCX, convertidos en algo así como un “formato no propietario”. Me resultó curioso, por lo que aprovecharé este espacio para aclarar algunos conceptos.

Empezamos por lo que es DOCX, el formato de documentos con el que guarda por defecto Word 2007 y posteriores, en contraposición a DOC, que era el tipo por defecto para Microsoft Word desde la versión 1.0 de 1983, y que sufrió diferentes revisiones a lo largo del tiempo, a pesar de conservar la misma extensión.

¿Qué es un formato propietario?, pues Wikipedia lo define muy bien: Un formato propietario o cerrado es un formato de archivo protegido por una patente o derechos de autor. Tales restricciones típicamente intentan prevenir la ingeniería inversa; si bien la ingeniería inversa en los formatos de archivo con propósitos de interoperabilidad generalmente es legal, según la creencia de quienes la practican. Las posiciones legales difieren conforme al país, entre otras cosas, en lo que se refiere a las patentes de software.

Sin embargo, DOCX, al pertenecer a la famila de formatos de Office Open XML, es en realidad un formato abierto. Es decir, su definición, diseño, estructura y capacidades están documentadas, y puede ser usado por terceros sin restricciones legales. Ello permite que desarrolladores ajenos a Microsoft como Softmaker con su Office, Apache con su OpenOffice, o LibreOffice, sean capaces de leer y escribir esos archivos.

El formato Office Open XML, no deja de ser un archivo ZIP, que contiene archivos XML, y esquemas, como podemos observar, todo muy abierto. Probablemente la confusión venga dada por el hecho que a pesar de ser abiertos en cuanto a especificaciones, lógicamente su implementación no lo es. Word es un software comercial, y además de código cerrado, pero eso no quita que en base a esas especificaciones públicas, pueda tratarse con el formato, que es en todo caso abierto.

Es un caso parecido a ZIP, o HTML, donde la especificación es abierta, pero la implementación original puede no serla.

4 comentarios en “Formato propietario DOCX”

  1. No me gusta este formato 😛 , aclaro que he trabajado más con el formato xlsx de excel 2007-2010

    Puntos positivos:

    * Mayor capacidad en las hojas de excel a partir de la versión 2007, hasta el 2003 estábamos limitados a 65000 renglones o filas, es cierto que difícilmente usaríamos tal cantidad, pero si nos pasó en el trabajo en el que reportes enormes exportados a excel se tenían que dividir.

    * Era muy frecuente que libros de excel se dañaran en el trabajo, y pues era el pánico porque hay información vital en ellos (los pude reparar con open office por cierto 🙂 ), ahora en este formato han sido pocas las veces que esto ha pasado.

    Puntos negativos:

    * El formato fue un caos cuando salio, pocos teníamos office 2007 y aunque había un plugin para abrir formatos del 2007 en office 2003 pocos lo tenían instalado o lo conocían.

    * Las versiones de open office aunque podían abrir los formatos de 2007, por lo menos en xlsx cuando se guardaban los documentos con filtros (desde open office) era imposible visualizar correctamente el documento desde excel 2007 (tenemos office 2010 en el trabajo y también tengo libre office 4.1.2.3 y parece haberse resuelto el problema).

  2. Javier Gutiérrez Chamorro (Guti)

    Muchísimas gracias por el repaso Manuel. Creo que tu punto de vista sobre formato XLSX, es totalmente aplicable a DOCX.

  3. Ademas existe unas librerias que puedes bajar gratis y crear documentos Word y Excel sin necesidad de tener instalado los programas y te ayudan a crear los documentos.

    Para excel hay una libreria aun mejor ClosedXML http://closedxml.codeplex.com/ veo que el nombre dará mas quebraderos de cabeza que es mas facil hacer hojas Excel.

Deja un comentario