Microsoft Makes XML the File Format for the Next Version of Microsoft Office

http://www.microsoft.com/presspass/features/2005/jun05/06-01XMLFileFormat.mspx

Creo que no lo había comentado nadie. Me he quedado un poco de piedra cuando lo he leído.

Algunos highlights:
...
The new formats improve file and data management, data recovery, and interoperability with line-of-business systems beyond what's possible with Office 2003 binary files. And any program that supports XML -- it doesn't have to be part of Office or even from Microsoft -- can access and work with data in the new file format. Because the information is stored in XML, customers can use standard transformations to extract or repurpose the file data.
...
PressPass: Won't this make it easier for your competitors to copy Microsoft Office?

Sinofsky: Certainly this will make it easier for other developers to use our formats to build solutions that don't require Office. However, the ability of other technology providers to use the new file format to integrate their solutions with the Microsoft Office System is an important and frequently requested capability by the industry. We feel it's to everyone's advantage to respond. Customers also know that the true value of a desktop application is not the format in which data is stored but the full breadth of capabilities offered by that application, along with the quality and security of the user experience that it provides.
...


Ahora si que están locos estos romanos. :O

Un saludo.
Da igual, como siempre lo implementaran a su manera, y tendremos xml incompatible con el resto de programas, y al final microsoft sacara un visor de xml, que vendra preinstalado en windows, y que todo el mundo usara, y dentro de 5 años, los de la fundacion mozilla sacaran un visor mejor, con mas extras...


Creo que se me va la pinza por momentos [sati]
No es eso lo que dicen.
XML is inherently interoperable because it is a text-based standard that has been defined by the W3C. It can be consumed and created by a wide variety of tools already on the market today. We have used this standard as the foundation for the new Office XML Open Formats, which are open, published document formats. In addition, we are publishing with it a royalty-free license, so any customer or technology provider can use the file formats in its own systems without financial consideration to Microsoft. This will ensure that the new file formats can be used by everyone to create, access, and modify documents in these formats.
bastian escribió:No es eso lo que dicen.


Que si, que eso dicen. Ahora falta que lo hagan...

Si un amigo le pasa un .doc a otro, y este ultimo no tiene el office instalado... o se baja un visor, o se instala el office al tiempo que se pone un parche en el ojo y se instala un loro en su hombro... Asi ms consigue otro usuariodependiente de su office, y eso le beneficia en un futuro.

Si cambia al xml estandard, crees que seguira pasando lo mismo que en el ejemplo??

Saludos ^__^

Pd. El ejemplo se supone para gente que no tenga ni warra de openoffice.org, abiword y derivados.
A ver si lo he entendido bien.... microsoft hace publicas la especificiones de sus nuevos formatos office basados en xml y que cualquier programa podra implementar sin tener que pagar un duro el licencias.

Vale hasta aqui podemos decir
"Estos romanos estan locos"



Pero hay una cosa... hace tiempo que m$ patentó el procesador de textos que guarda archivos en xml, o sea, que OpenOffice, Abiword y KOffice estan infrigiendo esta patente.

Enlace: http://barrapunto.com/article.pl?sid=05/03/17/0928253

Esto huele bastante mal, [MODO PARANOICO]o sea que ms pueda permitir libremente el uso de esta "patente" al soft privativo y no al soft libre, porque viendo el culebron con la comision europea no me extrañaria mucho [/MODO PARANOICO]

Salu2
jPlayer escribió:Si un amigo le pasa un .doc a otro, y este ultimo no tiene el office instalado... o se baja un visor, o se instala el office al tiempo que se pone un parche en el ojo y se instala un loro en su hombro... Asi ms consigue otro usuariodependiente de su office, y eso le beneficia en un futuro.

Si cambia al xml estandard, crees que seguira pasando lo mismo que en el ejemplo??

Saludos ^__^

Pd. El ejemplo se supone para gente que no tenga ni warra de openoffice.org, abiword y derivados.

Pues depende. Si yo le paso un xml a un amigo que no tiene ni guarrra y no tiene el office instalado, no le voy a decir que se piratee el office, sino que se baje openoffice (o el que sea) que le va a servir igual. Y SE SUPONE que si es un estandar abierto, ya no habrá esos problemas de incompatibilidades.

Por supuesto que si al final hacen una de las suyas, la hemos jodido, pero de momento nada apunta a eso (salvo la historia [sati]. Por lo menos digo yo que la cosa irá a mejor con respecto a ahora.

Un saludo.
Por lo que yo sé de XML: si el formato es XML, el futuro ".doc" será un fichero de texto. Por tanto, diga o no las especificaciones microsoft, cualquiera puede inspeccionar ese XML y saber qué significa cada etiqueta y cada atributo.

Luego queda el paso XML---> Formato visual. Pueden pasar dos cosas: que microsoft facilite los XSL o no. Si los facilita, no se necesita ningún programa accesorio, un procesador XSL bastaría para generar el formato visual. Por supuesto, lo más probable es que microsoft haga uso de extensiones en el XSL, por lo que un procesador estándar se encontraría con algunas dificultades.

En este último caso o si simplemente no facilita ningún XSL, basta hacerlo: una vez que se entiende el XML, lo otro solo requiere pericia en la programación.

El caso es que si el nuevo formato es XML, se acabó la incompatibilidad con la suite de microsoft office. Y si se acaba la incompatibilidad, se acaba el mercado cautivo.

Sinceramente, me parece un suicidio.
Un comentario: XML no tiene porque llevar texto en su interior, el nuevo formato puede ser perfectamente:


dfghkldfkñjlbnnntñoh5465t9eh30wvye4b08ws34nv54cw'348n'v7'43w8mcv9348c43


Es decir, todo en datos binarios.
no lo veo tan raro, microsoft gana mucho dinero con el soporte a empresas, y el soporte tecnico se paga sea el soft libre (a empresa X) o no (a empresa Y), asi q no es tan suicidio como parece [+risas]
No sé... pero alguien de verdad piensa que MS va a hacer algo que pueda facilitar la vida a los demás y que siga los estándares ya establecidos?

Sea por XML binario ó XSL, ó lo que sea... MS la seguirá jugando.

no lo veo tan raro, microsoft gana mucho dinero con el soporte a empresas, y el soporte tecnico se paga sea el soft libre (a empresa X) o no (a empresa Y), asi q no es tan suicidio como parece
Eso díselo a ellos y que te expliquen por qué Windows, Office, iExplorer, Messenger, etc... no son libres.

Un saludo!
porque quieren asacar mas dinero [666]
Hombre, tontos no son, y si hacen esto es porque ven alguna forma de sacar (más) pasta, lo cual no implica necesariamente que vayan a jugárnosla.

Por otra parte, lo de que los datos fuesen binarios, podría ser, pero no tendría mucho sentido si lo que dicen en el enlace es verdad. Lo he releído porque pensaba que decía que el contenido era texto, pero no está muy claro (aunque es lo que se da a entender=. De todas formas, repito que por los comentarios acerca de la interoperabilidad de aplicaciones, reducción del tamaño y la distinción con el actual formato binario, no es lo que apunta.

Un saludo.
Hasta que no lo vea no lo creo, como se suele decir. La mayoría de las tecnologías que han propuesto son interoperables, pero sólo al 100% con ellos mismos.
Churly escribió:Un comentario: XML no tiene porque llevar texto en su interior, el nuevo formato puede ser perfectamente:


dfghkldfkñjlbnnntñoh5465t9eh30wvye4b08ws34nv54cw'348n'v7'43w8mcv9348c43


Es decir, todo en datos binarios.


Pues si, pero es algo tan absolutamente estúpido que ni se me había ocurrido. Sinceramente, eso para mí no es XML. El que algo tenga marcas, no lo convierte en lenguaje de marcas. Las marcas son metainformación sobre la información y dfghkldfkñjlbnnntñoh5465t9eh3, etc..., ¿qué coño es? Si la información es texto, tiene que ir el texto y no otra cosa. El formato (negritas, tamaño,etc...) es metainformación y, por tanto, va codificada en las etiquetas y los atributos de las etiquetas. Distinto es que haya un gráfico y microsoft coja y haga algo como:

<image>
hdsfkd dsfds fdslksfd fds,fd kjsfdb fds fds ,fsd fdfsdfds, etc...
</image>


Eso, aunque es una chapuza insoportable, podría tener cierto sentido. Pero sólo con aquello que no es texto. Y aun con todo la imagen estará en algún formato ya existente (.jpg, .gif, etc...) con lo cual tampoco supone ningún problema. Para que supusiese un problema, microsoft tendría que crear un nuevo formato binario de imágenes.

Además, creo recordar que microsoft estuvo presionando para que su XML, fuese considerado el estándar XML para textos con formato. Al final se llevo el gato al agua el de OASIS (que creo que es el que implementa oo.org en su versión 2.0). ¿Tú crees que microsoft hubiera siquiera abierto la boca, si lo que presentaba ante el organismo de normalización es la aberración esa?
jPlayer escribió:Da igual, como siempre lo implementaran a su manera, y tendremos xml incompatible con el resto de programas, y al final microsoft sacara un visor de xml, que vendra preinstalado en windows, y que todo el mundo usara, y dentro de 5 años, los de la fundacion mozilla sacaran un visor mejor, con mas extras...


Creo que se me va la pinza por momentos [sati]

¿Tú sabes que el XML es un meta-lenguaje no? Es decir, que ellos sacan su definición de formato para office y punto, ni XML incompatible ni leches.
¿Tú sabes que el XML es un meta-lenguaje no? Es decir, que ellos sacan su definición de formato para office y punto, ni XML incompatible ni leches.


¿Tu sabes que dos meta-lenguajes pueden ser incompatibles entre sí, verdad? Así que menos leches y más pensar.

Microsoft es característico por inventarse parte del XSL a su gusto (y del HTML). Siendo ambos estándares definidos y públicos.

Saludos.Ferdy
zheo escribió:¿Tú sabes que el XML es un meta-lenguaje no? Es decir, que ellos sacan su definición de formato para office y punto, ni XML incompatible ni leches.


Por si no pillaste la ironia, era una "ligera" analogía con el HTML, ¿o me diras que el HTML que genera el frontpage es 100% estandard???

Para mas info, solo mira la web de msn con el explorer y con firefox, o la de hotmail, o cualquiera de las de M$...

Hace falta tambien recordar su "implementacion" de java?

Ademas, una de las mayores razones para actualizar el office es que te cambian las especificaciones del doc cuando les sale de la bola del raton, y asi presionan para que la gente vaya actualizando el office. Si meten un formato estandard, compatible, y que encima cualquiera pueda verlo con otra cosa que no sea SU producto... se les acaba todo. ¿Tan dificil es de entender? ¿tu pagarias por una actualizacion de office que no aporta nada mas que un clip con mas colores?

Saludos ;)
Ferdy escribió:Microsoft es característico por inventarse parte del XSL a su gusto (y del HTML). Siendo ambos estándares definidos y públicos.


Sí, Ferdy, pero ¿qué más da que hagan un XSL con extensiones para su MSXSL?

Microsoft lo que te proporciona es el XML y su especificación (esta etiqueta sirve para esto y este atributo para esto otro). Si no proporciona la especificación (cosa que dudo porque intentaron colarlo como estándar), es fácil averiguarla porque el XML es texto puro y duro.

El XSL es lo de menos. Si no lo da o crea uno que no sea compatible con XSL estándar (cosa que es bastante probable, porque ellos ya tienen un procesador XSL con extensiones), cualquier con conocimientos puede hacer otro de 0. O, si lo permite la licencia, modificar las partes que hacen uso de esas extensiones. Es más, ni siquiera hay que modificar las hojas de estilo de microsoft. Simplemente crear una capa superior en que se llame a las de microsoft y en la que se modifique las partes que se salen del estándar.

Compáralo con DocBook. La especificación de DocBook es XML (en realidad un DTD que define cómo deben ser los XML). Y ya está. A lo más que llega la especificación de DocBook es a indicarte en ocasiones que "tal cosa" debería generar tal otra. Los XSL no forman parte de la especificación de DocBook, aunque se facilitan. De hecho, si quieres generar un html puedes recurrir a las XSL oficiales (las de Norman Walsh) o si te lo deseas a otras que te hagas tú o que cojas de terceros.

Yo mismo empecé a modificar las de Norman Walsh porque no me gustaban (las que generan el HTML). Y tengo modificados todos los elementos de línea. Me faltan los de bloque. Incluso tengo modificado el XML para poder incluir un atributo en y que indiqué qué significa el acrónimo y qué significa la abreviatura. Incomprensiblemente DocBook no lo permite.

Y, en cualquier caso, ni siquiera las XSL de DocBook siguen el estándar. Por ejemplo, las XSLT hacen uso en ocasiones de EXSLT que no forman parte del estándar 1.0.

La clave está en que los XML son ficheros de texto, así que no hay forma ni de ocultar el texto (que es el contenido) ni de ocultar la estructura lógica (que lo indican las etiquetas).

Es más, al ser XML no hay porqué generar formatos de presentación. Se pueden hacer XSLT que conviertan a otros formatos como elmde DocBook o el estándar de OASIS.

Puedo estar equivocado, pero soy incapaz de ver cuál puede ser la trampa de microsoft. ¿Decir en la especificación una cosa y que no sea así? Eso es imposible de hacer porque como el XML es un fichero de texto, es muy fácil comprobar que microsoft está mintiendo en la especificación. ¿Cambiar periódicamente la especificación? Eso le obligaría a cambiar periódicamente también los msoffice.

En cuanto a vuestra analogía con HTML, creo que no entra. En este caso, HTML es un estándar que microsoft se lo salta apoyándose en su amplia cuota de mercado (por ejemplo, el atributo "alt" de las imágenes). El resto de navegadores se ven en la tesitura de seguir el estándar o seguirle el juego a microsoft. Y, con buen criterio, siguen el estándar aunque cuesta el mismo esfuerzo seguirle el juego. En este caso, no hay tal estándar. Lo que hay que hacer lo dice microsoft. Se hace y punto.
Yo no creo que Microsoft se vaya a pillar aquí los dedos; de todas formas no creo que tuviera muchas dificultades en 'crear' un XML con 'alguna extensión' y venderlo como 'la solución final'.

Simplemente si os soy sincero... me da bastante igual lo que haga Microsoft con sus formatos; no veo ningún 'avance tecnológico' en ellos.

Saludos.Ferdy
Ferdy escribió:Yo no creo que Microsoft se vaya a pillar aquí los dedos; de todas formas no creo que tuviera muchas dificultades en 'crear' un XML con 'alguna extensión' y venderlo como 'la solución final'.


A mí me extraña todo esto también. El caso es que XML, implica fichero de texto y en un fichero de texto es difícil ocultar algo.

Simplemente si os soy sincero... me da bastante igual lo que haga Microsoft con sus formatos; no veo ningún 'avance tecnológico' en ellos.


No creo que sea así. A mí, en principio, también me da igual. Sin embargo, no hay que olvidar que lo fundamental no son los programas, sino la información que generan los programas.

La suite de microsoft posee una gran cantidad de mercado cautivo debido a su formato. Incluso en el supuesto de que msoffice fuese una patata en comparación con una otra suite, seguiría teniendo una gran cantidad de mercado como consecuencia de que es "el único que lee bien los .doc".

Lo que está claro es que existen dos grandes soluciones para lograr el intercambio eficaz de información:

a) Todos usamos el mismo programa.
b) Cada cual usa el programa que le da la gana, pero todos usamos un formato universal. O al menos formatos abiertos fácilmente traducibles entre sí.

La opción a) es la que siempre han propuesto casas como microsoft, porque beneficia a sus monopolios de facto. La opción b), que es la más sana desde el punto de vista de la libertad individual y de mercado, es la que siempre ha propugnado el software libre.

Que microsoft claudique (si realmente es así) con sus formatos estrella (los del office) es una gran noticia. Eso implica que todo el mundo parte en igualdad de condiciones y que sobrevivirán los mejores programas y no los que tienen más mercado cautivo.

Y recuerda que tú y yo hemos pagado muchísimas licencias del office, aunque no lo hayamos utilizado en la vida. De cada ordenador público con un office legal, nosotros pagamos una parte proporcional en impuestos. Y el pago de la licencia de un office del ordenador de una empresa privada, grava el coste del producto que comercializa esa empresa. Así que vuelves a pagar una parte proporcional a través del precio.
Sin embargo, no hay que olvidar que lo fundamental no son los programas, sino la información que generan los programas.


Creo que has dado con esto en el clavo (o al menos en 'un clavo').

Todos sabemos que los formatos actuales de office guardan 'más información' que la que el usuario cree; sin duda esto va a ser 'cuasi' imposible si utilizan un formato XML abierto y claro. Esto es algo que también me hace dudar...

¿Nadie ha pensado que el XML tambien se puede ofuscar? Me parece demasiado 'evil' pero me espero cualquier cosa...

Y recuerda que tú y yo hemos pagado muchísimas licencias del office, aunque no lo hayamos utilizado en la vida. De cada ordenador público con un office legal, nosotros pagamos una parte proporcional en impuestos. Y el pago de la licencia de un office del ordenador de una empresa privada, grava el coste del producto que comercializa esa empresa. Así que vuelves a pagar una parte proporcional a través del precio.


Pero eso no creas que va a cambiar a corto plazo porque una utilidad libre sea capaz de manejar perfectamente el formato de Microsoft Office; o por lo menos no creo yo que eso cambie facilmente. La administración seguirá en sus 13...

Saludos.Ferdy
Ferdy escribió:¿Nadie ha pensado que el XML tambien se puede ofuscar? Me parece demasiado 'evil' pero me espero cualquier cosa...

Lo primero que pensé al saber del artículo hace unos días fue que un .docxml tendría esta pinta:
[...]<a121 r32="2" r54="5">texto cifrado</a121>[...]

XD
Buenas.
Yo, sin querer entrar en la parte técnica que no la conozco y no puedo opinar, lo veo como un intento de mantenerse en el cuasi monopolio de Microsoft.
Me parece una forma de evitar que, como ya ha pasado, algunas administraciones busquen alternativas por utilizar un formato cerrado. Basandose en que ahora archivan sus documentos en un estandar abierto y accesible a todos, MIcrosoft puede continuar con la ventaja que le da su enorme presencia, en las oposiciones, cursos y demas , parece que Office es sinónimo de suite ofimática.
No podemos olvidar que para un altísimo número de usuarios, no existen otros programas que los de MIcrosoft y desgraciadamente entre los que piensan eso parece que estan los que deciden que se instala en los ordenadores públicos.
Sin olvidar que no se van a cortar a la hora de enumerar todas la razones por las que son, segun ellos, superiores técnicamente y tampoco creo que sus departamentos de ventas vayan a poner reparos a la hora de hacer "lobby".
Narf escribió:Lo primero que pensé al saber del artículo hace unos días fue que un .docxml tendría esta pinta:
[...]<a121 r32="2" r54="5">texto cifrado</a121>[...]

XD


En ese caso, con texto cifrado, en mi opinión (IMHO que diría Ferdy ;-)), no estamos ante XML.

Para mí XML es información en texto plano (contenido) con metainformación (etiquetas y atributos). Si el texto está cifrado, no hay texto plano. De hecho, se estaría cifrando texto, ¿con qué fin? ¿Por qué escribir "Ipmb" en vez de "Hola"? ¿Habría que coger el contenido de cada elemento y pasarlo por una función descifrar(contenido_del_elemento)? Sería demasiado evidente que se haría para controlar que el resto de programas no sean capaces de leer el contenido. Demasiado monopolístico incluso para microsoft.

Por supuesto, se pueden ofuscar las etiquetas y los atributos para que el XML no sea autoexplicativo. Eso sí sería XML, aunque no buen XML.

Pero vuelvo a que microsoft quería colarlo como estándar. Si lo quería colar como estándar es imposible que cifrase el texto o que ofuscase demasiado las etiquetas.
auxiliar escribió:En ese caso, con texto cifrado, en mi opinión (IMHO que diría Ferdy ;-)), no estamos ante XML.

Para mí XML es información en texto plano (contenido) con metainformación (etiquetas y atributos). Si el texto está cifrado, no hay texto plano.

Hombre, dejando a un lado que estaba de coña (aunque en un oscuro rincón de mi mente sigo sospechando que harán algo parecido a lo que he puesto XD), no creo que el xml dejase de serlo por estar cifrado. Claro que hace años que no trabajo con xml, pero me extraña que no se pueda cifrar todo o parte de su contenido...
Claro que si puedes... lo que auxiliar dice (o eso creo yo :)) es que pierde la 'gracia' o la filosofía de ser XML.

Saludos.Ferdy
Ferdy escribió:Claro que si puedes... lo que auxiliar dice (o eso creo yo :)) es que pierde la 'gracia' o la filosofía de ser XML.

Ya me parecía...
Que pierde la gracia está claro, aunque al menos podrías editar el formato del documento :P.

Ya en serio, yo me inclino por que esta vez no harán de las suyas. Que vengan a intentar "extender" xml o algo parecido a estas alturas... lo dudo. Aunque no llego a entender bien a qué viene este cambio.

Psché, de todas formas me importaría una mierda, porque desde hace bastantes años tiro de latex XD.
Ferdy escribió:Claro que si puedes... lo que auxiliar dice (o eso creo yo :)) es que pierde la 'gracia' o la filosofía de ser XML.


Pues no, niego taxativamente que sea XML. Eso no es formalmente XML, porque no cumple la especificación. De la especificación de XML 1.0:

1.1 Origin and Goals

[...]
The design goals for XML are:
[...]
6. XML documents should be human-legible and reasonably clear.


Un documento XML, cuyo texto está cifrado, no cumple con el sexto objetivo de diseño: ser legibles por seres humanos. Así que no es XML.

Es más, también dice que deben ser "razonablemente claro". Así que un XML ofuscado, tampoco es XML.

microsoft dice que será XML, así que defiendo que será texto plano y etiquetas y atributos claros. Si no es así, entonces no es que yo esté equivocado, sino que microsoft miente.
Yo no entiendo eso que citas como condición necesaria, la especificación de XML no define qué significan SHOULD, MAY, MUST, ... pero por lo menos en los RFC, un SHOULD es una 'recomendación'.

Saludos.Ferdy
Aunque sea un formato de texto, supongo que MS hará todo lo posible para, al menos, desestandarizar a XML y que todo el mundo acabe usando su MSXML... Y esto es algo que de por sí ya me toca mucho los... las narices!

Se podrá interpretar y tal y cual, pero tampoco veo muy positivo entrar en ese agujero de desestandarización. Algo mejor que lo actual es, claro que sí, pero ya veremos qué sucede con el tiempo.

Un saludo.
Ferdy escribió:Yo no entiendo eso que citas como condición necesaria, la especificación de XML no define qué significan SHOULD, MAY, MUST, ... pero por lo menos en los RFC, un SHOULD es una 'recomendación'.


Sí, tienes razón: suena a recomendación. Dejémoslo entonces en que sería un XML nada recomendable.
Dejémoslo entonces en que sería un XML nada recomendable.


'nada recomendable' suena bastante benévolo :) De todas formas no veo donde estaría la ventaja (para ellos) en cambiar el formato a uno que sea prácticamente ininteligible...

Saludos.Ferdy
Ferdy escribió:'nada recomendable' suena bastante benévolo :) De todas formas no veo donde estaría la ventaja (para ellos) en cambiar el formato a uno que sea prácticamente ininteligible...


Hombre, el formato no sería prácticamente ininteligible: sería clara cuál es su estructura y sólo habría que ver cómo se ha cifra la información. Eso puede ser más o menos difícil (no tengo ni idea de criptología ( o cómo se llame), pero resistiría difícilmente un juicio antimonopolio.

Pero me parece muy improblable que microsoft cifre lo que debería ser texto plano.

Yo, sinceramente, no le veo ventajas a la jugada de microsoft. Ventajas para microsoft, por supuesto. Me parece una muy mala estrategia comercial, a menos que le hayan dado un aviso desde algunos Departamentos de Justicia. Pero este aviso me parece improbable, porque en lo que he seguido los juicios de microsoft (no demasiado) jamás he escuchado que nadie le pidiese que abriese los formatos.
33 respuestas