Discussion:
acentos en los XML
unknown
2003-11-02 12:48:16 UTC
Permalink
Hola:

Utilizo python2.3 y libxml2 para procesar ficheros XML y generar páginas HTML.
Tengo un problema con los caracteres acentuados. A pesar de que tanto el XML
original como el XHTML que genero tienen bien el encoding (iso-8859-1), el
programa no lee correctamente esos caracteres y los imprime mal.

Ejemplo:

Un atributo en el XML tal que "acción" lo lee como "acción'

Alguna idea?
unknown
2003-11-03 10:23:03 UTC
Permalink
Post by unknown
Utilizo python2.3 y libxml2 para procesar ficheros XML y generar páginas HTML.
Tengo un problema con los caracteres acentuados. A pesar de que tanto el XML
original como el XHTML que genero tienen bien el encoding (iso-8859-1), el
programa no lee correctamente esos caracteres y los imprime mal.
Un atributo en el XML tal que "acción" lo lee como "acción'
Alguna idea?
Igual lo lee bien, pero al mostrarlo en pantalla lo codificas como UTF8.
¿Cómo has hecho para sacarlo por pantalla?
unknown
2003-11-14 11:07:00 UTC
Permalink
Hola:

No lo escribo por pantalla, eso es lo que imprime en el fichero de salida. Ya
había pensado que podría ser por la codificación interna, pero no.


El Mon, 03 Nov 2003 11:23:03 +0100
Post by unknown
Post by unknown
Utilizo python2.3 y libxml2 para procesar ficheros XML y generar páginas
HTML. Tengo un problema con los caracteres acentuados. A pesar de que tanto
el XML original como el XHTML que genero tienen bien el encoding
(iso-8859-1), el programa no lee correctamente esos caracteres y los imprime
mal.
Un atributo en el XML tal que "acción" lo lee como "acción'
Alguna idea?
Igual lo lee bien, pero al mostrarlo en pantalla lo codificas como UTF8.
¿Cómo has hecho para sacarlo por pantalla?
_______________________________________________
Python-es mailing list
Python-es en aditel.org
http://listas.aditel.org/listinfo/python-es
unknown
2003-11-14 11:28:08 UTC
Permalink
Post by unknown
No lo escribo por pantalla, eso es lo que imprime en el fichero de salida. Ya
había pensado que podría ser por la codificación interna, pero no.
Qué método utilizas para escribir el fichero?
Post by unknown
El Mon, 03 Nov 2003 11:23:03 +0100
Post by unknown
Post by unknown
Utilizo python2.3 y libxml2 para procesar ficheros XML y generar
páginas
Post by unknown
Post by unknown
HTML. Tengo un problema con los caracteres acentuados. A pesar de que
tanto
Post by unknown
Post by unknown
el XML original como el XHTML que genero tienen bien el encoding
(iso-8859-1), el programa no lee correctamente esos caracteres y los
imprime
Post by unknown
Post by unknown
mal.
Un atributo en el XML tal que "acción" lo lee como "acción'
Alguna idea?
Igual lo lee bien, pero al mostrarlo en pantalla lo codificas como UTF8.
¿Cómo has hecho para sacarlo por pantalla?
_______________________________________________
Python-es mailing list
Python-es en aditel.org
http://listas.aditel.org/listinfo/python-es
_______________________________________________
Python-es mailing list
Python-es en aditel.org
http://listas.aditel.org/listinfo/python-es
--
Luis Miguel
unknown
2003-11-18 16:10:39 UTC
Permalink
Hola otra vez:

Os adjunto un ejemplillo mínimo: read_root.py y root.xml

Gracias.




El Fri, 14 Nov 2003 12:28:08 +0100
Post by unknown
Post by unknown
No lo escribo por pantalla, eso es lo que imprime en el fichero de salida. Ya
había pensado que podría ser por la codificación interna, pero no.
Qué método utilizas para escribir el fichero?
Post by unknown
El Mon, 03 Nov 2003 11:23:03 +0100
Post by unknown
Post by unknown
Utilizo python2.3 y libxml2 para procesar ficheros XML y generar
páginas
Post by unknown
Post by unknown
HTML. Tengo un problema con los caracteres acentuados. A pesar de que
tanto
Post by unknown
Post by unknown
el XML original como el XHTML que genero tienen bien el encoding
(iso-8859-1), el programa no lee correctamente esos caracteres y los
imprime
Post by unknown
Post by unknown
mal.
Un atributo en el XML tal que "acción" lo lee como "acción'
Alguna idea?
Igual lo lee bien, pero al mostrarlo en pantalla lo codificas como UTF8.
¿Cómo has hecho para sacarlo por pantalla?
_______________________________________________
Python-es mailing list
Python-es en aditel.org
http://listas.aditel.org/listinfo/python-es
_______________________________________________
Python-es mailing list
Python-es en aditel.org
http://listas.aditel.org/listinfo/python-es
--
Luis Miguel
_______________________________________________
Python-es mailing list
Python-es en aditel.org
http://listas.aditel.org/listinfo/python-es
------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: read_root.py
Type: application/octet-stream
Size: 173 bytes
Desc: no disponible
URL: <http://mail.python.org/pipermail/python-es/attachments/20031118/7c1282b1/attachment.obj>
------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: root.xml
Type: text/xml
Size: 76 bytes
Desc: no disponible
URL: <http://mail.python.org/pipermail/python-es/attachments/20031118/7c1282b1/attachment.xml>
------------ próxima parte ------------
unknown
2003-11-18 19:01:21 UTC
Permalink
Asunto: Re: [Python-es] acentos en los XML
Fecha: mar, nov 18, 2003 at 05:10:39 +0100
Post by unknown
Os adjunto un ejemplillo mínimo: read_root.py y root.xml
Gracias.
Ten en cuenta que los parsers suelen devolver objetos en UTF-8 [1].
No conozco libxml2, pero la mayoría de los parsers tienen un
prettyprint al que puedes darle el *encoding* que a tí te interesa.
Me suena que libxml tenía algo del tipo de encodingAlias?
Mientras tanto te puede funcionar esto:


#!/usr/bin/python
import libxml2

doc = libxml2.parseFile("root.xml")
root = doc.children
print root.prop('prop').decode('UTF-8')
child = root.children
print child.content.decode('UTF-8')
doc.freeDoc()


[1] http://xmlsoft.org/encoding.html
One of the core decision was to force all documents to be converted
to a default internal encoding, and that encoding to be UTF-8

Un saludo.
Post by unknown
El Fri, 14 Nov 2003 12:28:08 +0100
Post by unknown
Post by unknown
No lo escribo por pantalla, eso es lo que imprime en el fichero de salida. Ya
había pensado que podría ser por la codificación interna, pero no.
Qué método utilizas para escribir el fichero?
Post by unknown
El Mon, 03 Nov 2003 11:23:03 +0100
Post by unknown
Post by unknown
Utilizo python2.3 y libxml2 para procesar ficheros XML y generar
páginas
Post by unknown
Post by unknown
HTML. Tengo un problema con los caracteres acentuados. A pesar de que
tanto
Post by unknown
Post by unknown
el XML original como el XHTML que genero tienen bien el encoding
(iso-8859-1), el programa no lee correctamente esos caracteres y los
imprime
Post by unknown
Post by unknown
mal.
Un atributo en el XML tal que "acción" lo lee como "acción'
Alguna idea?
Igual lo lee bien, pero al mostrarlo en pantalla lo codificas como UTF8.
¿Cómo has hecho para sacarlo por pantalla?
_______________________________________________
Python-es mailing list
Python-es en aditel.org
http://listas.aditel.org/listinfo/python-es
_______________________________________________
Python-es mailing list
Python-es en aditel.org
http://listas.aditel.org/listinfo/python-es
--
Luis Miguel
_______________________________________________
Python-es mailing list
Python-es en aditel.org
http://listas.aditel.org/listinfo/python-es
_______________________________________________
Python-es mailing list
Python-es en aditel.org
http://listas.aditel.org/listinfo/python-es
--
Luis Miguel


# Por un mundo con conocimiento libre #
No a las patentes de software

http://www.zaralinux.org - http://www.hispalinux.es
http://www.augustux.org
Continúe leyendo en narkive:
Loading...