utf-8 y gnome

hola!
El otro dia al intentar grabar un cd con varios archivos me da siempre el mismo error de utf-8 invalido. Despues de intentar con varios programas supuse q seria un problema de gnome (uso ubuntu) q no reconocia los caracteres. Al final opte por cambiarlos a mano x otros para q no diera problemas. Ahora viene la pregunta (q se hacia de rogar :) ) : Hay alguna manera de q lo haga automaticamente, es decir, q aquellos caracteres q no reconozca los sustituya?
Muchas gracias
Hola. En resumen, lo mejor es utilizar el programa que indica Ferdy. Sin resumen (si digo alguna burrada, corregidme):

El problema viene de que, probablemente, esos archivos que se negaban a grabarse a CD han sido creados en Windows (que, por defecto, creo que usa la codificación ISO-8859-1 o la ISO-8859-15, nu sé) y ubuntu emplea UTF-8 (Unicode).

Una solución drástica, no recomendable y absolutamente despreciable (aunque yo, hasta que me convenza de ello, lo he hecho ^^) es añadir la codificación ISO-8859-1 y luego seleccionarla para que los programas la usen por defecto. El procedimiento en Ubuntu es el siguiente:

* Menú principal / Accesorios / Terminal
* sudo dpkg-reconfigure locales
* Introducir password
* Buscar el juego de caracteres "es_ES ISO-8859-1" y seleccionarlo con la tecla espacio
* Pulsar la tecla tabulador para seleccionar Aceptar y pulsar Enter
* Elegir como 'locale' predeterminado del sistema: "es_ES"
(No el "es_ES.UTF-8", que es el que se configura al instalarse Ubuntu, creo).

Quien dice "es_ES" dice "es_AR", "es_BO", "es_MX"...


Con esto desaparece el aviso de "Invalid encoding" que muestra Nautilus en el nombre de los ficheros y que probablemente esté relacionado con lo que te ha pasado al grabar. Pero al compartir con más gente que utilice Ubuntu les trasladaremos el mismo problema. Y la tendencia parece ser utilizar UTF-8 (la mayoría de las webs utilizan UTF-8 -por ejemplo, WIkipedia- y las distribuciones Debian también). Así que no me parece muy buena idea, pero para salir del paso...
No te molestes, pero creo que es una horrenda idea... Como dices, no sólo lo haces mal tú, sino que encima pasas el problema a los demás.

La evolución y lo lógico es utilizar UTF-8; si tienes algún problema con él, revisarlo y corregirlo es mejor que cualquier otra chapucilla temporal que acabas adoptando casi por definitiva...
Y si no recuerdo mal WinXP utiliza UTF-8.

¡Un saludo!
Cobo escribió:No te molestes, pero creo que es una horrenda idea...


Estoy de acuerdo. :)

Solucionar, soluciona el problema, pero reconozco que no es ni de lejos la mejor opción. Intentaré acostumbrarme al convmv ese.

Pero para mí el problema no sólo está en el nombre de los archivos. Es que cuando escribo un fichero de texto en Ubuntu (que suelo hacerlo bastante para pequeñas anotaciones) y luego lo abro en el Notepad de Windows ME, el texto aparece sin aplicar los saltos de línea, ni acentos ni ná de ná. Y por eso me había parecido una solución lo de ponerlo en ISO-8859-1. (Y sí, ya sé que el Windows ME es la peste :P, pero para lo que necesitaba me ha estado dando servicio perfectamente).

Me lo repensaré antes de que se me olvide que no lo tengo en UTF-8.
Ehm.... lo de los saltos de línea no es por la codificación
Cuando escribo algún fichero de texto en mi linux y se lo mando a algún amigo para que lo lea en su windows, le digo que lo abra con firefox :P
En vim:
:set ff=dos


Agur

P.D.:Wordpad los abre bien
Hola!
Muchas gracias por el por el programa. Funciona muy bien, sin embargo sigo sin poder grabarlos. Me sigue devolviendo el mismo error, creo q es por los de los archivos de musica ( esa info sobre el titulo, el año, etc) siguen siendo incompatibles.
Seguire investigando a ver...
Bueno, gracias de nuevo
sucius escribió:Me sigue devolviendo el mismo error, creo q es por los de los archivos de musica ( esa info sobre el titulo, el año, etc) siguen siendo incompatibles.

Si acaso intenta convertir los mp3 (o lo que sea) a algún otro formato. Igual el programa que haga la conversión maneja bien los ficheros y luego los deja grabar bien.

No se me ocurre otra cosa... Sigo con mi película:

amuchamu escribió:Cuando escribo algún fichero de texto en mi linux y se lo mando a algún amigo para que lo lea en su windows, le digo que lo abra con firefox

Zamorate escribió:P.D.:Wordpad los abre bien


Pues también es verdad. Ahora mismo vuelvo al UTF-8. Y utilizaré el 'convmv' en adelante. Seré bueno.

Ferdy escribió:Ehm.... lo de los saltos de línea no es por la codificación


Con esa contestación tan lacónica me has 'obligao' a buscarme la vida para entender tal mística frase. Que no todo el mundo es informático, leñe :P. Por si alguien más tiene curiosidad, trato de explicarlo (menos mal que existe la [url=http://es.wikipedia.org/wiki/Salto_de_línea]wikipedia[/url]):

Salto de línea - Wikipedia, la enciclopedia libre escribió:En ASCII y Unicode, el salto de línea se representa mediante el código decimal 10 (en hexadecimal 0A).


Vamos, que no había dicho ninguna burrada. Codificar, se codifica en hexadecimal como 0A. Pero sí, no es por eso lo de los saltos de línea. El caso es que leyendo el artículo ese, creo que ya sé por qué aparecían cuadraditos negros (o algo así) en el Notepad de Windows ME en lugar de los saltos de línea:

Y era por eso que comenta que en Windows se utiliza CRLF (retorno de carro y fin de línea) para realizar los saltos de línea y en Unix tan sólo LF (fin de línea). Y en el Mousepad (el programilla que utilizo en Ubuntu) por defecto guarda en la forma LF. Pero ya me he fijado que también admite guardar en CRLF.
Que yo sepa no tiene mucho que ver con la codificación. He creado 4 ficheros con el mismo contenido, pero codificados de distinta forma y con saltos de linea diferentes, estos son los resultados:
josu@arcueid ~/saltolinea $ file *
crlf.iso:  ISO-8859 text, with CRLF line terminators
crlf.utf8: UTF-8 Unicode text, with CRLF line terminators
lf.iso:    ISO-8859 text
lf.utf8:   UTF-8 Unicode text
Como se puede ver, se puede poner utf y crlf, e iso y lf. Estos son los comandos que he usado desde ${EDITOR}:
:set ff=dos   #para CRLF
:set ff=unix   #para LF
:set fileencoding=iso8859-15   #para ISO8859-15
:set fileencoding=utf8   #para UTF-8

Agur!

P.D. ${EDITOR} lógicamente es vim, ¿acaso existe otra cosa?
P.D.2 Tengo ganas de flame xD
Creo que puede venir al pelo, perdón, al hilo.

Tengo Debian muuuuy stable, y en la última actualización me han cambiado el "locale".

Me he dado cuento (con locale -a) que tengo esto:

C
es_ES@euro
es_ES.iso885915@euro
POSIX

Pensé que tenía UTF-8, pero ya no lo tengo tan claro, ni mucho menos. De hecho me surgió la duda porque al "reconfigurar" el locale me pidió qué codificación quería. Estuve buscando y ví que había una opción algo así como es_ES_utf-8.

¿Puedo añadirla o debo machacar las que tengo? ¿Cómo lo hago? Creo haber leido algo de dpkg -reconfigure ¿no? . En caso de añadirlo: ¿se hará la picha un lío mi PC con tantas codificaciones? y por último, pero no por ello más peregrino, ¿es por no tener el UTF-8 por lo que no veo los supuestos caracteres japoneses que me deberían salir con "kiten"?. Eso del kiten es un programita que viene con el KDE como "Herramienta de referencia/estudio del japonés". Francamente, el japonés me la trae al pairo (ya tengo bastante intentando hablar y escribir correctamente el castellano), pero es por simple curiosidad :-P .

Saludos. [bye]
11 respuestas