Limpiar archivo html caracteres latinos y poner codigo html
Mediante un script sh vamos a limpiar un archivo html y cambiar los caracteres á por á
Creamos el archivo
nano limpiahtml.sh
Sustituimos los acentos y las ñ, tanto en mayuscula como en minuscula
echo "limpiamos el fichero $1" sed -i -e 's/á/\á/g' $1 sed -i -e 's/é/\é/g' $1 sed -i -e 's/í/\í/g' $1 sed -i -e 's/ó/\ó/g' $1 sed -i -e 's/ú/\ú/g' $1 sed -i -e 's/Á/\Á/g' $1 sed -i -e 's/É/\É/g' $1 sed -i -e 's/Í/\Í/g' $1 sed -i -e 's/Ó/\Ó/g' $1 sed -i -e 's/Ú/\Ú/g' $1 sed -i -e 's/ñ/\ñ/g' $1 sed -i -e 's/Ñ/\Ñ/g' $1
Ahora damos permiso de ejecución
sudo chmod 777 limpiahtml.sh
Y solo nos queda probarlo
Con un archivo de texto como el siguiente
./limpiahtml.sh fichero.html
Vemos como el archivo ha cambiado todos los acentos y las eñes por sus caracteres codificados en html