miércoles, 4 de agosto de 2004

Parsear la web para cambiar codigos ASCII a HTML

Como soy un paquete, y no me se los codigos html necesarios
para los posts, y los posts son archivos ascii (txt),
me he currado un mini script para parsearlos y que la web
siga pasando el validator de w3c:

# shell script para hacerlo en todo mi directorio /wiki:
for i in `find . -iname "*.txt"`; do
dat=`ls -l --time-style=+%Y%m%d%H%M $i | awk '{ print $6 }'`
cat $i | wraphtml.pl > $i.new.txt
touch -t $dat $i.new.txt; mv $i $i.orig
done

# perl que realmente parsea:
wraphtml.pl