|
Esta sección es un esbozo en construcción. Se aprecian tus aportes y paciencia |
Procesamiento de texto
Contents
Los sistemas operativos tipo Unix siempre se han caracterizado por las potentes herramientas para procesamiento de texto. Tanto que es uno de sus pilares. En esta página pretendemos citar dichas herramientas.
Herramientas estandar de unix
Sed
Sed es un editor de flujos (stream editor ó simple ed en Inglés), es una herramienta de procesamiento de texto para el sistema operativo Unix que acepta como entrada un archivo o stdin (la entrada estándar, usando una tubería), lee y modifica línea a línea mostrando el resultado en pantalla.
Tareas comunes con Sed
- Reemplazar una cadena por otra
$ echo cadena | sed 's/cadena/reemplazo/g'
- Reemplazar una cadena por otra en un archivo
$ sed 's/cadena/reemplazo/g' -i archivo
- Reemplazar una cadena por reemplazo usando variables
$ CADENA=cadena $ REEMPLAZO=reemplazo $ echo $CADENA | sed "s/$cadena/$REEMPLAZO/g"
Awk
Imprime la primera palabra de la linea
echo hola mundo | awk '{print $1}'
Cat
Imprime en pantalla el contenido de un archivo
cat archivo
Diff
Muestra las diferencias entre el archivo 1 y el archivo 2
diff archivo1 archivo2
Ed
Tr
cut
Otras herramientas
Fold
Indent
Herramientas no estandar de unix
Glark
Un remplazo para (o un suplemento a) la familia grep, glark ofrece: expresiones regulares compatibles con perl, resaltado de las coincidencias, contexto al rededor de las coincidencias, expresiones complejas (and y or) y exclusion automatica de archivos que no son de texto
Tareas comunes con Glark
Extraer el texto que coincide con una expresión regular
#también se puede hacer con sed pero es mas complejo $ glark -gy 'expresion_regular' archivo > resultados
La opción -g hace que Glark imprima los resultados sin adornos.
