TetaTricks/chap/image.tex

401 lines
13 KiB
TeX
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

\chapter{Image}
\label{chap:image}
Le traitement des images est un art à part entière. Nous allons
voir quelques grands classiques de la catégorie pas du tout
interactif. Le genre de machin que l'on peut ranger au fond
d'un script shell pour le réutiliser la semaine prochaine.
\begin{itemize}
\item{ImageMagick}
\item{Gmic}
\item{NetPBM}
\item{Portable Network Graphic}
\item{TIFF}
\end{itemize}
% -------------------------------------------------------------------
\section{ImageMagick}\index{ImageMagick}
Attention, ça va devenir \textsl{hardu}%
\footnote{Nous attendons tous avec impatience l'ouvrage magistral
de maitre Brunus},
l'abondance d'options des outils ImageMagick est vraiment énorme,
et leurs interactions parfois troublantes\dots
Il y a plusieurs binaires dans le paquet : \texttt{convert} pour
la plupart des traitements,
\texttt{display} et \texttt{animate} pour visualiser des images,
\texttt{identify} pour en lire les méta-données.
Ils partagent un certain nombre d'options communes.
Certains d'entre eux peuvent avoir un effet destructif%
\footnote{En plus d'avoir un nom de série $Z$.},
vous êtes prévenus.
\subsection{L'option \texttt{-geometry}}
C'est une notion importante, car elle est utilisée comme paramètre
par beaucoup d'options. C'est avec ça que l'on peut définir des
choses comme la taille (largeur et hauteur) d'une image, ou
la position d'un texte dans l'image, ou une zone sur laquelle
on va travailler.
Et c'est assez compliqué, mais pas que.
\begin{tabular}{|l|p{7cm}|}
\hline
Code & Signification \\
\hline
scale\% & Height and width both scaled by specified percentage. \\
scale-x\%xscale-y\% & Height and width individually scaled by specified percentages. (Only one \% symbol needed.) \\
width & Width given, height automagically selected to preserve aspect ratio. \\
xheight & Height given, width automagically selected to preserve aspect ratio. \\
widthxheight & Maximum values of height and width given, aspect ratio preserved. \\
widthxheight\^ & Minimum values of width and height given, aspect ratio preserved. \\
widthxheight! & Width and height emphatically given, original aspect ratio ignored. \\
widthxheight> & Shrinks an image with dimension(s) larger than the corresponding width and/or height argument(s). \\
widthxheight< & Enlarges an image with dimension(s) smaller than the corresponding width and/or height argument(s). \\
area@ & Resize image to have specified area in pixels. Aspect ratio is preserved. \\
x:y & Here x and y denotes an aspect ratio (e.g. 3:2 = 1.5). \\
\hline
\end{tabular}
% !!!
% est-il nécessaire de traduire ce tableau ?
\subsection{Écrire du texte}
Voici un exemple concret
(tiré du script d'encodage du \textsc{cloître}\index{cloître})
qui montre l'essentiel pour bien débuter. C'est une fonction
écrite en bash\index{bash} qui rajoute un texte sur une image~:
\lstinputlisting[language=sh]{code/tagpic.sh}
Une petite commande toute bête pour rajouter la date facilement à une photo
daprès les données EXIF\index{EXIF}~:
\begin{lstlisting}
convert nom_du_fichier_source.jpg -gravity SouthEast \
-font Fudd-Regular -pointsize 40 -fill white \
-annotate +20+20 "%[exif:DateTimeOriginal]" \
-quality 100 nom_du_fichier_destination.jpg
\end{lstlisting}
Quelques explications semblent nécessaires, parce que certaines
options sont un peu ésotériques et parfois inter-dépendantes\dots
\begin{tabular}{|l|p{7cm}|}
\hline
Code & Signification \\
\hline
-txtfont & \\
-fontsize & taille des caractères \\
-kerning & espacement entre les caractères \\
-color & couleur de l'encre \\
-stroke & couleur 'bord' de caractère \\
-strokewidth & largeur de la bordure \\
-txtopts & \textsl{Gni?} \\
-gravity & vers quel point cardinal le texte va-t-il être \textsl{tiré} ? \\
-annotate & \texttt{+30+30 "texte à écrire"} \\
\hline
\end{tabular}
Pour avoir la liste des couleurs disponibles : \texttt{convert -list color}
et celles des fontes : \texttt{convert -list font}.
\subsubsection{Questions...}
\begin{itemize}
\item{Comment mettre une couleur de fond à ce texte ?}
\item{Et un texte semi-transparent ?}
\end{itemize}
% ------------------------------------------
% faire des affiches
\subsection{montage}\index{montage}
\begin{quote}
create a composite image by combining several separate images. The images are
tiled on the composite image optionally adorned with a border, frame,
image name, and more.
\end{quote}
Krkrkr\dots
% ------------------------------------------
\subsection{Faire des GIFs animées}\index{gif89a}
Ces petites images clignotantes sont l'essence même du
Web\index{web} moderne depuis 1992 malgré leurs limitations,
et \texttt{convert} sait très bien\footnote{modulo un taux de
compression pas génial.} les générer.
Encore un grand merci à Compuserve\index{Compuserve} pour cette
création essentielle à l'art graphique moderne.
\begin{verbatim}
convert -delay 20 -loop 0 a.png b.png c.png foo.gif
\end{verbatim}
Ce sujet pertinent est abordé plus en détails en
page \pageref{chap:gif89a} avec, nous l'espérons, un exemple
de dithering avec la palette de couleur \texttt{EGA}\index{EGA}.
% ------------------------------------------
\subsection{Extraire une partie de l'image}
Dans cette fonctionnalité aussi, il semble y avoir quelques
subtilités.
\begin{verbatim}
DIMENSION="1024x768"
POSITION="+R12+0"
convert -crop ${DIMENSION}${POSITION} +repage $img $dst
\end{verbatim}
\textsl{Use +repage to completely remove/reset the virtual canvas
meta-data from the images.}
En gros, on en a besoin quand une opération va
changer la dimension de l'image. En détail, j'ai pas tout compris.
% ------------------------------------------
\subsection{conversion vers TGA} \index{TGA}
On trouve encore en circulation de très vieux logiciels qui ne savent lire
qu'un encore plus ancien format : \textsl{Targa file format}.
Et dans une variante bien précise : mode \textsc{rgb} et non compressé%
\footnote{Un jour, peut-être, ça va changer\dots}.
Il nous faut donc une incantation bien précise avec, heureusement, des
arguments aux noms évocateurs :
\begin{lstlisting}
GOTO_TGA ()
{
convert $1 \
-compress none \
-alpha off \
-colorspace RGB \
-type truecolor \
$2
}
\end{lstlisting}
On peut aussi procéder autrement, avec les outils PNM\index{PNM} :
\begin{verbatim}
pngtopnm \$negatif | ppmtotga -rgb -norle > \$picz
\end{verbatim}
% ------------------------------------------
\subsection{identify}\index{identify}
Cette commande nous fournit un ensemble d'informations\footnote{aka metadata}
pertinentes sur un fichier image~: format, résolution, couleur ou n/b,
nombre de bits par pixel\dots
\begin{verbatim}
tth@konrad:~/GravityField $ identify WS/nanim//00000.pgm graph.png
WS/nanim//00000.pgm PGM 2048x2048 2048x2048+0+0 16-bit Grayscale
Gray 20.5765MiB 0.690u 0:00.690
graph.png PNG 640x640 640x640+0+0 8-bit sRGB 102c 18165B 0.000u 0:00.000
\end{verbatim}
https://imagemagick.org/script/escape.php
Et ces données peuvent être utilisé pour rajouter une simili
\textsc{IA}\footnote{Sorry, private joke inside\dots}
% ------------------------------------------
\subsection{Configuration}
La configuration est dans le répertoire \texttt{/etc/ImageMagick-6/}, et
on y trouve en particulier le fichier
\texttt{policy.xml}\footnote{Le XML, c'est comme la violence...}
certaines ressources, comme la mémoire utilisable, peuvent être réglées.
\begin{verbatim}
$ identify -list resource
Resource limits:
Width: 16KP
Height: 16KP
List length: 18.446744EP
Area: 128MP
Memory: 256MiB
Map: 512MiB
Disk: 1GiB
File: 768
Thread: 4
Throttle: 0
Time: unlimited
\end{verbatim}
Vous pouvez aussi essayer de comprendre le contenu du fichier
\texttt{thresholds.xml} et venir me l'expliquer juste après
ma sieste, je pense que ça permet de jouer sur différentes méthodes
de \textsl{dithering}, par exemple pour faire du Bayer.
% ------------------------------------------
\subsection{Trucs}
\begin{itemize}
\item{convert -average frame*.png output.png}
\end{itemize}
Il y en plein d'autres, des tricks \textsl{àlc} à découvrir.
Ce sera, pour vous amis lecteurs, une dure mission à assumer.
% ------------------------------------------
\subsection{Ressources}
Le futur livre de Brunus.
Réclamez les prmiers drafts dans
l'IRC\index{IRC} \texttt{libera.chat\#paulla} \textit{:)}
\texttt{http://www.fmwconcepts.com/imagemagick/index.php}
% https://legacy.imagemagick.org/Usage/resize/
% -------------------------------------------------------------------
\section{Gmic}\index{Gmic}
\textsl{Perform generic image processing operations, through the G'MIC
language interpreter. gmic: GREYC's Magic for Image Computing.}
Gmic se base sur une grosse\footnote{énorme, même. dans les deux sens\dots}
bibliothèque de fonctions écrite
en \texttt{C++}\index{C++} dont l'utilisation est bien
documentée dans le livre ???\index{XXX} mais nécessite quand même
de solides bases dans les subtilitées fourbes du \texttt{C++}.
Gmic existe aussi en plugin pour Gimp\index{Gimp} avec une interface
pleine de curseurs et de boutons, qui facilite (ou pas) l'exploration
des possibles.
% -------------------------------------------------------------------
\section{NetPBM}\index{netpbm}\label{netpbm}
With the Netpbm file formats, its trivial to output pixels using
nothing but text based IO%
\footnote{https://www.vidarholen.net/contents/blog/?p=904}.
\begin{verbatim}
#!/bin/bash
exec > my_image.ppm # All echo statements will write here
echo "P3 250 250 255" # magic, width, height, max component value
for ((y=0; y<250; y++)) {
for ((x=0; x<250; x++)) {
echo "$((x^y)) $((x^y)) $((x|y))" # r, g, b
}
}
\end{verbatim}
\subsection{Questions}
Comment faire un \textsl{resize} avec NetPBM ?
Est-il nécessaire d'apprendre la bibliothèque de fonctions
\texttt{libnetpbm}\footnote{Réponse: oui.} ?
% -------------------------------------------------------------------
\section{Portable Network Graphic}\index{PNG}
Voici le problème du soir%
\footnote{\textsl{trollday} Fri Nov 13 00:07:19 CET 2020} :
j'utilise pour lire ce format de fichier la bibliothèque
\texttt{pnglite} qui a de gros soucis avec beaucoup de
ceux-ci, par exemple ceux qui sont en \texttt{sRGB} crées
par des outils essentiels comme POVray\index{Povray}.
Il serait bon de voir la \texttt{libpng} officielle.
pngcrush ? optipng ?
\texttt{pngtopnm \$png | pnmtopng > \$goodpng}
% -------------------------------------------------------------------
\section{Tag Image File Format} \index{TIFF} \label{TIFF}
\begin{quote}
Yes, but tiffcp is by far the most significant case. And perhaps one of the
most used of the tools. I may not be impartial on this, though :-) because I
use it heavily.
\end{quote}
\begin{verbatim}
tiffcp combines one or more files created according to the Tag Image
File Format, Revision 6.0 into a single TIFF file. Because the output
file may be compressed using a different algorithm than the input
files, tiffcp is most often used to convert between different compres
sion schemes.
\end{verbatim}
% -------------------------------------------------------------------
\section {EXIF} \index{EXIF}
Un \textit{tag} EXIF est un petit morceau d'information nommée inclus
dans un fichier image. Il peut contenir des données comme la sensibilité
ISO\index{ISO} du capteur, ou le modèle d'objectif utilisé.
D'autres informations en page \pageref{whatisExdif}
% -------------------------------------------------------------------
\section{Cimg} \index{Cimg}
\texttt{Cimg} est l'énorme bibliothèque de fonctions
(écrites en \texttt{C++}\footnote{\textsc{wtf?}}) sur lesquelles
est basé Gmic. C'est long à compiler, ça produit des binaires
énormes, mais il semble bien que ça puisse faire des trucs géniaux.
Peut-être\footnote{Les rêves ne sont pas interdits.}, existe-il une
interface pour le Fortran moderne ?
\subsection{\textsc{hello world}}
\begin{lstlisting}
#define cimg_use_png
#include "CImg.h"
using namespace cimg_library;
#define BLUR 0.35
int main(int argc,char **argv)
{
if (3 != argc) {
fprintf(stderr, \
"Usage: %s infile.png outfile.png\n", argv[0]);
exit(1);
}
CImg<unsigned char> imgIn (argv[1]);
CImg<unsigned char> imgOut = \
imgIn.get_norm().blur(BLUR).normalize(0, 255);
imgOut.save(argv[2]);
return 0;
}
\end{lstlisting}
Un concept interessant, mais pas évident au premier abord. Un peu comme
les branchements dans Chuck\index{Chuck} ou les pipes du shell\dots
\subsection{Questions...}
\begin{itemize}
\item{Comment virer le canal alpha à l'enregistrement d'une image en PNG ?}
\end{itemize}
% -------------------------------------------------------------------