November 2006 \end{center} \vspace*{0.6em} \newcommand{\za}[1]{} %(Z.~#1)} \newcommand{\zb}[1]{} %(Z'.~#1)} \newcommand{\zc}[1]{} %(Z{}'{}'{}.~#1)} \setlength{\columnseprule}{1pt} \setlength{\columnsep}{30pt} \newenvironment{zitemize}{\begin{list}{--}{\addtolength{\leftmargin}{-1.5em}}}{\end{list}} \begin{multicols}{2} {\large \textbf{Definition}} \begin{zitemize} \item[--] Informationsgehalt eines Zeichens: \\ $I(x) := -\log_2 P(x); \qquad \left[1 \,\mathrm{bit}\right]$ \item[--] Entropie als Erwartungswert des Informationsgehalts: \\ $E(I) = \sum\limits_{x \in \Sigma} P(x) \cdot I(x);$ \end{zitemize} wobei \begin{tabbing} asdfff \= \kill $x$: \> ein bestimmtes Zeichen \\ $\Sigma$: \> Menge aller vorkommenden \\ \> Zeichen \\ $P(x)$: \> Wahrscheinlichkeit \\ \> des Auftretens von $x$ \\ \end{tabbing} {\large \textbf{Eigenschaften}} \begin{zitemize} \item[--] Maximale Entropie bei $\left|\Sigma\right| = 2^n$, $n \in \mathds{N}$: \\ $E(I) = -\log_2 \frac{1}{2^n} = n \,\mathrm{bit};$ \item[--] Maß für Überraschung; je seltener ein Zeichen, desto höher der Informationsgehalt \item[--] Maß für die untere Schranke verlustfreier Kompression \item[--] Maß für die Zufälligkeit von Information \item[--] Maß für "`Chaos"' \item[--] Charakteristika von Autoren und Komponisten \end{zitemize} {\large \textbf{Gezinkter Münzwurf}} \\ $\Sigma = \left\{ \text{Kopf}, \text{Zahl} \right\}\!;$ \medskip $P(\text{Kopf}) = p = 1 - P(\text{Zahl});$ \medskip $ \begin{array}{@{}rcl} I(\text{Kopf}) &=& -\log_2 p; \\ I(\text{Zahl}) &=& -\log_2 \left(1 - p\right); \end{array} $ \medskip $ \renewcommand{\arraystretch}{1.3} \begin{array}{@{}rclcl} E(I) &=& p \, I(\text{Kopf}) &+& \left(1 - p\right) I(\text{Zahl}) = \\ &=& p \cdot \left[-\log_2 p\right] &+& \left(1 - p\right) \cdot \left[-\log_2 \left(1 - p\right)\right]; \end{array} $ \columnbreak {\centering\scalebox{0.35}{\includegraphics{images/entropie-muenzwurf.png}}\par} \vspace*{1em} {\large \textbf{Shannon--Fano-Kodierung}} \\ \vspace*{-1em} \begin{zitemize} \item[--] Entropiekodierung ("`Kompressionsverfahren"') \item[--] Darstellung \textsl{häufiger} Zeichen durch \textsl{kurze} Bitfolgen, \textsl{seltener} Zeichen durch \textsl{lange} Bitfolgen \item[--] Eindeutigkeit der Bitfolgen ("`Präfixfreiheit"') notwendig \bigskip \item[1.] Sortierung der Zeichen nach rel. Häu\-fig\-keit \item[2.] Einteilung der Zeichen in zwei Gruppen, sodass Summen der Häufigkeiten etwa gleich \item[3.] So lange fortfahren, bis Entsprechung jedes Zeichens durch einen Pfad im Baum \end{zitemize} \scalebox{0.3}{\includegraphics{images/baum.png}} {\large \textbf{Probleme}} \vspace*{-1em} \begin{zitemize} \item[--] Keine Beachtung der Reihenfolge \item[--] Analyse nur auf syntaktischer Ebene \end{zitemize} \end{multicols} \end{document}