Festkommaformat
Ein Rechenwerk mit n-Bitstellen kann unterteilt werden in einen Teil für Vorkommastellen und einen anderen Teil für Nachkommastellen.
Beispiel: 8-Bit Rechenwerk
Vorkommastellen: 3
Nachkommastellen: 4

Vorteil: Jedes Rechenwerk, das mit ganzen Zahlen Rechenoperationen durchführen kann, kann auch für Festkommaoperationen verwendet werden.
Nachteil: Eingeschränkter Wertebereich
→ kleine Zahlen gehen durch Runden verloren.
→ große Zahlen können nicht mehr dargestellt werden.
⇒ Einsatz: Digitale Signalprozessoren.
Äquidistanz
Dies ist der kleinstmögliche Abstand zwischen zwei benachbarten Zahlen. (Bei Festkommazahlen Konstant) signed: unsigned:
Für = 8, signed:
Gleitkommazahlen (Nach IEEE 754)
IEEE 754 legt zwei Formate fest:
→ single precision, 32-Bit (einfache Genauigkeit)
→ double precision, 64-Bit (doppelte Genauigkeit)
in C/Java entspricht dies den Datentypen float und double.

Vorgehen zur Bestimmung des IEEE - Formats (32 Bit)
-
Verschieben des Kommas hinter die werthöchste Stelle 1,111101∗2 ⇒ Exponent E=3
-
Mantisse bilden: Das werthöchste Bit wird “versteckt” d.h. implizit dargestellt und die verbleibende Ziffernfolge mit Nullen aufgefüllt bis 23 Bit (Länge der Mantisse)! 111 1101 ⇒ 111 1010 0000 0000 0000 0000
-
Charakteristik bilden: C=E+V oder Charakteristik = Exponent + Verschiebezahl
V=127 bei 8-Bit Charakteristik
V=1023 bei 11-Bit Charakteristik
C=3+127=130=1000 0010 -
Vorzeichenbit der IEEE Zahl: 0 = + 1 = −
-
Kombinieren zur IEEE Zahl:

Beispiel
