Byte
>721428 Erklärung von „Bit“
>721717 Erklärung von „KByte“, „MByte“, „Gbyte“, „TByte“, „PByte“, „EByte“
Byte
Die US-englische Aussprache ist [bɑɪt]. Die deutsche Aussprache ist gleich.
Das Wort ist ein Nomen, sein Genus ist das Neutrum.
Der Nominativ ist „das Byte“, der Genitiv ist „des Byte(s)“, der Plural ist „die Byte(s)“.
Gelegentlich wird die Abkürzung „b“ oder „B“ für das Byte verwendet, wobei manchmal vorgeschlagen wird das kleine „b“ für das Bit und ein großes „B“ für ein Byte zu verwenden. Solche Abkürzungen sollten nur verwendet werden, wenn die Möglichkeit von Verwechselungen, etwa mit „Bit“ oder „barn“ ausgeschlossen werden kann; besser ist es, auf sie zu verzichten.
Herkunft
Nach verschiedenen Quellen [1][5] wurde der Begriff 1956 von Dr. Werner Buchholz (IBM ) im Rahmen der Beschreibung des Systems Stretch (IBM 7030 ) geprägt. Nach einer anderen Quelle [2] sei der Begriff im selben Jahr im Rahmen des Projekts SAGE entstanden. Da IBM auch an SAGE beteiligt war und das Jahr der beiden Projekte gleich ist, bestanden aber vielleicht Beziehungen zwischen diesen beiden Projekten.
Dr. Werner Buchholz wurde am 1922-10-24 in Detmold (Deutschland ) geboren [7] und erhielt 1990 den IEEE Computer Society Pioneer Award.
Das Wort wurde zunächst nach “bite ” (Biß) gebildet. Die Schreibweise mit „y“ wurde gewählt, da die Schreibweise “bite ” leichter mit “bit ” verwechselt werden kann.
Die Erklärungen des Wortes als Akronym aus “bit asynchronous transmission entity ” [4] oder “binary yoked transfer element ” [4] oder als Abkürzung für “binary term ” sind erst im nachhinein erfunden worden.
Das Wort „Byte“ ist also kein Akronym, und deswegen ist die Schreibweise „BYTE“ falsch.
Bedeutung
Die relevante internationale Norm ISO/IEC 2382-1 [3] definiert den Begriff folgendermaßen:
byte
A string that consists of a number of bits, treated as a unit, and usually representing a character or a part of a character.
NOTES
1 The number of bits in a byte is fixed for a given data processing system.
2 The number of bits in a byte is usually 8.
Eine deutsche Übersetzung lautet in etwa folgendermaßen:
Byte
Eine Sequenz, die aus einer bestimmten Zahl von Bits besteht und die als eine Einheit behandelt wird. Sie stellt normalerweise ein Zeichen oder einen Teil eines Zeichens dar.
Anmerkungen
1.) Die Zahl der Bits in einem Byte ist für ein bestimmtes Datenverarbeitungssystem eine Konstante.
2.) Die Zahl der Bits in einem Byte ist normalerweise acht.
(Ein n -Tupel ist, vereinfacht gesagt, eine lineare Anordnung von n verschiedenen Dingen, so ist ein 6-Tupel von Bits beispielsweise eine lineare Anordnung von 6 Bits.)
Ein Byte ist nach der ISO -Definition ein n -Tupel von Bits. Die Zahl der Bits ist durch den Zusammenhang bestimmt. Sie ist oft gleich acht, aber dies muß nicht immer so sein. Die Zahl der Bits hängt von dem System ab, über das gesprochen wird.
Ein Byte mit sechs Bit
.-----------------------------------------.
| Bit5 | Bit4 | Bit3 | Bit2 | Bit1 | Bit0 |
'-----------------------------------------'
Ursprünglich bezeichnete der Begriff “byte ” wohl ein (!) bis sechs Bit und erst später auch acht Bit. Damals verwendeten viele Ein-/Ausgabegeräte 6-Bit-Bytes. Auf dem Stretch -System hatte ein Zeichen zunächst sechs Bit, doch später (Ende 1956) acht Bit, wie dann auch beim System/360 und vielen späteren Systemen üblich.
Ein Byte ist ein n -Tupel von Bits. n hängt vom verwendeten Computersystem ab. n ist oft acht. Wenn ein 8-Tupel von Bits gemeint ist, dann sollte aber besser die Bezeichnung „Oktett“ (engl. “octet ”) verwendet werden.
Zeichen
Eine frühe (1962) Erklärung des Begriffs von Dr. Werner Buchholz deutet an, daß dieser ursprünglich eine Bit-Sequenz beschreibt, die meistens ein Zeichen darstellt, aber ein anderer Begriff als „Zeichen“ gesucht wurde, da diese Bit-Sequenz nicht immer ein Zeichen darstellt.
„BYTE denotes a group of bits used to encode a character, or the number of bits transmitted in parallel to and from input-output units. A term other than "character" is used here because a given character may be represented in different applications by more than one code, and different codes may use different number of bits (i.e., different ‘byte’ sizes). In input-output transmission, the grouping of bits may be completely arbitrary and have no relation to actual characters. (The term is coined from ‘bite’, but respelled to avoid accidental mutation to ‘bit’.) “ [6]
Ein Zeichen wird mit den im Jahr 2003 gebräuchlichen Codes meistens durch ein Oktett oder durch ein Oktett-Tupel codiert. Dementsprechend spricht man von Einoktettzeichen, Zweioktettzeichen oder Mehroktettzeichen.
Zum Transport oder zur Archivierung werden auch Codierungen eingesetzt, in denen die Zahl der Bit pro Zeichen durch an den Inhalt angepaßte Codierung verringert wird, dann kann nicht mehr eine bestimmte ganze Zahl von Bit angegeben werden, die für die Darstellung eines Zeichens benötigt wird, sondern nur noch ein Mittelwert, wie beispielsweise 4,3 bit pro Zeichen.
Werte, Speicher und Maßeinheit
Entsprechend der unterschiedlichen möglichen Bedeutungen des Wortes „Bit“ unterscheidet sich auch die Bedeutung des Wortes „Byte“:
- Mit „Byte“ kann ein bestimmter Bytewert gemeint sein, also ein Tupel von Bitwerten, wie beispielsweise das Tupel "010110".
- Mit „Byte“ kann ein bestimmter Bytespeicher gemeint sein, also ein Tupel von Bitspeichern, wie beispielsweise ein 6-Tupel von Bitspeichern 〈BS5 〉 〈BS4 〉 〈BS3 〉 〈BS2 〉 〈BS1 〉 〈BS0 〉. Im Unterschied zu einem bestimmten Bytewert ist ein Bytespeicher ein System, das einen Bytewert speichern kann. Zu unterschiedlichen Zeiten kann ein Bytespeicher unterschiedliche Bytewerte enthalten.
- Mit „Byte“ kann das Informationsmaß gemeint sein, welches die Menge an Information bezeichnet, die ein Bytespeicher enthält. Es handelt sich hierbei um diejenige Informationsmenge, die man erhält, wenn man erfährt, welcher Bytewert in einem Bytespeicher enthalten ist. Die Informationsmenge eines Bytes mit 6 Bit ist 6 bit, also ungefähr gleich 5,74 · 10^(−23) J/K.
Computerspeicher ist in Bytes organisiert ist, so können beispielsweise oft einzelne Byte adressiert werden, nicht aber einzelne Bits. Deswegen wird die Größe von Computerspeicher meistens in Bytes (oder Vielfachen eines Bytes) angegeben, in der Elektronik wird Speicher aber auch in Bits gemessen.
Hat ein Byte nicht doch genau 8 Bit?
Vor 1970 war die Zahl der Bits in einem Byte nicht allgemein festgelegt. In dem heutigen Sprachgebrauch wird Byte tatsächlich oft verwendet, um ein Oktett zu bezeichnen. Selbst in einer allgemeinen ISO -Norm findet sich diese Definition inzwischen wieder. In ISO 2382-4, Second edition, Organization of data wird in Abschnitt 5 ein Byte mit einem Oktett gleichgesetzt. (04.05.07: byte, octet, 8-bit byte: A string that consists of eight bits.)
Man muß also sagen, daß sich heute Argumente für oder gegen die Ansicht finden lassen, daß ein Byte genau 8 Bit hat.
Das Byte als adressierbare Einheit
Im Bereich der Mikrocomputertechnik gibt es heute auch den Sprachgebrauch, daß ein Byte die kleinste adressierbare Einheit bezeichnet. Dies sind wiederum derzeit fast immer 8 Bit.
Quellen
[1] Jules Schwartz (Erfinder von JOVIAL ) und Fred Brooks (Autor von The Mythical Man-Month ), nach http://www.xent.com/FoRK-archive/july99/0646.html, http://members.aol.com/jeff570/b.html
[2] Louis G. Dooley in einem Leserbrief an das Magazin Byte, veröffentlicht im 1995-02, nach http://www.byte.com/art/9502/sec2/art12.htm
[3] ISO/IEC 2382-1: 1993, Information technology – Vocabulary – Part 1: Fundamental terms
[4] http://wombat.doc.ic.ac.uk/foldoc/foldoc.cgi?byte
[5] Usenet-Posting <99fcmv$mvm$1@wanadoo.fr>
[6] Planning a Computer System (Project Stretch), W. Buchholz [Hrsg.], McGraw-Hill Book Company (1962).