Java Einführungs-Seminar
Unicode

Zeichensatz in Java

Die Namen für Klassen und Variable hängen vom verwendeten Zeichensatz ab.

In C oder C++ wurde nur der ASCII Zeichensatz unterstützt und andere Zeichen nur in Kommentaren gedultet. Manche Compiler haben selbst in Kommentaren noch Umlaute bemängelt.

In Java wird der Unicode-Zeichensatz verwendet. Vor der Version 1.1 war es die Unicode Version 1.5, ab 1.1 in der Version 2.0. Daher können in Java-Programmen Variablennamen Umlaute enthalten. Allerdings gilt dies natürlich nur, wenn ein Unicode/Latin-1 kompatibler Editor verwendet wird. Erstellen Sie eine Datei unter DOS, können Sie keine Umlaute verwenden, da der Zeichensatz unter DOS nicht zu Unicode/Latin-1 kompatibel ist.

Der tiefere Grund liegt in der vom Hostsystem angebotenen Konvertierungsprogrammen, die Dateien mit dem lokal benutzten Zeichensatz in Unicode umwandeln. Und der lokale Zeichensatz ist eben nun der Windows-Zeichensatz.

Unter Linux oder Windows können Sie jeden Editor benutzen.

Versuch:
Definieren Sie in einem Java-Programm eine Eigenschaft mit dem Namen "münchen". (z.B. int münchen = 89;) Wird der Quelltext mit einem Linux/Windows Editor erstellt, läßt sich das Programm übersetzen. Editieren Sie das Programm mit "edit" unter DOS, wird eine Fehlermeldung ausgegeben.

Unicode-Zeichen beinhalten den ASCII-Zeichensatz in der amerikanischen Variante, den ISO-8859-1 Zeichensatz (Latin 1) und alle weiteren zeichen der internationalen Alphabete. 

Zeichen, die man von der Tastatur nicht eingeben kann, können durch die Ersatzdarstellung \uxxxx in einen Text eingefügt werden. 

Anbei ist noch eine Übersicht über die Versionen 2.1 und 3.0 des Unicode Standards.
 
 
Category  V 2.1 V 3.0
Alphabetics, Symbols 6511 10236
CJK Ideographs 21204 27786
Hangul Syllables 11172 11172
Total assigned characters 38887 49194
Private Use 6400 6400
Surrogates 2048 2048
Controls 65 65
Not Characters 2 2
Total assigned 16-bit code values 47402 57709
Unassigned 16-bit code values 18134 7827


Das Seminar wurde entwickelt von Walter Herglotz, München. Alle Rechte sind vorbehalten. 
© Copyright "walter digital", Walter Herglotz, 1999-2000.