![]() ![]() ![]() |
![]() |
Java Einführungs-Seminar | ||||||||||||||||||||||||||||||||||||
Unicode |
Zeichensatz in JavaIn C oder C++ wurde nur der ASCII Zeichensatz unterstützt und andere Zeichen nur in Kommentaren gedultet. Manche Compiler haben selbst in Kommentaren noch Umlaute bemängelt. In Java wird der Unicode-Zeichensatz verwendet. Vor der Version 1.1 war es die Unicode Version 1.5, ab 1.1 in der Version 2.0. Daher können in Java-Programmen Variablennamen Umlaute enthalten. Allerdings gilt dies natürlich nur, wenn ein Unicode/Latin-1 kompatibler Editor verwendet wird. Erstellen Sie eine Datei unter DOS, können Sie keine Umlaute verwenden, da der Zeichensatz unter DOS nicht zu Unicode/Latin-1 kompatibel ist. Der tiefere Grund liegt in der vom Hostsystem angebotenen Konvertierungsprogrammen, die Dateien mit dem lokal benutzten Zeichensatz in Unicode umwandeln. Und der lokale Zeichensatz ist eben nun der Windows-Zeichensatz. Unter Linux oder Windows können Sie jeden Editor benutzen. Versuch:
Unicode-Zeichen beinhalten den ASCII-Zeichensatz in der amerikanischen Variante, den ISO-8859-1 Zeichensatz (Latin 1) und alle weiteren zeichen der internationalen Alphabete. Zeichen, die man von der Tastatur nicht eingeben kann, können durch die Ersatzdarstellung \uxxxx in einen Text eingefügt werden. Anbei ist noch eine Übersicht über die Versionen 2.1 und 3.0
des Unicode Standards.
|
|||||||||||||||||||||||||||||||||||||
![]() |
Das Seminar wurde entwickelt von Walter Herglotz, München. Alle Rechte sind vorbehalten. © Copyright "walter digital", Walter Herglotz, 1999-2000. |