Galileo Computing < openbook >
Galileo Computing - Professionelle Buecher. Auch fuer Einsteiger.
Galileo Computing - Professionelle Buecher. Auch fuer Einsteiger.


Java ist auch eine Insel von Christian Ullenboom
Buch: Java ist auch eine Insel (Galileo Computing)
gp Kapitel 12 Datenströme und Dateien
gp 12.1 Datei und Verzeichnis
gp 12.1.1 Dateien und Verzeichnisse mit der Klasse File
gp 12.1.2 Dateieigenschaften und -attribute
gp 12.1.3 Sicherheitsprüfung
gp 12.1.4 Umbenennen und Verzeichnisse anlegen
gp 12.1.5 Die Wurzel aller Verzeichnisse
gp 12.1.6 Verzeichnisse listen und Dateien filtern
gp 12.1.7 Dateien und Verzeichnisse löschen
gp 12.1.8 Implementierungsmöglichkeiten für die Klasse File
gp 12.1.9 Verzeichnisse nach Dateien rekursiv durchsuchen
gp 12.2 Dateien mit wahlfreiem Zugriff
gp 12.2.1 Ein RandomAccessFile öffnen
gp 12.2.2 Aus dem RandomAccessFile lesen
gp 12.2.3 Schreiben
gp 12.2.4 Die Länge des RandomAccessFile
gp 12.2.5 Hin und her in der Datei
gp 12.3 Übersicht über wichtige Stream- und WriterReader
gp 12.3.1 Die abstrakten Basisklassen
gp 12.3.2 Übersicht über Ein-/Ausgabeklassen
gp 12.4 Eingabe- und Ausgabe-Klassen: InputStream und OutputStream
gp 12.4.1 Die Klasse OutputStream
gp 12.4.2 Ein Datenschlucker
gp 12.4.3 Anwendung der Klasse FileOutputStream
gp 12.4.4 Die Eingabeklasse InputStream
gp 12.4.5 Anwenden der Klasse FileInputStream
gp 12.4.6 Kopieren von Dateien
gp 12.4.7 Daten filtern durch FilterInputStream und FilterOutputStream
gp 12.4.8 Der besondere Filter PrintStream
gp 12.4.9 System.in und System.out
gp 12.4.10 Bytes in den Strom schreiben mit ByteArrayOutputStream
gp 12.4.11 Ströme zusammensetzen mit SequenceInputStream
gp 12.5 Ressourcen wie Grafiken aus dem Klassenpfad und aus Jar-Archiven laden
gp 12.6 Die Unterklassen von Writer
gp 12.6.1 Die abstrakte Klasse Writer
gp 12.6.2 Datenkonvertierung durch den OutputStreamWriter
gp 12.6.3 In Dateien schreiben mit der Klasse FileWriter
gp 12.6.4 StringWriter und CharArrayWriter
gp 12.6.5 Writer als Filter verketten
gp 12.6.6 Gepufferte Ausgabe durch BufferedWriter
gp 12.6.7 Ausgabemöglichkeiten durch PrintWriter erweitern
gp 12.6.8 Daten mit FilterWriter filtern
gp 12.7 Die Klassen um Reader
gp 12.7.1 Die abstrakte Basisklasse Reader
gp 12.7.2 Automatische Konvertierungen mit dem InputStreamReader
gp 12.7.3 Dateien lesen mit der Klasse FileReader
gp 12.7.4 StringReader und CharArrayReader
gp 12.8 Schachteln von Eingabe-Streams
gp 12.8.1 Gepufferte Eingaben mit der Klasse BufferedReader
gp 12.8.2 LineNumberReader zählt automatisch Zeilen mit
gp 12.8.3 Eingaben filtern mit der Klasse FilterReader
gp 12.8.4 Daten mit der Klasse PushbackReader zurücklegen
gp 12.9 Kommunikation zwischen Threads mit Pipes
gp 12.9.1 PipedOutputStream und PipedInputStream
gp 12.9.2 PipedWriter und PipedReader
gp 12.10 Datenkompression
gp 12.10.1 Die Java-Unterstützung beim Komprimieren und Zusammenpacken
gp 12.10.2 Datenströme komprimieren
gp 12.10.3 Zip-Archive
gp 12.11 Prüfsummen
gp 12.11.1 Die Schnittstelle Checksum
gp 12.11.2 Die Klasse CRC32
gp 12.11.3 Die Adler32-Klasse
gp 12.12 Persistente Objekte und Serialisierung
gp 12.12.1 Objekte speichern
gp 12.12.2 Objekte lesen
gp 12.12.3 Die Schnittstelle Serializable
gp 12.12.4 Nicht serialisierbare Attribute mit transient aussparen
gp 12.12.5 Das Abspeichern selbst in die Hand nehmen
gp 12.12.6 Tiefe Objektkopien
gp 12.12.7 Versionenverwaltung und die SUID
gp 12.12.8 Wie die ArrayList serialisiert
gp 12.12.9 Serialisieren in XML-Dateien
gp 12.12.10 JSX (Java Serialization to XML)
gp 12.12.11 XML-API von Sun
gp 12.13 Zugriff auf SMB-Server
gp 12.13.1 jCIFS
gp 12.14 Tokenizer
gp 12.14.1 StreamTokenizer
gp 12.14.2 CSV (Comma Separated Values)-Dateien verarbeiten
gp 12.15 Die Logging-API


Galileo Computing

12.12 Persistente Objekte und Serialisierungdowntop

Objekte liegen zwar immer nur zur Laufzeit vor, doch können sie in Java durch einen einfachen Mechanismus gesichert beziehungsweise gelesen werden. Damit liegt ihre Struktur auch nach dem Beenden der virtuellen Maschine vor. Durch den Speichervorgang wird der Zustand und die Variablenbelegung zu einer bestimmten Zeit gesichert (persistent gemacht) und an anderer Stelle wieder hervorgeholt. Im Datenstrom sind alle Informationen, wie Objekttyp und Variablen, enthalten, um später das richtige Wiederherstellen zu ermöglichen.

Da Objekte oftmals weitere Objekte einschließen, müssen auch diese Unterobjekte gesichert werden. (Schreibe ich eine Menüzeile, so ist sie ohne die Menüeinträge wertlos. Auch eine Datenstruktur ist ohne die referenzierten Objekte sinnlos.) Genau dieser Mechanismus wird auch dann angewendet, wenn Objekte über das Netzwerk schwirren.1

Die persistenten Objekte sichern also neben ihren eigenen Informationen auch die Unterobjekte - also die, die von der betrachtenden Stelle aus erreichbar sind. Beim Speichern wird rekursiv ein Objektbaum durchlaufen, um eine vollständige Datenstruktur zu erhalten. Der doppelte Zugriff auf ein Objekt wird dabei genauso beachtet wie der Fall, dass zyklische Abhängigkeiten auftreten können. Jedes Objekt bekommt dabei ein Handle, so dass es im Datenstrom nur einmal kodiert wird.


Galileo Computing

12.12.1 Objekte speicherndowntop

Ein Objekt zu sichern, ist sehr einfach, denn es gilt nur die writeObject()-Methode der Klasse aufzurufen. Der Übergabeparameter ist die Referenz auf das zu sichernde Objekt. writeObject() existiert als Funktion der Klasse ObjectOutputStream.


Beispiel Speichere einen String und das aktuelle Tagesdatum in der Datei datum.ser

Listing 12.32 SerializeAndDeserializeDate.java

import java.io.*;
import java.util.*;
public class SerializeAndDeserializeDate
{
  static void serialize( String filename )
  {
    try
    {
      FileOutputStream file = new FileOutputStream( filename );
      ObjectOutputStream o = new ObjectOutputStream( file );
      o.writeObject( "Today" );
      o.writeObject( new Date() );
      o.close();
    }
    catch ( IOException e ) { System.err.println( e ); }
  }
  static void deserialize( String filename )
  {
    // ...
  }
  public static void main( String args[] )
  {
    String filename = "c:/datum.ser";
    serialize( filename );
    deserialize( filename );
  }
}

Ein ObjectOutputStream schreibt Objekte oder Primitive in einen OutputStream.

Wollen wir Objekte - oder allgemeiner Daten beziehungsweise Primitive - serialisieren, so benötigen wir einen OutputStream. Da wir die Werte in einer Datei sichern wollen, eignet sich ein FileOutputStream am besten (FileOutputStream erweitert die Klasse OutputStream). Der Dateiname wird meist so gewählt, dass er mit .ser endet. Wir schaffen nun eine Verbindung zwischen der Datei und dem Objektstrom durch die Klasse ObjectOutputStream, die als Konstruktor einen OutputStream annimmt. ObjectOutputStream implementiert ObjectOutput, das eine Schnittstelle ist. So besitzt die Klasse ObjectOutput beispielsweise die Funktion writeObject() zum Schreiben von Objekten. Damit wird das Serialisieren des String-Objekts (das »Today«) und des anschließenden Datum-Objekts zum Kinderspiel.


class java.io.ObjectOutputStream
extends OutputStream
implements ObjectOutput, ObjectStreamConstants

gp public ObjectOutputStream( OutputStream out ) throws IOException
Erzeugt einen ObjectOutputStream, der in den angegebenen OutputStream schreibt. Ein Fehler kann von den Methoden aus dem OutputStream kommen.

Das Interface ObjectOutput erweitert die Klasse DataOutput um das Schreiben von Objekten. Mit DataOutput können Primitive geschrieben werden, und dieses Interface definiert die Methoden: write(byte[]), write(byte[], int, int), write(int), writeBoolean(boolean), writeByte(int), writeBytes(String), writeChar(int), writeChars(String), writeDouble(double), writeFloat(float), writeInt(int), writeLong(long), writeShort(int) und writeUTF(String). Nun erweitert ObjectOutput die Klasse DataOutput, um Methoden, Attribute, Strings und Objekte zu speichern. Natürlich können wir wegen der Vererbung in ObjectOutput wieder primitive Daten speichern. In der folgenden Aufzählung sind die Methoden aufgeführt. Allerdings finden sich unter den Funktionen keine, die Objekte vom Typ Class schreiben. Hier müssen ebenso Sonderbehandlungen vorgenommen werden wie bei Strings oder Arrays.


interface java.io.ObjectOutput
extends DataOutput

gp void writeObject( Object obj ) throws IOException
Schreibt das Objekt. Die implementierende Klasse weiß, wie das Objekt zu schreiben ist.
gp void write( int b ) throws IOException
Ein Byte wird geschrieben.
gp void write( byte b[] ) throws IOException
Schreibt ein Array von Bytes.
gp void write( byte b[], int off, int len ) throws IOException
Schreibt einen Teil des Arrays. Es werden len Daten des Arrays b ab der Position off geschrieben.
gp void flush() throws IOException
Noch gepufferte Daten werden geschrieben.
gp void close() throws IOException
Der Stream wird geschlossen. Die Methode muss aufgerufen werden, bevor der Datenstrom zur Eingabe verwendet werden soll.

Alle diese Methoden können eine IOException genau dann werfen, wenn Fehler beim Auslesen der Attribute oder beim grundlegenden Schreiben auf dem Datei- beziehungsweise Netzwerksystem auftreten.

Objekte über das Netzwerk schicken

Es ist natürlich wieder feines OOD, dass es der Methode writeObject() egal ist, wohin das Objekt geschoben wird. Dazu wird ja einfach dem Konstruktor von ObjectOutputStream ein OutputStream übergeben, und writeObject() delegiert dann das Senden der entsprechenden Einträge an die passenden Methoden der Output-Klasse. Im oberen Beispiel benutzten wir ein FileOutputStream. Es sind aber auch noch eine ganze Menge anderer Klassen, die OutputStream erweitern. So können die Objekte auch in einer Datenbank abgelegt werden beziehungsweise über das Netzwerk verschickt werden. Wie dies funktioniert, zeigen die nächsten Zeilen:

Socket s = new Socket( "host", port );
OutputStream os = s.getOutputStream();
ObjectOutputStream oos = new ObjectOutputStream( os );
oos.writeObject( object );

Über s.getOutputStream() gelangen wir an den Datenstrom. Dann sieht alles wie bekannt aus. Da wir allerdings auf der Empfängerseite noch ein Protokoll ausmachen müssen, werden wir diesen Weg der Objektversendung nicht weiterverfolgen und uns später vielmehr auf eine Technik verlassen, die sich RMI nennt.

Objekte in ein Bytefeld schreiben

Die Klassen ObjectOutputStream und ByteArrayOutputStream sind zusammen zwei gute Partner, wenn es darum geht, eine Repräsentation eines Objekts im Speicher zu erzeugen und die Größe eines Objekts herauszufinden.

Object o = ...;
ByteArrayOutputStream baos = new ByteArrayOutputStream();
ObjectOutputStream    oos  = new ObjectOutputStream( baos );
oos.writeObject( o );
oos.close();
byte array[] = baos.toByteArray();

Nun steht das Objekt im Bytefeld. Wenn wir die Größe erfragen wollten, müssten wir das Attribut length des Felds auslesen. Dies gibt eine ganz grobe Vorstellung über den Platzbedarf im Speicher.


Galileo Computing

12.12.2 Objekte lesendowntop

Die entgegengesetzte Richtung des Schreibens ist das Lesen, und es gestaltet sich ebenso einfach.


Beispiel Serialisierte Objekte aus einer Datei lesen

Listing 12.33 SerializeAndDeserializeDate.java, Teil 2

  static void deserialize( String filename )
  {
    try
    {
      FileInputStream file = new FileInputStream( filename );
      ObjectInputStream o = new ObjectInputStream( file );
      String string = (String) o.readObject();
      Date date = (Date) o.readObject();
      o.close();
      System.out.println( string );
      System.out.println( date );
    }
    catch ( IOException e ) { System.err.println( e ); }
    catch ( ClassNotFoundException e ) { System.err.println( e ); }
  }

Um an den Eingabestrom zu kommen, verwenden wir ein InputStream. Da die Informationen aus einer Datei kommen, verwenden wir einen FileInputStream. Diesen verknüpfen wir mit einem ObjectInputStream, welcher die Daten aus in liest. Dann können wir aus dem ObjectInputStream den String und das Datum mit der Methode readObject() auslesen. Diese readObjekte()-Methode liest nun das Objekt und findet heraus, von welchem Typ es ist, und holt - wenn notwendig - auch noch Objekte, auf die verwiesen wird. Die explizite Typumwandlung kann natürlich bei einer falschen Zuweisung zu einem Fehler führen.

Das Interface ObjectInput ist von der gleichen Bauweise wie ObjectOutput. Es erweitert nur DataInput, welches wiederum das Lesen von Primitiven erlaubt.


interface java.io.ObjectInput
extends DataInput

gp Object readObject() throws ClassNotFoundException, IOException
Liest ein Object und gibt es zurück. Die Klasse, die readObject() implementiert, muss natürlich wissen, wie es gelesen wird. ClassNotFoundException wird dann ausgelöst, wenn das Objekt zu einer Klasse gehört, die nicht gefunden werden kann.
gp int read() throws IOException
Liest ein Byte aus dem Datenstrom. Dieses ist -1, wenn das Ende erreicht ist.
gp int read( byte b[] ) throws IOException
Liest ein Array in den Puffer. Auch hier zeigt -1 das Ende an.
gp int read( byte b[], int off, int len ) throws IOException
Liest in ein Array von Bytes in den Puffer b an der Stelle off genau len Bytes.
gp long skip( long n ) throws IOException
Überspringt n Bytes im Eingabestrom. Die Anzahl der tatsächlich übersprungenen Zeichen wird zurückgegeben.
gp int available() throws IOException
Gibt die Anzahl der Zeichen zurück, die ohne Blockade gelesen werden können.
gp void close() throws IOException
Schließt den Eingabestrom.

Galileo Computing

12.12.3 Die Schnittstelle Serializabledowntop

Bisher haben wir immer angenommen, dass eine Klasse weiß, wie sie geschrieben wird. Das funktioniert wie selbstverständlich bei allen vordefinierten Klassen, und so müssen wir uns bei writeObject(new Date()) keine Gedanken darüber machen, wie sich das Datum schreibt. Ist eine Klasse nicht in der Lage, sich zu serialisieren, wird eine NotSerializableException geworfen. Zu den Klassen, die sich nicht serialisieren lassen, gehören zum Beispiel Thread, Socket oder Klassen aus dem java.io-Paket.

Voraussetzung für die Serialisierung ist die Implementierung der Schnittstelle Serializable. Diese Schnittstelle enthält keine Methoden und ist nur eine Markierungsschnittstelle. Klassen, die diese Schnittstelle implementieren, signalisieren damit die Fähigkeit, sich selbst zu serialisieren.


Hinweis Feld-Objekte sind standardmäßig serialisierbar - sie implementieren versteckt die Schnittstelle Serializable.

Attribute einer Klasse automatisch schreiben

Wir wollen nun eine Klasse TestSer schreib- und lesefähig machen. Dazu benötigen wir folgendes Gerüst:

Listing 12.34 TestSer.java

import java.io.Serializable;
public class TestSer implements Serializable
{
  int    a;
  double d;
  static int u;
}

Erzeugen wir ein TestSer-Objekt, nennen wir es ts und rufen writeObject(ts) auf, so schiebt es all seine Variablen (hier a und d) in den Datenstrom.

Statische Variablen werden mit dem Standardserialisierungsmechanismus nicht gesichert. Dies kann auch nicht sein, denn verschiedene Objekte teilen sich ja eine statische Variable. Wenn zwei Objekte wieder deserialisiert werden, könnte es sonst passieren, dass beide unterschiedliche Werte haben. Was sollte dann passieren?


Galileo Computing

12.12.4 Nicht serialisierbare Attribute mit transient aussparendowntop

Es gibt eine Reihe von Objekttypen, die sich nicht serialisieren lassen - technisch gesprochen implementieren diese Klassen die Schnittstelle Serializable nicht. Aber warum sollte es überhaupt Objekte geben, die nicht persistent gemacht werden sollen? Ein Punkt ist die Sicherheit. Ein Objekt, welches etwa Passwörter speichert, soll nicht einfach geschrieben werden. Da reicht es nicht, dass die Attribute privat sind, denn auch sie werden geschrieben. Der andere Punkt ist, dass sich nicht alle Zustände beim Deserialisieren wieder herstellen lassen. Was ist, wenn ein FileInputStream serialisiert wird. Soll dann bei der Deserialisierung eine Datei geöffnet werden? Was ist, wenn die Datei nicht da ist? Was ist mit einem Socket oder einem ServerSocket? Da all diese Fragen ungeklärt sind, ist es das Einfachste, diese Klasse nicht die Schnittstelle Serializable implementieren zu lassen.

Doch wenn das so ist, haben wir spätestens dann ein Problem, wenn ein Objekt geschrieben wird, das intern auf ein nicht serialisierbares Objekt verweist - etwa auf einen Thread.

Abbildung
Hier klicken, um das Bild zu Vergrößern


Beispiel Die Serialisierung der folgenden Klasse bringt einen Laufzeitfehler ein:
public class SerializeTransient
{
  public static void main( String args[] ) throws Exception
  {
    ByteArrayOutputStream bytearray = new ByteArrayOutputStream();
    ObjectOutputStream oos = new ObjectOutputStream( bytearray );
    
    class NotTransientNotSerializable implements Serializable
    {
      Thread t = new Thread();
      String s = "Fremde sind Freunde, die man nur noch nicht kennengelernt hat.";
    }
    
    oos.writeObject( new NotTransientNotSerializable() );
    oos.close();
    
    System.out.println( bytearray.toString() );
  }
}

Der Fehler wird eine NotSerializableException sein:

java.io.NotSerializableException: java.lang.Thread
 at java.io.ObjectOutputStream.writeObject0(ObjectOutputStream.java:1054)
 at java.io.ObjectOutputStream.defaultWriteFields(ObjectOutputStream.java:1330)
 at java.io.ObjectOutputStream.writeSerialData(ObjectOutputStream.java:1302)
 at java.io.ObjectOutputStream.writeOrdinaryObject(ObjectOutputStream.java:1245)
 at java.io.ObjectOutputStream.writeObject0(ObjectOutputStream.java:1052)
 at java.io.ObjectOutputStream.writeObject(ObjectOutputStream.java:278)
 at SerializeTransient.main(SerializeTransient.java:18)
Exception in thread "main"

Die Begründung dafür ist einfach: Ein Thread kann nicht serialisiert werden. Falls wir aber ein Objekt vom Typ NotTransientNotSerializable ohne Thread serialisieren wollen, müssen wir dem Serialisierungsmechanismus mitteilen: »Nimm so weit alle Objekte, aber den Thread nicht!« Dazu existiert in Java ein spezielles Schlüsselwort: transient. Es markiert alle Attribute, die nicht persistent sein sollen. Damit lassen wir die nicht serialisierbaren Kandidaten also außen vor und speichern alles das, was geht.

Um das Beispiel damit zu Ende zu bringen, setzen wir den Modifizierer transient vor den Variablentyp, und das Beispiel ist ablauffähig.

transient Thread t = new Thread();

Galileo Computing

12.12.5 Das Abspeichern selbst in die Hand nehmendowntop

Es kann nun passieren, dass es beim Serialisieren nicht ausreicht, die normalen Attribute zu sichern. Für diesen Fall müssen spezielle Methoden implementiert werden. Beide müssen die nachstehenden Signaturen besitzen:

private synchronized void writeObject( java.io.ObjectOutputStream s )
  throws IOException

und

private synchronized void readObject( java.io.ObjectInputStream s )
  throws IOException, ClassNotFoundException

Die Methode writeObject() ist für das Schreiben verantwortlich. Ist der Rumpf leer, so gelangen keine Informationen in den Strom und das Objekt wird folglich nicht gesichert.

Mit diesen Funktionen können wir also die Serialisierung selbst in die Hand nehmen. Wir können Attribute so speichern, wie wir es für sinnvoll halten, und es lässt sich eine Kompatibilität erzwingen. Eine kleine Versionsnummer im Datenstrom könnte eine Verzweigung provozieren, in der die Daten der Version 1 oder andere Daten der Version 2 gelesen werden. Auch können auf diese Weise statische Attribute in den Datenstrom kommen.

Beim Lesen können komplette Objekte wieder aufgebaut werden, und es lassen sich zum Beispiel nicht transiente Objekte wieder beleben. Stellen wir uns einen Thread vor, dessen Zustände beim Schreiben persistent gemacht werden, und beim Lesen wird ein Thread-Objekt wieder erzeugt und zum Leben erweckt.

Oberklassen serialisieren sich gleich mit

Wird eine Klasse serialisiert, so wird auch automatisch die Oberklasse serialisiert. Dabei gilt, dass wie beim Konstruktur erst die Attribute der Oberklasse in den Datenstrom geschrieben werden und anschließend die Attribute der Unterklasse. Insbesondere heißt dass, das die Unterklasse nicht noch einmal die Attribute der Oberklasse speichern sollte. Das folgende Programm zeigt den Effekt:

Listing 12.35 WriteTop.java

import java.io.*;
class Base implements Serializable
{
  private void writeObject( ObjectOutputStream oos )
  {
    System.err.println( "Base" );
  }
} 
public class WriteTop extends Base implements Serializable
{
  public static void main( String args[] ) throws IOException
  {
    ObjectOutputStream oos = new ObjectOutputStream( System.out );
    oos.writeObject( new WriteTop() );
  }
  private void writeObject( ObjectOutputStream oos )
  {
    System.err.println( "Top" );
  }
}

In der Ausgabe von Eclipse ist anderfarbig die Ausgabe »Base« und »Top« zu erkennen.

Abbildung
Hier klicken, um das Bild zu Vergrößern

Doch noch den Standardserialisierer nutzen

Die Funktionen read/writeObject() sind Alles-oder-nichts-Funktionen. Erkennt der Serialisierer, dass die Schnittstelle Serializable implementiert wird, fragt er die Klasse, ob sie die Methoden implementiert. Macht sie es nicht, so beginnt bei der Serialisierung der Serialisierungsmechanismus eigenständig die Attribute auszulesen und in den Datenstrom zu schreiben. Gibt es die read/writeObject()-Methoden, so wird der Serialisierer diese aufrufen und nicht selbst die Objekte nach den Werten fragen oder die Objekte mit Werten füllen.

Doch die Arbeit des Serialisierers ist eine große Hilfe. Falls viele Attribute zu speichern sind, fällt viel lästige Arbeit beim Programmieren an, denn für jedes zu speichernde Attribut ist eine eigene write-Funktion nötig und beim Lesen eine entsprechende read-Funktion. Aus diesem Dilemma gibt es einen Ausweg, denn in den read/writeObject()-Methoden kann der Serialisierer auch nachträglich dazu verpflichtet werden, die nicht transienten Attribute zu lesen oder zu schreiben. Die privaten Funktionen readObject() und writeObject() bekommen als Parameter ein ObjectInputStream und ein ObjectOutputStream, die über die entsprechende Funktion verfügen.


Hinweis Es ist gar nicht so abwegig, nur eine readObject(), aber keine writeObject()-Funktion zu implementieren. In readObject() lässt ein defaultReadObject() alle Eigenschaften initialisieren und danach noch Initialisierungsarbeit ähnlich einem Konstruktor durchführen. Dazu zählt etwa Initialisierung von transienten Attributen, Registrierung von Listenern und Weiteres.

Die Klasse ObjectOutputStream erweitert java.io.OutputStream unter anderem um die Methode defaultWriteObject(). Sie speichert die Attribute einer Klasse.


class java.io.ObjectOutputStream
extends OutputStream
implements ObjectOutput, ObjectStreamConstants

gp public final void defaultWriteObject() throws IOException
Schreibt alle nicht statischen und nicht transienten Attribute in den Datenstrom. Die Methode kann nur innerhalb einer privaten writeObject()-Funktion aufgerufen werden; andernfalls erhalten wir eine NotActiveException.

Das Gleiche gilt auch für die Funktion defaultReadObject() in der Klasse ObjectInputStream.


Beispiel Eine Klasse definiert zwei Attribute: freundin und alter. Da Frauen über ihr Alter nicht sprechen, soll alter nicht serialisert werden; es ist transient. Wir implementieren eigene read/writeObject()-Funktionen, die den Standardserialisierer bemühen, sonst aber nichts Interessantes machen.

Listing 12.36 DefaultReadWriteObject.java

import java.io.*;
public class DefaultReadWriteObject implements Serializable
{
  public String freundin = "Tatjana";
  
  public transient int alter = 30;
  private void writeObject( ObjectOutputStream oos ) throws IOException
  {
    oos.defaultWriteObject();  // Schreibe freundin, aber nicht alter
  }
  private void readObject( ObjectInputStream ois ) throws IOException
  {
    try
    {
      ois.defaultReadObject();  // Lese freundin, aber nicht das alter
    }
    catch ( ClassNotFoundException e )
    {
      throw new IOException( "Klasse nicht gefunden. HILFE!!" );
    }
  }
}


Galileo Computing

12.12.6 Tiefe Objektkopiendowntop

Klassen können die clone()-Methode von Object überschreiben und so eine Kopie der Werte liefern. Die Standardimplementierung ist jedoch so angelegt, dass diese Kopie flach ist. Das bedeutet, Referenzen auf Objekte, die von dem zu klonenden Objekt ausgehen, werden beibehalten und diese Objekte nicht extra kopiert. Als Beispiel kann die einfache Datenstruktur eines Felds genügen, das auf Vector-Objekte verweist. Ein Klon dieses Felds ist lediglich ein zweites Feld, dessen Elemente auf die gleichen Vektoren zeigen. Eine Änderung wird also beiden Feldern bewusst.

Möchten wir das Verhalten ändern und eine tiefe Kopie anfertigen, so haben wir mit einem kleinen Trick damit keine Mühe. Die Idee ist, dass wir das zu klonende Objekt einfach serialisieren und dann wieder auspacken. Die zu klonenden Objekte müssen dann nur das Serializable-Interface implementieren.

Listing 12.37 Dolly.java, deepCopy()

public static Object deepCopy( Object o ) throws Exception
{
  ByteArrayOutputStream baos = new ByteArrayOutputStream();
  new ObjectOutputStream( baos ).writeObject( o );
  ByteArrayInputStream bais = new ByteArrayInputStream( baos.toByteArray() );
  return  new ObjectInputStream(bais).readObject();
}

Das Einzige, was wir zum Gelingen der Methode deepCopy() machen müssen, ist, das Objekt in einem Bytefeld zu serialisieren, es wieder auszulesen und zu einem Objekt zu konvertieren. Den Einsatz eines ByteArrayOutputStream haben wir schon gesehen, als wir die Länge eines Objekts herausfinden wollten. Nur fügen wir nun das Feld wieder zu einem ByteArrayInputStream hinzu, aus dessen Daten dann ObjectInputStream wieder das Objekt rekreieren kann.

Überzeugen wir uns anhand eines kleinen Programms, dass die tiefe Kopie tatsächlich etwas anderes als ein clone() ist.

Listing 12.38 Dolly.java, main()

public static void main( String args[] ) throws Exception
{
  Map map = new HashMap() {{
    put( "Cul de Paris",
         "hinten unter dem Kleid getragenes Gestell oder Polster" );
  }};
  LinkedList l1 = new LinkedList();
  l1.add( map );
  List l2 = (List) l1.clone();
  List l3 = (List) deepCopy( l1 );
  map.clear();
  System.out.println( l1 ); // [{}]
  System.out.println( l2 ); // [{}]
  System.out.println( l3 ); // [{Cul de Paris=hinten unter dem Kleid ...}]
}

Zunächst erstellen wir eine Map, die wir anschließend in eine Liste packen. Die Map enthält ein Pärchen. Klonen wir mit clone() die Liste, so wird zwar die Liste selbst kopiert, aber nicht die Map. Die tiefe Kopie kopiert neben der Liste auch gleich die Map mit. Das sehen wir dann, wenn wir den Eintrag aus der Map löschen. Dann ergibt l1 genauso wie l2 eine leere Liste, da l2 nur die Verweise auf die Map gespeichert hat, die dann aber geleert ist. Anders ist dies bei l3, der tiefen Kopie; hier ist das Paar noch vorhanden.

An diesem Beispiel sehen wir, wie wunderbar die Stream-Klassen zusammenarbeiten. Einzige Voraussetzung zum Gelingen ist die Implementierung der Schnittstelle Serializable. Da aber die zu klonenden Klassen auch clone() implementieren müssen, gilt in der Regel, dass sie serialisierbar sind. Daher stehen in der implements-Zeile die Schnittstellen Clonable und Serializable direkt nebeneinander.


Galileo Computing

12.12.7 Versionenverwaltung und die SUIDdowntop

Die erste Version einer Klassenbibliothek ist in der Regel nicht vollständig und nicht beendet. Es kann gut sein, dass Attribute und Methoden nachträglich in die Klasse eingefügt, gelöscht oder modifiziert werden. Das bedeutet aber gleichzeitig, dass die Serialisierung zu einem Problem werden kann. Denn ändert sich der Typ einer Variablen oder kommen Variablen hinzu, dann ist eine gespeicherte Objektserialisierung nicht mehr gültig.

Bei der Serialisierung wird in Java nicht nur der Objektinhalt geschrieben, sondern zusätzlich noch eine eindeutige Kennung der Klasse, die UID. Die UID ist ein Hashcode aus Namen, Attributen, Parametern, Sichtbarkeit und so weiter. Sie wird als long wie ein Attribut gespeichert. Ändert sich der Aufbau einer Klasse, ändert sich der Hashcode und damit die UID. Klassen mit unterschiedlicher UID sind nicht kompatibel. Erkennt der Lesemechanismus in einem Datenstrom eine UID, die nicht zu der Klasse passt, wird eine InvalidClassException ausgelöst. Das bedeutet, dass schon ein einfaches Zufügen von Attributen zu einem Fehler führt.

Wir wollen uns dies einmal an einer einfachen Klasse ansehen. Wir entwickeln eine Klasse SerMe mit einem einfachen Ganzzahlattribut. Später fügen wir dann eine Fließkommazahl hinzu.

Listing 12.39 InvalidSer.java, Teil 1

class SerMe implements Serializable
{
  int i;
//  double d;
//  float i;
}

Dann benötigen wir noch das Hauptprogramm. Wir bilden ein Exemplar von SerMe und schreiben es in eine Datei. Ohne Änderungen können wir es direkt wieder deserialisieren. Ändern wir jedoch die Klassendefinition, führt dies zu einem Fehler.

Listing 12.40 InvalidSer.java, Teil 2

import java.io.*;
public class InvalidSer
{
  public static void main( String args[] ) throws Exception
  {
    das String filename = "c:/test.ser";
    // Teil 1: Schreiben
    ObjectOutputStream oo = new ObjectOutputStream(
      new FileOutputStream( filename ) );
    oo.writeObject( new SerMe() );
    oo.close();
    // Teil 2: Klasse SerMe ändern und zu lesen versuchen
    ObjectInputStream oi = new ObjectInputStream(
      new FileInputStream( filename ) );
    SerMe o = (SerMe) oi.readObject();
    oi.close();
  }
}

Fügen wir der Klasse SerMe das Attribut double d zu oder ändern wir den Typ der Ganzzahlvariablen auf float, folgt eine lange Fehlerliste:

java.io.InvalidClassException: SerMe; Local class not compatible:
stream classdesc serialVersionUID=9027745268614067035
local class serialVersionUID=-3271853622578609637
    at java.io.ObjectStreamClass.validateLocalClass(ObjectStreamClass.java:523)
    at java.io.ObjectStreamClass.setClass(ObjectStreamClass.java:567)
    at ujava.io.ObjectInputStream.inputClassDescriptor(ObjectInputStream.java:936)
    at java.io.ObjectInputStream.readObject(ObjectInputStream.java:366)
    at java.io.ObjectInputStream.readObject(ObjectInputStream.java:236)
    at java.io.ObjectInputStream.inputObject(ObjectInputStream.java:1186)
    at java.io.ObjectInputStream.readObject(ObjectInputStream.java:386)
    at java.io.ObjectInputStream.readObject(ObjectInputStream.java:236)
    at InvalidSer.main(InvalidSer.java:28)

Die eigene SUID

Aus dem oberen Fehlerauszug erkennen wir, dass der Serialisierungsmechanismus die SUID selbst berechnet. Das Attribut ist als statische, finale Variable mit dem Namen serialVersionUID in der Klasse abgelegt. Ändern sich die Klassenattribute, ist es günstig, eine eigene SUID einzutragen, denn der Mechanismus zum Deserialisieren kann dann etwas gutmütiger mit den Daten umgehen. Denn beim Einlesen gibt es Informationen, die nicht hinderlich sind. Wir sprechen in diesem Zusammenhang auch von Stream-kompatibel. Dazu gehören zwei Bereiche.

Neue Felder

Befinden sich in der neuen Klasse Attribute, die im Datenstrom nicht benannt sind, so werden diese Attribute mit 0 oder null initialisiert.

Fehlende Felder

Befinden sich im Datenstrom Attribute, die in der neuen Klasse nicht vorkommen, so werden sie einfach ignoriert.

Die SUID lässt sich mit einem kleinen Dienstprogramm serialver berechnen. Dadurch erreichen wir eine Stream-kompatible Serialisierung.


Beispiel Dies wollen wir für unsere Klasse SerMe mit dem Dienstprogramm testen:
$ serialver SerMe
SerMe:    static final long serialVersionUID = 9027745268614067035L;

Diese letze Zeile können wir in unsere Klasse SerMe kopieren. Nehmen wir jetzt noch eine Fließkommazahl d hinzu, dann wird die InvalidClassException nicht mehr auftreten, da mit der Hinzunahme eines Attributs die Stream-Kompatibilität gewährleistet ist.

class SerMe implements Serializable
{
  int i;
  double d;
  static final long serialVersionUID = 9027745268614067035L;
}

Galileo Computing

12.12.8 Wie die ArrayList serialisiertdowntop

Am Beispiel einer java.util.ArrayList lässt sich sehr schön beobachten, wie sich die Funktionen writeObject() und readObject() nutzen lassen. Eine ArrayList beinhaltet eine Reihe von Elementen. Zur Speicherung nutzt die Datenstruktur ein internes Feld. Das Feld kann größer als die Anzahl der Elemente sein, damit bei jedem add() nicht immer das Feld neu vergrößert werden muss. Nehmen wir an, die ArrayList würde eine Standardserialisierung nutzen. Was passiert? Dann könnte das Problem entstehen, dass bei nur einem Objektverweis in der Liste und einer internen Feldgröße von 1000 Elementen leider 999 null-Verweise gespeichert würden. Das wäre aber Verschwendung! Besser ist, eine angepasste Serialisierung zu verwenden.

Wir schauen uns einmal den Quellcode der Methoden aus dem Projekt GNU Classpath an:

private void writeObject(ObjectOutputStream s) throws IOException
{
    // The 'size' field.
  s.defaultWriteObject();
  // We serialize unused list entries to preserve capacity.
  int len = data.length;
  s.writeInt(len);
  // it would be more efficient to just write "size" items,
  // this need readObject read "size" items too.
  for (int i = 0; i < size; i++)
    s.writeObject(data[i]);
}
private void readObject(ObjectInputStream s)
  throws IOException, ClassNotFoundException
{
  // the `size' field.
  s.defaultReadObject();
  int capacity = s.readInt();
  data = new Object[capacity];
  for (int i = 0; i < size; i++)
    data[i] = s.readObject();
}

Galileo Computing

12.12.9 Serialisieren in XML-Dateiendowntop

Der klassische Weg von einem Objekt zu einer persistenten Speicherung führt über den Serialisierungsmechanismus von Java über die Klassen ObjectOutputStream und Object InputStream. Die Serialisierung in Binärdaten ist aber nicht ohne Nachteile. Schwierig ist beispielsweise die Weiterverarbeitung von Nicht-Java-Programmen oder die nachträgliche Änderung ohne Einlesen und Wiederaufbauen der Objektverbunde. Wünschenswert ist daher eine Textrepräsentation. Diese hat nicht die oben genannten Nachteile. Insbesondere wenn der Text in einem XML-Format strukturiert ist, finden wir mittlerweile viele Programme, die die Weiterverarbeitung sichern.

Für die Serialisierung in XML gibt es eine ganze Reihe von Bibliotheken. Wir wollen hier JSX von Macmillan vorstellen. In Java 1.4 ist die Serialisierung in XML integriert, doch kann der Mechanismus nur Klassen serialisieren, die ausdrücklich Serializable implementieren; JSX ist das egal.


Galileo Computing

12.12.10 JSX (Java Serialization to XML)downtop

Brendan Macmillan (bren@csse.monash.edu.au) implementierte die Java-Serialisierung in das Ausgabeformat XML in der Bibliothek JSX (Java Serialization to XML). Damit können Objekte in XML-Dokumente umgewandelt und eingelesen werden. Unter http://www.csse.monash.edu.au/~bren/JSX/ liegt die Bibliothek, die sehr einfach zu nutzen ist.

JSX erzeugt XML-Dateien etwa der folgenden Art:

<java.util.Vector>
  <java.lang.Integer valueOf="10"/>
  <java.lang.String valueOf="Häufchen"/>
</java.util.Vector>

Der Mechanismus findet über Reflection die Attribute der Objekte heraus und schreibt sie nach obigem Schema in eine Datei. Die Tags der XML-Datei sind dann die Klassennamen.

Funktionsangebot

Der XML-Serialisierer schreibt das Objekt über ein ObjOut-Objekt und liest es über ObjIn ein. Ein ObjOut-Objekt kann über verschiedene Konstruktoren erzeugt werden. Die parametrisierten Konstruktoren nehmen einen PrintWriter, OutputStreamWriter oder OutputStream entgegen. Der Standard-Konstruktor schreibt die Ausgabe auf den Standardausgabestrom. Für große Dateien ist es klug, hier einen gepufferten Strom zu nutzen. Intern nutzt die Klasse einen PrintWriter.


Beispiel Für gepufferte Ausgaben nutzen wir die Klasse BufferedWriter

Um das Objekt o in eine Datei zu xml-serialisieren, schreiben wir:

String file = "XYZ.xml";
ObjOut out = new ObjOut( new PrintWriter(
                          new BufferedWriter(
                            new FileWriter(file))) );
out.writeObject( o );

Zum Deserialisieren nutzen wir die Klasse ObjIn und dann die Objektmethode readObject(). Das Objekt ObjIn lässt sich mit einem InputStreamReader und einem InputStream initialisieren. Der Standard-Konstruktor liest die Daten über den Standardeingabstrom ein.

Da ObjIn die Klasse ObjectInputStream erweitert, lassen sich über die Klasse auch alle anderen Datentypen lesen. Für ObjOut, die ObjectOutputStream erweitert, gilt Gleiches.

Voraussetzungen und Einschränkungen

JSX stellt an die Objekte wenige Voraussetzungen. Der Mechanismus serialisiert alle primitiven Datentypen, auch geschachtelte Felder. Zyklische Abhängigkeiten werden genauso beachtet wie selbstimplementierte writeObject()- beziehungsweise readObject()-Methoden. Die Klassen müssen keinen Konstruktor besitzen und nicht wie bei der Standardserialisierung die Schnittstelle Serializable implementieren.

JSX serialisiert die Daten ohne Verifizierung. Es wird keine DTD erstellt, die die Korrektheit sicherstellt. Die Erstellung einer DTD für die Dokumentation und Validierung ist jedoch schon implementiert und in der Testphase. Ebenso die Möglichkeit, über XSLT zyklische Verweise zu validieren. Bisher entspricht ein Tag immer dem Klassennamen, und die Abbildung lässt sich nicht festlegen. Wünschenswert ist die Abbildung von Strukturen auf andere Klassen, so dass ein Austausch über Plattformen hinaus möglich ist. Serialisieren wir zum Beispiel ein ArrayList, so wünschen wir vielleicht, dass es zur Klasse Array wird. Beim Einlesen soll dann wieder Array zu ArrayList werden.

Folgendes Programm serialisiert die Daten in einer Datei und liest sie anschließend wieder aus:

Listing 12.41 JSXDemo.java

import JSX.*;
import java.util.*;
import java.io.*;
public class JSXDemo
{
  public static void main( String args[] ) throws Exception
  {
    String file = "c:/XYZ.xml";
    ObjOut out = new ObjOut( new FileWriter(file) );
    Integer i = new Integer(10);
    Vector v = new Vector();
    v.addElement( i );
    v.addElement( "Häufchen" );
    v.addElement( v );
    out.writeObject( v );
    out.writeObject( i );
    class CircularRef {
      CircularRef left, right;
    }
    CircularRef c = new CircularRef();
    c.left = c.right = c;
    out.writeObject( c );
    out.writeObject(
      new Object[] {
        new int[] {2,3},
        new int[] {5,7}
      }
    );
//    out.close();
    ObjIn in = new ObjIn( new FileReader(file) );
    Object o = in.readObject();
    System.out.println( o.getClass().getName() );
    Integer io = (Integer)((Vector)o).get(0);
    Object p = in.readObject();
    System.out.println( p.getClass().getName() );
    System.out.println( "Vektor-Int und Int sind " +
                         io == p ? "gleich." : "nicht gleich?" );
    Object q = in.readObject();
    System.out.println( q.getClass().getName() );
    Object r = in.readObject();
    System.out.println( r.getClass().getName() );
//    in.close();
  }
}

Die Ausgabe der letzten Zeilen ist Folgende:

java.util.Vector
java.lang.Integer
nicht gleich?
JSXDemo$1$CircularRef
[Ljava.lang.Object;

An dem Integer-Objekt können wir ablesen, dass die aktuelle Implementierung hier noch einen Fehler hat.

Ein Blick auf die generierte Datei c:\XYZ.xml ergibt folgendes Bild:

<java.util.Vector>
  <java.lang.Integer valueOf="10"/>
  <java.lang.String valueOf="Häufchen"/>
  <alias-ref alias="0"/>
</java.util.Vector>
<java.lang.Integer
 value="10"/>
<JSXDemo$1$CircularRef>
  <alias-ref obj-name="left" alias="0"/>
  <alias-ref obj-name="right" alias="0"/>
</JSXDemo$1$CircularRef>
<ArrayOf-java.lang.Object length="2">
  <ArrayOf-int length="2"
   a0="2"
   a1="3"/>
  <ArrayOf-int length="2"
   a0="5"
   a1="7"/>
</ArrayOf-java.lang.Object>

Galileo Computing

12.12.11 XML-API von Suntoptop

Um in XML zu schreiben und von dort zu laden, werden die Klassen ObjectOutputStream und ObjectInputStream durch die Klassen XMLEncoder und XMLDecoder ersetzt.

Abbildung
Hier klicken, um das Bild zu Vergrößern

Die folgende Klasse ist unserem Programm SerializeAndDeserialize nachempfunden. Ersetzen müssen wir lediglich die Object-Streams. Die Klassen XMLEncoder und XMLDecoder liegen auch nicht in java.io, sondern unter dem Paket java.beans. Interessanterweise muss die Ausnahme ClassNotFoundException nicht mehr aufgefangen werden.

Listing 12.42 SerializeAndDeserializeXML.java

import java.io.*;
import java.util.*;
import java.beans.*;
public class SerializeAndDeserializeXML
{
  static void serialize( String filename )
  {
    try
    {
      XMLEncoder  o = new XMLEncoder( new FileOutputStream(filename) );
      o.writeObject( "Today" );
      o.writeObject( new Date() );
      o.close();
    } catch ( IOException e ) { }
  }
  static void deserialize( String filename )
  {
    try
    {
      XMLDecoder o = new XMLDecoder(
        new FileInputStream(filename) );
      String string = (String) o.readObject();
      Date date = (Date) o.readObject();
      o.close();
      System.out.println( string );
      System.out.println( date );
    }
    catch ( IOException e ) { }
  }
  public static void main( String args[] )
  {
    String filename = "c:/datum.ser.xml";
    serialize( filename );
    deserialize( filename );
  }
}

Und so sehen wir nach dem Ablauf des Programms in der Datei datum.ser.xml Folgendes:

<?xml version="1.0" encoding="UTF-8"?>
<java version="1.4.0-beta" class="java.beans.XMLDecoder">
  <string>Today</string>
  <object class="java.util.Date">
    <long>997183601217</long>
  </object>
</java>

Bei eigenen Objekt muss immer bedacht sein, dass die XML-Serialisierer von Sun nur Beans schreibt. Eigene Klassen müssen daher immer ihre serialisierbaren Eigenschaften über getXXX()/setXXX()-Methoden bereitstellen.






1 Die Rede ist hier von RMI.





Copyright (c) Galileo Press GmbH 2004
Für Ihren privaten Gebrauch dürfen Sie die Online-Version natürlich ausdrucken. Ansonsten unterliegt das <openbook> denselben Bestimmungen, wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.


[Galileo Computing]

Galileo Press GmbH, Gartenstraße 24, 53229 Bonn, Tel.: 0228.42150.0, Fax 0228.42150.77, info@galileo-press.de