Ruby Weblog Archiv 2005 Quartal 1

Winfried Mueller, www.reintechnisch.de

30.03.2005 :: Deep Copy und Shallow Copy

Wenn man ein Objekt kopiert oder einer Referenz ein anderes Objekt zuweist, wird man früher oder später über merkwürdige Effekte stolpern. Genaugenommen darüber, dass man in einem Objekt was ändert und in einem anderen ändert sich auf einmal auch was.

Will man der Sache auf den Grund gehen, muss man wissen, wie Ruby Objekte handhabt, wenn man sie kopiert oder wenn man Zuweisungen macht.

Generell beinhaltet jede Variable in Ruby nicht das Objekt selber sondern es ist eine Referenz (ein Zeiger) auf eine Objekt. Objekte schweben also salopp gesagt im freien Raum und Variablen zeigen auf sie. Zeigt nichts mehr auf ein Objekt, wird es früher oder später vom Garbage Collector (GC) gelöscht. Das macht Ruby nicht sofort, sondern dann, wenn der Speicher mal wieder knapp wird und aufgeräumt werden muss.

Bei einer Zuweisung wird generell die Referenz kopiert, nicht aber das Objekt.

 
s = "Hello"
t = s              # t und s zeigen auf das gleiche Stringobjekt 
                   # mit dem Inhalt "Hello"

puts t.object_id   # beide sind identisch
puts s.object_id

t << " World"      # verändert das Objekt. Weil s ebenso auf das selbe
                   # Objekt zeigt, ist der Zugriff über s ebenso verändert

puts s             # >> "Hello World"
puts t             # >> "Hello World"

Möchte man eine Kopie eines Objektes haben, nutzt man die Methoden dup oder clone. Beide machen sogenannte Shallow Copys, also flache Kopien. Das bedeutet, dass zwar das Objekt selber kopiert wird, nicht aber die Objekte, auf die in dem Objekt referenziert werden.

 
s = "Hello"
t = s.clone    # jetzt existieren 2 Objekte mit dem Inhalt "Hello"
t << " World"  # Das Objekt, worauf t zeigt, wird nur erweitert


puts "s:"
puts s            # Objekt 1 beinhaltet immer noch "Hello"
puts s.object_id  # und hat seine eigene ID

puts "t:"
puts t            # Objekt 2 beinhaltet "Hello World"
puts t.object_id

Hiermit haben wir also eine echte Kopie des String-Objektes gemacht. 2 identische Objekte existieren im Speicher und wenn man das eine verändert, verändert sich nicht das andere. Das es sich um eine flache Kopie handelt, fällt hier nicht auf, weil ein String auf kein anderes Objekt referenziert. Anders sieht es hier aus:

 
class MyClass
  def initialize
    @arr = [1,2,3]
    @s = "Hello"
  end
  attr_accessor :arr, :s
end

a = MyClass.new
b = a.clone

a.arr << 4
a.s << " World"

puts a.arr.join   # '1234' wie erwartet
puts a.s          # 'Hello World' wie erwartet

puts b.arr.join   # ups, auch '1234'
puts b.s          # und auch hier 'Hello World'

Obwohl wir hier also eine Kopie von a der Objekt-Referenz b zugewiesen haben, beeinflussen sich die beiden Objekte gegenseitig. Und genau das ist der Punkt, wo viele erstmal verblüfft sind.

Eine flache Kopie heißt, dass wir tatsächlich 2 Objekte im Speicher liegen haben. Jedoch zeigen beide Objekte auf ein und das selbe Array-Objekt und auf eine und dasselbe String Objekt. Das teilen sie sich sozusagen miteinander. Denn diese wurden nicht auch kopiert. Ruby kann von Haus aus generell nur flache Kopien erstellen. Um alles andere muss man sich selber kümmern. Oder man braucht eine entsprechende Bibliothek.

Hier ein Beispiel, wie eine tiefe Kopie für diese Klasse aussehen könnte:

 
class MyClass
  def initialize
    @arr = [1,2,3]
    @s = "Hello"
  end
  attr_accessor :arr, :s

  def deep_copy
    d = self.clone
    d.arr = @arr.clone
    d.s = s.clone
    d
  end
end

a = MyClass.new
b = a.deep_copy

a.arr << 4
a.s << " World"

puts a.arr.join
puts a.s

puts b.arr.join
puts b.s

Das klappt hier so einfach, weil unsere Klasse nur Basisobjekte enthält, die ihrerseits nicht wieder auf andere Objekte verweisen. Also brauchen wir nur alle Members ebenfalls zu clonen. Andernfalls müsste man auch diese anregen, sich tief zu kopieren.

Shallow Copy und Deep Copy sind Konzepte, die sich in jedem Grundlagenbuch über Objektorientierung finden lassen sollten. Wer also tiefer in das Thema einsteigen will, kann dort weiterlesen.

Manchmal kommt der Trugschluß auf, eine Zuweisung würde das Objekt doch kopieren.

 
s = "Hello"
t = s
t = "Hello World"

puts s  # s immer noch "Hello"
puts t  # t "Hello World"

Also doch eine Kopie? Sonst stände doch in s und t der gleiche String. Nein. Zuerst wird "Hello" angelegt und s zugewiesen. Die Referenz s zeigt also jetzt auf Objekt 1 mit dem Inhalt "Hello". Dann wird mit t = s der Referenz t ebenfalls dieses Objekt zugewiesen. Demnach zeigt jetzt t, genau wie s auf Objekt 1 mit dem Inhalt "Hello". Dann aber wird t ein neues Objekt 2 zugewiesen mit dem Inhalt "Hello World". Die Referenz s hingegen zeigt noch auf Objekt 1.

Übrigens sind dup und clone nicht völlig identisch. Beide machen sie flache Kopien, das ist definitiv so. Das PickAxe-Buch zeigt nebulös die Unterschiede auf. Viel Klarheit hat mir das aber nicht beschert. Matz persönlich schreibt dazu:

%div `clone' copies everything; internal state, singleton methods, etc.
`dup' copies object contents only (plus taintness status). apply=div%

Weblinks:

c-call	Aufruf einer C-Routine
c-return	Rücksprung aus C-Routine
call	Aufruf einer Methode (Rubycode)
return	Rücksprung aus Methode (Rubycode)
class	Start Klassen- oder Moduldefinition
end	Ende Klassen- oder Moduldefinition
raise	Auslösung einer Exception

Event-Name	Beschreibung
line	Ausführen einer Codezeile

Ruby Weblog Archiv 2005 Quartal 1

30.03.2005 :: Deep Copy und Shallow Copy

28.03.2005 :: YAML für Konfigurationsdateien

25.03.2005 :: gsub Backreference Falle

24.03.2005 :: Interessanter Ruby Artikel auf DevSource.com

22.03.2005 :: Interview zu Skriptsprachen

21.03.2005 :: AES Verschlüsselungs Experimente

21.03.2005 :: IO-Puffer leeren mit flush

19.03.2005 :: (1..7).each { |i| puts ' '*i << 'Schleifen in Ruby' }

18.03.2005 :: Kleiner Fehler in irb unter Windows

11.03.2005 :: md5sum erzeugen

11.03.2005 :: Mysterium SCRIPT_LINES__

11.03.2005 :: Rekursives Durchwandern von Verzeichnissen

10.03.2005 :: Interessante Optionen für Einzeiler

10.03.2005 :: Ausgabe Warnungen einschalten

10.03.2005 Gültigkeit Variablen im Block

08.03.2005 :: Ruby on Rails

01.03.2005 :: Atomzeituhr bitte...

28.02.2005 :: Doppel chomp!

28.02.2005 :: Wiki Software und Weblog in Ruby

25.02.2005 :: Klassenvariablen, Klasseninstanzvariablen und Konstanten

25.02.2005 :: Skript zur Assemblierung von Ruby-Code

24.02.2005 :: Namensräume

24.02.2005 :: reguläre Suche im Ruby-Wiki

24.02.2005 :: Verwendung Nicht-Alphanumerischer Zeichen in Ruby

23.02.2005 :: Anfängertipp: Codepassagen ausdokumentieren

23.02.2005 :: Windows Registry auslesen mit Win32/Registry.rb

22.02.2005 :: String mit Zeilennummer: each_with_index

22.02.2005 Zuweisung nur wenn Variable zuvor nil

22.02.2005 :: Wie funktioniert binding() ?

22.02.2005 :: rescue ohne Klassenangabe

21.02.2005 :: Closures, yield, Codeblöcke

21.02.2005 :: Trace-Debug Hilfe

21.02.2005 :: sub Falle

21.02.2005 :: Webhoster mit Ruby-Unterstützung

17.02.2005 :: Wohin mit der Konfiguration

16.02.2005 :: Zuweisungsfalle Mehrfachzuweisung

14.02.2005 :: Änderungen von Ruby Version 1.8.1 auf 1.8.2

14.02.2005 :: Klassenmethoden über Singleton-Methode

13.02.2005 :: require 'tempfile'

04.02.2005 Kurzform: Datei lesen

04.02.2005 :: CSV-Dateien bearbeiten

03.02.2005 :: Ruby portierbar halten: Interpreteraufruf

03.02.2005 :: Mailingliste Archivsuche

Copyright dieser Seite