du bist schon nah dran bzw. mit deinem OOP Beispiel nicht weit weg.
Der Begriff wird oft u.a. in der VM Welt genutzt um eine VM zu bezeichnen, welche z.B. von einem bestimmten Image erzeugt wird. Diese VM ist dann der Server.
Wenn du das im Zusammenhang mit Ressourcenanpassung hörst, dann laufen dort z.B. mehrere VM Instanzen mit einer Applikation X oder einem Webserver o.ä. Wenn die Systemauslastung nun durch erhöhten Traffic o.ä. steigt, können auf der Ebene einfach weitere Instanzen dieses Systems erzeugt werden… so skaliert das in die Breite.