Anmerkungen: instant-grid-testing.iso vom 31.10.2006

Submitted by Andreas Hoheisel on Mon, 30/10/2006 - 16:38.
Hallo,


Ich teste gerade die aktuelle instant-grid-testing vom 31.10.2006 und mir sind folgende Sachen aufgefallen:

  • Weitere Rechner (bombay etc.) booten über LAN, und ich kann sie erfolgreich vom server aus anpingen, sie erscheinen aber (nach ca. 10 Minuten) noch nicht automatisch in Ganglia. Ein nachträgliches "/etc/init.d/ganglia-monitor start" scheint zu helfen.(FIXED)
  • Auch die Globus-Dienste scheinen nicht (immer) automatisch auf den Clients zu starten. Hab ich vielleicht zu wenig Hauptspeicher? Das Verzeichnis /etc/grid-security/ ist leer! (FIXED)
  • Einer meiner Rechner heißt auf dem Server "istanbul" aber lokal "seoul". Was kann da passiert sein?
  • Wenn ich mit "su -" auf einem Client root werden möchte, spielt danach die Tastatur verrrückt. (FIXED)
  • D-GRDL: Der Eintrag software_cat-fhrg.xml in der Ressourcendatenbank enthält noch einen alten Pfad. Wo kann ich das abändern?
  • Der aktuelle GWES schickt jetzt erfolgreich Zusatzinformationen an Ganglia. Daran sehe ich nun zum Beispiel auch, dass Tomcat insgesamt etwa 120 Threads (nach dem start von Grid-Sphere) aufmacht. Läuft /etc/init.d/tomcat5 nun zuverlässig? Wieviele tomcat-Instanzen werden jetzt gestartet?

Auch die Globus-Dienste

  • Auch die Globus-Dienste scheinen nicht (immer) automatisch auf den Clients zu starten. Hab ich vielleicht zu wenig Hauptspeicher? Das Verzeichnis /etc/grid-security/ ist leer!


Ich habe ähnliche Erfahrungen in VMWare gemacht wenn ich weniger als ca. 524 MB Speicher hatte. Jedoch passiert dies nicht deterministisch. Es hilft z.B. tomcat herunterzufahren, den Globus-Container nochmals zu starten und anschließend tomcat wieder neu zu starten.

  • Läuft /etc/init.d/tomcat5 nun zuverlässig?


Tomcat muss über "/etc/init.d/tomcat stop-force" (o.ä.) beendet werden. Die normale stop-Option beendet den Tomcat noch nicht richtig.

  • D-GRDL: Der Eintrag software_cat-fhrg.xml in der Ressourcendatenbank enthält noch einen alten Pfad. Wo kann ich das abändern?


Das kann in der Datei /etc/ig-software.xml geändert werden. Diese ist auch im SVN von IG. Die Änderungen werden beim nächsten Datenbankupdate aktualisiert.

/etc/ig-software.xml

  • Alexander: "Das kann in der Datei /etc/ig-software.xml geändert werden. Diese ist auch im SVN von IG. Die Änderungen werden beim nächsten Datenbankupdate aktualisiert."

Ich finde die Datei nicht im SVN und habe bestimmt keine Schreibrechte. Kannst Du bitte folgenden Pfad für cat.sh eintragen?

<simpleProperty ident="executable" type="string" unit="">/usr/local/gwes/cat/cat.sh</simpleProperty>

Ich finde die Datei nicht im

Ich finde die Datei nicht im SVN und habe bestimmt keine Schreibrechte. Kannst Du bitte folgenden Pfad für cat.sh eintragen? /usr/local/gwes/cat/cat.sh
Habe ich eingetragen, aber ich glaube, dass du auch Schreibrechte für die Datei hast.

Danke!

Danke, ich hatte die Datei nicht im SVN gefunden...

Problem liegt beim NFS

Hallo,

die beschriebenen Probleme hängen mit der Tatsache zusammen, dass eine Änderung für das Mounten per NFS von "/clusterwork" ins SVN gestellt und vorher nicht ausreichend getestet wurde. Als Folge haben die Clienten nun kein funktionierendes "/clusterwork"-Vrz. mehr, wodurch der Distributor keinen Abgleich wichtiger Systemdateien mehr durchführen kann und auch viele Dienste nicht gestartet werden.

Ich werde die Änderungen zurücknehmen und ab dem nächsten nightly-build sollte wieder alles funktionieren.

Danke!

Danke!