Sun Grid Engine

Dari PaloDozen

Sun Grid Engine (SGE) adalah manajer sumberdaya pada sistem kluster. SGE mampu membagi penggunaan CPU, Memori, Perangkat lunak, lisensi pada sistem kluster dengan efisien.

Daftar isi

Pemasangan

Pada Rocks Cluster 5.x, SGE sudah terpasang sebagai paket bawaan. Jadi tinggal pakai.

Persiapan Memakai

Loginlah ke kluster seperti biasa (lihat Bantuan:Memakai_Kluster). Untuk meyakinkan apakah SGE sudah siap dipakai, panggil perintah berikut:

$ echo $SGE_ROOT
/opt/gridengine

$ which qsub
/opt/gridengine/bin/lx26-amd64/qsub

Kemudian sebagai root eksekusi perintah:

qconf -as frontend-name

Memakai Command Line

Buat anda yang suka mengetik daripada meng-klik, SGE lebih enak digunakan dari terminal. Secara umum, ada 5 langkah memakai SGE.

Membuat Script

Script adalah program kecil yang akan meluncurkan program utama, dimana program utama ini adalah kerjaan yang akan dibagikan ke kluster. Misalkan kita akan meluncurkan program mpi-test yang sudah dibuat di petunjuk Message Passing Interface. Maka kita buat script mpi-ring.sh sebagai berikut:

#!/bin/bash
#
#$ -cwd
#$ -j y
#$ -S /bin/bash
#
# 5 baris diatas ketik apa adanya.
# Baris berikut sesuaikan untuk meluncurkan program utama

/opt/openmpi/bin/mpirun -np $NSLOTS $HOME/test/mpi-ring

Mengirim Kerjaan

Luncurkan script mpi-ring.qsub dengan perintah:

$ qsub -pe orte 16 mpi-ring.sh

Di sini "16" menyatakan jumlah prosesor yang akan digunakan.

Setelah kerjaan diluncurkan, anda tinggal menunggu. Jika perlu silahkan keluar (logout) dari sistem, dan kembali kapan saja.

Memantau Kerjaan

Untuk memantau kerjaan, panggil

$ qstat
$ qstat -f


Menghapus Kerjaan

Kalau tah-tahu anda berubah pikiran dan ingin membatalkan kerjaan, panggil

$ qdel 10

Dimana "10" adalah ID kerjaan (bisa dilihat dengan qstat).

Melihat Hasil

Ada dua file yang bisa dilihat setelah SGE berjalan, yakni:

  • mpi-ring.qsub.o
  • mpi-ring.qsub.e

bisa anda lihat isinya dengan mc (pakai menu View, F3).

Memakai GUI

SGE menyediakan layar GUI yang barangkali lebih nyaman bagi anda. Untuk memakai mode ini, dari terminal login panggillah

[tamu@dozen]$ qmon &

Pada layar klien akan muncul tampilan GUI. Berkas:SGE_QMON.png


Trouble Shooting

Tidak ada queue

Jika saat menngirim pesan ada error:

$ qsub launch.sh
Unable to run job: warning: user_name your job is not allowed to run in any queue
Your job 16 ("launch.sh") has been submitted.
Exiting.

Itu artinya instalasi sge gagal, sehingga tidak ada queue. Coba periksa

# qconf -sql
no cqueue list defined

Membetulkannya adalah :

echo "group_name  @allhosts" > /tmp/hostqueue
echo "hostlist    NONE" >> /tmp/hostqueue
qconf -Ahgrp /tmp/hostqueue
qconf -sq > /tmp/hostqueue
sed -e "/qname/s/template/all.q/" \
    -e "/hostlist/s/NONE/@allhosts/" \
    -e "/pe_list/s/NONE/make/" /tmp/hostqueue > /tmp/hostqueue.q
qconf -Aq /tmp/hostqueue.q
rm -f /tmp/hostqueue*

Kontributor: Mursito