Press ESC to close

Oracle Clusterware Start-Up Failures and Troubleshooting Guide

Oracle RAC ortamlarında Clusterware servislerinin düzgün şekilde başlatılamaması, OCR erişim problemleri, Voting Disk hataları veya OHASD süreç sorunları gibi durumlar cluster erişilebilirliğini doğrudan etkileyebilir. Bu tür problemlerde doğru log dosyalarının incelenmesi, servis durumlarının doğrulanması ve gerekli recovery işlemlerinin uygulanması kritik önem taşımaktadır.

Oracle Grid Infrastructure; CRS, OHASD, OCR, OLR, Voting Disk ve network bileşenlerinin yönetimi için çeşitli komut satırı araçları sunmaktadır. crsctl, ocrconfig, ocrcheck, srvctl ve oifcfg gibi araçlar sayesinde DBA’ler cluster servislerini yönetebilir, hata analizleri gerçekleştirebilir ve recovery işlemlerini uygulayabilir.

Örneğin Clusterware servislerinin beklenildiği şekilde başlamadığı bir senaryoda aşağıdaki hatalar ile karşılaşılabilir:

$GRID_HOME/bin/crsctl check cluster

CRS-4639: Could not contact Oracle High Availability Services
CRS-4000: Command Check failed, or completed with errors


veya;


CRS-4535: Cannot communicate with Cluster Ready Services
CRS-4530: Communications failure contacting Cluster Synchronization Services daemon
CRS-4534: Cannot communicate with Event Manager

Bu tip durumlarda ilk olarak OHASD, CRS ve CSS servislerinin durumu kontrol edilmeli, ardından ilgili log ve trace dosyaları incelenmelidir.

OHASD ve CRS Servis Kontrolleri

Oracle High Availability Services (OHASD) süreçlerinde oluşabilecek başlıca hatalar aşağıdaki gibidir:

CRS-4639: Could not contact Oracle High Availability Services

veya

CRS-4124: Oracle High Availability Services startup failed
CRS-4000: Command Start failed, or completed with errors

Bu hatalar alındığında öncelikle aşağıdaki log dosyaları incelenmelidir:

  • Clusterware alert log
  • $GRID_HOME/log/<hostname>/ohasd/ohasd.log

Ayrıca otomatik başlatma yapılandırması aşağıdaki komutlar ile doğrulanabilir:

$GRID_HOME/bin/crsctl config has
$GRID_HOME/bin/crsctl config crs

Servislerin otomatik başlatılması ve manuel başlatılması için aşağıdaki komutlar kullanılabilir:

$GRID_HOME/bin/crsctl enable has
$GRID_HOME/bin/crsctl enable crs

$GRID_HOME/bin/crsctl start has
$GRID_HOME/bin/crsctl start crs

OHASD sürecinin işletim sistemi üzerinde çalışıp çalışmadığı aşağıdaki komut ile doğrulanabilir:

ps -ef | grep init.ohasd

Sorun devam ediyorsa OLR (Oracle Local Registry) erişimi, GRID_HOME izinleri ve ownership bilgileri kontrol edilmelidir. Gerekli durumlarda OLR aşağıdaki komut ile restore edilebilir:

ocrconfig -local -restore <backup_location>/<backup_filename>.olr

Clusterware Yönetiminde Sık Kullanılan Komutlar

Clusterware Start / Stop İşlemleri

crsctl start crs
crsctl stop crs

crsctl enable crs
crsctl disable crs

Cluster Servis Durum Kontrolleri

crsctl check crs
crsctl check cluster
crsctl check cssd
crsctl check crsd
crsctl check evmd

OCR ve Voting Disk Kontrolleri

crsctl query css votedisk
cat /etc/oracle/ocr.loc

ocrcheck

Voting Disk Yönetimi

Voting Disk ekleme, silme ve taşıma işlemleri aşağıdaki komutlar ile gerçekleştirilebilir:

crsctl add css votedisk <disk_path>

crsctl delete css votedisk <disk_path>

crsctl replace votedisk +DATA

OCR Backup ve Recovery İşlemleri

OCR Backup Kontrolleri

ocrconfig -showbackup auto

ocrconfig -showbackup manual

Manuel OCR Backup Alma

ocrconfig -manualbackup

ocrconfig -export <export_path>

OCR Restore İşlemi

crsctl stop cluster -all

crsctl stop crs

ocrconfig -restore <ocr_backup_path>

crsctl start crs

cluvfy comp ocr -n all

OLR (Oracle Local Registry) Yönetimi

Her cluster node üzerinde ilgili node’a ait bir OLR yapısı bulunmaktadır. OLR, node ile cluster arasındaki iletişim için kritik öneme sahiptir ve özellikle OCR ile Voting Disk ASM üzerinde bulunduğunda Clusterware başlangıcında aktif rol oynar.

OLR dosyası genel olarak aşağıdaki konumda bulunur:

$GRID_HOME/cdata/<hostname>.olr

OLR yönetimi için aşağıdaki komutlar kullanılabilir:

ocrcheck -local

ocrdump -local -stdout

ocrconfig -local -export <file_name>

ocrconfig -local -import <file_name>

ocrconfig -local -repair olr <file_name>

Clusterware Network Yönetimi

Cluster ağ yapılandırmalarını kontrol etmek için aşağıdaki komutlar kullanılabilir:

oifcfg iflist -p -n

oifcfg getif

srvctl config nodeapps -a

Public VIP Adresi Değiştirme

Bir node üzerindeki VIP adresini değiştirmek için öncelikle ilgili node üzerindeki servisler durdurulmalıdır.

srvctl stop service -d RDBA -s crm,hr -n rac1

srvctl config vip -n rac1

srvctl stop vip -n rac1

İlgili IP değişiklikleri sonrasında VIP aşağıdaki komut ile güncellenebilir:

srvctl modify nodeapps -n rac1 -A <new_vip_ip>

srvctl start vip -n rac1

İşlem sonrasında cluster node haberleşmesi doğrulanmalıdır:

cluvfy comp nodecon -n all -verbose

SCAN VIP ve SCAN Listener Yönetimi

SCAN VIP ve SCAN Listener işlemleri için aşağıdaki komutlar kullanılabilir:

srvctl add scan -n racdb-scan

srvctl remove scan -f

srvctl add scan_listener

srvctl add scan_listener -p <port>

srvctl remove scan_listener -f

srvctl modify scan -n cluster01-scan

srvctl modify scan_listener -u

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir