•Oracle Database 10g Release 2 <Insert Picture Here> •EM 을 이용한 Oracle Data Guard 구성방안 EM 을 이용한 오라클 DataGuard 구성방안 (RAC + EM + DataGuard) Oracle Korea Agenda • 1. 제안 개요 • 2. 제안 솔루션 소개 • 가용성 보장을 위한 Oracle RAC • 재난복구(DR) 복제 솔루션 • 3. 구축 및 운영 방안 • EM을 이용한 DataGuard 구축방안 • 4. 관리방안 • EM을 이용한 RAC 모니터링방안 • 5. 시스템 구성도 EM 을 이용한 DataGuard 시스템 구성도 • 6. 참조고객 2/67 <Insert Picture Here> 1. 제안 개요 3/67 제안 개요 • 개요 • 글로벌 기업으로서 경제의 유동성과 시장의 빠른 변화에 적응하면서 예측할 수 없는 비즈니스 장애요소에 대처하기 위함 • 일반적인 장애요소로 부터 글로벌 기업의 IT 인프라를 보호하기 위함 • 예측할 수 없는 Unplanned System down 및 예측 가능한 Planned system down( ex: Database patch 및 Upgrade ) 상황으로부터 비즈니스의 연속성을 유지 하기 위함. • 고객 요구사항 : • 장애 발생시 시스템 가용성 보장을 위한 안정적인 운영 솔루션 • 두 시스템간의 Data 동기화 및 장애복구 솔루션 4/67 <Insert Picture Here> 2. 제안 솔루션 소개 5/67 제안 솔루션 소개 • 고객 요구사항 : • 장애 발생시 시스템 가용성 보장을 위한 안정적인 운영 솔루션 • 두 시스템간의 Data 동기화 및 장애복구 솔루션 • 가용 솔루션 • Oracle RAC 솔루션 • Oracle Data Guard ( Database 복제 솔루션 ) • 오라클에서 제안하는 보광휘닉스파크 제안솔루션 • 무정지 서비스 가용성 향상을 위한 Oracle RAC • 재난대비 복제 솔루션 Oracle DataGuard • 관리 및 통제를 위한 Enterprise Manager Console 6/67 <Insert Picture Here> 24*365 무정지 가용성 및 확장성 보장을 위한 이중화 솔루션 - Oracle RAC 7/67 고가용성의 클러스터링기술 및 장애복구 기능:RAC • 오라클은 고가용성 지원을 위한 틀러스터링 기술로써 오라클 클러스터 데이터베이스인 Real Application Clusters ( RAC )를 제공합니다. • 클러스터링 기술 개요 • 오라클 RAC을 사용하면 한 노드에 장애가 발생하더라도 서비스는 지속됩니다. • 다른 벤더의 데이타베이스를 사용하면서 프로세서의 장애와 같은 상황에 의한 서비스 다운 현상을 막기 위해서는, 별도의 SMP 서버를 구매해서 대기 상태로 두어야 할 것입니다. 이러한 구성을 cold standby 혹은 active/passive 구성이라고 합니다. 이 구성은 단점은 장애 복구의 시간이 오래 걸린다는 것과 비용이 많이 든다는 것입니다. 그러나 오라클 RAC는 디스크를 공유하는 active/active 구성되기 때문에 서비스 다운 현상을 막을 수 있습니다. • 장애 복구 시간 • 오라클 RAC을 사용하면 장애 복구 시간이 5~30초 혹은 수초면 됩니다. • 오라클 RAC은 위의 복구 단계가 필요없습니다. • 살아 있는 노드에 접속되어 있는 사용자는 그대로 해당 노드들을 사용하면 되고, 단지 장애가 발생된 노드에 접속되어 있던 사용자만 자동으로 재접속 됩니다. 이 부분에 있어서, 오라클은 사용자들을 백업 노드에 미리 접속을 시키는 기술을 제공하는데, 이 경우 재접속의 지연 시간도 제거할 수 있습니다. 마지막으로 살아 있는 노드들의 버퍼 캐쉬는 자주 액세스되는 데이터를 캐슁하고 있으므로, 곧바로 고성능에 도달하게 되는 것입니다. 8/67 고가용성의 RAC 의 가용성 • 가용성 • 물리적인 노드가 독립적으로 운영되기 때문에 하나 이상의 노드에 장애가 발생하더라도 클러스터의 여타 노드에 영향을 미치지 않습니다. (폴트 톨러런스) • 클러스터 시스템은 단 하나의 노드만이 생존하더라도 서비스가 가능합니다. (고도의 가용성을 실현) • 유지보수를 위해 노드 그룹이 오프라인으로 되어 있는 동안 나머지 클러스터가 서비스를 할 수 있습니다. No Single point of Failure Node A 9/67 Node B Node A in an RAC cluster fails, users are migrated Node A Node B 고가용성의 RAC (정상운영) Availability 부문 – Failover 원리 • 정상 운영 환경 – Active/Active의 서비스 지원 노드 1 인스턴스 ‘A’ Active 노드 2 인스턴스 ‘B’ Active Database (공유 디스크) 10/67 • • • • • 모든 노드가 Active 클라이언트의 부하 분산(Load Balancing) 동일한 데이터 환경 제공 (Share Disk) Server Failure 자동 감지 Node간의 Resource Pooling 고가용성의 RAC (장애발생) Availability 부문 – Failover 원리(계속) • Server Failure 발생시 – 지속적으로 투명한 서비스 기능 TAF 노드 1 인스턴스 ‘A’ Failure 장애발생 노드 2 인스턴스 ‘B’ Still Active • • 인스턴스 ‘A’ 대한 Recovery를 ‘B’에서 수행(무결성 보장) • Database (공유 디스크) • • 11/67 장애를 대비한 운영모드 1. TAF (Transparent Application Fail-Over) 를 통한 DB 세션을 자동으로 복구. Application은 Node의 장애를 감지 못함 나머지 노드가 대신 실패한 노드의 모든 작업을 분담하여 작업 지속 2. FCF(Fast Connection Failover), FAN(Fast Application Notification)으로 5 ~ 30초 내에 모든 작업 을 정상화 모든 작업 자동 진행 RAC를 이용한 물리적 H/A 효과 – RAC High Availability 측면 - 물리적 구조 ( 2노드 예시) Fast Ethernet Switch Primary line or Active line Fast Ethernet Switch Second line NIC2 NIC2 NIC0 NIC0 NIC1 NIC1 NIC5 NIC5 NIC3 NIC3 NIC4 NIC4 interconnect interconnect Shared Disk Type 1. RAW device 2. Shared CFS 3. Oracle ASM 12/67 서버 뿐만 아닌 모든 H/W 장비가 고가용성을 위해 이중화 구조 권장 Gigabit Switch Gigabit Switch SAN Switch SAN Switch OCR Voting Disk 노드간의 DB Buffer Cache 데이터 처리를 빠르게 하기위해 클러스터 Interconnect는 Gigabit 이상의 대역의 Switch 장비 필요 데이터베이스 시스템 데이터 및 각종 고객 데이터가 공유 디스크에 저장됨. 공유 디스크 구조로는 볼륨 매니저에 의해 관리되는 Raw device, 3th벤더의 공 유 클러스터 파일 시스템, 오라클 제공 ASM (Automatic Storage Management)의 세가지 유형 중 선택 적용 가능 RAC를 이용한 Instance H/A 효과 – RAC 신속한 Failover 및 Instance복구측면 - HW적 HA 절차 비교 HW적 HA 적용 시 Oracle RAC 기반의 자동 Failover Giga bit Switch ACTIVE STANDBY ACTIVE ACTIVE 노드-2 Oracle10g 노드-3 Oracle 10g RAC SAN Switch 1) Active시스템에서만 서비스 처리 수행 2) Active시스템 장애시 백업용(Standby)시스템으로 Failover 수행 - 백업시스템으로 복구 및 처리 절차 ① 운영시스템 Disk 절체 ② Standby시스템으로 Disk Mount ③ Mount된 Disk의 File시스템 Check ④ DB Startup시 Instance Recovery 수행 ⑤ DB 정상화 후 Application Start 3) Standby시스템이 Active 되어 서비스 처리 수행 최소 5분 ~ 30 분 이상 소요 13/67 1) Active-Active 시스템에서 모두 서비스 처리 수행 2) 한쪽 운영시스템 장애시 백업용(Standby)시스템으로 Failover 수행 - 장애시 복구 및 처리 절차 ① 다른 Active시스템에서 장애난 Instance의 Recovery 즉시 수행 ( 데이터 무결성 보장을 위해 장애난 시스템 의 미 반영된 Log 및 Undo 데이터 처리) 3) 다른 Active시스템에서 서비스 즉시 처리 수행 최소 20초 ~ 60 초 전후 소요 <Insert Picture Here> 재난복구(DR) 복제 솔루션 - Oracle DataGuard 14/67 Database 관리자의 도전과제 • Site 전체에 정전, 지진 과 같은 천재지변으로 장애가 발생했다면 대응방안은 ? • 만일 사용자가 실수 로 Data 를 일부 또는 모두 삭제 또는 전체 Update 했다면 ? • 노후된 disk 또는 갑작스런 instance down으로 블록 corruption이 발생했다면 ? • 다른 복제 솔루션을 사용했더라도 Online 상의 Transaction 마지막 Data 까지 안전하게 보장 할 수 있을까 ? • 만약 장애 발생시 복구 시도가 실패 했다면 또 다른 백업SET 은 ? • 장애 발생시 복구수행전 장애시점의 DATA 를 백업 후 복구를 시도 하라고 권장합니다. 긴급한 장애발생시 관리자는 백업을 받아 놓고 복구를 시도 할 시간적 여유가 있을까 ? • 장애복구 실패 시 최후의 보류는 ? • 만약 대용량 Data 장애에 대해 복원시도가 오래걸린다면 복원한다고 의미가 있는가? • 장애 복구시 Index 와 같은 다른 Object 에 대해서는 ? 15/67 Oracle Data Guard 개요 • 개요 • Standby 데이터베이스를 생성하여 운영 데이터베이스의 재난 상황에 대비할 수 있으며, 오라클 엔터프라이즈 서버에 구현되어 있는 기능을 이용하는 소프트웨어 솔루션이다 • Redo 데이터를 전달하고 적용하는 방식으로, 운영과 Standby 데이터베이스의 일관성을 유지한다 • 운영과 Standby 데이터베이스의 거리 제약이 적다 • 오라클 데이터베이스 내의 데이터만을 보호대상으로 한다 • 계획된 유지보수를 위한 switch over와 불시의 장애발생에 대한 failover를 지원한다 • GUI를 통한 손쉬운 구성과 제어 • 동기적 Log 전송에의한 데이터 무손실 보장 • 실수및 corruption으로 인한 전파 방지 16/67 Data Guard 이점 • Data Guard 기능 • • • • • • • Site Failures 에 대한 DR Solution 물리적, 논리적, Online Data 에 대한 이중화 사용자 실수로 인한 즉각적인 Data 손상방지 대용량( TB) Data 에 대한 빠른 복구 Rolling Upgrades 장애 복구 실패 시 할 수 있는 최후의 보류 사용자 실수 및 블럭corruption으로 인한 전파 방지 • 대기 시스템의 활용 • 필요시 동일한 테스트 시스템 환경제공 • 운영Database 대신 Standby database에서 백업 함으로써 운영부담 절감 • 레포트 시스템, Summary 시스템으로 활용 • Data Guard 구성시 고려사항 • • • • 17/67 근거리 또는 원거리 Data 복제 Physical or Logical Standby DB Synchronous or asynchronous redo shipping SQL> Alter Database Force LOGGING; Oracle Data Guard 활용 • Oracle Maximum Availability Architecture(MAA) • Oracle RAC로써 H/W적인 장애에 대비하고, Data Guard로써 디스크 장애나 재난 상황에 대비한다 18/67 무장애/무정지 시스템을 위한 Oracle솔루션 최대 가용성 Solution : MAA(Maximum Availability Architecture) 기반의 24X365 고가용성을 위한 DB 구성 ( RAC + DataGuard ) RAC Primary Site (평창) Broker Primary Database • • • • Standby Site (제주) Data Guard Primary Site 는 시스템 장애 대비 RAC 로 구성 운영 재해 및 디스크 장애 대비 Standby Site는 Data Guard 로 구성 end-to-end Data Protection and HA Single 구성환경처럼 관리 가능 19/67 Standby Database 무장애/무정지 시스템을 위한Oracle솔루션 • 모든 경우의 데이터 장애 대처 방안 Dramatic Advances in Ease of Use Data Guard Flash Recovery Area Flashback Human Error ASM Mirroring Protection Storage Failure Protection 20/67 Corruption Protection Site Failure Protection Combine the Features to Achieve Any Level of Data Protection Oracle Database 10g 가용성 • 데이터 장애 대처 방안 – Site장애(DR) 대처 (Data Guard) • Oracle Database 10g에서 제공하는 Data Guard는 서버 머신의 다운 또는 자연 재해와 같은 사고 때문에 데이터베이스의 데이터를 접근 하지 못하는 경우 대비하여 데이터베이스의 계속적인 서비스를 가능하게 하는 환경을 지원하기 위한 기능으로 데이터베이스의 고가용성과 장애 극복을 위해 다음과 같은 기능을 제공합니다. • 일관성 있는 관리 인터페이스 Physical Standby Database • 물리적 스탠바이 데이터베이스를 자동으로 생성 • Failover와 Switchover 기능 • 물리적 결함에 대한 보호망 Sync or Async Redo Shipping Production Database • 로그 전송 서비스에 대한 설정 Backup Redo Apply DIGITAL DATA STORAGE DIGITAL DATA STORAGE Networ k Broker Optional Delay • 로그 적용 서비스에 대한 설정 • 모니터링, 경고와 제어 메커니즘 Logical Standby Database Transform Redo to SQL • 논리적 스탠바이 데이터베이스 지원 Open for Reports • Auto Failover 지원(10g Release 2) Optional Delay 21/67 SQL Apply Additional Indexes & MVs Oracle Data Guard Architecture Physical Standby Database Sync or Async Redo data 동기화 Backup 현재운영 Database Redo Apply Network DIGITAL DAT A ST ORAGE Broker Transform Redo to SQL Logical Standby Database SQL Apply 22/67 DIGITAL DAT A ST ORAGE Open for Reports Additional Indexes & MVs Oracle Database 10g 가용성 • 데이터 장애 대처 방안 – Site장애(DR) 대처 (Data Guard) • 데이터 가드 REDO 적용 (Physical Standby Database) • Production Database 에서 생성된 Redo 데이터를 Standby Database에 전송하고 전송된 데이터를 복구 모드에 있는 대기 데이터베이스에 적용합니다. • 물리적 대기 데이터베이스는 읽기/쓰기로 Open하여 리포트용도 또는 Batch Job실행, Backup, TEST용도 등으로 적극 활용할 수 있습니다. 쓰기로 Open후 되돌리기는 10g Release 2의 새로운 기능입니다. Data Guard Broker Physical Standby Database Primary Database Optional Delay Backup Network Sync or Async Redo Shipping 23/67 DIGITAL DATA STORAGE Redo Apply Oracle Database 10g 가용성 • 데이터 장애 대처 방안 – Site장애(DR) 대처 (Data Guard) • 데이터 가드 SQL 적용(Logical Standby Database) • SQL 적용 모드에서의 데이터 가드는 아카이브 로그로 부터 변경된 내용을 SQL 트랜잭션으로 생성하여 이를 대기 데이터베이스에 적용합니다. SQL을 적용하기 때문에 대기 데이터베이스는 정성적인 Open해서 사용이 가능하며 Production 데이터베이스와 다른 물리적인 구조를 가질 수 있다. 이를 논리적 대기 데이터베이스라 부릅니다. • Primary 사이트의 정지 없이 논리적 스탠바이의 인스턴트를 지원합니다. Additional Indexes & Materialized Views Data Guard Broker Primary Database Optional Delay Logical Standby Database Continuously Open for Reports Network Sync or Async Redo Shipping 24/67 Transform Redo to SQL and Apply Oracle Database 10g 가용성 • 데이터 장애 대처 방안 – Site장애(DR) 대처 (Data Guard) • REAL TIME APPLY AND FLASHBACK DATABASE • Oracle Database 10g의 데이터 카드에서는 FLASHBACK 데이터베이스를 이용하여 실시간 적용과 통합을 지원합니다. • 실시간 (Real Time) 기능은 로그 적용 서비스(Log Apply Services)가 Primary 데이터베이스로 부터 리두 데이터를 받자 마자 Standby 데이터베이스의 Current 로그의 아카이브 로그 생성의 기다림 없이 바로 적용을 할 수 있습니다. • 이러한 기능은 빠른 역할 변경 (switchover, failover)을 가능하게 하여 비계획/계획된 다운타임을 최소화 시켜줍니다. Reporting Production Database Transaction Shipping (Real Time Apply) Standby Database On Real Time Data Some Nodes Used for Other Computing No Delay 25/67 Flashback Log Flashback Log Oracle Database 10g 가용성 • 데이터 변경 대처 방안 – Online상의 여러 Operation (Online Reorganization) • 인터넷 비즈니스는 항상 응용 시스템이 항상 가용해야 되며, 계획된 유지보수를 할 경우라도 데이터베이스에 대한 접근은 계속되어야 합니다. 또한, 데이터가 데이터베이스에 삽입과 삭제됨에 따라 객체는 조각나게 되므로 때때로 객체 저장 속성은 대용량 데이터를 처리하기 위해서 변경되어야 할 필요가 있습니다. • 온라인 스키마 재정의 ( add, modify, drop column) • 온라인 인덱스 재구성 ( create, recreate, replace • 온라인 테이블 재구성 (온라인 재구성 시, Update 및 Query 지속) Source Table Copy Table Transfor m Result Table GUI interface to make it Simple Update Tracking 26/67 Store Updates Transfor m Updates Data Guard: 동기화/서비스 전환 Automatic Failover 운영 (Primary) 데이터베이스 Data 동기화 Data Guard • Synchronous or asynchronous redo shipping • Corruptions don’t propagate • Thousands of production customers 27/67 물리적/논리적 Standby DB 최장거리 Data복제 솔루션 Data Guard DR Sweet Spot • Far enough to avoid regional disaster • Close enough for zero data loss 1mile = 1609.34m 100 miles 200 miles Data Guard: Synchronous Redo Shipping Synchronous Disk Mirroring • Data Guard redo transport uses order of magnitude less network messaging than disk-based remote mirroring • Enables zero data loss at hundreds of miles 28/67 300+ miles Down Time 최소화 방안 방안1. RAC를 통한 Oracle Instance의 이원화를 통한 Down Time 최소화 DBMS 환경 A Server B Server A Instance B Instance Live DB Patch Set 및 Upgrade의 경우, 2시간 이상의 서비스 정지 발생 Single 패치 적용 시 다운 타임을 최소화 시킬 수 있다. 패치의 적용을 각 인스턴스 별로 수행하고, 나머지 서버를 통해 서비스를 계속 진행한다. 29/67 Down Time 최소화 방안 방안2. 이원화된 서버 및 Logical Standby DB를 통한 Down Time 최소화 DBMS 환경 A Server B Server New SVR1 New SVR2 B’ Instance A’ Instance Oracle DataGuard A Instance B Instance Live DB Flashback Standby DB Flashback Live DB와 Standby DB간을 Oracle Data Gurard에 의해 Logical Standby DB로 구성하며 Data를 동기화 한다. Oracle DataGuard를 사용할 경우 Automatic Archive apply 및 Manual Archive apply가 가능하며 시스템 Failover 및 switchover 기능을 이용하여 switchover 및 takeover가 가능하다 먼저, Standby DB로의 Redo SQL Apply를 중지하고, Standby DB의 인스턴스 A’, B’를 Down한 후, Patch Set을 적용한다. Standby DB의 패치 작업 후, A’, B’를 기동하여, Primary로부터 지금까지 적용된 내용을 동기화 한다. Live DB로의 Patch Set적용은, Standby DB로 switchover한 후 Standby DB에서 사용자 서비스를 수행하고 Live DB의 Oracle A,B Instance를 Down 한 후 Oracle Patch 및 변경 작업을 수행 한다. Live DB Oracle Patch Set작업 완료시, Standby DB에서 Live DB로 takeover 한 후 Liver DB에서 사용자 서비 스를 수행하면 된다. 30/67 Down Time 최소화 방안 방안3. 동일 서버 상에 이원화된 Logical Standby DB를 통한 Down Time 최소화 DBMS 환경 A Server B Server A Instance A’ Instance Live DB B Instance B’ Instance Oracle DataGuard Standby DB “이원화된 서버 및 Logical Standby DB를 통한 Down Time 최소화” 방안과 운영 방안은 동일함 별도의 서버가 필요하지 않으며 기존 시스템에 메모리 및 Live DB 와 동일한 Size의 Disk가 필요하다 시스템 Down Time의 경우 방법 1과 비슷하지만 Standby DB 재구성 및 Data Guard 반영 시간이 방법 1에 비해 편리하다 별도의 서버 구성이 필요하지 않기 때문에 2안 보다 투자 비용이 적게 든다 시스템 Down time 은 방법 2안과 동일하다. Cluster 와 관련된 작업이 발생할 경우 (Crs Patch) 모든 Instance를 Down해야 한다. 31/67 <Insert Picture Here> DataGuard - Physical Standby (Redo Apply) 32/67 Standby Database 운영모드 • Managed Recovery Mode • 운영 데이터베이스에서 발생한 Redo Log를 Standby 데이터베이스에 전달하고, Standby 데이터베이스는 이를 적용한다 • Standby 데이터베이스를 오픈할 수 없다. • Read-Only Mode • 운영 데이터베이스가 보내는 Redo Log는 계속해서 받아둔다 • Redo Log의 적용을 멈추고, Standby 데이터베이스를 읽기 전용으로 오픈한다 • Standby 데이터베이스에 질의문을 수행하여, 필요한 리포팅을 할 수 있다 33/67 Oracle Data Guard 설정 모드 • Data Guard 설정 모드 • 보호 모드(Maximum Protection) • 최소한 하나의 Standby 서버에 트랜젝션 데이터가 Commit 처리 됨을 확인하기 전까지 운영머신의 트랜젝션은 commit 되지 않습니다. 2개 이상의 Standby database 운영 권장 • 가용 모드(Maximum Availability) • 최소한 하나의 Standby 서버에 트랜젝션 데이터가 Commit 처리 됨을 확인하고 운영머신의 트랜젝션은 commit 처리 함. • Maximum Protection 모드로 운영되다가, Standby쪽에 Redo Log가 기록될 수 없는 상황이 발생하면, Maximum Performance 모드로 전환된다. • 연결 재개시 즉시 운영머신의 누적된 Archive log 를 이용하여 데이터베이스간 동기화를 자동으로 수행됨. • 운영과 Standby에서의 Redo Log 의 적용 차이가 복구되면 다시 Maximum Protection 모드로 운영됩니다. • 성능 모드(Maximum Performance) • 기본 모드이다 • Standby쪽에 Redo Log가 기록되는 것은, 운영쪽 트랜잭션의 commit과는 상관없다. • Redo Log의 변경내용이 비동기식으로 전달된다 34/67 Flexible Data Protection Modes Protection Mode 재해 발생시 데이터 손실의 위험 Redo Shipment Maximum Protection 손실 전혀 없음 Double Failure Protection LGWR, SYNC Synchronous redo shipping to 2 sites Maximum Availability 손실 전혀 없음 Single Failure Protection LGWR, SYNC Synchronous redo shipping Maximum Performance Minimal data loss – usually 0 to few seconds LGWR ASYNC/ARCH Asynchronous redo shipping Balance cost, availability, performance, and transaction protection 35/67 고가용성 지원을 위한 장애복구 솔루션 • 오라클은 고가용성 지원을 위한 장애복구 기능으로써 Oracle만의 강력한 Flashback 및 다양한 복구기능을 아래와 같이 제공합니다. • • • • • 데이터 장애 대처 방안 – Flashback Database • Oracle Database 10g 이전까지는 transactional point-in-time recovery를 위해서는 backup용 file과 redo log file을 이용하여 원하는 시간까지의 복구를 하였었습니다. 그러나 이 방법은 backup용 file이 오래된 것이며, archive log가 많이 쌓여 있을 때는 많은 시간이 소요된다. Oracle 10g부터는 flashback database를 이용하여 윈하는 시점으로 수초~수분내의 recovery가 가능하게 되었습니다. Flashback Drop & Flashback Table • Oracle 10g부터는 recycle bin(휴지통)이 있어서 어떤 table을 drop하면, drop된 table과 해당 table과 관계되는 object들을 되살릴 수 있게 되었습니다. Flashback Version Query • Flashback Versions Query는 Select시 versions between명령을 넣으면 해당 정보의 history 정보를 확인하고 보구할 수 있는 기능입니다. Flashback Transaction Query • Flashback Transaction Query는 아래의 그림과 같이 user의 실수로 잘못된 query를 수행하였을 경우, 해당 query를 undo할 수 있기 때문에 human error에 대한 복구를 더욱 손쉽게 할 수 있습니다. 로그마이너(Logminor) • • 리두 로그의 정보를 해석하고 분석할 수 있는 툴로서 데이터베이스의 논리적 결함을 진단하고, 상세한 복구를 수행할 수 있는 기능을 제공합니다. Data Guard • Oracle Database 10g에서 제공하는 Data Guard는 서버 머신의 다운 또는 자연 재해와 같은 사고 때문에 데이터베이스의 데이터를 접근 하지 못하는 경우 대비하여 데이터베이스의 계속적인 서비스를 가능하게 하는 환경을 지원하기 위한 기능으로 데이터베이스의 고가용성과 장애 극복(DR)의 기능을 제공합니다. 36/67 <Insert Picture Here> Data Guard 의 주요 기능 37/67 Switchover • • • • 운영시스템/하드웨어 업그레이드 오라클데이터베이스에 대한 패치 셋 롤링 업그레이드 재해 복구 환경 점검 테스트를 위해서는 운영 데이터베이스에 대한 모든 사용자 세션을 해제 한 후 테스트를 진행함 • DGMGRL> SWITCHOVER TO Standby_Chicago; 38/67 Role Change – 역활전환 이벤트 • 현재의 운영중인 데이터 베이스가 더 이상 운영모드로 전환 하지 않음을 어플리케이션에 통보하기 위한 이벤트 기능 추가 • DB_ROLE_CHANGE 시스템 이벤트 • DB_DOWN FAN (Fast Applicaion Notification) 이벤트 • FAN 이벤트 수신 하도록 설정 => OCI Client 로 통보 • Data Guard + RAC • 데이터베이스 레벨의 가용성과 시스템 레벨의 가용성을 동시에 구현 39/67 Manual Failover • 관리자가 EM GUI, DGMGRL, SQL*Plus 이용하여 페일오버 과정에서 타겟 스텐바이 데이터베이스를 선택하여 전환함 • DGMGRL> FAILOVER TO Standby_Chicago; 40/67 Fast-Start Failover Primary Site Standby Site Observer 4. Observer <=> primary connection times out (timeout threshold configurable) 5. Observer asks target standby if it is ready to fail over 6. Observer begins Fast-Start Failover 41/67 운영방안1 – 읽기 전용 OPEN • Physical Standby 데이터베이스를 읽기 전용으로 open 하고 레포트 및 기타 Summary 작업 수행 읽기 전용 모드에서는 복구작업을 수행할 수 없기에 잠시 복구 작업을 중지 시킵니다. SQL> ALTER DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL; 아래 명령어로 읽기 전용 모드로 Open 됩니다. SQL> ALTER DATABASE OPEN; 42/67 운영방안2 – 테스트 DB 로 읽기 쓰기 (FLASHBACK 전환) • DATA GUARD 와 FLASHBACK 기능 조합으로 • 임시로 읽기/쓰기 모드로 전환 후 테스트작업 수행 • 다시 과거시점으로 Flashback 작업진행 후 Data Guard 가 다시 자동으로 Standby database 로 재동기화 됨으로써 본연의 DR 역활 수행 • Physical Standby 데이터베이스를 다시 재생성 하실 필요가 없습니다. SQL> ALTER DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL; SQL> CREATE RESTORE POINT t1 GUARANTEE FLASHBACK DATABASE; SQL> ALTER DATABASE ACTIVATE STANDBY DATABASE; 일기 / 쓰기 작업 진행하면서 레포팅 작업 수행수 SQL> FLASHBACK DATABASE TO RESTORE POINT t1; SQL> ALTER DATABASE CONVERT TO PHYSICAL STANDBY; 43/67 <Insert Picture Here> 3. 구축 및 운영방안 EM을 이용한 DataGuard 구축방안 44/67 Oracle Enterprise Manager를 이용한 Data Guard의 초기화면 45/67 Oracle Enterprise Manager를 이용한 Data Guard의 추가 46/67 Oracle Enterprise Manager를 이용한 Data Guard의 생성 47/67 Oracle Enterprise Manager를 이용한 Data Guard의 Add Standby Database 48/67 Oracle Enterprise Manager를 이용한 Data Guard의 Log Apply 49/67 Oracle Enterprise Manager를 이용한 Data Guard의 Protection Mode 50/67 Oracle Enterprise Manager를 이용한 Data Guard의 Switchover 51/67 Oracle Enterprise Manager를 이용한 Data Guard의 Failover 52/67 <Insert Picture Here> 4. 관리방안 EM을 이용한 RAC 모니터링방안 53/67 Oracle Enterprise Manager를 이용한 Data Guard의 Performance view 54/67 EM10g – 편리해진 RAC 환경 모니터링 • Monitor inter-instances communication 55/67 • Identify performance problems due to object contention EM10g – 편리해진 RAC 환경 모니터링 • Monitor & Alert private and public interconnects 56/67 • RAC –Topology management EM10g – 편리해진 RAC 환경 모니터링 성능 분석 및 튜닝 Pack • 튜닝 방안 권장 제시 • 다각적 방법의 문제 분석 • SQL 추출/튜닝/비교 기능 <과거/현재 실행 선택 후 비교 기능 제공> 57/67 <ADDM 성능분석 결과> 장애예방 및 모니터링 Performance • DB Performance Page에 호스트와 DB의 실시간 정보를 직관적으로 보여줌 • DB Performance Page로 부터 드릴다운 메튜를 통해 신속환 원인분석이 가능함 • DB Performance Page에 제공하는 다양한 링크를 통해 다양한 기준( Top Activity, Top Consumers)으로 모니터링 할 수 있음 • Host Performance Page는 CPU, 메모리, 디스크 사용률 등을 한 눈에 확인할 수 있음. Active Sessions는 크게 “CPU Used”(녹색) , “Application”(갈색), “Concurrency”(진갈색) 세 부분으로 이루어져 있음을 직관적으로 알 수 있다. Other Network Administrative Configuration Commit Application Concurrency System I/O User I/O Scheduler CPU Used 58/67 RAC DB Topology • RAC 구성 Topology Overview • 구성 Component 별 상세정보 Display • A Cluster database, Database Instances, ASM Instances, Listeners, Interfaces 59/67 CRS Topology RAC를 구성하는 Component의 Topology 및 상세설명 및 Status Summary 60/67 RAC DB Performance • Average Current/CR Block Receive Time에 대한 실시간 모니터링 • Cluster Cache Coherency 모니터링 61/67 Oracle Enterprise Manager의 기대효과 Oracle Enterprise Manager는 모든 Oracle 제품과 3rd vendor 제품을 관리하기 위한 전문 Enterprise Management Solution입니다. 특히 Oracle Database 서버에 대해서 모니터링, 성능분석,튜닝, Configuration 등의 종합적인 관리를 통해 장애를 예방하고 최적의 운영상 태를 유지함으로써 귀사의 IT서비스의 가용성과 품질를 향상시키고 시스템 관리비용을 절 감하여 귀사의 ROA(Return of Assets)를 극대화 시켜줄 것입니다. IT서비스 가용성과 품질향상 + 시스템 관리비용 절감 장애예방 & 모니터링 62/67 자동성능분석 & 튜닝 DB Administration RAC & CRS Adminstration Configuration & Change 관리 오라클제품 및 타사제품 지원 <Insert Picture Here> 5. 시스템 구성도 EM 을 통한 오라클 DR 솔루션 구성도 ( RAC + EM + DataGuard ) 63/67 EM 을 통한 오라클 DR 솔루션 구성도 EM Server RAC Primary Host : grid4.us.oracle.com Host : ora10gr2n1.us.oracle.com GridControl R4 (EM server)설치 Primary DB : ORCL2 Disk Device : File system Disk Device : Repository DB : Oracle 10.2.0.4 - raw device 또는 - ASM 또는 agent agent GC Agent : 10.2.0.4 Standby - Veritas Volume Manager file system Oracle 10.2.0.3 agent EM GC Agent : 10.2.0.4 Data Guard (Physical Standby) Data 동기화 switch over 전환가능 Host : ora10gr2n2.us.oracle.com Standby DB : ORCL2DG2 Disk Device : File system Oracle 10.2.0.3 GC Agent : 10.2.0.4 64/67 <Insert Picture Here> 6. 참조고객 65/67 Reference : Oracle Data Guard 아산 병원 • • • • Oracle 10g RAC로 구성 Oracle Data Guard가 DR 센터에 구축 RAC로 구성된 병원 종합시스템의 한쪽 노드에 Standby DB를 구성하여 Read Only 모드로 오픈하여 사용. Read Only 모드로 사용되는 Standby DB는 야간에 히다찌 투루카피 솔루션으로 데이타파일 복제를 통해 Consistency를 유지. 병원 종합시스템/인트라넷 병원 종합시스템/인트라넷 IBM AIX 5.2 P690 P4 16 CPU 48G RAM Oracle Database 10.1.0.3 IBM AIX 5.2 P690 P4 16 CPU 48G RAM Oracle Database 10.1.0.3 Oracle Database 10g RAC Standby Instance 구성 (10.1.0.3) Data 용량 : 2.4 TB 66/67 히다찌 트루카피 이용 DR 센터 Physical Standby IBM AIX 5.2 P590 P4 8 CPU Data Guard 24G RAM Log Shipping Oracle Database 10.1.0.3 References : • 국내외 다수의 기업에서 사용 • 대부분이 업무의 특성을 고려한 고 가용성의 Oracle Database RAC 와 Oracle Standby Database로 운영. • 아래에 기술한 고객들은 Physical Standby DB를 오픈하여 분석용 등의 용도로 데이타베이스를 활용하고 디스크 복제 솔루션을 활용하여 백업용도 및 다른 용도의 업무로 활용. 회사명 Standby DB 적용 업 무 Protection 모드 Maximum Performance DB 버전 삼성 서울 병원 의료 정보 검색 엔진용 서울 아산병원 병원 OCS 업무 분석용 서울대 병원 병원 OCS 업무 분석용 하나생명 보험 기간계 Maximum Performance 9.2.0.7 하이닉스 공장 자동화 Maximum Performance 9.2.0.4 청주 하이닉스 반도체 공장 자동화 Maximum Performance 9.2.0.4 청주 매그나칩 반도체 공장 자동화 Maximum Performance 10.2.0.3 67/67 Maximum Performance Maximum Performance 10.1.0.5 10.2.0.1 9.2.0.4