BigData

AWS 지원 데이터베이스 종류와 특징

IT오이시이 2025. 4. 15. 09:51
728x90

 
데이터베이스: • Amazon Aurora • Amazon DocumentDB(MongoDB 호환) • Amazon DynamoDB • Amazon DynamoDB Accelerator(DAX) • Amazon ElastiCache • Amazon Keyspaces(for Apache Cassandra) • Amazon Neptune • Amazon Quantum Ledger Database(Amazon QLDB) • Amazon RDS • Amazon Redshift • Amazon Timestream

 
AWS 지원 데이터베이스 종류와 특징

AWS 지원 데이터베이스 종류:
• Amazon Aurora
• Amazon DocumentDB(MongoDB 호환)
• Amazon DynamoDB
• Amazon DynamoDB Accelerator(DAX)
• Amazon ElastiCache
• Amazon Keyspaces(for Apache Cassandra)
• Amazon Neptune • Amazon Quantum Ledger Database(Amazon QLDB)
• Amazon RDS
• Amazon Redshift (Data Ware House)
• Amazon Timestream

 
 
각 데이터베이스 서비스의 특징, 기술 요소, 그리고 활용 방안을 상세하게 정리한 내용입니다.
 
 



 




1. Amazon Aurora

특징

  • 고성능 관계형 데이터베이스: Aurora는 MySQL 및 PostgreSQL과 호환되며, 전통적인 상용 데이터베이스보다 최대 5배(또는 PostgreSQL의 경우 3배) 향상된 처리량과 성능을 제공합니다.
  • 고가용성 및 내구성: 자동 복구, 멀티 AZ 배포, 그리고 데이터 저장소의 자가 복구 기능 덕분에 높은 가용성과 안정성을 보장합니다.

기술 요소

  • 분리된 컴퓨팅/스토리지: 컴퓨팅과 스토리지가 분리되어 있어 필요에 따라 독립적으로 확장할 수 있습니다.
  • 자동 확장 스토리지: 데이터 양의 변화에 따라 스토리지 용량을 자동으로 조절합니다.
  • 클러스터링 및 복제: 최대 15개의 읽기 전용 복제본을 지원하여 읽기 성능을 강화하고, 고속 장애 조치를 제공합니다.
  • Aurora Serverless 옵션: 사용량 기반 자동 확장 및 축소가 가능하여, 급격한 트래픽 변화에 유연하게 대응합니다.

활용 방안

  • 거래 및 트랜잭션 처리: 금융, 전자상거래, ERP 등 ACID 트랜잭션이 중요한 애플리케이션.
  • 실시간 데이터 분석: 낮은 지연 시간과 확장성을 활용해 백엔드 분석 및 대시보드 구현.
  • 모바일/웹 애플리케이션: 고가용성 데이터 저장소로 사용하여 사용자 경험을 극대화.

 


2. Amazon DocumentDB (MongoDB 호환)

특징

  • 문서 기반 데이터베이스: MongoDB API와 드라이버를 지원하여 기존 MongoDB 애플리케이션을 최소한의 변경으로 AWS 환경으로 이전할 수 있습니다.
  • 자동 관리: 고가용성, 자동 백업, 보안 패치 관리 등이 내장되어 있어 개발자는 애플리케이션 로직에 집중할 수 있습니다.

기술 요소

  • JSON 문서 저장: 유연한 스키마를 지원하며, 동적 데이터를 효과적으로 저장하고 쿼리할 수 있습니다.
  • 수평 확장: 읽기 인스턴스 추가를 통해 읽기 처리량을 손쉽게 확장할 수 있습니다.
  • 멀티 AZ 배포 및 자동 복제: 장애 발생 시 신속하게 복구할 수 있는 아키텍처.

활용 방안

  • 콘텐츠 관리 시스템(CMS): 유연한 JSON 스키마를 활용해 빠르게 변하는 데이터를 저장 및 관리.
  • 모바일/웹 애플리케이션: 사용자 프로필, 세션 데이터 또는 로그 데이터를 효율적으로 처리.
  • 데이터 중심 애플리케이션: 검색, 필터링, 집계 작업이 많은 애플리케이션에 적합.

 


3. Amazon DynamoDB

특징

  • 완전관리형 NoSQL 데이터베이스: 단일 자리수 밀리초의 응답 시간과 높은 처리량을 자랑하며, 서버 관리 부담이 전혀 없습니다.
  • 유연한 데이터 모델: 키-값 및 문서 모델을 모두 지원하여 다양한 데이터 처리 요구를 충족합니다.

기술 요소

  • 자동 스케일링: 요청량에 따라 자동으로 프로비저닝 또는 스케일 아웃이 이루어집니다.
  • ACID 트랜잭션 지원: 비록 NoSQL이라도 복잡한 트랜잭션 처리가 가능합니다.
  • DynamoDB Streams: 데이터 변경 이벤트를 실시간으로 캡처하여 Lambda 등과 연계할 수 있습니다.
  • 글로벌 테이블 기능: 여러 AWS 리전에 걸친 데이터 복제를 제공, 전 세계 사용자에게 빠른 응답을 보장합니다.

활용 방안

  • 실시간 애플리케이션: 게임, 전자 상거래, IoT 애플리케이션 등 즉각적인 응답이 요구되는 환경.
  • 모바일 백엔드: 빠른 데이터 접근과 확장성을 통해 사용 경험을 개선.
  • 이벤트 기반 서버리스 애플리케이션: 데이터 스트림을 활용해 비즈니스 로직을 트리거하는 아키텍처에 적합.

 


4. Amazon DynamoDB Accelerator (DAX)

특징

  • 인메모리 캐시 서비스: DynamoDB의 읽기 작업을 위한 전용 캐시 레이어로, 최대 10배 빠른 읽기 성능을 제공합니다.
  • 완전관리형 캐시: 복잡한 캐시 관리 없이 애플리케이션에 간단하게 통합할 수 있습니다.

기술 요소

  • 자동 장애 조치: 캐시 인스턴스 장애 발생 시 자동으로 복구하여 지속적인 서비스를 보장합니다.
  • 투명한 통합: DynamoDB 클라이언트 호출을 그대로 사용할 수 있어 애플리케이션 코드를 크게 수정할 필요가 없습니다.

활용 방안

  • 읽기 집중 워크로드: 사용자 세션 관리, 뉴스 피드, 실시간 데이터 보고 등 읽기 요청이 많은 애플리케이션.
  • 애플리케이션 속도 향상: 데이터 조회 응답 시간을 크게 줄여 사용자 경험을 개선.

 


5. Amazon ElastiCache

특징

  • 인메모리 데이터 스토어: Redis와 Memcached 두 가지 엔진을 지원하며, 초저 지연 응답을 제공합니다.
  • 데이터 캐싱: 백엔드 데이터베이스 또는 애플리케이션의 부하를 줄이기 위해 주로 캐시로 사용됩니다.

기술 요소

  • Redis: 데이터 복제, 지속성 옵션, 고급 데이터 구조, Pub/Sub 메시징 지원.
  • Memcached: 간단하고 빠른 캐싱 솔루션으로, 확장성이 뛰어나며 분산 캐시 환경 구축에 적합.
  • 수평 확장 및 자동 장애 조치: 클러스터 모드 및 복제 그룹을 통해 캐시 성능과 안정성을 보장합니다.

활용 방안

  • 웹 애플리케이션 가속화: 데이터베이스 부하를 줄이고 응답 속도를 높이기 위해 캐시 계층으로 활용.
  • 세션 스토리지: 로그인, 장바구니 등 사용자 세션 데이터를 빠르게 저장 및 검색.
  • 실시간 분석 및 메시징: Pub/Sub 기능을 이용해 빠른 데이터 스트리밍 및 이벤트 기반 시스템 구현.

 


6. Amazon Keyspaces (for Apache Cassandra)

특징

  • Cassandra 호환 서비스: Cassandra API와 CQL을 그대로 사용할 수 있으며, 서버리스 방식으로 운영되어 관리 부담 없이 수평 확장이 가능합니다.
  • 완전관리형 운영: 백업, 장애 조치, 보안 패치 등이 자동으로 관리되어 운영 편의성이 매우 높습니다.

기술 요소

  • 자동 스케일링 및 글로벌 복제: 데이터 증가에 따른 자동 스케일링과 다중 리전 복제를 제공하여 높은 가용성을 구현합니다.
  • CQL 지원: 기존 Cassandra 애플리케이션과 원활하게 통합할 수 있는 쿼리 언어 사용.
  • 높은 처리량 및 낮은 지연 시간: 분산 아키텍처를 통해 대규모 데이터 읽기/쓰기 처리에 최적화되어 있습니다.

활용 방안

  • 대규모 로그 및 센서 데이터 저장: 변화가 잦은 데이터의 빠른 저장과 조회에 효율적입니다.
  • 실시간 분석: 빠른 읽기/쓰기가 필요한 분산 애플리케이션에 이상적입니다.
  • 동적 스키마 환경: 데이터 모델의 유연성이 필요한 애플리케이션에서 효과적입니다.

 


7. Amazon Neptune

특징

  • 전문 그래프 데이터베이스: 복잡한 연결 관계와 노드 간 연관성을 빠르게 처리하는 데 최적화된 서비스입니다.
  • 이중 그래프 모델 지원: Property Graph와 RDF 두 가지 데이터 모델을 지원하여 다양한 그래프 쿼리 요구에 대응합니다.

기술 요소

  • Apache TinkerPop Gremlin 및 SPARQL 지원: 두 가지 주요 그래프 쿼리 언어를 지원하여, 개발자들이 친숙한 방식으로 쿼리를 작성할 수 있습니다.
  • 실시간 그래프 처리: 낮은 지연 시간과 ACID 트랜잭션 보장을 통해 복잡한 관계형 데이터를 빠르게 처리할 수 있습니다.
  • 고가용성과 복제: 멀티 AZ 배포 및 읽기 전용 복제본을 지원하여 안정적인 서비스 제공.

활용 방안

  • 추천 및 소셜 네트워크: 사용자 간의 관계와 추천 알고리즘 구현이 용이합니다.
  • 사기 탐지 및 네트워크 보안: 복잡한 연결 관계 분석을 통해 비정상 활동을 조기에 탐지할 수 있습니다.
  • 지식 및 관계 기반 데이터 모델링: 지식 그래프, 조직도, 네트워크 토폴로지 등의 도메인 모델링에 적합합니다.

 


8. Amazon Quantum Ledger Database (Amazon QLDB)

특징

  • 불변의 원장 데이터베이스: 모든 데이터 변경 기록을 투명하고 변경 불가능한 방식으로 저장, 감사 및 추적이 가능하도록 설계되었습니다.
  • 암호화 검증: 내장된 암호화 기능으로 데이터 무결성을 보장하며, 각 거래 기록이 변경 불가능한 저널에 저장됩니다.

기술 요소

  • ACID 트랜잭션: 높은 일관성 하에서 트랜잭션이 기록됩니다.
  • 자동 감사 기능: 모든 데이터 변경 사항이 자동으로 기록되어 추적 및 감사 시나리오에 활용됩니다.
  • 암호화 및 보안: 데이터 무결성 및 보안을 위해 암호화 알고리즘을 적용하여 변경 조작이 불가능합니다.

활용 방안

  • 금융 거래 기록: 모든 거래 이력을 신뢰성 있게 관리해야 하는 금융 및 보험 분야에 적합합니다.
  • 공급망 및 계약 추적: 계약 이행, 공급망 변경 기록 등 투명한 감사 기능이 요구되는 애플리케이션.
  • 규제 준수 및 감사 기록: 법적 책임 및 준수 체크가 필요한 비즈니스 환경에서 활용.

 


9. Amazon RDS (Relational Database Service)

특징

  • 다양한 데이터베이스 엔진 지원: MySQL, PostgreSQL, Oracle, SQL Server, MariaDB 등 다양한 관계형 데이터베이스 엔진을 선택할 수 있습니다.
  • 완전관리형 서비스: 소프트웨어 패치, 백업, 복제, 장애 조치 등 데이터베이스 관리를 AWS가 대신 처리합니다.

기술 요소

  • 자동 백업 및 스냅샷: 정기적으로 데이터베이스 백업을 생성하여 손실 위험을 최소화합니다.
  • 멀티 AZ 배포: 고가용성과 내구성을 위해 여러 가용 영역에 걸쳐 데이터베이스 인스턴스를 복제합니다.
  • 읽기 전용 복제본: 읽기 작업 부하 분산을 위한 복제본 생성 및 관리가 용이합니다.
  • 보안 및 모니터링: VPC, 보안 그룹, 암호화, IAM 및 CloudWatch와의 통합으로 안전하고 효율적인 운영 보장.

활용 방안

  • 전통적인 비즈니스 애플리케이션: ERP, CRM, 전자상거래 등 안정적인 관계형 DB가 필요한 업무 시스템.
  • 개발 및 테스트 환경: 비교적 짧은 프로젝트 주기 동안 손쉽게 배포하고 관리할 수 있습니다.
  • 데이터 집계 및 OLTP: ACID 트랜잭션을 보장해야 하는 온라인 트랜잭션 처리 시스템에 최적입니다.

 


10. Amazon Redshift (데이터 웨어하우스 서비스)

특징

  • 대규모 데이터 웨어하우스: 페타바이트 단위의 데이터를 빠른 속도로 분석할 수 있도록 설계된 서비스입니다.
  • 고성능 쿼리 처리: MPP(대규모 병렬 처리) 아키텍처와 컬럼 지향 저장소를 통해 복잡한 분석 쿼리를 효율적으로 처리합니다.

기술 요소

  • 열 기반 스토리지 및 데이터 압축: 컬럼 스토리지와 압축 기술을 통해 I/O 성능을 극대화합니다.
  • 대규모 병렬 처리 구조(MPP) :  Redshift의 클러스터 내에 리더 및 컴퓨팅 노드 계층 구조를 생성하여 데이터를 쉽게 분석할 수 있도록 지원. 병렬 처리를 통해 사용자는 시스템 지연 없이 여러 쿼리(정형 또는 반정형 데이터 포함)에서 작업 가능.
  • 자동 데이터 분산 및 스케일링: 데이터 로드 및 분산이 자동으로 관리되며, 클러스터 확장을 통해 성능을 유지합니다.
  • 보안 및 통합 기능: VPC, IAM, SSO, S3와의 연동 등 강력한 보안 및 데이터 통합 기능 제공.
  • SQL 기반 쿼리: 기존 SQL 쿼리 문법을 사용하여 복잡한 BI 및 분석 작업 수행.

활용 방안

  • 비즈니스 인텔리전스 및 분석: 대규모 데이터 집계 및 OLAP(Online Analytical Processing) 쿼리 처리.
  • 데이터 레이크 구축: 다양한 소스의 대용량 데이터를 통합 및 분석.
  • 리포팅 및 대시보드: 빠른 응답 속도로 실시간 데이터를 시각화하여 의사 결정에 도움을 주는 시스템.

 

 
 


11. Amazon Timestream

특징

  • 시계열 데이터 전용: IoT, 모니터링, 애플리케이션 로그 등 시간에 따른 데이터 저장 및 분석에 최적화된 서비스입니다.
  • 자동 데이터 수명 주기 관리: 최신 데이터와 오래된 데이터를 구분하여 비용 효율적인 저장소로 자동 이동합니다.

기술 요소

  • 고속 쓰기 및 읽기 처리: 초당 수십만 건의 데이터 포인트를 효율적으로 처리할 수 있는 인프라.
  • SQL 기반 시계열 쿼리: 시간 및 범위 기반 데이터를 쉽게 집계하고 분석할 수 있도록 최적화된 쿼리 언어 제공.
  • 자동 스케일링: 데이터 증가에 따라 자동으로 리소스를 조정, 안정적인 성능 유지.
  • 데이터 압축 및 분할: 시계열 데이터 특성에 맞춘 저장소 최적화 기술 적용.

활용 방안

  • IoT 센서 데이터 분석: 실시간 또는 배치 방식으로 센서 데이터를 수집, 분석, 시각화.
  • 애플리케이션 및 인프라 모니터링: 로그 데이터와 메트릭 데이터를 빠르게 분석하여 이상 징후 감지.
  • 산업 데이터 및 실시간 분석: 시간 기반 데이터를 활용하는 제조, 에너지, 스마트 시티 등 다양한 산업 분야에서 활용.

각 서비스는 AWS 클라우드의 강력한 보안, 확장성, 내구성, 그리고 통합 관리 기능을 바탕으로 특정 사용 사례에 최적화되어 있습니다.
 
 
 
AWS-Certified-Database-Specialty_Exam-Guide.pdf

728x90
반응형