일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 데이터 엔지니어
- 팀 프로젝트
- Kafka
- 코딩 테스트
- 데이터 시각화
- Snowflake
- superset
- AWS
- HTML
- SQL
- VPC
- airflow
- Tableau
- Selenium
- 슈퍼셋
- beuatifulsoup
- django
- GCP
- PCCP
- Spark
- 데브코스
- 코테 연습
- Til
- cloud platform
- 코딩테스트
- Today
- Total
주니어 데이터 엔지니어 우솨's 개발일지
데이터 엔지니어링 27일차 TIL 본문
학습 내용
SQL : 정형데이터 관리
NOSQL : 비정형데이터 관리 (Key-Value, Graph, Document, Column store 등)
RDS
-DB 인스턴스는 클라우드에서 실행하는 격리된 데이터베이스 환경이다.
- DB 인스턴스에는 여러 사용자가 만든 데이터베이스가 포함될 수 있으며, 독립 실행형 데이터베이스 인스턴스에 액세스할 때 사용하는 도구 및 애플리케이션을 사용해 액세스 할 수 있다.
- AWS 명령줄 도구, Amazon RDS API작업 또는 AWS Management Console을 사용해 간단히 DB인스턴스를 만들고 수정할 수 있다.
- RDS는 serverless가 아니다.
Document DB
- MongoDB API 워크로드의 완전 관리 및 유연한 확장이 가능한 문서전용(Document) 데이터베이스
- Amazon DocumentDB에서는 스토리지 및 컴퓨팅이 분리되어 각각을 독립적으로 조정
- 개발자는 데이터 크기에 관계없이 지연시간이 짧은 읽기전용 복제본을 몇분내에 최대 15개까지 추가하여 읽기 용량을 초당 수백만개의 요청으로 늘릴 수 있다.
- amazon DocumentDB는 99.99%의 가용성을 위해 설계되었으며 6개의 데이터 복사본을 3개의 AWS 가용 영역(AZ)에 복제.
- JSON 데이터 사용, 유연한 인덱싱
MongoDB
- Document지향 Database이다.
- 데이터 중복이 발생할 수 있지만, 접근성과 가시성이 좋다.
- 스키마 설계가어렵지만, 스키마가 유연해서 Appliciation의 요구사항에 맞게 데이터를 수용할 수 있다.
- 분산에 대한 솔루션을 자체적으로 지원해서 Scale-out이 쉽다.
- 확장 시, Application을 변경하지 않아도 된다.
Dynamo DB
- Amazon DynamoDB는 완전관리형 Key-Value 기반 NoSQL 데이터베이스 서비스이다.
- Auto-Scaling
- DynamoDB는 유휴 시 암호화를 제공하여 중요한 데이터 보호와 관련된 운영 부담 및 복잡성을 제거한다.
- DynamoDB를 통해 원하는 양의 데이터를 저장 및 검색하고 어느 수준의 요청 트래픽도 처리할 수 있는 데이터베이스 테이블을 생성할 수 있다.
- AWS Management Console을 사용하여 리소스 사용률 및 성능 지표를 모니터링 할 수 있다.
- DynamoDB는 온디맨드 백업 기능을 제공한다.
- 테이블 생성시 스키마 생성 필요가 없다.
Route53
: Amazon Route 53는 가용성과 확장성이 뛰어난 DNS(도메인 이름 시스템) 웹 서비스이다.
- Route53을 사용하여 도메인등록, DNS 라우팅, 상태 확인을 조합하여 실행할 수 있다.
- public host zone 과 private host zone이 존재한다.
- DNS(네임서버) + 모니터링 + L4 + GSLB
- 도메인 구입이 필요하다
Certification Manager(인증서 관리)
: AWS 서비스 및 연결된 내부 리소스에 사용할 공인 및 사설 SSL/TLS 인증서를 프로비저닝, 관리 및 배포 할 수 있다.
- ACM은 SSL/TLS 인증서를 구매, 업로드 및 갱신하는데 드는 시간 소모적인 수동 프로세스를 대신 처리해준다.
1. 사용할 TLS/SSL 인증서를 AWS계정으로 요청하거나 가져온다.
2. 도메인 이름 시스템(DNS) 또는 이메일 검증을 통해 요청된 인증서의 도메인 소유권을 검증하여 인증서 발급을 완료한다.
3. Elastic Load Balancing(ELB), Amazon CloudFront 등과 같은 다양한 AWS 서비스에서 새로 발급되거나 가져온 인증서를 사용한다.
CloudFront
: 뛰어난 성능, 보안 및 개발자 편의를 위해 구축된 콘텐츠 전송 네트워크(CDN) 서비스이다.
- 대기 시간 감소, 보안 향상, 비용 절감, 사용자 정의 전송
CDN(콘텐츠 전송 네트워크)
- 데이터 사용량이 많은 애플리케이션의 웹 페이지 로드 속도를 높이는 상호 연결된 서버 네트워크
- 정적 콘텐츠 와 동적콘텐츠 모두 사용가능하다.
- 캐싱/ 동적 가속/ 엣지 로직 계산하는기능이 있다.
ELB(Elastic Load Balancing)
로드 밸런싱은 애플리케이션을 지원하는 리소스 풀 전체에 네트워크 트래픽을 균등하게 배포하는 방법이다.
- 대상그룹에 등록해야한다.
- 기본적으로 로드 밸런서는 대상 그룹에 대해 지정한 프로토콜과 포트 번호를 사용하여 등록된 대상으로 요청을 전송한다.
VPC(Amazon Virtual Private Cloud)
: 사용자가 정의한 가상 네트워크
- aws의 확장 가능한 인프라를 사용한다는 이점과 함께 고객의 자체 데이터 센터에서 운영하는 기존 네트워크와 유사하다.
- 서브넷 : vpc의 ip주소 범위, 단일 가용영역에 상주해야 한다, 서브넷을 추가한 후에는 vpc에 aws 리소스를 배포할 수 있다.
- IP 주소 지정 : vpc와 서브넷에 IPv4와 IPv6주소를 할당할 수 있다, 퍼블릭 IPv4 및 IPv6 GUA 주소를 AWS로 가져오고 vpc의 리소스에 할당할 수 있다.
- 라우팅 : 라우팅 테이블을 사용하여 서브넷 또는 게이트웨이의 네트워크 트래픽이 전달되는 위치를 결정한다.
- 게이트웨이 및 엔드포인트 : 게이트웨이는 VPC 다른 네트워크에 연결하며, VPC 엔드포인트를 사용하여 이넡넷 게이트웨이 또는 NAT장치를 사용하지 않고 AWS 서비스에 비공개로 연결한다.
- 피어링 연결 : VPC 피어링 연결을 사용하여 두 VPC 간 트래픽을 라우팅한다.
- 트래픽 미러링 : 네트워크 인터페이스에서 네트워크 트래픽을 복사하고 심층 패킷 검사를 위해 보안 및 모니터링 어플라이언스로 전송한다.
- Transit Gateway : 중앙 허브 역할을 하는 전송 게이트웨이를 사용하여 VPC, VPN 연결 및 AWS Direct Connect 연결 간에 트래픽을 라우팅한다.
- VPC 흐름 로그 : VPC의 네트워크 인터페이스로 들어오고 나가는 IP 트래픽에 대한 정보를 캡쳐한다.
- VPN연결: AWS VPN을 사용하여 온프레미스 네트워크에 VPC를 연결한다.
느낀 점
AWS안에 여러 서비스들이 엄청나게 많다는 것을 알았다.
아직 제대로된 사용은 해보지 않아 정확한 이용법은 모르겠지만 이론을 통해 대략적인 활용처에 대해 배웠고, 나중에 필요할 때 어떤 서비스를 이용해야할지 대략적으로 짐작이 가능했다.
서비스들을 생성만 해보았기 때문에 직접 사용하면서 작업해보는 것이 기대된다.
'데브코스' 카테고리의 다른 글
데이터 엔지니어링 29일차 TIL (0) | 2024.05.09 |
---|---|
데이터 엔지니어링 28일차 TIL (0) | 2024.05.01 |
데이터 엔지니어링 26일차 TIL (0) | 2024.04.29 |
데이터 엔지니어링 25일차 TIL (1) | 2024.04.26 |
데이터 엔지니어링 24일차 (0) | 2024.04.26 |