일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- django
- 코테 연습
- 데이터 시각화
- Kafka
- Snowflake
- 데이터 엔지니어
- Tableau
- Selenium
- airflow
- HTML
- 슈퍼셋
- 코딩테스트
- SQL
- Til
- PCCP
- 데브코스
- superset
- beuatifulsoup
- AWS
- 코딩 테스트
- 팀 프로젝트
- Spark
- cloud platform
- Today
- Total
목록데브코스 (65)
주니어 데이터 엔지니어 우솨's 개발일지
학습내용 힙(heap)의 문제풀이 성질 : 최대/최소 원소를 빠르게 찾을 수 있다. 연산 heapify - 힙구성 insert - 삽입 remove - 삭제 동적계획(Dynamic Programming법 문제풀이 ex) 피보나치,Knapsack Problem 문제의 성질에 따라, 동적계획법으로 풀어냄으로써 탐색해야 하는 범위를 효과적으로 줄일 수 있다. 깊이/너비 우선탐색(DFS/BFS) 깊이 우선 탐색(DFS) : 한 정점에서 인접한 모든(아직 방문하지 않은) 정점을 방문하되, 각 인접 정점을 기준으로 깊이 우선 탐색을 끝낸 후 다음 정점으로 진행 너비우선탐색(BFS) : 한 정점에서 인접한 모든(아직 방문하지 않은)정점을 방문하고, 방문한 각 인접 정점을 기준으로(방문한 순서에 따라) 또 다시 너비 ..
학습내용 Hash 사전, key-value 탐욕법 (Greedy Algorithm) 현재의 선택이 마지막해답의 최적성을 해치지 않을 때 각 단계에서 그 순간이 최적이라 판단되는 것을 선택한다. 해쉬와 탐욕 알고리즘의 실습문제 풀이 1. 2. 3. 4. 특강 GPT LLM(Large Language Model) 모델 훈련 : 웹상에서 존재하는 문서들이 모델의 훈련 데이터가 된다. -품질이 중요하기에 위키피디아가 가장 많이 사용됨 -이를 코드에 적용 가능하며 이 경우 github 훈련용 데이터가 된다. -비지도학습(Unsupervised Learning) 단점 -들어가는 비용이 상상을 초월한다. -탄소 발생으로 지구 온난화 가속화 -데이터 주권문제 Word to Vector -단어를 그대로 사용할 수 없고 ..
학습 내용 큐(Queue) 자료를 보관할 수 있는 선형구조 선입선출(FIFO : First-In-Fisrt-Out)의 특징을 가진다. 큐의 연산의 정의 size() - 큐에 들어있는 데이터 원소의 수를 구한다. O(1) isEmpty() - 현재 큐가 비어 있는지를 판단 O(1) enqueue(x) - 원소x를 큐에 추가 O(1) dequeue() - 큐의 맨 앞에 저장된 원소를 제거 O(n) peek() - 큐의 맨 앞에 저장된 원소를 반환 O(1) 큐의 활용 자료를 생성하는 작업과 그 자료를 이용하는 작업이 비동기적으로 일어나는 경우 자료의 생성이 여러곳에서 일어나는 경우 자료의 생성과 그 자료를 이용하는 작업이 양쪽 다 여러곳에서 일어나는경우(컴퓨터 시스템내부) 등 환형 큐(Circular Queu..
학습내용 추상적 자료구조(Abstract Data Structures) Data : 정수, 문자열, 레코드 등 A sete of operations : 삽입, 삭제, 순회, 정렬, 탐색 등 연결리스트(linked lists) : 각 원소들을 줄줄이 엮어서 늘어 놓은 것 배열과 연결리스트의 차이 저장공간 : 배열 - 연속한 위치, 연결리스트 - 임의의 위치 특정 원소 지칭 : 배열 - 매우 간편 O(1) , 연결리스트 - 선현탐색과 유사 O(n) 연결리스트의 원소 삽입 def insertAt(self, pos, newNode) : if pos < 1 or pos return False if pos = 1: newNode.next = self.head self.head = newNode else: if po..
오늘 학습 내용 자료구조(Data Structures) 리스트 리스트에서 최대값을 구하려면 모든 원소를 뒤져보지 않고서는 찾을 수 없다. 단위가 큰 리스트에서 최대값을 찾는 max함수를 이용하면 갯수에 비례하는 만큼의 시간이 걸린다. 풀어야 하는 문제에 따라 내가 이용하는 자료구조가 어떤 성질을 가지느냐를 이해해야 한다. 알고리즘(algorithm)이란? [사전적 정의]어떤 문제를 해결하기 위한 절차, 방법, 명령어들의 집합 [프로그래밍] 주어진 문제의 해결을 위한 자료구조와 연산 방법에 대한 선택 해결하고자 하는 문제에 따라 최적의 해법이 다르기 때문에 이 선택을 어떻게 해야 하느냐를 알기 위해 자료구조를 이해해야 한다. 배열(Arrays) 같은 종류의 데이터가 줄지어 늘어서 있는 것 -원소들을 순서대..