본문 바로가기

전체 글160

데이터 엔지니어링 4일차 TIL 학습내용 Hash 사전, key-value 탐욕법 (Greedy Algorithm) 현재의 선택이 마지막해답의 최적성을 해치지 않을 때 각 단계에서 그 순간이 최적이라 판단되는 것을 선택한다. 해쉬와 탐욕 알고리즘의 실습문제 풀이 1. 2. 3. 4. 특강 GPT LLM(Large Language Model) 모델 훈련 : 웹상에서 존재하는 문서들이 모델의 훈련 데이터가 된다. -품질이 중요하기에 위키피디아가 가장 많이 사용됨 -이를 코드에 적용 가능하며 이 경우 github 훈련용 데이터가 된다. -비지도학습(Unsupervised Learning) 단점 -들어가는 비용이 상상을 초월한다. -탄소 발생으로 지구 온난화 가속화 -데이터 주권문제 Word to Vector -단어를 그대로 사용할 수 없고 .. 2024. 3. 28.
데이터 엔지니어링 3일차 TIL 학습 내용 큐(Queue) 자료를 보관할 수 있는 선형구조 선입선출(FIFO : First-In-Fisrt-Out)의 특징을 가진다. 큐의 연산의 정의 size() - 큐에 들어있는 데이터 원소의 수를 구한다. O(1) isEmpty() - 현재 큐가 비어 있는지를 판단 O(1) enqueue(x) - 원소x를 큐에 추가 O(1) dequeue() - 큐의 맨 앞에 저장된 원소를 제거 O(n) peek() - 큐의 맨 앞에 저장된 원소를 반환 O(1) 큐의 활용 자료를 생성하는 작업과 그 자료를 이용하는 작업이 비동기적으로 일어나는 경우 자료의 생성이 여러곳에서 일어나는 경우 자료의 생성과 그 자료를 이용하는 작업이 양쪽 다 여러곳에서 일어나는경우(컴퓨터 시스템내부) 등 환형 큐(Circular Queu.. 2024. 3. 27.
데이터 엔지니어링 2일차 TIL 학습내용 추상적 자료구조(Abstract Data Structures) Data : 정수, 문자열, 레코드 등 A sete of operations : 삽입, 삭제, 순회, 정렬, 탐색 등 연결리스트(linked lists) : 각 원소들을 줄줄이 엮어서 늘어 놓은 것 배열과 연결리스트의 차이 저장공간 : 배열 - 연속한 위치, 연결리스트 - 임의의 위치 특정 원소 지칭 : 배열 - 매우 간편 O(1) , 연결리스트 - 선현탐색과 유사 O(n) 연결리스트의 원소 삽입 def insertAt(self, pos, newNode) : if pos < 1 or pos return False if pos = 1: newNode.next = self.head self.head = newNode else: if po.. 2024. 3. 26.
데이터 엔지니어링 1일차 TIL 오늘 학습 내용 자료구조(Data Structures) 리스트 리스트에서 최대값을 구하려면 모든 원소를 뒤져보지 않고서는 찾을 수 없다. 단위가 큰 리스트에서 최대값을 찾는 max함수를 이용하면 갯수에 비례하는 만큼의 시간이 걸린다. 풀어야 하는 문제에 따라 내가 이용하는 자료구조가 어떤 성질을 가지느냐를 이해해야 한다. 알고리즘(algorithm)이란? [사전적 정의]어떤 문제를 해결하기 위한 절차, 방법, 명령어들의 집합 [프로그래밍] 주어진 문제의 해결을 위한 자료구조와 연산 방법에 대한 선택 해결하고자 하는 문제에 따라 최적의 해법이 다르기 때문에 이 선택을 어떻게 해야 하느냐를 알기 위해 자료구조를 이해해야 한다. 배열(Arrays) 같은 종류의 데이터가 줄지어 늘어서 있는 것 -원소들을 순서대.. 2024. 3. 25.