Computer Science
-
CS : Deep Learning (1/2)Computer Science/ML, DL 2021. 4. 6. 11:26
** 순서는 무의미합니다. attention mask 학습 시간의 효율을 위해, 패딩된 부분을 attention 구조에 통과시키지 않도록 함 값이 있다면 1, 패딩 부분이라면 0 0 부분은 bert 모델에서 attention을 수행하지 않게 된다. embedding 자연어 처리에서 특징을 추출하기 위해 수치화, 벡터화 해주는 과정 tokenizing 자연어 처리에서 텍스트의 전처리 과정에서 사용됨 일상 언어를 컴퓨터가 이해할 수 있도록 '의미 있는 가장 작은 단위(토큰)'로 나누는 과정 padding 텍스트에 대해 embedding 처리 후, 텍스트의 길이를 max_len으로 동일하게 변환 빈 공간에 대해 0으로 채우는 작업 padding을 하지 않으면, 가장자리에 대한 정보가 유실될 수 있기 때문에, ..
-
CS : Algorithm : DFS & BFSComputer Science/Algorithm, Data Structure 2021. 4. 1. 22:59
탐색 알고리즘 1. 그래프의 모든 정점들을 특정한 순서에 따라 방문하는 알고리즘 2. 그래프 : 정점과 간선으로 구성된, 한정된 자료구조. 각각의 지점을 정점이라고 하고, 정점과 정점의 연결을 간선이라고 한다. 3. 그래프가 주어지고, 특정 정점과 다른 정점 간 이동이 가능한가? 또는 이동할 수 있다고 했을 때 해당 경로는 효율적인가? 등을 따질 때 사용되는 알고리즘이 탐색 알고리즘이다. DFS (깊이 우선 탐색) 1. 가장 직관적이고, 구현하기 쉬운 탐색 방법 2. 현재의 정점과 연결된 정점들을 하나씩 갈 수 있는지 검사하고, 특정 정점을 갈 수 있다면 그 정점에 가서 같은 행위를 반복한다. 갈 수 없다면, 이전 정점으로 돌아간다. 3. 같은 정점을 다시 방문하지 않도록 정점에 방문했다는 것을 표시해준..
-
CS : DB : 인덱스, 리플리케이션, 클러스터링Computer Science/DB 2021. 4. 1. 19:01
Index (인덱스) 인덱스 : 테이블의 동작 속도를 높여주는 자료 구조 테이블 내의 1개 이상의 컬럼을 이용하여 인덱스를 생성할 수 있다. 사용 이유 WHERE절과 일치하는 열을 찾기 위해 join 시, 다른 테이블의 열을 추출하기 위해 min(), max() 값을 찾기 위해 데이터 열을 참조하지 않는 상태로 값을 추출하기 위해서 쿼리를 최적화 하기 위해 DELETE, UPDATE 연산이 빈번하다면, 인덱스는 비효율적일 수 있다. 위의 연산은 기존의 인덱스를 삭제하는 것이 아니라, '사용하지 않음' 처리하기 때문이다. 인덱스의 자료구조 해시 테이블 Key와 Value로 데이터를 저장하는 자료구조 O(1)로써 매우 빠르다. '=' 연산에 특화되어 있기 때문에, '' 연산과 같은 연속적 데이터를 위한 순차..
-
CS : Network : 웹 동작 방식Computer Science/Network 2021. 4. 1. 17:50
웹 동작 방식 1. 2. 사용자가 웹 브라우저를 통해, 찾고 싶은 웹 페이지의 URL 주소를 입력한다. 3. 사용자가 입력한 URL 주소 중, 도메인 네임(domain name) 부분을 DNS 서버에서 검색한다. 4. DNS 서버에서 해당 도메인 네임에 해당하는 ip주소를 찾아, 사용자가 입력한 URL 정보와 함께 전달한다. 5. 6. 웹 페이지의 URL 정보와 전달받은 ip주소는, HTTP 프로토콜을 사용하여 HTTP 요청 메시지를 생성한다. 7. 8. 웹 서버에 도착한 HTTP 요청 메시지는, HTTP 프로토콜을 사용하여 웹 페이지 URL 정보로 변환되고, 해당 정보를 통해 찾고자 하는 데이터를 검색한다. 9. 10. 검색된 웹 페이지 데이터는, HTTP 프로토콜을 사용하여 HTTP 응답 메시지를 생..