일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- Special String Again
- 격파르타 장점
- Recursion: Davis' Staircase
- 구슬탈출2
- 매칭점수
- Algorithm
- hackerrank
- 코딩테스트
- python
- Reverse Shuffle Merge
- 머신러닝
- 프로그래머스
- Max Array Sum
- [sqld]자격증합격
- 격파르타 후기
- 알고리즘
- programmers
- 백준
- 해커랭크
- 격파르타 합격후기
- Roads and Libraries
- BFS: Shortest Reach in a Graph
- Interview Preparation Kit
- Find the nearest clone
- 야근지수
- 파이썬
- Common Child
- DFS: Connected Cell in a Grid
- candies
- 피보나치 함수
- Today
- Total
목록공부 (65)
Archive
제네릭 프로그래밍 제네릭(generic) : 파라미터의 타입이 나중에 지정되게 해서 재활용성을 높일 수 있는 프로그래밍 스타일. 파이썬은 원래 동적 타이핑(Dynamic Typing)언어이기 때문에 제네릭이 필요 없음. 타입이 표기되지 않기 때문에 특정 변수의 타입을 바로 알기 어려워 가동성이 낮음. 후에 PEP 484에 추가된 타입 힌트(Type Hints)를 통해 제네릭을 사용. PEP 484는 파이썬 3.5부터 사용 가능. 타입 힌트를 통해 함수의 파라미터가 어떤 자료형이 들어가고, 리턴 값이 무엇인지 명시해줌으로써 가독성을 향상시킴. def are_equal(a : int, b : int) -> bool: return a==b 네이밍 컨벤션 Snake case : 각 단어를 '_'로..
programmers.co.kr/learn/courses/30/lessons/62049 코딩테스트 연습 - 종이접기 직사각형 종이를 n번 접으려고 합니다. 이때, 항상 오른쪽 절반을 왼쪽으로 접어 나갑니다. 다음은 n = 2인 경우의 예시입니다. 먼저 오른쪽 절반을 왼쪽으로 접습니다. 다시 오른쪽 절반을 왼쪽�� programmers.co.kr 후기 규칙을 정확히 찾아야 함. 처음 test case 1, 2, 3만 봤을 때, 이전 접은것이 2번 반복 + [1]로 코딩했으나 틀림. 규칙은 이전 값 + [0] + 이전 값의 xor 이었음. 재귀함수보다 for문으로 answer를 덮어쓰는 방법으로 구현. 파이썬 코드 def solution(n): answer = [] for i in range(n): answ..
www.hackerrank.com/challenges/climbing-the-leaderboard/problem Climbing the Leaderboard | HackerRank Help Alice track her progress toward the top of the leaderboard! www.hackerrank.com 후기 문제 입력 조건을 꼼꼼히 봐야함. scores의 경우 내림차순으로(100, 90, 80, ...) 입력받고, alice의 경우 오름차순(50, 60, 79, ...)으로 입력받는다. 처음에는 입력 조건 제대로 안보고 scores list를 매번 반복문을 통해 순회하며 올바른 등수를 찾았지만, 시간초과 남. 나중에 입력 조건 확인 후, 정렬된 값으로 입력받기 때문에 alice..
Chapter 1. 유전 알고리즘의 기본 용어 유전 알고리즘의 기본 구조 : 개체들은 교차에 의해 염색체를 부분 결합하고 돌연변이에 의해 조금씩 변화된 새로운 염색체를 가진 새로운 개체를 만들어 내는데, 이 때 개체는 환경에 적응하기 유리한 정도에 따라 선택적으로 번성하게 됨. 유전 알고리즘은 이러한 생물의 진화 과정을 문제 해결 과정으로 옮긴 것. 염색체(chromosome) : 임의의 해를 유전 알고리즘이 이해하는 형태로 표현한 것 해집단(population) : 정해진 수의 염색체 집단. 유전자(gene) : 해를 구성하는 인자 유전자형(genotype) : 보이는 그대로의 유전자 조합. 염색체 그 자체. 표현형(phenotype) : 유전자형과 관계되어 관찰되는 형질. 해의 성질이나 품질 유전 알..
유한 개의 Hypothesis set을 가정하고, training error를 가장 적게 하는 hypothesis에 대해서 generalization error bound를 구함. 위에서 구한 generalization error bound를 통해 learning theory 관점에서 bias variance trade-off를 볼 수 있음. 1. Preliminaries Lemma. (The union bound) Let $A_1, A_2, ..., A_k$ be $k$ different events(that may not be independent). Then $$P(A_1 \cup \cdots \cup A_k) \leq P(A_1) + \cdots + P(A_k)$$ Lemma. (Hoeffding..
2.1 Theory of Generalization 학습에 사용되지 않은 데이터(out-of-sample)에 대한 error ( $E_{out}$ )는 학습된 모델을 새로운 데이터에 적용했을 때, 얼마나 잘 일반화(generalize)할 수 있는가를 나타낸다. $E_{out}$은 input space $\chi$ 전체에 걸쳐 영향을 받는다.(학습에 사용된 입력으로 모델이 훈련되고 결정된다. 그리고 학습에 사용된 데이터로는 generalization을 측정할 수 없다.) $E_{out}$을 추론할 때는 학습에 사용되지 않은 데이터 샘플을 사용해야 한다. 이와 달리 $E_{in}$은 학습에 사용된 데이터(in-sample)에 대한 error를 나타내고, 모델이 주어진 데이터에 대한 학습이 얼마나 잘 되었는지..
1. 접근 방법- 일반적인 통계모형을 만들 때는 수치형 데이터를 사용한다.- 텍스트를 수치형 데이터로 간주해 통계분석 모형을 수립하고 테스트하자.- 텍스트 데이터를 구조화하기# 문자(letter), 형태소(morpheme), 단어(word), 문장(sentence), 문서(document) 등의 hierarchical 질서를 갖는 텍스트를 matrix 형태의 데이터로 개념화하기# token기반으로 topic이나 sentiment를 추정하는 기법 2. 텍스트 데이터의 구조- 텍스트 데이터는 hierarchical 질서를 갖는 데이터로 파닥한다.- corpus(말뭉치) : 분석을 위해 수집된 문서들의 집합- document(문서) : corpus를 구성한다.# 텍스트 데이터 분석을 하기 위해 100개의 논문..