본문 바로가기

전체 글

(74)
High Performance Visual Tracking with Siamese Region Proposal Network(Siamese-RPN) 오늘은 Siamese-RPN에 대하여 정리해보도록 하겠습니다. 밀리테크 연구 과제에 적용하기 위해 해당 내용을 깊이 이해하기 위해 노력해보겠습니다. Siamese-RPN은 Computer Vision 분야에서 매우 중요한 역할을 다하였고, 이를 응용한 다양한 모델도 꾸준히 등장하였습니다. 그럼 이제 본격적으로 Siamese-RPN에 대하여 정리해보도록 하겠습니다. 논문의 아이디어는 크게 어렵지 않은데 논문을 읽기가 참 어려운 논문인것 같습니다 ㅜㅜ 핵심 아이디어는 요약에 정리하였으니 요약을 먼저 보시고 읽어보시면 좋을 것 같습니다. oneshot-detection과 관련된 부분은 좀 더 찾아보고 추가해야될 것 같습니다.... 1. Introduction Siamese-RPN은 template branch..
[이것이 코딩테스트다] 구현 1. 구현 구현 문제 : 풀이를 떠올리는 것은 쉽지만 소스코드로 옮기기 어려운 문제 ex) 코드가 길어지는 문제, 특정 소수점까지 출력하는 문제, 문자열이 입력으로 주어졌을 때 파싱해야하는 문제 등 -> 문법적인 문제나 라이브러리 사용 경험이 부족하다면 어려운 문제들 나처럼 알고리즘 문제 풀이 경험이 적은 사람이 전형적으로 어려워하는 문제들이다.... 2. 실습 2.1 상하좌우 나의코드 n = int(input()) plan = list(input().split()) row=[0,0,-1,1] col=[-1,1,0,0] x,y=1,1 for p in plan: if p == 'L': if 1
4.4 앙상블 학습(배깅) 이번 시간에는 앙상블 기법 중 배깅에 대하여 다뤄보도록 하겠습니다. 해당 내용은 '파이썬 머신러닝 완벽 가이드'를 정리한 내용입니다. 1. 배깅(Bagging) 배깅 : 같은 알고리즘으로 여러 개의 분류기를 만들어서 보팅으로 최종 결정하는 알고리즘 가장 대표적인 알고리즘으로 랜덤 포레스트가 있음 2. 랜덤 포레스트 랜덤포레스트는 결정 트리 기반의 알고리즘으로 결정 트리의 쉽고 직관적인 장점을 그대로 갖고 있으며, 수행 속도가 비교적 빠릅니다. 하지만 트리 기반의 앙상블 기법으로 하이퍼 파라미터를 튜닝 하더라도 예측성능이 크게 향상 되지 않는다는 단점이 있습니다. 랜덤 포레스트의 개별 분류기는 학습 데이터의 샘플 데이터를 학습합니다. 이때 샘플 데이터를 부트스트래핑(bootstrapping)방식으로 분할합..
4.3 앙상블 학습(보팅) 이번 시간부터 이제 본격적으로 머신러닝 분류의 하이라이트 앙상블에 대하여 다뤄보도록 하겠습니다. 앙상블 학습 유형에 따라 이론과 실습을 진행하도록 하겠습니다. 해당 내용은 '파이썬 머신러닝 완벽 가이드'를 정리한 내용입니다. 1. 앙상블 학습(Ensemble Learning) 앙상블 학습 : 여러 개의 분류기를 생성하고 그 예측을 결합함으로써 보다 정확한 최종 예측을 도출하는 기법으로, 크게 보팅(Voting), 배깅(Bagging), 부스팅(Boosting)으로 나눌 수 있다. 앙상블은 단순하게 생각해서 여러 명의 전문가가 모여 다같이 힘을 합쳐 문제를 해결하는 것이라 생각하면 됩니다. 앙상블 기법을 통해 대부분의 정형 데이터 분류 시 높은 성능을 보여줍니다. 2. 보팅(Voting) 보팅(Voting..
4.2 결정 트리 실습 - 사용자 행동 인식 데이터 세트 '사용자 행동 인식 데이터셋'을 통해 결정 트리 실습을 진행해보도록 하겠습니다. 해당 내용은 '파이썬 머신러닝 완벽 가이드'를 정리한 내용입니다. 먼저 데이터 전처리를 해주도록 하겠습니다. 데이터 전처리는 머신러닝에서 매우 중요한 부분이지만 지금은 알고리즘을 학습시키는 방법에 집중하기로 하고 간단하게 보고만 넘어가도록 하겠습니다. 아래 코드는 pandas에서는 중복된 피처를 처리를 못하기 때문에 중복된 피처에 _1, _2와 같이 구분자를 추가하여 피처를 처리하는 과정입니다. import pandas as pd import matplotlib.pyplot as plt %matplotlib inline ### features.txt 파일에 있는 컬럼명을 입력 받아서 중복된 컬럼명은 원본 컬럼명+_1, _2와..
4.1 분류(결정트리) 4장 '분류'부터가 이제 정말 머신러닝의 시작입니다. 그전까지는 머신러닝에 대한 전반적인 과정을 다뤘다면 분류를 시작으로 머신러닝의 핵심 알고리즘을 다뤄보도록 하겠습니다. 같이 시작하시죠!! 해당 내용은 '파이썬 머신러닝 완벽 가이드'를 정리한 내용입니다. 1. 분류 분류 : 학습 데이터로 주어진 데이터의 피처와 레이블 값을 머신러닝 알고리즘으로 학습해 모델을 생성하고, 새로운 데이터가 주어졌을 때 미지의 레이블 값을 예측하는 것 앞서 우리가 다뤘던 예제들이 모두 분류에 해당하는 문제들이었습니다. 분류에는 다양한 알고리즘이 존재하지만, 그중에서 정형 데이터에 대하여 가장 많이 사용하는 알고리즘이 바로 앙상블 기법입니다. 앙상블 기법은 뒤에서 더욱 자세하게 다루도록 하고 이번 시간에는 앙상블 기법의 가장 ..
3.3 피마 인디언 당뇨병 예측 이번 시간에는 지금까지 다룬 다양한 평가 지표를 가지고 피마 인디언 당뇨병 예측을 진행해보고 성능을 평가해보도록 하겠습니다. 지금까지 배운걸 실제로 적용해보는 것이니 가벼운 마음으로 한번 쓱 보면 될 것 같습니다. 해당 내용은 '파이썬 머신러닝 완벽 가이드'를 정리한 내용입니다. 먼저 '피마 인디언 데이터셋'을 분석해보도록 하겠습니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt %matplotlib inline from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score, precision_score, recal..
3.2 평가(F1 스코어, ROC와 AUC) 지난 시간에 아주 재현율과 정밀도에 대해 깊이 다뤄봤습니다. 서로는 상호 보완관계로 하나만 강조할 수는 없죠 따라서 두 평가지표를 모두 고려한 F1 스코어와 ROC에 대해 다뤄보도록 하겠습니다. 이는 '파이썬 머신러닝 완벽가이드'를 정리한 내용입니다. 1. F1 스코어 F1 스코어 : 정밀도와 재현율을 결합한 지표로, 정밀도와 재현율 어느 쪽으로 치우치지 않을 때 상대적으로 높은 값을 가진다. F1 스코어 공식의 다음과 같습니다. F1 스코어는 f1_score()라는 API를 통해 구현이 가능합니다. 앞선 타이타닉 예제에서 F1 스크어를 구해보도록 하겠습니다. from sklearn.metrics import f1_score def get_clf_eval(y_test , pred): confusion =..

728x90
반응형