검색결과 리스트
글
트래이딩분야에 적용된 딥러닝 기술
그 동안 개인적으로 테스트해 본 트래이딩에서의 딥러닝 알고리즘은 그닥 효과가 좋지 못하다. 트래이딩 알고리즘의 시뮬레이션을 위해 구축한 웹페이지 (http://www.bigdata-trader.com/simulation_preview.jsp?month=00000000)에서 확인할 수도 있는데, 딥러닝 모델(현재 A26부터 A30까지 5개 모델이 딥러닝 모델, 나머지는 전통적 트레이딩 알고리즘)의 단타 매매 성공율은 겨우 60퍼센트 정도에 미치고 있다. 물론 딥러닝 모델은 아직 2개월 정도밖에 운영하지 않았지만 몇 년을 돌려도 크게 바뀔거 같지는 않다. 이 정도의 performance는 전통적 방법의 트래이딩 알고리즘(예를 들면 A14나 A4)보다도 훨씬 뒤쳐지는 성적이다.


참고로 각 알고리즘은 DBN을 이용하여 72개월간 다음 데이터를 학습한며, 매일 10거래일 전 발행한 추천 종목의 성적을 평가한다.
A26: 주가
A27: 주가+인덱스
A28: 주가변동률+인덱스변동률
A29: 주가변동률+거래량+외인거래량
A30: 주가변동률+거래량+외인거래량+외인보유portion
다양한 딥러닝 아키텍춰를 추가해서 LSTM 등을 이용할 계획이긴 하지만 크게 향상될것 같지는 않다. 아키텍춰보다는 데이터나 모델을 바꿔야 할듯.
USC의 Greg Harris 가 트래이딩 분야에 적용된 딥러닝 기술을 잘 정리를 해둔것을 발견하여 정리해본다. 원문은 http://gregharris.info/a-survey-of-deep-learning-techniques-applied-to-trading/
(요약 할것)
1. Limit order book modeling
2. price-based classification models
3. Text-based Classification models
4. Volatility Prediction
5. Portfolio Optimization
각 모델별로 아키텍춰를 달리한 논문들을 소개하고 있는데 내 시스템에 적용 가능한것부터 하나하나 테스트 해볼 생각이다.
========== continued..
일단 위에 열거된 다른 연구자들의 결과를 보고 놀라운 점은 수익 성공률이 53% 정도 밖에 안된다는 것. 내가 구현한 딥러닝 모델보다도 조금 더 나쁘고 A4나 A14보다도 훨씬 안좋다. 하지만 위 요약을 읽으면서 몇가지 새로운 모델에 대한 구상이 떠올라서 구현해보기로 한다.
1. 먼저 리턴(closing price - opening price)이라는 개념. 나의 예측 모델들은 모두 regression problem에 집중한데 반해 리턴이란 개념으로 접근한다면 classification 문제가 된다. + 일것이냐 - 일것이냐의 classification. 사실 class 수를 더 늘려서 regression 처럼 학습할 수 있지만. 어쩄든. 그게 중한게 아니고. return을 계산하기 위해서는 opening price 를 알아야 하는데. 이런식으로 하려면 실시간 시스템이어야 한다. 종가 확인 후 하루 한번 예측을 수행하는 일(daily) 베이스의 bigdata trader 시스템에서는 적용할 수 없다. opening price를 무시한다면 성공률이 50%로 수렴할 것이 뻔하다. 서비스 용도말고 관리자창에 테스트 용도로 장중 opening price를 입력 받아 return을 얻어내는 실험 모듈을 추가해야겠다.
- 조금 더 생각해보니 "종목 상세 보기"에서는 사용자 입력 후 해당 종목에 한 해 실시간 장중가를 가져 올 수 있으니 그날의 리턴을 계산할 수도 있겠다.
2. Text 기반 classification
경제면 headline 들과 개별 종목 등락을 학습한다는 개념. 말그대로 bigdata trader의 기본 개념인데... sns 대신 경제면 headline 을 학습한다는 것.
3. moving box learning
DBN 을 써서 oscillating box를 학습 한다는 것인데. 학습이고 뭐고를 떠나 이 전략은 전략 자체의 validation 이 필요하다고 본다. 박스 바닥 뚫고 진입시 매수, 박스 바닥 뚫고 진출수 매도. 그러나 박스권의 설정 자체가 이미 후행적이고 결과론 적이다. oscillating box 이론이 잘 맞는 종목도 있을테니 선택적으로 적용한다면 시도해볼만 하다. 각 종목이 얼마나 oscillating box 이론에 일치하는가 평가하는 모듈이 먼저 필요하다.
(임시저장)
'금융' 카테고리의 다른 글
PER을 활용한 주식투자 전략: 중고급 투자자를 위한 가이드 (0) | 2024.02.13 |
---|---|
PBR을 활용한 주식투자 전략: 중고급 투자자를 위한 가이드 (0) | 2024.02.13 |
나만의 로보 어드바이저(robo-advisor) 만들기 [5] (0) | 2016.09.23 |
나만의 로보 어드바이저(robo-advisor) 만들기 [4] (0) | 2016.09.05 |
나만의 로보 어드바이저(robo-advisor) 만들기 [2] (0) | 2016.08.30 |
글
세부과제 2
Deep learning for Early Detection of Dementia
and a pilot study
운영회의
2016.05.24
목차
인공지능(기계학습)을 이용한 질병 진단
Why Deep Learning?
기존 기계학습
Deep Learning
Deep Learning을 이용한 EEG 분석 Pilot Study
Why Deep Learning (Neural Network)?
Integrated Learning
기존 데이터 분석을 통한 질병 진단
기존 기계학습을 이용한 학습
기존 기계학습을 이용한 진단
딥러닝을 이용한 진단
딥러닝을 이용한 학습
사람의 인지 과정과 유사
추상화: 저수준표현è고수준 표현
기존 기계학습 기법 대비 Deep Learning 장점
자동화된 Feature selection
학습 데이터 제작 비용 ↓ 시간 ↓
대용량 원시 데이터 학습 (sensor, raw,…)
월등한 성능!!
현재 딥러닝 기술 수준
Playing Game
Object Recognition
Semantic Segmentation
Image Completion
Hand Writing by Machine
Music Composition
Image Caption Generation
Visual Question Answering
Word Analogy
Neural Machine Translation
Playing Game
Object Recognition
Semantic Segmentation
Image Completion
Hand Writing by Machine
Music Composition
Painting
Image Caption Generation
Visual Question Answering
Word Analogy
Neural Machine Translation
Deep Learning을 이용한 EEG 분석 Pilot Study
UCI EEG Data
Two groups: alcoholic and nc
122 subjects x about 120 trials (different stimuli); total 11057 cases
Each case: 64 electrodes x 256 hz
700mb
Stimulus: object S1, or S1 and S2 (matched or non-matched)
Electrode position: Zhang et al. 1995
Alcoholic EEG vs NC EEG
Pilot Study
Pilot Study
Deep Belief Network을 이용한 EEG 데이터 학습
EEG 최대값 465.63, 최소값 -158.96, 평균 -1.86
대부분 -30~+100에 집중
Z-score normalization
Pilot Study
‘전체 데이터의 90% 학습, 10%는 평가에 이용’ 10 fold cross-validation
실험결과
Accuracy(=(TP+TN)/(P+N)): 0.77
Precision(=TP/(TP+FP)): 0.78
Sensitivity(=Recall=TP/(TP+FN)): 0.78
F1 score(=2TP/(2TP+FP+FN)): 0.78
Further Study
Further study
뇌파 패턴 분석
Normalization 최적화 (z-score, linear min-max, 3depth linear, Bezier,...)
Activation function 최적화
Network type 최적화
DBN, CNN, RNN, LSTM, RBM, DeepQ,..
Question? Comment?
'상념' 카테고리의 다른 글
나만의 로보 어드바이저(robo-advisor) 만들기 [1] (0) | 2016.08.30 |
---|---|
ECCB 2016 app (0) | 2016.08.28 |
도메인을 하나 더 구입했는데.. (0) | 2016.08.24 |
동영상의 vectorizing은 어떻게 해야하나? (0) | 2016.08.24 |
새로운 블로그 시작과 블로그의 성격 (0) | 2015.08.10 |
글
티스토리 블로그에 계정을 만든지는 몇달 되었지만 이제 처음 글을 쓰게 된다. 이곳에는 나의 연구내용을 기록하기로 한다.
최근 나의 연구 관심은 타임시리즈 데이터의 단기간 미래 예측에 대한 것이다. 이러한 연구는 금융분야 특히 시스템 트레이딩 분야에서 유용하게 사용될 수 있을 것이다. 쉽게 말해 주가 예측에 대한 연구이다. 나는 기본적 분석을 철저히 지양하고 오로지 물결과 같이 파동치는 데이터의 성질만을 이용한 기술적 분석만으로 성공 확률 50프로 이상의 알고리즘을 발견하는 것이 가능하다고 믿고 있으며 부족하지만 내가 가진 모든 수학적 능력과 컴퓨터 프로그래밍 재능을 그러한 알고리즘의 개발에 헌신하고자 한다.
내가 기본적 분석을 지양하는 이유는 별게아니다. 그러한 방법이 틀렸거나 비효율적이기 때문이 아니다. 단지 그 분야에는 내가 관심있는 연구 내용이 없고 그 분야에서 내가 후손에게 컨트리뷰션할 것이 없기 때문이다. 기본분석이건 기술분석이건 각각 장단점이 있을것이라는데 이견은 없다.
주가 예측에 있어 연구적 흥미 이외에 기술적 접근 방법이 맞다고 생각하는 이유, 즉 가까운 미래를 예측하는 알고리즘이 존재한다고 생각하는 이유,로 한가지 는
'상념' 카테고리의 다른 글
나만의 로보 어드바이저(robo-advisor) 만들기 [1] (0) | 2016.08.30 |
---|---|
ECCB 2016 app (0) | 2016.08.28 |
도메인을 하나 더 구입했는데.. (0) | 2016.08.24 |
동영상의 vectorizing은 어떻게 해야하나? (0) | 2016.08.24 |
뇌파 분석을 통한 치매 조기 예측, 딥러닝을 이용한 뇌파 분석 파일럿 스터디 (0) | 2016.05.24 |
RECENT COMMENT