3% 수익 도달 예측 AI 모델 구축 – 1단계: 학습 데이터 준비하기

3% 수익 도달 예측 AI 모델 구축 – 1단계: 학습 데이터 준비하기

HTS 자동매매 시스템에서 기록된 매수 로그 데이터를 바탕으로, 특정 종목이 매수된 후 3% 이상 수익에 도달할 가능성을 예측하는 AI 모델을 구축하는 프로젝트를 진행합니다.


✅ 목표

  • 매수 후 수익률 3% 이상 도달 여부를 예측
  • 엑셀 로그 데이터를 기반으로 머신러닝 학습 데이터를 구성
  • 이후 ONNX 기반 모델을 NPU에서 실시간 추론할 수 있도록 설계

📌 1단계: 학습용 CSV 데이터셋 생성

우선 엑셀 로그 파일 Log_S2_YYYYMMDD.xlsxSheet2를 기준으로 다음과 같은 데이터를 추출합니다:

  • 종목명
  • 전일종가 (매수 기준)
  • 매수가
  • 매수 대비 비율 (매수가 ÷ 전일종가)
  • 수익률.1
  • target: 수익률.1이 3% 이상이면 1, 그렇지 않으면 0

▶ 자동 추출 스크립트 요약

파이썬을 통해 다음과 같은 자동 전처리 로직을 사용합니다.

# 주요 처리 항목
- 최근 5일간 로그 파일 자동 탐색
- Sheet2에서 수익률 3% 이상 도달 여부 계산
- '매수 대비 비율' 계산
- 학습용 CSV로 저장 (예: train_data.csv)

출력 결과는 다음과 같이 구성됩니다:

종목명, 매수가, 전일종가, 매수대비, 수익률.1, target
카카오게임즈, 18,450, 18,200, 1.0137, 3.3, 1
NHN KCP, 7,100, 7,200, 0.9861, 1.8, 0
...

📂 저장 경로 및 다음 단계

생성된 학습 데이터는 다음 경로에 저장됩니다:
C:/ALOG매수신호매매/202506/train_data.csv

이후 단계에서는 이 데이터를 바탕으로 랜덤포레스트 모델 학습onnxruntime 변환을 통해 NPU 기반 실시간 예측을 진행할 예정입니다.


🔜 다음 단계 예고

  • 2단계: AI 모델 학습 및 ONNX 변환
  • 3단계: 실시간 종목 예측 자동화 + NPU 활용

해당 프로젝트는 ChatGPT + HTS 시스템 연동 기반으로, 수익률 향상을 위한 실전 자동화 전략에 초점을 맞추고 있습니다.


본 포스팅은 HTS 자동매매 로그 데이터를 기반으로 AI 학습 시스템 구축을 위해 ChatGPT에서 작성되었습니다.

Leave a Comment