Introduction
- 알파(효과적인 트레이딩 신호 또는 팩터) 발굴 중요함.
- 초과 수익률 또는 위험에 대한 예측력을 가진 금융 신호 또는 함수 → 기호 규칙이나 수식으로 표현
- ex) $-\frac{close-open}{(high-low)+0.001}$
- 기존 알파 mining은 수동적, 퀀트 연구자의 아이디어나 직관에 의존, 비효율
- 알고리즘 탐색(유전 프로그래밍 등) 은 조합의 수가 매우 방대해 엄청난 컴퓨팅 자원이 필요

- Alpha-GPT, a new interactive alpha mining system framework that provides a heuristic way to “understand” the ideas of quant researchers and outputs creative, insightful, and effective alphas.
- 퀀트 연구자들의 아이디어를 휴리스틱으로 이해 → 효과적인 알파를 출력하는 상호작용 시스템
- LLM의 능력으로 퀀트 연구자의 아이디어를 적절한 수식으로 변환
- 광범위한 사전 지식을 활용하여 성능 좋은 알파를 찾음
- 반복적인 알파 마이닝 파이프라인 단순화
- WorldQuant International Quant Championship 2024, top-10
Agentic Workflow

2.1 Ideation
- Trading Idea Polisher: 연구자가 자연어로 시장 아이디어를 설명하면, 에이전트가 이를 LLM이 처리할 수 있는 구조화된 프롬프트로 변환
- 외부 database에 질의 (금융 용어, 문맥 등을 참고하여 사용자의 의도를 정확하게 포착)
- 아이디어와 가장 관련된 기존 지식 / 데이터필드 정의를 끌어와서 prompt에 삽입
- 외부 지식(RAG 결과)을 활용하여 아이디어를 더 풍부하게
- 애매한 표현을 수학적으로 표현 가능하도록 수정
2.2 Implementation
- Quant Developer: processes the structured prompt to generate a set of initial “seed” alpha expressions (수식으로 변환)
- Alpha Database : quant developer가 구조화된 프롬프트를 처리하여 얻은 초기 seed 알파 표현식 저장
- Alpha Compute Framework : 유전 프로그래밍과 같은 알고리즘적 탐색 방법을 사용하여 seed를 반복적으로 개선 → 성능이 좋은 다양하고 정교한 후보 집합을 추출
2.3 Review
- Analyst: 생성된 알파 후보들을 백테스트와 통계적 평가로 검증
- Trading Backtest Engine
- 평가지표: backtest returns, Information Coefficient (IC), and Sharpe ratio
- Analyst 에이전트가 결과를 정리해 자연어 리포트로 요약
- 연구자가 이 보고서를 보고 다음 방향 제시. 다시 Ideation으로 루프.
- Trading Backtest Engine
Modes of Operation
3.1 Interactive Mode

- 인간의 인간의 도메인 전문성과 직관이 LLM보다 우수함, Alpha-GPT는 보조
- 인간 연구자는 아이디어 제시, iteration의 검토 단계에서 피드백과 지침을 제공
- Alpha-GPT는 인간의 추상적인 개념을 정확한 알파 표현수식으로 변환
- 유전 프로그래밍 등을 통한 알파 개선이나 백테스팅 등을 수행
3.2 Autonomous Mode

- 시스템이 독립적으로 트레이딩 아이디어를 생성하고 반복
- 수만 개의 데이터 필드를 포함할 수 있는 대규모 정량적 데이터베이스를 체계적으로 탐색할 때 유용
- 전체 데이터 필드를 한번에 넣으면 context window가 터지므로 → 계층적 RAG
- RAG#0 : 기존 Alpha Database를 분석하여 이전에 성공적이었던 알파의 특성을 학습
- RAG#1 : 최상위 범주 ex) Price-Volume, Sentiment
- RAG#2 : second-level categories
- RAG#3 : specific data fields
System Architecture

User Interface
- 웹 기반 대화상자, 마이닝 session manager (개별적인 연구 스레드 관리), dashboard (결과시각화)
AlphaBot
- 표준 프롬프트 엔지니어링 파이프라인을 사용하여 사용자의 의도(user intent)를 구조화된 작업(structured tasks)으로 변환 ← RAG 를 통한 근거제공
Algorithmic Alpha Mining
- Alpha Search Enhancement : 유전 프로그래밍(genetic programming)과 같은 기술을 사용하여 다양한 후보 알파 세트를 생성
- Backtesting and Evaluation : historical 데이터를 기준으로 성능을 평가하여 적합한 알파를 필터링
- Alpha Selection : 중복성을 제거하고, 상관관계를 낮추며, 가장 가치 있는 신호를 식별하기 위해 점수를 매겨 알파를 정리
- Alpha Deployment : 완성된 알파를 실시간 계산의 정확성을 보장하며 실거래(live trading)를 준비
Alpha Computation Acceleration
Experiments
- 중국 및 미국 주식의 장중 거래량-가격 데이터(OHLCV, VWAP, 섹터 데이터)
- 시계열 연산, 교차 단면 연산, 그룹별 연산, 기본 요소별 연산 등 19가지 기본 연산자와 기존 라이브러리의 연산자가 통합
- 지식 라이브러리: Kakushadze (2016)에 제시된 알파들과 독점 알파 기반(proprietary alpha base)을 바탕으로 구축되었으며, 해석 가능성 및 일관성을 높이기 위한 보조 자료로 사용
- LLM 모델: 채팅 모델로는 Llama 3 70B가, 임베딩 모델로는 BGE-M3가 사용
- 아이디어→알파 변환 능력

- 알파 개선(Iterative Refinement) (상호작용 1회 + 검색 개선(IT+SE) 후 개선)

- 알파 마이닝 계층의 search enhancement (본 적 없는 샘플에 대해서도 안정적)

- high-frequency trading competition (상위 5퍼센트 인간 수준)

- WorldQuant International Quant Championship (IQC) 2024

