📊

Dataset

Trading Signals

Name: Trading Signals
Creator: tripolskypetr
License: MIT

by tripolskypetr hf-dataset--tripolskypetr--trading-signals

Nexus Index

30.7 Top 100%

S: Semantic 50

A: Authority 0

P: Popularity 62

R: Recency 33

Q: Quality 30

Tech Context

Vital Performance

0 DL / 30D

0.0%

Source →

Data Integrity 30.7 FNI Score

- Size

- Rows

Parquet Format

- Tokens

Dataset Information Summary
Entity Passport
Registry ID	hf-dataset--tripolskypetr--trading-signals
License	MIT
Provider	huggingface

📜

Cite this dataset

Academic & Research Attribution

BibTeX

@misc{hf_dataset__tripolskypetr__trading_signals,
  author = {tripolskypetr},
  title = {Trading Signals Dataset},
  year = {2026},
  howpublished = {\url{https://huggingface.co/datasets/tripolskypetr/trading-signals}},
  note = {Accessed via Free2AITools Knowledge Fortress}
}

APA Style

tripolskypetr. (2026). Trading Signals [Dataset]. Free2AITools. https://huggingface.co/datasets/tripolskypetr/trading-signals

🔬Technical Deep Dive

Full Specifications [+]

⚖️ Nexus Index V2.0

Methodology Index Protocol

30.7

TOP 100% SYSTEM IMPACT

Semantic (S) 50

Authority (A) 0

Popularity (P) 62

Recency (R) 33

Quality (Q) 30

💬 Index Insight

FNI V2.0 for Trading Signals: Semantic (S:50), Authority (A:0), Popularity (P:62), Recency (R:33), Quality (Q:30).

Free2AITools Nexus Index

Verification Authority

HuggingFace API GitHub Metadata Arxiv Citation DB System Audit

Unbiased Data Node Refresh: VFS Live

⬇️

Downloads

226,935

👁️ Data Preview

📊

Row-level preview not available for this dataset.

Schema structure is shown in the Field Logic panel when available.

🔗 Explore Full Dataset ↗

🧬 Field Logic

🧬

Schema not yet indexed for this dataset.

Dataset Specification

Trading Signals Dataset

Описание

Этот датасет содержит данные о торговых сигналах для криптовалют, включающие взаимодействия между системными промптами, пользовательскими сообщениями и выходными данными языковых моделей для торговли криптовалютой.

Структура данных

Датасет расположен в директории dump/outline/ и содержит 188,975 файлов в формате Markdown, организованных в папки с уникальными идентификаторами сессий.

Структура папок

text

dump/outline/
├── [session-id]/
│   ├── 00_system_prompt.md      # Системный промпт
│   ├── 01_user_message.md       # Первое пользовательское сообщение
│   ├── 02_user_message.md       # Второе пользовательское сообщение
│   ├── ...                      # Дополнительные сообщения
│   └── XX_llm_output.md         # Финальный ответ модели

Содержание файлов

System prompts (00_system_prompt.md): Детальные инструкции для анализа криптовалютных рынков, включающие стратегии для LONG/SHORT позиций, технический анализ, управление рисками
User messages (XX_user_message.md): Рыночные данные в реальном времени - цены, индикаторы, объемы, техническая информация
LLM outputs (XX_llm_output.md): Структурированные торговые решения в JSON формате с полями:
- action: "trade" или "wait"
- position: "long", "short", или "wait"
- description: Краткое описание решения
- reasoning: Детальное обоснование
- current_price: Текущая цена
- stop_loss_price: Уровень стоп-лосса
- take_profit_price: Уровень тейк-профита

Использование для обучения языковых моделей

1. Подготовка данных

python

import os
import json
from pathlib import Path

def load_trading_dataset(dump_path="dump/outline/"):
    """Загружает все торговые сессии из датасета"""
    sessions = []
    
    for session_dir in Path(dump_path).iterdir():
        if session_dir.is_dir():
            session_data = load_session(session_dir)
            if session_data:
                sessions.append(session_data)
    
    return sessions

def load_session(session_path):
    """Загружает одну торговую сессию"""
    files = list(session_path.glob("*.md"))
    files.sort()
    
    session = {
        "system_prompt": "",
        "user_messages": [],
        "llm_output": ""
    }
    
    for file in files:
        content = file.read_text(encoding='utf-8')
        
        if file.name.startswith("00_system_prompt"):
            session["system_prompt"] = content
        elif file.name.endswith("_user_message.md"):
            session["user_messages"].append(content)
        elif file.name.endswith("_llm_output.md"):
            session["llm_output"] = content
    
    return session

2. Форматирование для обучения

python

def format_for_training(sessions):
    """Форматирует сессии для обучения модели"""
    training_data = []
    
    for session in sessions:
        # Объединяем системный промпт с пользовательскими сообщениями
        full_prompt = session["system_prompt"] + "\n\n"
        full_prompt += "\n\n".join(session["user_messages"])
        
        training_example = {
            "input": full_prompt,
            "output": session["llm_output"]
        }
        
        training_data.append(training_example)
    
    return training_data

3. Применение для fine-tuning

Для моделей типа GPT/Claude:

python

# Конвертация в формат для ChatML или аналогичный
def to_chat_format(sessions):
    chat_data = []
    
    for session in sessions:
        messages = [
            {"role": "system", "content": session["system_prompt"]},
            *[{"role": "user", "content": msg} for msg in session["user_messages"]],
            {"role": "assistant", "content": session["llm_output"]}
        ]
        
        chat_data.append({"messages": messages})
    
    return chat_data

Для обучения с Hugging Face Transformers:

python

from transformers import AutoTokenizer, AutoModelForCausalLM, Trainer

def create_hf_dataset(training_data, tokenizer, max_length=2048):
    """Создает датасет для Hugging Face"""
    
    def tokenize_function(examples):
        full_text = examples["input"] + tokenizer.eos_token + examples["output"]
        return tokenizer(
            full_text,
            truncation=True,
            padding="max_length",
            max_length=max_length
        )
    
    return [tokenize_function(example) for example in training_data]

4. Специализированные техники

Извлечение торговых паттернов:

python

def extract_trading_patterns(sessions):
    """Извлекает паттерны успешных торговых решений"""
    patterns = {
        "successful_longs": [],
        "successful_shorts": [],
        "wait_decisions": []
    }
    
    for session in sessions:
        # Парсинг JSON из llm_output
        try:
            decision = json.loads(extract_json_from_output(session["llm_output"]))
            
            if decision["action"] == "trade":
                if decision["position"] == "long":
                    patterns["successful_longs"].append(session)
                elif decision["position"] == "short":
                    patterns["successful_shorts"].append(session)
            else:
                patterns["wait_decisions"].append(session)
                
        except Exception as e:
            continue
    
    return patterns

Обучение с подкреплением:

python

# Использование исторических данных P&L для reward modeling
def create_reward_dataset(sessions):
    """Создает датасет для обучения reward модели"""
    reward_data = []
    
    for session in sessions:
        # Извлекаем информацию о прибыли/убытке из reasoning
        reward_score = extract_pnl_score(session["llm_output"])
        
        reward_data.append({
            "state": session["user_messages"][-1],  # Последние рыночные данные
            "action": session["llm_output"],
            "reward": reward_score
        })
    
    return reward_data

5. Рекомендации по обучению

Балансировка данных: Обеспечьте равное представление LONG, SHORT и WAIT решений
Временная валидация: Используйте хронологическое разделение на train/test
Контекстное обучение: Включайте исторические данные P&L в промпты
Многозадачное обучение: Тренируйте модель на предсказание и цены, и торгового решения
Регуляризация: Используйте dropout и weight decay для предотвращения переобучения

📊 Structured Schema (Zero-Fabrication)

Feature Key	Data Type
`SOLUSDT`	`unknown`
`XRPUSDT`	`unknown`
`BNBUSDT`	`unknown`
`ETHUSDT`	`unknown`
`BTCUSDT`	`unknown`

Estimated Rows: 1

Social Proof

HuggingFace Hub

226.9KDownloads

Hub Discussions

🤗 Data Source: Hugging Face ↗

🔄 Daily sync (03:00 UTC)

AI Summary: Based on Hugging Face metadata. Not a recommendation.

📊 FNI Methodology 📚 Knowledge Baseℹ️ Verify with original source

🛡️ Dataset Transparency Report

Technical metadata sourced from upstream repositories.

Open Metadata

🆔 Identity & Source

id: hf-dataset--tripolskypetr--trading-signals
slug: tripolskypetr--trading-signals
source: huggingface
author: tripolskypetr
license: MIT
tags: license:mit, size_categories:n<1k, format:json, modality:text, library:datasets, library:pandas, library:mlcroissant, library:polars, doi:10.57967/hf/6531, region:us

⚙️ Technical Specs

architecture: null
params billions: null
context length: null
pipeline tag

📊 Engagement & Metrics

downloads: 226,935
stars: 0
forks: 0

Data indexed from public sources. Updated daily.

Welcome to Free2AI Tools!

Smart Search

FNI Score

You're All Set!

Cite this dataset

🔬Technical Deep Dive

⚖️ Nexus Index V2.0

💬 Index Insight

Verification Authority

👁️ Data Preview

🧬 Field Logic

Dataset Specification

Trading Signals Dataset

Описание

Структура данных

Структура папок

Содержание файлов

Использование для обучения языковых моделей

1. Подготовка данных

2. Форматирование для обучения

3. Применение для fine-tuning

Для моделей типа GPT/Claude:

Для обучения с Hugging Face Transformers:

4. Специализированные техники

Извлечение торговых паттернов:

Обучение с подкреплением:

5. Рекомендации по обучению

📊 Structured Schema (Zero-Fabrication)

Social Proof

🛡️ Dataset Transparency Report

🆔 Identity & Source

⚙️ Technical Specs

📊 Engagement & Metrics