Building production ML systems for financial services — from model training to Docker deployment
I'm an ML Engineer focused on Fintech products and Generative AI. I specialize in the full development cycle: data analysis → model training & optimization → production deployment via FastAPI + Docker.
I don't just train models in Jupyter — I build reliable, interpretable and scalable ML pipelines ready for real business use.
Core expertise:
- 🏦 Fintech ML — credit scoring, fraud detection (GNN + classical ML), PFM transaction categorization
- 🤖 LLM & RAG — Fine-Tuning (LoRA/PEFT), RAG architectures, voice AI assistants
- ⚙️ MLOps — MLflow, Evidently AI, Kafka Streaming, A/B testing, Docker
Machine Learning
LLM & Voice AI
Backend & MLOps
Fraud detection via transaction graph analysis using Graph Convolutional Networks
Транзакции представлены как граф: 590K узлов, 493K рёбер. GCN видит транзакцию в контексте её связей — если карта участвовала в подозрительных операциях, модель "заражает" соседей подозрением. Именно так работают антифрод системы Visa и Mastercard. AUC-ROC: 0.78, Fraud Recall: 62%.
💡 GNN vs LightGBM: классический ML смотрит на транзакцию изолированно, GNN видит коллаборативный фрод через топологию графа.
PyTorch Geometric GCNConv NetworkX FastAPI IEEE-CIS Dataset Graph ML
Hybrid real-time fraud detection microservice
Двухслойная архитектура: Redis Velocity Check (защита от брутфорса) + LightGBM (поведенческие паттерны). Встроенный A/B Testing Router распределяет трафик 80/20 между Champion и Challenger моделями для безопасного тестирования гипотез в продакшне.
LightGBM Redis Feature Store Docker Compose FastAPI A/B Testing Class Imbalance
Full MLOps pipeline for bank credit scoring — from Kaggle dataset to deployed REST API
LightGBM обёрнут в FastAPI-микросервис. MLflow Model Registry — модель динамически загружается по RUN_ID. SHAP TreeExplainer — каждый отказ сопровождается топ-5 факторами решения (требование банковских регуляторов). Evidently AI — мониторинг Data Drift. Логирование каждого предсказания в SQLite.
LightGBM MLflow SHAP Evidently AI FastAPI Docker SQLite Render
Real-time fraud detection streaming pipeline on Apache Kafka
Event-Driven пайплайн: Producer генерирует поток транзакций → Kafka Broker → Consumer Group с детектором. Демонстрация горизонтального масштабирования — при запуске нескольких Consumer инстансов Kafka автоматически перераспределяет нагрузку (Rebalance).
Apache Kafka Zookeeper Docker Compose Consumer Groups Event-Driven
Intelligent bank support assistant with semantic search over knowledge base (RAG)
Полноценная RAG-архитектура: документы → чанкинг → HuggingFace Embeddings → Qdrant (векторная БД) → Llama 3 (Groq). Жёсткий Hallucination Prevention: бот отвечает строго по документам, показывая источники через Expander UI.
Qdrant RAG LangChain Llama-3 HuggingFace Embeddings Streamlit
Full voice pipeline: Speech-to-Text → LLM → Text-to-Speech with conversation memory
Полный голосовой пайплайн: Whisper Large v3 транскрибирует речь → Llama 3.3-70B генерирует ответ с памятью всего диалога → gTTS синтезирует голос с автовоспроизведением. System Prompt оптимизирован под TTS-сценарий: краткие ответы без списков, как живой оператор по телефону.
Whisper v3 Llama-3.3-70B gTTS Groq Conversation Memory Streamlit
Parameter-Efficient Fine-Tuning of LLM for bank support (PEFT/LoRA)
Fine-Tuning TinyLlama-1.1B с использованием LoRA-адаптеров — обучалось всего 1,126,400 параметров (0.10%) вместо полной модели. Cloud-to-Local Pipeline: обучение на GPU (Google Colab T4) → инференс на CPU.
💡 RAG vs Fine-Tuning:
bank-ai-assistantиспользует внешнюю базу знаний, этот проект "зашивает" знания в веса модели — два подхода к одной задаче.
TinyLlama LoRA PEFT SFTTrainer PyTorch HuggingFace
NLP system for "dirty" bank transaction categorization (PFM)
Fine-Tuning многоязычного DistilBERT на классификацию 5 банковских категорий. Модель устойчива к опечаткам, латинице и шумам (ID терминалов). Inference UI с Confidence Score на Streamlit.
DistilBERT PyTorch Hugging Face Fine-Tuning NLP Streamlit
Bank churn prediction with custom PyTorch MLP from scratch
Полносвязная нейросеть (MLP) реализована на чистом PyTorch без высокоуровневых оберток. Ручная реализация Training Loop, Forward/Backward Pass, DataLoader с батч-обработкой тензоров. Accuracy: 94.5% на тестовой выборке.
PyTorch MLP Custom Training Loop Binary Classification
Real-time object detection web application (YOLOv8)
Zero-Shot Inference на предобученных весах MS COCO (80 классов). Поддержка масштабирования от yolov8n (Nano) до yolov8x (eXtra Large). Автоматический парсинг Bounding Boxes и генерация статистики.
YOLOv8 Ultralytics OpenCV Zero-Shot Streamlit
| nurbekovrashidjob@gmail.com | |
| 💬 Telegram | @RaNurbek |
| 📍 Location | Almaty, Kazakhstan 🇰🇿 |