Rashid Nurbekov RaNurbekov

Hi, I'm Rashid 👋

ML Engineer | Fintech & Generative AI

Building production ML systems for financial services — from model training to Docker deployment

👨‍💻 About Me

I'm an ML Engineer focused on Fintech products and Generative AI. I specialize in the full development cycle: data analysis → model training & optimization → production deployment via FastAPI + Docker.

I don't just train models in Jupyter — I build reliable, interpretable and scalable ML pipelines ready for real business use.

Core expertise:

🏦 Fintech ML — credit scoring, fraud detection (GNN + classical ML), PFM transaction categorization
🤖 LLM & RAG — Fine-Tuning (LoRA/PEFT), RAG architectures, voice AI assistants
⚙️ MLOps — MLflow, Evidently AI, Kafka Streaming, A/B testing, Docker

🛠 Tech Stack

Machine Learning

LLM & Voice AI

Backend & MLOps

💼 Projects

🔍 fraud-gnn

Fraud detection via transaction graph analysis using Graph Convolutional Networks

Транзакции представлены как граф: 590K узлов, 493K рёбер. GCN видит транзакцию в контексте её связей — если карта участвовала в подозрительных операциях, модель "заражает" соседей подозрением. Именно так работают антифрод системы Visa и Mastercard. AUC-ROC: 0.78, Fraud Recall: 62%.

💡 GNN vs LightGBM: классический ML смотрит на транзакцию изолированно, GNN видит коллаборативный фрод через топологию графа.

PyTorch Geometric GCNConv NetworkX FastAPI IEEE-CIS Dataset Graph ML

🛡️ fraud-detection-api

Hybrid real-time fraud detection microservice

Двухслойная архитектура: Redis Velocity Check (защита от брутфорса) + LightGBM (поведенческие паттерны). Встроенный A/B Testing Router распределяет трафик 80/20 между Champion и Challenger моделями для безопасного тестирования гипотез в продакшне.

LightGBM Redis Feature Store Docker Compose FastAPI A/B Testing Class Imbalance

🏦 credit-risk-api

Full MLOps pipeline for bank credit scoring — from Kaggle dataset to deployed REST API

LightGBM обёрнут в FastAPI-микросервис. MLflow Model Registry — модель динамически загружается по RUN_ID. SHAP TreeExplainer — каждый отказ сопровождается топ-5 факторами решения (требование банковских регуляторов). Evidently AI — мониторинг Data Drift. Логирование каждого предсказания в SQLite.

🔗 Live Demo

LightGBM MLflow SHAP Evidently AI FastAPI Docker SQLite Render

🌊 kafka-fraud-streaming

Real-time fraud detection streaming pipeline on Apache Kafka

Event-Driven пайплайн: Producer генерирует поток транзакций → Kafka Broker → Consumer Group с детектором. Демонстрация горизонтального масштабирования — при запуске нескольких Consumer инстансов Kafka автоматически перераспределяет нагрузку (Rebalance).

Apache Kafka Zookeeper Docker Compose Consumer Groups Event-Driven

💬 bank-ai-assistant

Intelligent bank support assistant with semantic search over knowledge base (RAG)

Полноценная RAG-архитектура: документы → чанкинг → HuggingFace Embeddings → Qdrant (векторная БД) → Llama 3 (Groq). Жёсткий Hallucination Prevention: бот отвечает строго по документам, показывая источники через Expander UI.

Qdrant RAG LangChain Llama-3 HuggingFace Embeddings Streamlit

🎙️ voice-bank-assistant

Full voice pipeline: Speech-to-Text → LLM → Text-to-Speech with conversation memory

Полный голосовой пайплайн: Whisper Large v3 транскрибирует речь → Llama 3.3-70B генерирует ответ с памятью всего диалога → gTTS синтезирует голос с автовоспроизведением. System Prompt оптимизирован под TTS-сценарий: краткие ответы без списков, как живой оператор по телефону.

Whisper v3 Llama-3.3-70B gTTS Groq Conversation Memory Streamlit

🧠 bank-llm-finetuning

Parameter-Efficient Fine-Tuning of LLM for bank support (PEFT/LoRA)

Fine-Tuning TinyLlama-1.1B с использованием LoRA-адаптеров — обучалось всего 1,126,400 параметров (0.10%) вместо полной модели. Cloud-to-Local Pipeline: обучение на GPU (Google Colab T4) → инференс на CPU.

💡 RAG vs Fine-Tuning: bank-ai-assistant использует внешнюю базу знаний, этот проект "зашивает" знания в веса модели — два подхода к одной задаче.

TinyLlama LoRA PEFT SFTTrainer PyTorch HuggingFace

💳 bank-transaction-categorizer

NLP system for "dirty" bank transaction categorization (PFM)

Fine-Tuning многоязычного DistilBERT на классификацию 5 банковских категорий. Модель устойчива к опечаткам, латинице и шумам (ID терминалов). Inference UI с Confidence Score на Streamlit.

DistilBERT PyTorch Hugging Face Fine-Tuning NLP Streamlit

🔥 pytorch-bank-churn

Bank churn prediction with custom PyTorch MLP from scratch

Полносвязная нейросеть (MLP) реализована на чистом PyTorch без высокоуровневых оберток. Ручная реализация Training Loop, Forward/Backward Pass, DataLoader с батч-обработкой тензоров. Accuracy: 94.5% на тестовой выборке.

PyTorch MLP Custom Training Loop Binary Classification

👁️ yolov8-object-detection

Real-time object detection web application (YOLOv8)

Zero-Shot Inference на предобученных весах MS COCO (80 классов). Поддержка масштабирования от yolov8n (Nano) до yolov8x (eXtra Large). Автоматический парсинг Bounding Boxes и генерация статистики.

YOLOv8 Ultralytics OpenCV Zero-Shot Streamlit

📊 GitHub Stats

📫 Get in Touch


📧 Email	nurbekovrashidjob@gmail.com
💬 Telegram	@RaNurbek
📍 Location	Almaty, Kazakhstan 🇰🇿

"Data without action is just numbers. I build systems that make decisions."

Provide feedback

Saved searches

Use saved searches to filter your results more quickly