Skip to content
View RaNurbekov's full-sized avatar
  • Almaty, Kazakhstan

Block or report RaNurbekov

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
RaNurbekov/README.md

Hi, I'm Rashid 👋

ML Engineer | Fintech & Generative AI

Building production ML systems for financial services — from model training to Docker deployment

Profile Views Telegram Email


👨‍💻 About Me

I'm an ML Engineer focused on Fintech products and Generative AI. I specialize in the full development cycle: data analysis → model training & optimization → production deployment via FastAPI + Docker.

I don't just train models in Jupyter — I build reliable, interpretable and scalable ML pipelines ready for real business use.

Core expertise:

  • 🏦 Fintech ML — credit scoring, fraud detection (GNN + classical ML), PFM transaction categorization
  • 🤖 LLM & RAG — Fine-Tuning (LoRA/PEFT), RAG architectures, voice AI assistants
  • ⚙️ MLOps — MLflow, Evidently AI, Kafka Streaming, A/B testing, Docker

🛠 Tech Stack

Machine Learning

Python PyTorch Scikit-Learn LightGBM HuggingFace PyG SHAP

LLM & Voice AI

LangChain Qdrant LoRA Whisper Groq

Backend & MLOps

FastAPI Docker Redis Kafka MLflow Evidently Streamlit


💼 Projects

Fraud detection via transaction graph analysis using Graph Convolutional Networks

Транзакции представлены как граф: 590K узлов, 493K рёбер. GCN видит транзакцию в контексте её связей — если карта участвовала в подозрительных операциях, модель "заражает" соседей подозрением. Именно так работают антифрод системы Visa и Mastercard. AUC-ROC: 0.78, Fraud Recall: 62%.

💡 GNN vs LightGBM: классический ML смотрит на транзакцию изолированно, GNN видит коллаборативный фрод через топологию графа.

PyTorch Geometric GCNConv NetworkX FastAPI IEEE-CIS Dataset Graph ML


Hybrid real-time fraud detection microservice

Двухслойная архитектура: Redis Velocity Check (защита от брутфорса) + LightGBM (поведенческие паттерны). Встроенный A/B Testing Router распределяет трафик 80/20 между Champion и Challenger моделями для безопасного тестирования гипотез в продакшне.

LightGBM Redis Feature Store Docker Compose FastAPI A/B Testing Class Imbalance


Full MLOps pipeline for bank credit scoring — from Kaggle dataset to deployed REST API

LightGBM обёрнут в FastAPI-микросервис. MLflow Model Registry — модель динамически загружается по RUN_ID. SHAP TreeExplainer — каждый отказ сопровождается топ-5 факторами решения (требование банковских регуляторов). Evidently AI — мониторинг Data Drift. Логирование каждого предсказания в SQLite.

🔗 Live Demo

LightGBM MLflow SHAP Evidently AI FastAPI Docker SQLite Render


Real-time fraud detection streaming pipeline on Apache Kafka

Event-Driven пайплайн: Producer генерирует поток транзакций → Kafka Broker → Consumer Group с детектором. Демонстрация горизонтального масштабирования — при запуске нескольких Consumer инстансов Kafka автоматически перераспределяет нагрузку (Rebalance).

Apache Kafka Zookeeper Docker Compose Consumer Groups Event-Driven


Intelligent bank support assistant with semantic search over knowledge base (RAG)

Полноценная RAG-архитектура: документы → чанкинг → HuggingFace Embeddings → Qdrant (векторная БД) → Llama 3 (Groq). Жёсткий Hallucination Prevention: бот отвечает строго по документам, показывая источники через Expander UI.

Qdrant RAG LangChain Llama-3 HuggingFace Embeddings Streamlit


Full voice pipeline: Speech-to-Text → LLM → Text-to-Speech with conversation memory

Полный голосовой пайплайн: Whisper Large v3 транскрибирует речь → Llama 3.3-70B генерирует ответ с памятью всего диалога → gTTS синтезирует голос с автовоспроизведением. System Prompt оптимизирован под TTS-сценарий: краткие ответы без списков, как живой оператор по телефону.

Whisper v3 Llama-3.3-70B gTTS Groq Conversation Memory Streamlit


Parameter-Efficient Fine-Tuning of LLM for bank support (PEFT/LoRA)

Fine-Tuning TinyLlama-1.1B с использованием LoRA-адаптеров — обучалось всего 1,126,400 параметров (0.10%) вместо полной модели. Cloud-to-Local Pipeline: обучение на GPU (Google Colab T4) → инференс на CPU.

💡 RAG vs Fine-Tuning: bank-ai-assistant использует внешнюю базу знаний, этот проект "зашивает" знания в веса модели — два подхода к одной задаче.

TinyLlama LoRA PEFT SFTTrainer PyTorch HuggingFace


NLP system for "dirty" bank transaction categorization (PFM)

Fine-Tuning многоязычного DistilBERT на классификацию 5 банковских категорий. Модель устойчива к опечаткам, латинице и шумам (ID терминалов). Inference UI с Confidence Score на Streamlit.

DistilBERT PyTorch Hugging Face Fine-Tuning NLP Streamlit


Bank churn prediction with custom PyTorch MLP from scratch

Полносвязная нейросеть (MLP) реализована на чистом PyTorch без высокоуровневых оберток. Ручная реализация Training Loop, Forward/Backward Pass, DataLoader с батч-обработкой тензоров. Accuracy: 94.5% на тестовой выборке.

PyTorch MLP Custom Training Loop Binary Classification


Real-time object detection web application (YOLOv8)

Zero-Shot Inference на предобученных весах MS COCO (80 классов). Поддержка масштабирования от yolov8n (Nano) до yolov8x (eXtra Large). Автоматический парсинг Bounding Boxes и генерация статистики.

YOLOv8 Ultralytics OpenCV Zero-Shot Streamlit


📊 GitHub Stats

RaNurbekov's GitHub Stats Top Languages

GitHub Streak


📫 Get in Touch

📧 Email nurbekovrashidjob@gmail.com
💬 Telegram @RaNurbek
📍 Location Almaty, Kazakhstan 🇰🇿

"Data without action is just numbers. I build systems that make decisions."

Pinned Loading

  1. credit-risk-api credit-risk-api Public

    Python

  2. fraud-detection-api fraud-detection-api Public

    Jupyter Notebook

  3. bank-llm-finetuning bank-llm-finetuning Public

    Python

  4. fraud-gnn fraud-gnn Public

    Python

  5. bank-ai-assistant bank-ai-assistant Public

    Python

  6. kafka-fraud-streaming kafka-fraud-streaming Public

    Python