Skip to content
View JonasMelo21's full-sized avatar
  • Brasilia - Brazil
  • 22:31 (UTC -03:00)

Block or report JonasMelo21

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
JonasMelo21/README.md

👨‍💻 Jonas Honorato | Data Engineer & ML Developer

🌐 Scroll down to keep reading this README in English or Click here for Pt-br version --> Versão em Português 🔍 "Building robust data pipelines and interpretable ML models — from theory to production." 📌 Currently: Data Engineering Intern @ BBTS (Banco do Brasil Tecnologias e Serviços)
🌱 Focus: End-to-end Data Projects (ETL → ML → MLOps) + Backend Development

LinkedIn Portuguese Version


🏆 My Badges & Certifications

An image of @jonasmelo21's Holopin badges, which is a link to view their full Holopin profile


🛠️ Core Skills

🛠️ Tech Stack

  • Data Engineering/MLOps:

    • Python
    • SQL
    • ETL
    • Spark
    • Azure Databricks
    • Azure Data Factory
    • Azure DevOps
  • ML:

    • Scikit-learn
    • Feature Engineering
    • Statisticss
    • Validation
    • Azure Databricks
  • Visualization:

    • Power BI
    • Matplotlib & Seaborn
    • Excel
    • Plotly
  • Backend:

    • FastAPI
    • Flask
    • PostgreSQL
    • System Design
  • Numerical:

    • C
    • Algorithms
    • Optimization
    • Numerical Methods

🚀 Highlighted Projects

🔍 Data Science & ML

⚽ Fut-IA: Football Match Predictor (End-to-End) | Click Here to View Project

  • Scope: Full-stack Data Science project (ETL -> Modeling -> Web App) predicting Copa do Brasil outcomes.
  • Pipeline: Automated data ingestion from APIs, Feature Engineering (Rolling Averages), and Random Forest modeling.
  • Outcome: Deployed interactive Streamlit app with CI/CD, creating a usable product from raw data.
  • Tech: Python Scikit-Learn Streamlit Plotly RapidAPI

🤖 mini_ml: Minimal ML Library | Click Here to View Project

  • Scope: Educational ML library built from scratch for learning core algorithms.
  • Contents: KNN, linear/logistic regression, preprocessing, optimization, and stats utilities.
  • Tech: Python

🎓 Student Performance Classifier | Click Here to View Project

  • Challenge: Kaggle dataset contained label errors in target variable
  • Solution: Manual label correction + SMOTE after train-test split
  • Results: 96% Accuracy | F1-score 0.96
  • Tech: Pandas SMOTE GridSearch Pipeline Design

📉 Churn Prediction (Stats + MLP) | Click Here to View Project

  • Approach: Combined hypothesis testing (Chi², Mann-Whitney) with neural networks
  • Insights: Age > 40 doubles churn risk | German customers churn more
  • Results: 67% Recall | 82% Accuracy
  • Tech: SciPy TensorFlow SHAP Statistical Validation

🏠 Rent Price Prediction | Click Here toView Project

  • Dual Approach: Linear regression + price classification (business-interpretable)
  • Key Findings: +R$24.03/m² | -R$51.10/km from center
  • Results: R² 0.82 | Classification Accuracy 84%
  • Tech: StatsModels Matplotlib Business Rules

⚙️ Backend Systems

  • X-Men Management System Full CRUD for mutant academy with relational DB design (FastAPI SQLAlchemy Tkinter UI)

  • TaskMaster Collaborative task manager with priority queues (Python Flask Business Rules & SQL)

📐 Numerical Analysis / Numerical Computing

🧮 NumLab: Numerical Computing Lab | Click Here to View Project

  • Scope: Interactive numerical computing lab for root-finding methods with visual animations.
  • Tech: Python FastAPI React TypeScript

Implemented algorithms from Burden & Faires:
Equation Solving | Numerical Linear Algebra | Eigenvectors and Eigenvalues | Linear and Nonlinear Systems | ODEs 🔗 Repository


🌟 What Defines My Work

  • ML with Engineering Rigor: Focus on reproducible pipelines over one-off models
  • Cloud-Native Approach: Leverage Azure stack for scalable data solutions
  • Production Mindset: From notebooks to deployable systems (learning MLOps)
  • Full Pipeline Awareness: From raw data to business insights

📫 Let's connect: LinkedIn | jonashonorato4@gmail.com


🇧🇷 Versão em Português

🔍 "Construindo pipelines robustos e modelos de ML interpretáveis — da teoria à produção." 📌 Atualmente: Estagiário em Engenharia de Dados @ BBTS (Banco do Brasil Tecnologias e Serviços)
🌱 Foco: Projetos end-to-end (ETL → ML → MLOps) + Desenvolvimento Backend

LinkedIn English Version


🏆 Meus Badges e Certificações

[![An image of @jonasmelo21's Holopin badges, which is a link to view their full Holopin profile](https://holopin.me/jonasmelo21)](https://holopin.io/@jonasmelo21)

🛠️ Principais Habilidades

Engenharia de Dados Python | SQL | ETL | Spark | Databricks | Azure Data Factory

ML/MLOps Scikit-learn | Engenharia de Features | Validação Estatística | Jupyter Notebooks | Azure Databricks

Visualização de Dados Power BI | Matplotlib & Seaborn | Excel | Plotly

Backend FastAPI | Flask | PostgreSQL | Design de Sistemas | Azure DevOps

Computação Numérica C | Algoritmos | Otimização | Cálculo Numérico | Álgebra Linear Numérica


🚀 Projetos Destacados

🔍 Ciência de Dados & ML

⚽ Fut-IA: Preditor de Futebol (End-to-End) | Ver Projeto

  • Escopo: Projeto Full-stack de Data Science (ETL -> Modelagem -> Web App) prevendo resultados da Copa do Brasil.
  • Pipeline: Ingestão automatizada de APIs, Engenharia de Features (Médias Móveis) e modelagem com Random Forest.
  • Resultado: Dashboard interativo em Streamlit com CI/CD, transformando dados brutos em produto utilizável.
  • Tecnologias: Python Scikit-Learn Streamlit Plotly RapidAPI

🤖 mini_ml: Biblioteca de ML Minimalista | Ver Projeto

  • Escopo: Biblioteca educacional de ML implementada do zero para estudo.
  • Conteúdo: KNN, regressões linear/logística, pré-processamento, otimização e estatística.
  • Tecnologias: Python

🎓 Classificador de Performance Estudantil | Ver Projeto

  • Desafio: Dataset do Kaggle continha erros nos rótulos da variável alvo
  • Solução: Correção manual + SMOTE após divisão treino-teste
  • Resultados: 96% Acurácia | F1-score 0.96
  • Tecnologias: Pandas SMOTE GridSearch Pipelines

📉 Predição de Churn (Estatística + MLP) | Ver Projeto

  • Abordagem: Testes de hipótese (Qui², Mann-Whitney) combinados com redes neurais
  • Insights: Idade > 40 dobra risco de churn | Clientes alemães saem mais
  • Resultados: 67% Recall | 82% Acurácia
  • Tecnologias: SciPy TensorFlow SHAP Validação Estatística

🏠 Predição de Preços de Aluguel | Ver Projeto

  • Abordagem Dupla: Regressão linear + classificação de preços (interpretável)
  • Coeficientes: +R$24,03/m² | -R$51,10/km do centro
  • Resultados: R² 0.82 | Acurácia 84%
  • Tecnologias: StatsModels Matplotlib Regras de Negócio

⚙️ Sistemas Backend

  • Sistema X-Men CRUD completo para academia de mutantes com banco relacional (FastAPI SQLAlchemy Tkinter UI)

  • TaskMaster Gerenciador de tarefas colaborativo com filas de prioridade (Python Flask Regras de Negócio)

📐 Análise Numérica / Computação Numérica

🧮 NumLab: Laboratório de Computação Numérica | Ver Projeto

  • Escopo: Laboratório interativo para métodos de busca de raízes com animações visuais.
  • Tecnologias: Python FastAPI React TypeScript

Algoritmos implementados do livro Burden & Faires:
Solução de Equações | Álgebra Linear Numérica | Autovetores e Autovalores | Sistemas Lineares e Não Lineares | EDOs
🔗 Repositório


🌟 O Que Define Meu Trabalho

  • Rigor em Engenharia de ML: Pipelines reprodutíveis em vez de modelos isolados
  • Abordagem em Nuvem: Uso do stack Azure para soluções escaláveis
  • Mentalidade de Produção: Do notebook à implantação (aprendendo MLOps)
  • Visão do Pipeline Completo: Dados brutos até insights de negócio

📫 Vamos conversar: LinkedIn | jonashonorato4@gmail.com

Pinned Loading

  1. Numerical-Analysis-Studies Numerical-Analysis-Studies Public

    This repository aims to keep track of my journey in my personal studies in the field of Numerical Analysis.

    C 2

  2. CrackingTheCodeInterviewStudies CrackingTheCodeInterviewStudies Public

    My personal space for tracking progress on Cracking the Coding Interview questions.

    Java

  3. Data_Science_Studies Data_Science_Studies Public

    My personal space to document my learning journey in the field of Data Science, ML and AI

    Jupyter Notebook

  4. Sistema-X-Men Sistema-X-Men Public

    Python

  5. TaskMaster TaskMaster Public

    HTML

  6. NumLab NumLab Public

    NumLab - Laboratório para Métodos Numéricos

    Python