From d2b59a7de9bc96fca8904f683b9fba84b08fd00d Mon Sep 17 00:00:00 2001
From: AI Assistant <ai@example.com>
Date: Mon, 15 Dec 2025 20:18:55 +0000
Subject: [PATCH] Refactor validator to use async/parallel processing for
 GitHub API calls

---
 gittensor/utils/github_api_tools.py           | 350 +++++++++--------
 gittensor/validator/evaluation/inspections.py |  12 +-
 gittensor/validator/evaluation/reward.py      |  38 +-
 gittensor/validator/evaluation/scoring.py     |  63 ++--
 requirements.txt                              |   1 +
 tests/utils/test_github_api_tools.py          | 357 ++++++------------
 6 files changed, 380 insertions(+), 441 deletions(-)

diff --git a/gittensor/utils/github_api_tools.py b/gittensor/utils/github_api_tools.py
index 99d98ab..6a679c5 100644
--- a/gittensor/utils/github_api_tools.py
+++ b/gittensor/utils/github_api_tools.py
@@ -1,12 +1,12 @@
 # Entrius 2025
 import base64
 import fnmatch
-import time
+import asyncio
 from datetime import datetime, timedelta, timezone
 from typing import Any, Dict, List, Optional
 
 import bittensor as bt
-import requests
+import aiohttp
 
 from gittensor.classes import FileChange, PRCountResult
 from gittensor.constants import (
@@ -123,7 +123,7 @@ def make_headers(token: str) -> Dict[str, str]:
 _GITHUB_USER_CACHE: Dict[str, Dict[str, Any]] = {}
 
 
-def get_github_user(token: str) -> Optional[Dict[str, Any]]:
+async def get_github_user(token: str) -> Optional[Dict[str, Any]]:
     """Fetch GitHub user data for a PAT with retry and in-process cache.
 
     Args:
@@ -142,36 +142,37 @@ def get_github_user(token: str) -> Optional[Dict[str, Any]]:
     headers = make_headers(token)
 
     # Retry logic for timeout issues
-    for attempt in range(6):
-        try:
-            response = requests.get(f"{BASE_GITHUB_API_URL}/user", headers=headers, timeout=30)
-            if response.status_code == 200:
-                try:
-                    user_data: Dict[str, Any] = response.json()
-                except Exception as e:  # pragma: no cover
-                    bt.logging.warning(f"Failed to parse GitHub /user JSON response: {e}")
-                    return None
-
-                _GITHUB_USER_CACHE[token] = user_data
-                return user_data
-
-            bt.logging.warning(
-                f"GitHub /user request failed with status {response.status_code} (attempt {attempt + 1}/6)"
-            )
-            if attempt < 5:
-                time.sleep(2)
-
-        except Exception as e:
-            bt.logging.warning(
-                f"Could not fetch GitHub user (attempt {attempt + 1}/6): {e}"
-            )
-            if attempt < 5:  # Don't sleep on last attempt
-                time.sleep(2)
+    async with aiohttp.ClientSession() as session:
+        for attempt in range(6):
+            try:
+                async with session.get(f"{BASE_GITHUB_API_URL}/user", headers=headers, timeout=30) as response:
+                    if response.status == 200:
+                        try:
+                            user_data: Dict[str, Any] = await response.json()
+                        except Exception as e:
+                            bt.logging.warning(f"Failed to parse GitHub /user JSON response: {e}")
+                            return None
+
+                        _GITHUB_USER_CACHE[token] = user_data
+                        return user_data
+
+                    bt.logging.warning(
+                        f"GitHub /user request failed with status {response.status} (attempt {attempt + 1}/6)"
+                    )
+                    if attempt < 5:
+                        await asyncio.sleep(2)
+
+            except Exception as e:
+                bt.logging.warning(
+                    f"Could not fetch GitHub user (attempt {attempt + 1}/6): {e}"
+                )
+                if attempt < 5:  # Don't sleep on last attempt
+                    await asyncio.sleep(2)
 
     return None
 
 
-def get_github_username(token: str) -> Optional[str]:
+async def get_github_username(token: str) -> Optional[str]:
     """Get GitHub username (login) using a PAT.
 
     Args:
@@ -180,13 +181,13 @@ def get_github_username(token: str) -> Optional[str]:
     Returns:
         Optional[str]: Username (login) string, or None if the PAT is invalid or an error occurred.
     """
-    user_data = get_github_user(token)
+    user_data = await get_github_user(token)
     if not user_data:
         return None
     return user_data.get("login")
 
 
-def get_github_id(token: str) -> Optional[str]:
+async def get_github_id(token: str) -> Optional[str]:
     """Get GitHub numeric user id (as string) using a PAT.
 
     Args:
@@ -195,7 +196,7 @@ def get_github_id(token: str) -> Optional[str]:
     Returns:
         Optional[str]: Numeric user id as a string, or None if it cannot be determined.
     """
-    user_data = get_github_user(token)
+    user_data = await get_github_user(token)
     if not user_data:
         return None
 
@@ -206,7 +207,7 @@ def get_github_id(token: str) -> Optional[str]:
     return str(user_id)
 
 
-def get_github_account_age_days(token: str) -> Optional[int]:
+async def get_github_account_age_days(token: str) -> Optional[int]:
     """Get GitHub account age in days for a PAT.
 
     Args:
@@ -215,7 +216,7 @@ def get_github_account_age_days(token: str) -> Optional[int]:
     Returns:
         Optional[int]: Number of days since account creation, or None if it cannot be determined.
     """
-    user_data = get_github_user(token)
+    user_data = await get_github_user(token)
     if not user_data:
         return None
 
@@ -232,40 +233,84 @@ def get_github_account_age_days(token: str) -> Optional[int]:
         return None
 
 
-def get_pull_request_file_changes(repository: str, pr_number: int, token: str) -> Optional[List[FileChange]]:
+async def get_pull_request_file_changes(
+    repository: str, pr_number: int, token: str, session: Optional[aiohttp.ClientSession] = None
+) -> Optional[List[FileChange]]:
     '''
     Get the diff for a specific PR by repository name and PR number
     Args:
         repository (str): Repository in format 'owner/repo'
         pr_number (int): PR number
         token (str): Github pat
+        session (Optional[aiohttp.ClientSession]): Existing aiohttp session to reuse
     Returns:
         List[FileChanges]: List object with file changes or None if error
     '''
     headers = make_headers(token)
+    
+    # Use provided session or create a new one
+    if session:
+        client = session
+        should_close = False
+    else:
+        client = aiohttp.ClientSession()
+        should_close = True
 
-    try:
-        response = requests.get(
-            f'{BASE_GITHUB_API_URL}/repos/{repository}/pulls/{pr_number}/files', headers=headers, timeout=15
-        )
-        if response.status_code == 200:
-            file_diffs = response.json()
-            return [FileChange.from_github_response(pr_number, repository, file_diff) for file_diff in file_diffs]
+    attempts = 6
 
+    try:
+        for attempt in range(attempts):
+            try:
+                async with client.get(
+                    f'{BASE_GITHUB_API_URL}/repos/{repository}/pulls/{pr_number}/files', headers=headers, timeout=15
+                ) as response:
+                    if response.status == 200:
+                        file_diffs = await response.json()
+                        return [FileChange.from_github_response(pr_number, repository, file_diff) for file_diff in file_diffs]
+                    
+                    # Handle rate limits or temporary failures
+                    elif attempt < (attempts - 1):
+                         # Exponential backoff: 5s, 10s, 20s, 40s, 80s
+                        backoff_delay = 5 * (2**attempt)
+                        bt.logging.warning(
+                            f"File changes request failed for {repository}#{pr_number} with status {response.status} (attempt {attempt + 1}/{attempts}), retrying in {backoff_delay}s..."
+                        )
+                        await asyncio.sleep(backoff_delay)
+                    else:
+                        bt.logging.error(f"Failed to get file changes after {attempts} attempts. Status: {response.status}")
+                        return []
+
+            except (aiohttp.ClientError, asyncio.TimeoutError) as e:
+                if attempt < (attempts - 1):
+                    backoff_delay = 5 * (2**attempt)
+                    bt.logging.warning(
+                        f"Connection error getting file changes for {repository}#{pr_number} (attempt {attempt + 1}/{attempts}): {e}, retrying in {backoff_delay}s..."
+                    )
+                    await asyncio.sleep(backoff_delay)
+                else:
+                    bt.logging.error(f"Connection error getting file changes after {attempts} attempts: {e}")
+                    return []
+        
         return []
 
-    except Exception as e:
-        bt.logging.error(f"Error getting file changes for PR #{pr_number} in {repository}: {e}")
-        return []
+    finally:
+        if should_close:
+            await client.close()
 
 
-def get_github_graphql_query(
-    token: str, global_user_id: str, all_valid_prs: List[Dict], max_prs: int, cursor: Optional[str]
-) -> Optional[requests.Response]:
+async def get_github_graphql_query(
+    session: aiohttp.ClientSession,
+    token: str,
+    global_user_id: str,
+    all_valid_prs: List[Dict],
+    max_prs: int,
+    cursor: Optional[str]
+) -> Optional[Dict]:
     """
     Get all merged PRs for a user across all repositories using GraphQL API with pagination.
 
     Args:
+        session (aiohttp.ClientSession): The active client session
         token (str): GitHub PAT
         global_user_id (str): Converted numeric user ID to GraphQL global node ID
         all_valid_prs (List[Dict]): List of raw currently validated PRs
@@ -273,7 +318,7 @@ def get_github_graphql_query(
         cursor (Optional[str]): Pagination cursor (where query left off last), None for first page
 
     Returns:
-        Optional[requests.Response]: Response object from the GraphQL query or None if errors occurred
+        Optional[Dict]: Parsed JSON response from the GraphQL query or None if errors occurred
     """
 
     attempts = 6
@@ -286,36 +331,37 @@ def get_github_graphql_query(
 
     for attempt in range(attempts):
         try:
-            response = requests.post(
+            async with session.post(
                 f'{BASE_GITHUB_API_URL}/graphql',
                 headers=headers,
                 json={"query": QUERY, "variables": variables},
                 timeout=30,
-            )
-
-            if response.status_code == 200:
-                return response
-            # error - log and retry
-            elif attempt < (attempts - 1):
-                # Exponential backoff: 5s, 10s, 20s, 40s, 80s
-                backoff_delay = 5 * (2**attempt)
-                bt.logging.warning(
-                    f"GraphQL request failed with status {response.status_code} (attempt {attempt + 1}/{attempts}), retrying in {backoff_delay}s..."
-                )
-                time.sleep(backoff_delay)
-            else:
-                bt.logging.error(
-                    f"GraphQL request failed with status {response.status_code} after {attempts} attempts: {response.text}"
-                )
-
-        except requests.exceptions.RequestException as e:
+            ) as response:
+
+                if response.status == 200:
+                    return await response.json()
+                # error - log and retry
+                elif attempt < (attempts - 1):
+                    # Exponential backoff: 5s, 10s, 20s, 40s, 80s
+                    backoff_delay = 5 * (2**attempt)
+                    bt.logging.warning(
+                        f"GraphQL request failed with status {response.status} (attempt {attempt + 1}/{attempts}), retrying in {backoff_delay}s..."
+                    )
+                    await asyncio.sleep(backoff_delay)
+                else:
+                    text = await response.text()
+                    bt.logging.error(
+                        f"GraphQL request failed with status {response.status} after {attempts} attempts: {text}"
+                    )
+
+        except aiohttp.ClientError as e:
             if attempt < (attempts - 1):
                 # Exponential backoff: 5s, 10s, 20s, 40s, 80s
                 backoff_delay = 5 * (2**attempt)
                 bt.logging.warning(
                     f"GraphQL request connection error (attempt {attempt + 1}/{attempts}): {e}, retrying in {backoff_delay}s..."
                 )
-                time.sleep(backoff_delay)
+                await asyncio.sleep(backoff_delay)
             else:
                 bt.logging.error(f"GraphQL request failed after {attempts} attempts: {e}")
                 return None
@@ -463,7 +509,7 @@ def _should_skip_merged_pr(
     return (False, None)
 
 
-def get_user_merged_prs_graphql(
+async def get_user_merged_prs_graphql(
     user_id: str, token: str, master_repositories: dict[str, dict], max_prs: int = 1000
 ) -> PRCountResult:
     """
@@ -507,88 +553,88 @@ def get_user_merged_prs_graphql(
     ]
 
     try:
-        while len(all_valid_prs) < max_prs:
-            # graphql query
-            response = get_github_graphql_query(token, global_user_id, all_valid_prs, max_prs, cursor)
-            if not response:
-                return PRCountResult(
-                    valid_prs=all_valid_prs,
-                    open_pr_count=open_pr_count,
-                    merged_pr_count=merged_pr_count,
-                    closed_pr_count=closed_pr_count,
-                )
-            data = response.json()
-
-            if 'errors' in data:
-                bt.logging.error(f"GraphQL errors: {data['errors']}")
-                break
-
-            # Extract user data from node query
-            user_data = data.get('data', {}).get('node')
-
-            if not user_data:
-                bt.logging.warning("User not found or no pull requests")
-                break
-
-            pr_data = user_data.get('pullRequests', {})
-            prs = pr_data.get('nodes', [])
-            page_info = pr_data.get('pageInfo', {})
-
-            # Process PRs from this page
-            for pr_raw in prs:
-                repository_full_name = f"{pr_raw['repository']['owner']['login']}/{pr_raw['repository']['name']}"
-                pr_state = pr_raw['state']
-
-                # Process non-merged PRs (OPEN or CLOSED without merge)
-                open_delta, closed_delta = _process_non_merged_pr(
-                    pr_raw, repository_full_name, pr_state, date_filter, active_repositories
-                )
-                open_pr_count += open_delta
-                closed_pr_count += closed_delta
-
-                # Skip if not a merged PR
-                if not pr_raw['mergedAt']:
-                    continue
-
-                # Parse merge date
-                merged_dt = datetime.fromisoformat(pr_raw['mergedAt'].rstrip("Z")).replace(tzinfo=timezone.utc)
-
-                # Validate merged PR against all criteria
-                should_skip, skip_reason = _should_skip_merged_pr(
-                    pr_raw, repository_full_name, master_repositories, date_filter, merged_dt
-                )
-
-                if should_skip:
-                    bt.logging.debug(skip_reason)
-                    continue
-
-                # PR passed all validation checks
-                base_ref = pr_raw['baseRefName']
-                bt.logging.info(f"Accepting PR #{pr_raw['number']} in {repository_full_name} - merged to '{base_ref}'")
-
-                # Increment merged_pr_count if merged after MERGE_SUCCESS_RATIO_APPLICATION_DATE
-                if merged_dt > MERGE_SUCCESS_RATIO_APPLICATION_DATE:
-                    merged_pr_count += 1
-
-                # Consider PR valid if all checks passed
-                all_valid_prs.append(pr_raw)
-
-            # Check if we should continue pagination
-            if not page_info.get('hasNextPage') or len(prs) == 0:
-                break
-
-            cursor = page_info.get('endCursor')
-
-        bt.logging.info(
-            f"Found {len(all_valid_prs)} valid merged PRs, {open_pr_count} open PRs, "
-            f"{merged_pr_count} merged PRs, {closed_pr_count} closed PRs."
-        )
-        return PRCountResult(
-            valid_prs=all_valid_prs,
-            open_pr_count=open_pr_count,
-            merged_pr_count=merged_pr_count,
-            closed_pr_count=closed_pr_count,
-        )
+        async with aiohttp.ClientSession() as session:
+            while len(all_valid_prs) < max_prs:
+                # graphql query
+                data = await get_github_graphql_query(session, token, global_user_id, all_valid_prs, max_prs, cursor)
+                if not data:
+                    return PRCountResult(
+                        valid_prs=all_valid_prs,
+                        open_pr_count=open_pr_count,
+                        merged_pr_count=merged_pr_count,
+                        closed_pr_count=closed_pr_count,
+                    )
+
+                if 'errors' in data:
+                    bt.logging.error(f"GraphQL errors: {data['errors']}")
+                    break
+
+                # Extract user data from node query
+                user_data = data.get('data', {}).get('node')
+
+                if not user_data:
+                    bt.logging.warning("User not found or no pull requests")
+                    break
+
+                pr_data = user_data.get('pullRequests', {})
+                prs = pr_data.get('nodes', [])
+                page_info = pr_data.get('pageInfo', {})
+
+                # Process PRs from this page
+                for pr_raw in prs:
+                    repository_full_name = f"{pr_raw['repository']['owner']['login']}/{pr_raw['repository']['name']}"
+                    pr_state = pr_raw['state']
+
+                    # Process non-merged PRs (OPEN or CLOSED without merge)
+                    open_delta, closed_delta = _process_non_merged_pr(
+                        pr_raw, repository_full_name, pr_state, date_filter, active_repositories
+                    )
+                    open_pr_count += open_delta
+                    closed_pr_count += closed_delta
+
+                    # Skip if not a merged PR
+                    if not pr_raw['mergedAt']:
+                        continue
+
+                    # Parse merge date
+                    merged_dt = datetime.fromisoformat(pr_raw['mergedAt'].rstrip("Z")).replace(tzinfo=timezone.utc)
+
+                    # Validate merged PR against all criteria
+                    should_skip, skip_reason = _should_skip_merged_pr(
+                        pr_raw, repository_full_name, master_repositories, date_filter, merged_dt
+                    )
+
+                    if should_skip:
+                        bt.logging.debug(skip_reason)
+                        continue
+
+                    # PR passed all validation checks
+                    base_ref = pr_raw['baseRefName']
+                    bt.logging.info(f"Accepting PR #{pr_raw['number']} in {repository_full_name} - merged to '{base_ref}'")
+
+                    # Increment merged_pr_count if merged after MERGE_SUCCESS_RATIO_APPLICATION_DATE
+                    if merged_dt > MERGE_SUCCESS_RATIO_APPLICATION_DATE:
+                        merged_pr_count += 1
+
+                    # Consider PR valid if all checks passed
+                    all_valid_prs.append(pr_raw)
+
+                # Check if we should continue pagination
+                if not page_info.get('hasNextPage') or len(prs) == 0:
+                    break
+
+                cursor = page_info.get('endCursor')
+
+            bt.logging.info(
+                f"Found {len(all_valid_prs)} valid merged PRs, {open_pr_count} open PRs, "
+                f"{merged_pr_count} merged PRs, {closed_pr_count} closed PRs."
+            )
+            return PRCountResult(
+                valid_prs=all_valid_prs,
+                open_pr_count=open_pr_count,
+                merged_pr_count=merged_pr_count,
+                closed_pr_count=closed_pr_count,
+            )
 
     except Exception as e:
         bt.logging.error(f"Error fetching PRs via GraphQL for user: {e}")
diff --git a/gittensor/validator/evaluation/inspections.py b/gittensor/validator/evaluation/inspections.py
index 134ad2a..b5c6e4c 100644
--- a/gittensor/validator/evaluation/inspections.py
+++ b/gittensor/validator/evaluation/inspections.py
@@ -52,7 +52,7 @@ def detect_and_penalize_duplicates(
     bt.logging.info(f"Total duplicate miners penalized: {duplicate_count}")
 
 
-def validate_response_and_initialize_miner_evaluation(uid: int, response: GitPatSynapse) -> MinerEvaluation:
+async def validate_response_and_initialize_miner_evaluation(uid: int, response: GitPatSynapse) -> MinerEvaluation:
 
     miner_eval = MinerEvaluation(uid=uid, hotkey=response.axon.hotkey)
 
@@ -64,7 +64,7 @@ def validate_response_and_initialize_miner_evaluation(uid: int, response: GitPat
         miner_eval.set_invalid_response_reason(f"No response provided by miner {uid}")
         return miner_eval
 
-    github_id, error = _validate_github_credentials(uid, response.github_access_token)
+    github_id, error = await _validate_github_credentials(uid, response.github_access_token)
     if error:
         miner_eval.set_invalid_response_reason(error)
         return miner_eval
@@ -74,19 +74,19 @@ def validate_response_and_initialize_miner_evaluation(uid: int, response: GitPat
     return miner_eval
 
 
-def _validate_github_credentials(uid: int, pat: Optional[str]) -> Tuple[Optional[str], Optional[str]]:
+async def _validate_github_credentials(uid: int, pat: Optional[str]) -> Tuple[Optional[str], Optional[str]]:
     """Validate PAT and return (github_id, error_reason) tuple."""
     if not pat:
         return None, f"No Github PAT provided by miner {uid}"
     
-    github_id = get_github_id(pat)
+    github_id = await get_github_id(pat)
     if not github_id:
         return None, f"No Github id found for miner {uid}'s PAT"
     
-    account_age = get_github_account_age_days(pat)
+    account_age = await get_github_account_age_days(pat)
     if not account_age:
         return None, f"Could not determine Github account age for miner {uid}"
     if account_age < MIN_GITHUB_ACCOUNT_AGE:
         return None, f"Miner {uid}'s Github account too young ({account_age} < {MIN_GITHUB_ACCOUNT_AGE} days)"
     
-    return github_id, None
\ No newline at end of file
+    return github_id, None
diff --git a/gittensor/validator/evaluation/reward.py b/gittensor/validator/evaluation/reward.py
index 6c39afe..fbd9dec 100644
--- a/gittensor/validator/evaluation/reward.py
+++ b/gittensor/validator/evaluation/reward.py
@@ -2,6 +2,7 @@
 # Copyright © 2025 Entrius
 from __future__ import annotations
 
+import asyncio
 from typing import TYPE_CHECKING, Dict
 
 import bittensor as bt
@@ -71,12 +72,12 @@ async def reward(
 
     bt.logging.info(f"******* Reward function called for UID: {uid} *******")
 
-    miner_eval = validate_response_and_initialize_miner_evaluation(uid, response)
+    miner_eval = await validate_response_and_initialize_miner_evaluation(uid, response)
     if miner_eval.failed_reason is not None:
         bt.logging.info(f"UID {uid} not being evaluated: {miner_eval.failed_reason}")
         return miner_eval
 
-    pr_result = get_user_merged_prs_graphql(miner_eval.github_id, miner_eval.github_pat, master_repositories)
+    pr_result = await get_user_merged_prs_graphql(miner_eval.github_id, miner_eval.github_pat, master_repositories)
 
     miner_eval.total_merged_prs = pr_result.merged_pr_count
     miner_eval.total_open_prs = pr_result.open_pr_count
@@ -87,7 +88,7 @@ async def reward(
             PullRequest.from_graphql_response(raw_pr, uid, miner_eval.hotkey, miner_eval.github_id)
         )
 
-    score_pull_requests(miner_eval, master_repositories, programming_languages)
+    await score_pull_requests(miner_eval, master_repositories, programming_languages)
 
     # Clear PAT after scoring to avoid storing sensitive data
     miner_eval.github_pat = None
@@ -110,19 +111,24 @@ async def get_rewards(
 
     bt.logging.info(f"UIDs: {uids}")
 
-    responses: Dict[int, GitPatSynapse] = {}
-    miner_evaluations: Dict[int, MinerEvaluation] = {}
-
-    # Query miners and calculate score.
-    for uid in uids:
-
-        # retrieve PAT
-        miner_response = await query_miner(self, uid)
-        responses[uid] = miner_response
-
-        # Calculate score
-        miner_evaluation = await reward(uid, miner_response, master_repositories, programming_languages)
-        miner_evaluations[uid] = miner_evaluation
+    # Query all miners in parallel
+    query_tasks = [query_miner(self, uid) for uid in uids]
+    miner_responses_list = await asyncio.gather(*query_tasks)
+    
+    responses: Dict[int, GitPatSynapse] = {
+        uid: resp for uid, resp in zip(uids, miner_responses_list)
+    }
+
+    # Evaluate all miners in parallel
+    eval_tasks = [
+        reward(uid, responses[uid], master_repositories, programming_languages)
+        for uid in uids
+    ]
+    miner_evaluations_list = await asyncio.gather(*eval_tasks)
+    
+    miner_evaluations: Dict[int, MinerEvaluation] = {
+        ev.uid: ev for ev in miner_evaluations_list
+    }
 
     # Adjust scores for duplicate accounts
     detect_and_penalize_duplicates(responses, miner_evaluations)
diff --git a/gittensor/validator/evaluation/scoring.py b/gittensor/validator/evaluation/scoring.py
index bbc3c8b..5184944 100644
--- a/gittensor/validator/evaluation/scoring.py
+++ b/gittensor/validator/evaluation/scoring.py
@@ -2,6 +2,7 @@
 # Copyright © 2025 Entrius
 
 import math
+import aiohttp
 from datetime import datetime, timezone
 from typing import Dict
 
@@ -29,7 +30,7 @@
 )
 from gittensor.utils.github_api_tools import get_pull_request_file_changes
 
-def score_pull_requests(
+async def score_pull_requests(
     miner_eval: MinerEvaluation,
     master_repositories: Dict[str, Dict],
     programming_languages: Dict[str, float],
@@ -50,39 +51,43 @@ def score_pull_requests(
     total_prs = len(miner_eval.pull_requests)
     bt.logging.info(f"Scoring {total_prs} PRs for uid {miner_eval.uid}")
 
-    for n, pr in enumerate(miner_eval.pull_requests, start=1):
-        bt.logging.info(f"\n[{n}/{total_prs}] - Scoring PR #{pr.number} in {pr.repository_full_name}")
+    # Use a single session for all PRs for this miner to improve performance
+    async with aiohttp.ClientSession() as session:
+        for n, pr in enumerate(miner_eval.pull_requests, start=1):
+            bt.logging.info(f"\n[{n}/{total_prs}] - Scoring PR #{pr.number} in {pr.repository_full_name}")
 
-        file_changes = get_pull_request_file_changes(pr.repository_full_name, pr.number, miner_eval.github_pat)
+            file_changes = await get_pull_request_file_changes(
+                pr.repository_full_name, pr.number, miner_eval.github_pat, session=session
+            )
 
-        if not file_changes:
-            bt.logging.warning("No file changes found for this PR.")
-            continue
+            if not file_changes:
+                bt.logging.warning("No file changes found for this PR.")
+                continue
 
-        pr.set_file_changes(file_changes)
+            pr.set_file_changes(file_changes)
 
-        repo_weight = master_repositories.get(pr.repository_full_name, {}).get("weight", 0.01)
-        file_change_score = pr.calculate_score_from_file_changes(programming_languages)
-        issue_multiplier = calculate_issue_multiplier(pr)
-        open_pr_spam_multiplier = calculate_pr_spam_penalty_multiplier(miner_eval.total_open_prs)
-        time_decay_multiplier = calculate_time_decay_multiplier(pr)
-        gittensor_tag_multiplier = GITTENSOR_TAGLINE_BOOST if (pr.gittensor_tagged and pr.repository_full_name.lower() != GITTENSOR_REPOSITORY.lower()) else 1.0
-        
-        # Only apply merge success penalty to PRs merged after the cutoff date
-        if pr.merged_at > MERGE_SUCCESS_RATIO_APPLICATION_DATE:
-            merge_success_multiplier = calculate_merge_success_multiplier(miner_eval)
-        else:
-            merge_success_multiplier = 1.0  # No penalty for PRs merged before cutoff
+            repo_weight = master_repositories.get(pr.repository_full_name, {}).get("weight", 0.01)
+            file_change_score = pr.calculate_score_from_file_changes(programming_languages)
+            issue_multiplier = calculate_issue_multiplier(pr)
+            open_pr_spam_multiplier = calculate_pr_spam_penalty_multiplier(miner_eval.total_open_prs)
+            time_decay_multiplier = calculate_time_decay_multiplier(pr)
+            gittensor_tag_multiplier = GITTENSOR_TAGLINE_BOOST if (pr.gittensor_tagged and pr.repository_full_name.lower() != GITTENSOR_REPOSITORY.lower()) else 1.0
+            
+            # Only apply merge success penalty to PRs merged after the cutoff date
+            if pr.merged_at > MERGE_SUCCESS_RATIO_APPLICATION_DATE:
+                merge_success_multiplier = calculate_merge_success_multiplier(miner_eval)
+            else:
+                merge_success_multiplier = 1.0  # No penalty for PRs merged before cutoff
 
-        pr.repo_weight_multiplier = round(repo_weight, 2)
-        pr.base_score = round(file_change_score, 2)
-        pr.issue_multiplier = round(issue_multiplier, 2)
-        pr.open_pr_spam_multiplier = round(open_pr_spam_multiplier, 2)
-        pr.time_decay_multiplier = round(time_decay_multiplier, 2)
-        pr.gittensor_tag_multiplier = round(gittensor_tag_multiplier, 2)
-        pr.merge_success_multiplier = round(merge_success_multiplier, 2)
+            pr.repo_weight_multiplier = round(repo_weight, 2)
+            pr.base_score = round(file_change_score, 2)
+            pr.issue_multiplier = round(issue_multiplier, 2)
+            pr.open_pr_spam_multiplier = round(open_pr_spam_multiplier, 2)
+            pr.time_decay_multiplier = round(time_decay_multiplier, 2)
+            pr.gittensor_tag_multiplier = round(gittensor_tag_multiplier, 2)
+            pr.merge_success_multiplier = round(merge_success_multiplier, 2)
 
-        miner_eval.unique_repos_contributed_to.add(pr.repository_full_name)
+            miner_eval.unique_repos_contributed_to.add(pr.repository_full_name)
 
 
 def count_repository_contributors(miner_evaluations: Dict[int, MinerEvaluation]) -> Dict[str, int]:
@@ -272,4 +277,4 @@ def _is_valid_issue(issue: Issue, pr: PullRequest) -> bool:
             bt.logging.warning(f"Skipping issue #{issue.number} - closed {days_diff:.1f}d from PR merge (max: {MAX_ISSUE_CLOSE_WINDOW_DAYS})")
             return False
 
-    return True
\ No newline at end of file
+    return True
diff --git a/requirements.txt b/requirements.txt
index e0191e6..7a2131d 100644
--- a/requirements.txt
+++ b/requirements.txt
@@ -14,3 +14,4 @@ debugpy==1.8.11
 # For validator database storage (not required for validators to run)
 pytz==2025.2
 psycopg2-binary==2.9.10
+aiohttp==3.11.11
diff --git a/tests/utils/test_github_api_tools.py b/tests/utils/test_github_api_tools.py
index 06b3768..40b7ce5 100644
--- a/tests/utils/test_github_api_tools.py
+++ b/tests/utils/test_github_api_tools.py
@@ -3,20 +3,15 @@
 
 """
 Unit tests for github_api_tools module
-
-Tests the GitHub API interaction functions, particularly focusing on:
-- Retry logic for transient failures (502, 503, 504)
-- Exponential backoff behavior
-- Error handling for various response codes
-- Successful request scenarios
 """
 
 import sys
 import unittest
-from unittest.mock import Mock, call, patch
+from unittest.mock import Mock, call, patch, AsyncMock, MagicMock
+import asyncio
+import aiohttp
 
 # Mock the circular import dependencies before importing the module
-# This prevents the circular import error when running tests
 sys.modules['gittensor.validator'] = Mock()
 sys.modules['gittensor.validator.utils'] = Mock()
 sys.modules['gittensor.validator.utils.config'] = Mock()
@@ -26,10 +21,27 @@
     get_user_merged_prs_graphql,
     get_github_id,
     get_github_account_age_days,
+    get_pull_request_file_changes,
 )
 
 
-class TestGraphQLRetryLogic(unittest.TestCase):
+def create_mock_response(status, json_data=None, text_data=""):
+    """Helper to create a mock aiohttp response context manager"""
+    response = AsyncMock()
+    response.status = status
+    if json_data is not None:
+        response.json.return_value = json_data
+    response.text.return_value = text_data
+    
+    # The context manager returned by session.get/post
+    context = MagicMock()
+    context.__aenter__ = AsyncMock(return_value=response)
+    context.__aexit__ = AsyncMock(return_value=None)
+    
+    return context
+
+
+class TestGraphQLRetryLogic(unittest.IsolatedAsyncioTestCase):
     """Test suite for GraphQL request retry logic"""
 
     def setUp(self):
@@ -38,20 +50,18 @@ def setUp(self):
         self.test_token = 'fake_github_token'
         self.master_repositories = {}
 
-    @patch('gittensor.utils.github_api_tools.requests.post')
-    @patch('gittensor.utils.github_api_tools.time.sleep')
+    @patch('gittensor.utils.github_api_tools.aiohttp.ClientSession')
+    @patch('gittensor.utils.github_api_tools.asyncio.sleep')
     @patch('gittensor.utils.github_api_tools.bt.logging')
-    def test_retry_on_502_then_success(self, mock_logging, mock_sleep, mock_post):
-        """Test that function retries on 502 Bad Gateway and succeeds on third attempt"""
+    async def test_retry_on_error_status_then_success(self, mock_logging, mock_sleep, mock_session_cls):
+        """Test that function retries on error status and succeeds on subsequent attempt"""
 
-        # First two calls return 502, third succeeds
-        mock_response_502 = Mock()
-        mock_response_502.status_code = 502
-        mock_response_502.text = "<html><title>502 Bad Gateway</title></html>"
+        mock_session = MagicMock()
+        mock_session_cls.return_value.__aenter__.return_value = mock_session
 
-        mock_response_200 = Mock()
-        mock_response_200.status_code = 200
-        mock_response_200.json.return_value = {
+        # First call returns 502, second returns 200
+        ctx_502 = create_mock_response(502, text_data="Bad Gateway")
+        ctx_200 = create_mock_response(200, json_data={
             'data': {
                 'node': {
                     'pullRequests': {
@@ -60,92 +70,53 @@ def test_retry_on_502_then_success(self, mock_logging, mock_sleep, mock_post):
                     }
                 }
             }
-        }
+        })
 
-        mock_post.side_effect = [mock_response_502, mock_response_502, mock_response_200]
+        mock_session.post.side_effect = [ctx_502, ctx_200]
 
         # Execute
-        result = get_user_merged_prs_graphql(self.test_user_id, self.test_token, self.master_repositories)
+        result = await get_user_merged_prs_graphql(self.test_user_id, self.test_token, self.master_repositories)
 
         # Verify
-        self.assertEqual(mock_post.call_count, 3, "Should retry 3 times total")
-        self.assertEqual(mock_sleep.call_count, 2, "Should sleep twice between retries")
+        self.assertEqual(mock_session.post.call_count, 2, "Should retry once")
+        self.assertEqual(mock_sleep.call_count, 1, "Should sleep once between retries")
         self.assertEqual(result.valid_prs, [])
-        self.assertEqual(result.open_pr_count, 0)
+        
+        mock_sleep.assert_called_with(5)
 
-        # Verify 15 second wait between retries
-        sleep_calls = [call(15), call(15)]
-        mock_sleep.assert_has_calls(sleep_calls)
 
-    @patch('gittensor.utils.github_api_tools.requests.post')
-    @patch('gittensor.utils.github_api_tools.time.sleep')
+    @patch('gittensor.utils.github_api_tools.aiohttp.ClientSession')
+    @patch('gittensor.utils.github_api_tools.asyncio.sleep')
     @patch('gittensor.utils.github_api_tools.bt.logging')
-    def test_gives_up_after_three_502s(self, mock_logging, mock_sleep, mock_post):
-        """Test that function gives up after 3 failed 502 attempts"""
+    async def test_gives_up_after_max_retries(self, mock_logging, mock_sleep, mock_session_cls):
+        """Test that function gives up after max retries"""
 
-        mock_response_502 = Mock()
-        mock_response_502.status_code = 502
-        mock_response_502.text = "<html><title>502 Bad Gateway</title></html>"
+        mock_session = MagicMock()
+        mock_session_cls.return_value.__aenter__.return_value = mock_session
 
-        mock_post.return_value = mock_response_502
+        # Always return 502
+        ctx_502 = create_mock_response(502, text_data="Bad Gateway")
+        mock_session.post.return_value = ctx_502
 
         # Execute
-        result = get_user_merged_prs_graphql(self.test_user_id, self.test_token, self.master_repositories)
+        result = await get_user_merged_prs_graphql(self.test_user_id, self.test_token, self.master_repositories)
 
         # Verify
-        self.assertEqual(mock_post.call_count, 3, "Should try exactly 3 times")
-        self.assertEqual(mock_sleep.call_count, 2, "Should sleep twice")
+        self.assertEqual(mock_session.post.call_count, 6, "Should try exactly 6 times")
+        self.assertEqual(mock_sleep.call_count, 5, "Should sleep 5 times")
         self.assertEqual(result.valid_prs, [])
-        self.assertEqual(result.open_pr_count, 0)
-
-        # Verify error was logged
-        mock_logging.error.assert_called()
-
-    @patch('gittensor.utils.github_api_tools.requests.post')
-    @patch('gittensor.utils.github_api_tools.time.sleep')
-    @patch('gittensor.utils.github_api_tools.bt.logging')
-    def test_retry_on_503_service_unavailable(self, mock_logging, mock_sleep, mock_post):
-        """Test that function retries on 503 Service Unavailable"""
-
-        mock_response_503 = Mock()
-        mock_response_503.status_code = 503
-        mock_response_503.text = "Service Unavailable"
-
-        mock_response_200 = Mock()
-        mock_response_200.status_code = 200
-        mock_response_200.json.return_value = {
-            'data': {
-                'node': {
-                    'pullRequests': {
-                        'pageInfo': {'hasNextPage': False, 'endCursor': None},
-                        'nodes': [],
-                    }
-                }
-            }
-        }
 
-        mock_post.side_effect = [mock_response_503, mock_response_200]
 
-        # Execute
-        result = get_user_merged_prs_graphql(self.test_user_id, self.test_token, self.master_repositories)
-
-        # Verify
-        self.assertEqual(mock_post.call_count, 2, "Should retry once after 503")
-        self.assertEqual(mock_sleep.call_count, 1, "Should sleep once")
-
-    @patch('gittensor.utils.github_api_tools.requests.post')
-    @patch('gittensor.utils.github_api_tools.time.sleep')
+    @patch('gittensor.utils.github_api_tools.aiohttp.ClientSession')
+    @patch('gittensor.utils.github_api_tools.asyncio.sleep')
     @patch('gittensor.utils.github_api_tools.bt.logging')
-    def test_retry_on_504_gateway_timeout(self, mock_logging, mock_sleep, mock_post):
-        """Test that function retries on 504 Gateway Timeout"""
+    async def test_retry_on_client_error(self, mock_logging, mock_sleep, mock_session_cls):
+        """Test that function retries on aiohttp ClientError"""
 
-        mock_response_504 = Mock()
-        mock_response_504.status_code = 504
-        mock_response_504.text = "Gateway Timeout"
+        mock_session = MagicMock()
+        mock_session_cls.return_value.__aenter__.return_value = mock_session
 
-        mock_response_200 = Mock()
-        mock_response_200.status_code = 200
-        mock_response_200.json.return_value = {
+        ctx_200 = create_mock_response(200, json_data={
             'data': {
                 'node': {
                     'pullRequests': {
@@ -154,192 +125,102 @@ def test_retry_on_504_gateway_timeout(self, mock_logging, mock_sleep, mock_post)
                     }
                 }
             }
-        }
-
-        mock_post.side_effect = [mock_response_504, mock_response_200]
+        })
 
-        # Execute
-        result = get_user_merged_prs_graphql(self.test_user_id, self.test_token, self.master_repositories)
-
-        # Verify
-        self.assertEqual(mock_post.call_count, 2, "Should retry once after 504")
-
-    @patch('gittensor.utils.github_api_tools.requests.post')
-    @patch('gittensor.utils.github_api_tools.time.sleep')
-    @patch('gittensor.utils.github_api_tools.bt.logging')
-    def test_no_retry_on_401_unauthorized(self, mock_logging, mock_sleep, mock_post):
-        """Test that function does NOT retry on 401 Unauthorized (non-retryable error)"""
-
-        mock_response_401 = Mock()
-        mock_response_401.status_code = 401
-        mock_response_401.text = "Unauthorized"
-
-        mock_post.return_value = mock_response_401
-
-        # Execute
-        result = get_user_merged_prs_graphql(self.test_user_id, self.test_token, self.master_repositories)
-
-        # Verify - should only try once, not retry
-        self.assertEqual(mock_post.call_count, 1, "Should NOT retry on 401")
-        self.assertEqual(mock_sleep.call_count, 0, "Should not sleep")
-        self.assertEqual(result.valid_prs, [])
-
-    @patch('gittensor.utils.github_api_tools.requests.post')
-    @patch('gittensor.utils.github_api_tools.time.sleep')
-    @patch('gittensor.utils.github_api_tools.bt.logging')
-    def test_no_retry_on_404_not_found(self, mock_logging, mock_sleep, mock_post):
-        """Test that function does NOT retry on 404 Not Found (non-retryable error)"""
-
-        mock_response_404 = Mock()
-        mock_response_404.status_code = 404
-        mock_response_404.text = "Not Found"
-
-        mock_post.return_value = mock_response_404
-
-        # Execute
-        result = get_user_merged_prs_graphql(self.test_user_id, self.test_token, self.master_repositories)
-
-        # Verify
-        self.assertEqual(mock_post.call_count, 1, "Should NOT retry on 404")
-        self.assertEqual(mock_sleep.call_count, 0, "Should not sleep")
-
-    @patch('gittensor.utils.github_api_tools.requests.post')
-    @patch('gittensor.utils.github_api_tools.time.sleep')
-    @patch('gittensor.utils.github_api_tools.bt.logging')
-    def test_retry_on_connection_error(self, mock_logging, mock_sleep, mock_post):
-        """Test that function retries on connection errors"""
-        import requests
-
-        # Simulate connection error on first two attempts, then success
-        mock_response_200 = Mock()
-        mock_response_200.status_code = 200
-        mock_response_200.json.return_value = {
-            'data': {
-                'node': {
-                    'pullRequests': {
-                        'pageInfo': {'hasNextPage': False, 'endCursor': None},
-                        'nodes': [],
-                    }
-                }
-            }
-        }
-
-        mock_post.side_effect = [
-            requests.exceptions.ConnectionError("Connection refused"),
-            requests.exceptions.ConnectionError("Connection refused"),
-            mock_response_200,
+        mock_session.post.side_effect = [
+            aiohttp.ClientError("Connection error"),
+            ctx_200
         ]
 
         # Execute
-        result = get_user_merged_prs_graphql(self.test_user_id, self.test_token, self.master_repositories)
-
-        # Verify
-        self.assertEqual(mock_post.call_count, 3, "Should retry after connection errors")
-        self.assertEqual(mock_sleep.call_count, 2, "Should sleep twice")
-
-        # Verify 15 second wait between retries
-        sleep_calls = [call(15), call(15)]
-        mock_sleep.assert_has_calls(sleep_calls)
-
-    @patch('gittensor.utils.github_api_tools.requests.post')
-    @patch('gittensor.utils.github_api_tools.time.sleep')
-    @patch('gittensor.utils.github_api_tools.bt.logging')
-    def test_gives_up_after_three_connection_errors(self, mock_logging, mock_sleep, mock_post):
-        """Test that function gives up after 3 connection errors"""
-        import requests
-
-        mock_post.side_effect = requests.exceptions.ConnectionError("Connection refused")
-
-        # Execute
-        result = get_user_merged_prs_graphql(self.test_user_id, self.test_token, self.master_repositories)
+        result = await get_user_merged_prs_graphql(self.test_user_id, self.test_token, self.master_repositories)
 
         # Verify
-        self.assertEqual(mock_post.call_count, 3, "Should try 3 times before giving up")
-        self.assertEqual(result.valid_prs, [])
-        self.assertEqual(result.open_pr_count, 0)
-
-    @patch('gittensor.utils.github_api_tools.requests.post')
-    @patch('gittensor.utils.github_api_tools.bt.logging')
-    def test_successful_request_no_retry(self, mock_logging, mock_post):
-        """Test that successful requests don't trigger retry logic"""
-
-        mock_response_200 = Mock()
-        mock_response_200.status_code = 200
-        mock_response_200.json.return_value = {
-            'data': {
-                'node': {
-                    'pullRequests': {
-                        'pageInfo': {'hasNextPage': False, 'endCursor': None},
-                        'nodes': [],
-                    }
-                }
-            }
-        }
-
-        mock_post.return_value = mock_response_200
-
-        # Execute
-        result = get_user_merged_prs_graphql(self.test_user_id, self.test_token, self.master_repositories)
-
-        # Verify
-        self.assertEqual(mock_post.call_count, 1, "Should only call once on success")
-        self.assertEqual(result.valid_prs, [])
-        self.assertEqual(result.open_pr_count, 0)
+        self.assertEqual(mock_session.post.call_count, 2, "Should retry after exception")
+        self.assertEqual(mock_sleep.call_count, 1, "Should sleep once")
 
 
-class TestOtherGitHubAPIFunctions(unittest.TestCase):
+class TestOtherGitHubAPIFunctions(unittest.IsolatedAsyncioTestCase):
     """Test suite for other GitHub API functions with existing retry logic"""
+    
+    def setUp(self):
+        # Clear cache before each test
+        from gittensor.utils.github_api_tools import _GITHUB_USER_CACHE
+        _GITHUB_USER_CACHE.clear()
 
-    @patch('gittensor.utils.github_api_tools.requests.get')
-    @patch('gittensor.utils.github_api_tools.time.sleep')
-    def test_get_github_id_retry_logic(self, mock_sleep, mock_get):
+    @patch('gittensor.utils.github_api_tools.aiohttp.ClientSession')
+    @patch('gittensor.utils.github_api_tools.asyncio.sleep')
+    async def test_get_github_id_retry_logic(self, mock_sleep, mock_session_cls):
         """Test that get_github_id retries on failure"""
+        
+        mock_session = MagicMock()
+        mock_session_cls.return_value.__aenter__.return_value = mock_session
 
-        # First two fail, third succeeds
-        mock_response_fail = Mock()
-        mock_response_fail.status_code = 500
-        mock_response_fail.json.side_effect = Exception("Failed")
+        ctx_success = create_mock_response(200, json_data={'id': 12345, 'login': 'testuser'})
 
-        mock_response_success = Mock()
-        mock_response_success.status_code = 200
-        mock_response_success.json.return_value = {'id': 12345}
-
-        mock_get.side_effect = [
+        # First two raise exception, third succeeds
+        mock_session.get.side_effect = [
             Exception("Timeout"),
             Exception("Timeout"),
-            mock_response_success,
+            ctx_success
         ]
 
         # Execute
-        result = get_github_id('fake_token')
+        result = await get_github_id('fake_token')
 
         # Verify
         self.assertEqual(result, '12345')
-        self.assertEqual(mock_get.call_count, 3)
+        self.assertEqual(mock_session.get.call_count, 3)
 
-    @patch('gittensor.utils.github_api_tools.requests.get')
-    @patch('gittensor.utils.github_api_tools.time.sleep')
-    def test_get_github_account_age_retry_logic(self, mock_sleep, mock_get):
+    @patch('gittensor.utils.github_api_tools.aiohttp.ClientSession')
+    @patch('gittensor.utils.github_api_tools.asyncio.sleep')
+    async def test_get_github_account_age_retry_logic(self, mock_sleep, mock_session_cls):
         """Test that get_github_account_age_days retries on failure"""
 
-        # First attempt fails, second succeeds
-        mock_response_success = Mock()
-        mock_response_success.status_code = 200
-        mock_response_success.json.return_value = {'created_at': '2020-01-01T00:00:00Z'}
+        mock_session = MagicMock()
+        mock_session_cls.return_value.__aenter__.return_value = mock_session
 
-        mock_get.side_effect = [
+        ctx_success = create_mock_response(200, json_data={'created_at': '2020-01-01T00:00:00Z', 'login': 'testuser'})
+
+        # First attempt fails, second succeeds
+        mock_session.get.side_effect = [
             Exception("Timeout"),
-            mock_response_success,
+            ctx_success
         ]
 
         # Execute
-        result = get_github_account_age_days('fake_token')
+        result = await get_github_account_age_days('fake_token')
 
         # Verify
         self.assertIsNotNone(result)
         self.assertIsInstance(result, int)
-        self.assertGreater(result, 1000)  # Account older than 1000 days
-        self.assertEqual(mock_get.call_count, 2)
+        self.assertGreater(result, 1000)
+        self.assertEqual(mock_session.get.call_count, 2)
+    
+    @patch('gittensor.utils.github_api_tools.aiohttp.ClientSession')
+    @patch('gittensor.utils.github_api_tools.asyncio.sleep')
+    async def test_get_pull_request_file_changes_with_session(self, mock_sleep, mock_session_cls):
+        """Test get_pull_request_file_changes using an existing session"""
+        
+        # Create a specific session to pass
+        existing_session = MagicMock()
+        
+        ctx_success = create_mock_response(200, json_data=[
+            {'filename': 'test.py', 'additions': 10, 'deletions': 5, 'changes': 15, 'status': 'modified', 'patch': '@@ -1,5 +1,10 @@'}
+        ])
+        
+        existing_session.get.return_value = ctx_success
+        
+        # Execute
+        result = await get_pull_request_file_changes('owner/repo', 1, 'token', session=existing_session)
+        
+        # Verify
+        self.assertIsNotNone(result)
+        self.assertEqual(len(result), 1)
+        self.assertEqual(existing_session.get.call_count, 1)
+        
+        # Verify that ClientSession was NOT initialized (since we passed one)
+        mock_session_cls.assert_not_called()
 
 
 if __name__ == '__main__':