UCD-BDLab
diff --git a/‎.github/workflows/docs.yml‎
Lines changed: 9 additions & 7 deletions b/‎.github/workflows/docs.yml‎
Lines changed: 9 additions & 7 deletions
diff --git a/‎.github/workflows/python-app.yml‎
Lines changed: 46 additions & 63 deletions b/‎.github/workflows/python-app.yml‎
Lines changed: 46 additions & 63 deletions
diff --git a/‎.github/workflows/readthedocs.yml‎
Lines changed: 0 additions & 18 deletions b/‎.github/workflows/readthedocs.yml‎
Lines changed: 0 additions & 18 deletions
diff --git a/‎.gitignore‎
Lines changed: 9 additions & 0 deletions b/‎.gitignore‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎.pre-commit-config.yml‎
Lines changed: 4 additions & 0 deletions b/‎.pre-commit-config.yml‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎ArunTest.py‎
Lines changed: 57 additions & 45 deletions b/‎ArunTest.py‎
Lines changed: 57 additions & 45 deletions
@@ -2,9 +2,9 @@ name: Build and Deploy Documentation
 
 on:
   push:
-    branches: [ main ]
+    branches: [main]
   pull_request:
-    branches: [ main ]
+    branches: [main]
 
 jobs:
   build-deploy-docs:
@@ -19,22 +19,24 @@ jobs:
       - name: Set up Python 3.10
         uses: actions/setup-python@v4
         with:
-          python-version: '3.10'
+          python-version: "3.10"
           check-latest: true
 
-      - name: Install Dependencies and Set Up Environment
+      - name: Install Dependencies
         run: |
           python -m pip install --upgrade pip
-          python fast-install.py --cuda --cuda-version 12.1 --dev
+          pip install -r requirements.txt
+          pip install -r requirements-dev.txt
+          pip install torch
+          pip install torch_geometric
         shell: bash
 
       - name: Build Documentation
         run: |
-          source ./bioneuralnet-env/bin/activate
           mkdir -p docs/build/html
           sphinx-build -b html docs/source/ docs/build/html/
         shell: bash
-      
+
       - name: Deploy to GitHub Pages
         uses: peaceiris/actions-gh-pages@v3
         with:
 
@@ -1,84 +1,67 @@
-name: BioNeuralNet
+name: BioNeuralNet CI
 
 on:
   push:
-    branches: [ main ]
+    branches: [main]
   pull_request:
-    branches: [ main ]
+    branches: [main]
 
 jobs:
   build:
     strategy:
       matrix:
         os: [ubuntu-latest, macos-latest, windows-latest]
-        python-version: ['3.10', '3.11']
+        python-version: ["3.10", "3.11"]
 
     runs-on: ${{ matrix.os }}
 
     steps:
-    - name: Checkout repository
-      uses: actions/checkout@v3
+      - name: Checkout repository
+        uses: actions/checkout@v3
 
-    - name: Set up Python ${{ matrix.python-version }}
-      uses: actions/setup-python@v4
-      with:
-        python-version: ${{ matrix.python-version }}
-        check-latest: true
+      - name: Set up Python ${{ matrix.python-version }}
+        uses: actions/setup-python@v4
+        with:
+          python-version: ${{ matrix.python-version }}
+          check-latest: true
 
-    - name: Cache pip dependencies
-      uses: actions/cache@v3
-      with:
-        path: |
-          ~/.cache/pip
-        key: ${{ runner.os }}-pip-${{ hashFiles('**/requirements.txt', '**/scripts/requirements-dev.txt', 'fast-install.py') }}
-        restore-keys: |
-          ${{ runner.os }}-pip-
+      - name: Cache pip dependencies
+        uses: actions/cache@v3
+        with:
+          path: ~/.cache/pip
+          key: ${{ runner.os }}-pip-${{ hashFiles('**/requirements.txt', '**/requirements-dev.txt') }}
+          restore-keys: ${{ runner.os }}-pip-
 
-    - name: Install dependencies using fast-install.py (Unix)
-      if: matrix.os != 'windows-latest'
-      run: |
-        chmod +x fast-install.py
-        ./fast-install.py --cuda --cuda-version 12.1 --dev
-      shell: bash
+      - name: Install Python dependencies
+        run: |
+          python -m pip install --upgrade pip
+          pip install -r requirements.txt
+          pip install -r requirements-dev.txt
+          pip install torch
+          pip install torch_geometric
+        shell: bash
 
-    - name: Install dependencies using fast-install.py (Windows)
-      if: matrix.os == 'windows-latest'
-      run: |
-        python fast-install.py --cuda --cuda-version 12.1 --dev
-      shell: powershell
+      - name: Install R
+        uses: r-lib/actions/setup-r@v2
+        with:
+          r-version: "latest"
 
-    - name: Verify installed Python packages (Unix)
-      if: matrix.os != 'windows-latest'
-      run: |
-        source ./bioneuralnet-env/bin/activate
-        pip list
-      shell: bash
+      - name: Install R packages
+        run: |
+          Rscript -e "if (!requireNamespace('BiocManager', quietly = TRUE)) install.packages('BiocManager')"
+          Rscript -e "BiocManager::install(update = TRUE, ask = FALSE)"
+          Rscript -e "install.packages(c('SmCCNet', 'jsonlite', 'dplyr'))"
+          Rscript -e "BiocManager::install(c('WGCNA', 'impute', 'GO.db', 'dynamicTreeCut', 'fastcluster'))"
+        shell: bash
 
-    - name: Verify installed Python packages (Windows)
-      if: matrix.os == 'windows-latest'
-      run: |
-        .\bioneuralnet-env\Scripts\Activate.ps1
-        pip list
-      shell: powershell
+      - name: Run tests with pytest
+        run: |
+          pytest --cov=bioneuralnet --cov-report=xml tests/
 
-    - name: Run tests with pytest (Unix)
-      if: matrix.os != 'windows-latest'
-      run: |
-        source ./bioneuralnet-env/bin/activate
-        pytest --cov=bioneuralnet --cov-report=xml tests/
-      shell: bash
-
-    - name: Run tests with pytest (Windows)
-      if: matrix.os == 'windows-latest'
-      run: |
-        .\bioneuralnet-env\Scripts\Activate.ps1
-        pytest --cov=bioneuralnet --cov-report=xml tests/
-      shell: powershell
-
-    - name: Upload coverage to Codecov
-      uses: codecov/codecov-action@v3
-      with:
-        token: ${{ secrets.CODECOV_TOKEN }}
-        files: ./coverage.xml
-        flags: unittests
-        name: codecov-umbrella
+      - name: Upload coverage to Codecov
+        uses: codecov/codecov-action@v3
+        with:
+          token: ${{ secrets.CODECOV_TOKEN }}
+          files: ./coverage.xml
+          flags: unittests
+          name: codecov-umbrella
@@ -11,6 +11,15 @@ venv.bak/
 .pytest_cache
 release.md
 bioneuralnet.egg-info
+/dist/
+/build/
+/docker_files/
+
+
+# Block sensitive file types globally
+*.csv
+*.RData
+
 
 # Sphinx documentation build
 docs/build/
 
@@ -6,6 +6,10 @@ repos:
       - id: end-of-file-fixer
       - id: check-yaml
       - id: check-added-large-files
+      - id: forbidden-files
+        args:
+          - '*.csv'
+          - '*.RData'
 
   - repo: https://github.com/psf/black
     rev: 23.3.0
 
@@ -12,13 +12,13 @@
 """
 
 import pandas as pd
-from bioneuralnet.graph_generation import SmCCNet
+from bioneuralnet.external_tools import SmCCNet
 from bioneuralnet.downstream_task import DPMON
 
-def run_smccnet_dpmon_workflow(omics_genes: pd.DataFrame,
-                               
-                               phenotype: pd.Series,
-                               clinical_data: pd.DataFrame) -> pd.DataFrame:
+
+def run_smccnet_dpmon_workflow(
+    omics_genes: pd.DataFrame, phenotype: pd.Series, clinical_data: pd.DataFrame
+) -> pd.DataFrame:
     """
     Executes the hybrid workflow combining SmCCNet for network generation and DPMON for disease prediction.
 
@@ -39,10 +39,10 @@ def run_smccnet_dpmon_workflow(omics_genes: pd.DataFrame,
     try:
         smccnet_instance = SmCCNet(
             phenotype_df=phenotype,
-            omics_dfs=[gene_names],
-            data_types=['genes'],
+            omics_dfs=[omics_genes],
+            data_types=["genes"],
             kfold=5,
-            summarization='PCA',
+            summarization="PCA",
             seed=732,
         )
         adjacency_matrix = smccnet_instance.run()
@@ -53,63 +53,75 @@ def run_smccnet_dpmon_workflow(omics_genes: pd.DataFrame,
             omics_list=[omics_genes],
             phenotype_data=phenotype,
             features_data=clinical_data,
-            model='GCN',  
-            tune=False,  
-            gpu=False     
+            model="GCN",
+            tune=False,
+            gpu=False,
         )
 
         predictions_df = dpmon_instance.run()
         if not predictions_df.empty:
             print("DPMON workflow completed successfully. Predictions generated.")
         else:
-            print("DPMON hyperparameter tuning completed. No predictions were generated.")
+            print(
+                "DPMON hyperparameter tuning completed. No predictions were generated."
+            )
 
         return predictions_df
 
     except Exception as e:
         print(f"An error occurred during the SmCCNet + DPMON workflow: {e}")
         raise e
 
+
 if __name__ == "__main__":
     try:
         print("Starting SmCCNet + DPMON Hybrid Workflow...")
 
-        # omics_proteins = pd.DataFrame({
-        #     'protein_feature1': [0.1, 0.2],
-        #     'protein_feature2': [0.3, 0.4]
-        # }, index=['Sample1', 'Sample2'])
-
-        # omics_metabolites = pd.DataFrame({
-        #     'metabolite_feature1': [0.5, 0.6],
-        #     'metabolite_feature2': [0.7, 0.8]
-        # }, index=['Sample1', 'Sample2'])
-
-        # phenotype_data = pd.Series([1, 0], index=['Sample1', 'Sample2'])
-
-        # clinical_data = pd.DataFrame({
-        #     'clinical_feature1': [5, 3],
-        #     'clinical_feature2': [7, 2]
-        # }, index=['Sample1', 'Sample2'])
-
-        ## COPDGeneCounts.csv: 1st column is geneID_split containing the gene names
-        omics_genes = pd.read_csv("/Users/sarkara/Desktop/GitHub/BioNeuralNet/COPDGeneCounts.csv")
-        
-        #gene_names = omics_genes["geneID_split"]
-        values = omics_genes[omics_genes.columns[0:337]]
-        gene_names = values.drop(["geneID"], axis=1)
-        gene_names_transposed = gene_names.reset_index().transpose()
-        print(gene_names_transposed)
-
-        md = pd.read_csv("/Users/sarkara/Desktop/GitHub/BioNeuralNet/COPDGeneMetadata.csv")
+        omics_genes = pd.read_csv("example_data/COPDGeneCounts.csv")
+        omics_genes = omics_genes.drop(
+            [
+                "geneID",
+                "end",
+                "strand",
+                "gene_id",
+                "gene_name",
+                "gene_type",
+                "chr",
+                "start",
+            ],
+            axis=1,
+        )
+        omics_genes_t = omics_genes.T
+        omics_genes_t = omics_genes_t.reset_index().rename(columns={"index": "sid"})
+
+        new_header = omics_genes_t.iloc[0].copy()
+        new_header.iloc[0] = "sid"
+        omics_genes_t = omics_genes_t[1:]
+        omics_genes_t.columns = new_header
+        omics_genes_t = omics_genes_t.reset_index(drop=True)
+
+        # gene_names = omics_genes["geneID_split"]
+        md = pd.read_csv("example_data/COPDGeneMetadata.csv")
         phenotype = md[["sid", "finalgold_visit"]].reset_index()
-        clinical_data = md[["sid", "age_visit", "gender", "smoking_status"]].reset_index()
-        print(clinical_data)
-        print(phenotype)
-        gene_names = gene_names.reset_index()
-        predictions = run_smccnet_dpmon_workflow(gene_names, phenotype, clinical_data)
+        clinical_data = md[
+            ["sid", "age_visit", "gender", "smoking_status"]
+        ].reset_index(drop=True)
+
+        phenotype_subset = phenotype[["sid", "finalgold_visit"]]
+        phenotype_subset["finalgold_visit"] = pd.to_numeric(
+            phenotype_subset["finalgold_visit"], errors="coerce"
+        )
+
+        print(f"Gene name:\n {omics_genes_t}")
+        print(f"Phenotype subset: \n{phenotype_subset}")
+        print(f"Cclinical data: \n{clinical_data}")
+
+        predictions = run_smccnet_dpmon_workflow(
+            omics_genes_t, phenotype_subset, clinical_data
+        )
 
         print("DPMON Predictions:")
-        #print(predictions)
+        print(predictions)
 
         print("Hybrid Workflow completed successfully.\n")
     except Exception as e: