hypernetwork-research-group · ddevin96 · Nov 19, 2025 · Oct 24, 2025 · Nov 3, 2025
diff --git a/hyperbench/hyperlink_prediction/datasets/imdb_dataset.py b/hyperbench/hyperlink_prediction/datasets/imdb_dataset.py
@@ -110,7 +110,7 @@ class IMDBHypergraphDataset(CHLPBaseDataset):
 
 class ARXIVHypergraphDataset(CHLPBaseDataset):
 
-    GDRIVE_ID = "1nGkihnayNx4PskOHqiqwUYcYoGF3t-1H"
+    GDRIVE_ID = "1pXRgFzVKIC-WtSslapAEPf9KlerTFhnd"
     DATASET_NAME = "ARXIV"
 
 class COURSERAHypergraphDataset(CHLPBaseDataset):

diff --git a/hyperbench/pipelines/pipeline.py b/hyperbench/pipelines/pipeline.py
@@ -7,12 +7,14 @@ def execute():
     parser.add_argument('--hlp_method', type=str, help="hyperlink prediction method to use, possible method: \nCommonNeighbors", required=True)
     parser.add_argument('--output_path', type=str, help="Path to save the results", default="./results")
     parser.add_argument('--random_seed', type=int, help="Random seed for reproducibility", default=None)
+    parser.add_argument('--test', type=bool, help="If true, runs in test mode", default=False)
     args = parser.parse_args()
     dataset_name= args.dataset_name
     negative_method = args.negative_sampling
     hlp_method = args.hlp_method
     output_path = args.output_path
     random_seed = args.random_seed
+    test = args.test
 
     import torch
     import numpy as np
@@ -53,10 +55,25 @@ def pre_transform(data: HyperGraphData):
         unique, inverse = data.edge_index[1].unique(return_inverse = True)
         data.edge_attr = data.edge_attr[unique]
         data.edge_index[1] = inverse
-
         return data
 
     dataset = select_dataset(dataset_name, pre_transform= pre_transform)
+    if test:
+        reduction = min(1000, dataset._data.num_edges)
+        edge_index = dataset._data.edge_index[:, :reduction].clone()
+        edge_attr = dataset._data.edge_attr[:reduction].clone()
+        nodes_present = torch.unique(edge_index[0]).sort()[0]
+        num_nodes = edge_index.max().item() + 1
+        mapping = -torch.ones(num_nodes, dtype=torch.long)
+        mapping[nodes_present] = torch.arange(len(nodes_present))
+        edge_index = mapping[edge_index]
+        test_data = HyperGraphData(
+            x=dataset._data.x[nodes_present].clone(),
+            edge_index=edge_index,
+            edge_attr=edge_attr.clone(),
+            num_nodes=len(nodes_present),
+        )
+        dataset._data = test_data
 
     test_size = 0.2
     val_size = 0.0
@@ -84,8 +101,8 @@ def __init__(self,
             self.activation = nn.LeakyReLU()
             self.in_norm = nn.LayerNorm(in_channels)
             self.in_proj = nn.Linear(in_channels, hidden_channels)
-            self.e_proj = nn.Linear(in_channels, hidden_channels)
-            self.e_norm = nn.LayerNorm(in_channels)
+            self.e_proj = None
+            self.e_norm = None
 
             for i in range(num_layers):
                 setattr(self, f"n_norm_{i}", nn.LayerNorm(hidden_channels))
@@ -108,8 +125,13 @@ def forward(self, x, x_e, edge_index):
             x = self.in_proj(x)
             x = self.activation(x)
             x = self.dropout(x)
+            if self.e_norm is None:
+                self.e_norm = nn.LayerNorm(x_e.size(-1)).to(x_e.device)
 
+            x_e = x_e.to(dtype=self.e_norm.weight.dtype, device=self.e_norm.weight.device)
             x_e = self.e_norm(x_e)
+            if self.e_proj is None:
+                self.e_proj = nn.Linear(x_e.size(-1), self.in_proj.out_features).to(x_e.device)
             x_e = self.e_proj(x_e)
             x_e = self.activation(x_e)
             x_e = self.dropout(x_e)
@@ -138,7 +160,7 @@ def forward(self, x, x_e, edge_index):
     criterion = torch.nn.BCEWithLogitsLoss()
     test_criterion = torch.nn.BCELoss()
 
-    negative_hypergraph = setNegativeSamplingAlgorithm(negative_method,test_dataset.x.__len__()).generate(test_dataset._data.edge_index)
+    negative_hypergraph = setNegativeSamplingAlgorithm(negative_method, test_dataset._data.num_nodes).generate(test_dataset._data.edge_index)
     edge_index_test = test_dataset._data.edge_index.clone()
     test_dataset.y = torch.vstack((
         torch.ones((test_dataset._data.edge_index[1].max() + 1, 1)),

diff --git a/tests/methods_test.py b/tests/methods_test.py
@@ -4,18 +4,18 @@
 def dataset_dict():
     datasets = {}
     dataset_arb = [
-        'coauth-DBLP',
-        # "coauth-MAG-Geology",
-        # "email-Enron",
-        # "tags-math-sx",
-        # "contact-high-school",
-        # "contact-primary-school",
-        # "NDC-substances"
+        "coauth-DBLP",
+        "coauth-MAG-Geology",
+        "email-Enron",
+        "tags-math-sx",
+        "contact-high-school",
+        "contact-primary-school",
+        "NDC-substances"
     ]
     datasets_CHLP = [
-        #"IMDB",
+        "IMDB",
         "COURSERA",
-        #"ARXIV"
+        "ARXIV"
     ]
     negative_methods = [
         "SizedHypergraphNegativeSampler",
@@ -48,6 +48,7 @@ def create_pipelines_comand():
                 f"--dataset_name {dataset_name} "
                 f"--hlp_method {hlp} "
                 f"--negative_sampling {ns}"
+                f" --test True"
             )
             pipelines.append(cmd)