frederikhoengaard
diff --git a/‎Pipfile
+2-2 b/‎Pipfile
+2-2
diff --git a/‎python/src/lazylearn/lazylearn.py
+5-14 b/‎python/src/lazylearn/lazylearn.py
+5-14
diff --git a/‎python/src/lazylearn/models/models.py
+4-2 b/‎python/src/lazylearn/models/models.py
+4-2
diff --git a/‎python/src/lazylearn/regression/models/randomforest/randomforest.py
+3-2 b/‎python/src/lazylearn/regression/models/randomforest/randomforest.py
+3-2
diff --git a/‎python/src/lazylearn/strategies/strategy_builder.py
+42 b/‎python/src/lazylearn/strategies/strategy_builder.py
+42
@@ -6,10 +6,10 @@ verify_ssl = true
 [packages]
 loguru = "==0.6.*"
 pandas = "==1.5.*"
-scikit-learn = "*"
+scikit-learn = "1.2.2"
 tqdm = "*"
 jupyter = "*"
-xgboost = "*"
+xgboost = "1.7.*"
 
 [dev-packages]
 black = "==23.*"
 
@@ -5,7 +5,7 @@
 from regression.models.randomforest.randomforest import (  # noqa
     RandomForestRegressionRunner,
 )
-from sklearn.metrics import mean_absolute_error
+from strategies.strategy_builder import StrategyBuilder
 
 
 class LazyLearner:
@@ -50,18 +50,9 @@ def run_autopilot(self):
 
         :return:
         """
+        sb = StrategyBuilder(task=self.task, dataset=self.dataset, target=self.target, random_state=self.random_state)
+        self.leaderboard = sorted([model for model in sb.models], key=lambda x: x.score)
 
-        simple_random_forest = RandomForestRegressionRunner(
-            target=self.target,
-            dataset=self.dataset,
-            random_state=self.random_state,  # noqa
-        )
-        simple_random_forest.fit()
+    def get_leaderboard(self):
+        return [(item.name, item.score) for item in self.leaderboard]
 
-        # get holdout scores
-        simple_random_forest.predict(self.dataset.partitions["test"])
-        simple_random_forest.pipeline.holdout_score = mean_absolute_error(
-            self.dataset.partitions["test"][self.target],
-            simple_random_forest.pipeline.tmp_pred,
-        )
-        return simple_random_forest
@@ -22,8 +22,10 @@ def save(self):
 
 
 class Model:
-    def __init__(self):
-        self.name = None
+    def __init__(self, name: str, score: float, pipeline):
+        self.name = name
+        self.score = score
+        self.pipeline = pipeline
 
     def save(self, path: str):
         raise NotImplementedError
 
@@ -7,7 +7,8 @@
 
 
 class RandomForestRegressionRunner:
-    def __init__(self, target, dataset, random_state=42):
+    def __init__(self, target, dataset, random_state=None):
+        self.name = "RandomForestRegressor"
         self.target = target
         self.dataset: Dataset = dataset
         self.random_state = random_state
@@ -31,7 +32,7 @@ def fit(self):
 
         self.pipeline.add(OrdinalConverter(cat_vars=cat_vars))
 
-        self.pipeline.add(RandomForestRegressorStep())
+        self.pipeline.add(RandomForestRegressorStep(random_state=self.random_state))
 
         self.pipeline.fit()
 
 
@@ -0,0 +1,42 @@
+from sklearn.metrics import mean_absolute_error
+
+from models.models import Model
+from regression.models.randomforest.randomforest import RandomForestRegressionRunner
+
+class StrategyBuilder:
+    def __init__(self, task, dataset, target, random_state=None):
+        self.task = task
+        self.dataset = dataset
+        self.target = target
+        self.random_state = random_state
+        self.strategies = []
+        self.models = []
+
+        self.build()
+        self.start()
+
+    def build(self):
+        if self.task == "regression":
+            self.strategies.append(
+                RandomForestRegressionRunner(
+                    target=self.target,
+                    dataset=self.dataset,
+                    random_state=self.random_state,  # noqa
+                )
+            )
+        else:
+            raise ValueError("Unsupported task!")
+
+    def start(self):
+        for strategy in self.strategies:
+            strategy.fit()
+
+            # get holdout scores
+            strategy.predict(self.dataset.partitions["test"])
+            strategy.pipeline.holdout_score = mean_absolute_error(
+                self.dataset.partitions["test"][self.target],
+                strategy.pipeline.tmp_pred,
+            )
+
+            self.models.append(Model(name=strategy.name, score=strategy.pipeline.holdout_score, pipeline=strategy))
+