[Bug]: fit time is incorrect #1332

DRMPN · 2024-09-07T20:48:01Z

Expected Behavior

Current Behavior

Green is real time.
Purple or red is calculated(estimated) time.

8 hours run

5 minutes run

Possible Solution

Multiplication instead of addition in time estimator I guess.

Steps to Reproduce

Data can be obtained from: https://www.kaggle.com/competitions/playground-series-s4e9/data
Simple notebooks to reproduce the bug:

8 hours notebook:

import pandas as pd
import numpy as np
from fedot.api.main import Fedot

train = pd.read_csv("C:/Users/nnikitin-user/Desktop/automl-september/playground-series-s4e9/train.csv")
test = pd.read_csv("C:/Users/nnikitin-user/Desktop/automl-september/playground-series-s4e9/test.csv")
sub = pd.read_csv("C:/Users/nnikitin-user/Desktop/automl-september/playground-series-s4e9/sample_submission.csv")

train.drop(columns=["id"], inplace=True)
test.drop(columns=["id"], inplace=True)

auto_model = Fedot(
    problem="regression",
    metric=["rmse"],
    preset="best_quality",
    with_tuning=True,
    timeout=480,
    cv_folds=10,
    seed=42,
    n_jobs=1,
    logging_level=10,
    use_pipelines_cache=False,
    use_auto_preprocessing=False,
)

auto_model.fit(features=train, target="price")

auto_model.current_pipeline.save(
    path="C:/Users/nnikitin-user/Desktop/automl-september/run_8hours/saved_pipelines",
    create_subdir=True,
    is_datetime_in_path=True,
)

prediction = auto_model.predict(features=test)

sub["price"] = prediction.ravel()
sub.to_csv("submission.csv", index=False)

30 mins notebook:

import pandas as pd
import numpy as np
from fedot.api.main import Fedot
from fedot.core.pipelines.pipeline_builder import PipelineBuilder

train = pd.read_csv("C:/Users/nnikitin-user/Desktop/automl-september/playground-series-s4e9/train.csv")
test = pd.read_csv("C:/Users/nnikitin-user/Desktop/automl-september/playground-series-s4e9/test.csv")
sub = pd.read_csv("C:/Users/nnikitin-user/Desktop/automl-september/playground-series-s4e9/sample_submission.csv")

train.drop(columns=["id"], inplace=True)
test.drop(columns=["id"], inplace=True)

auto_model = Fedot(
    problem="regression",
    metric=["rmse"],
    preset="best_quality",
    with_tuning=True,
    timeout=5,
    cv_folds=10,
    seed=42,
    n_jobs=1,
    logging_level=10,
    initial_assumption=PipelineBuilder().add_node("lgbmreg").build(),
    use_pipelines_cache=False,
    use_auto_preprocessing=False,
)

auto_model.fit(features=train, target="price")

auto_model.current_pipeline.save(
    path="C:/Users/nnikitin-user/Desktop/automl-september/run_lgbm/saved_pipelines",
    create_subdir=True,
    is_datetime_in_path=True,
)

prediction = auto_model.predict(features=test)

sub["price"] = prediction
sub.to_csv("submission.csv", index=False)

Context [OPTIONAL]

Participating in a Kaggle competition https://www.kaggle.com/competitions/playground-series-s4e9

The text was updated successfully, but these errors were encountered:

aPovidlo · 2024-09-08T14:39:46Z

@DRMPN А какие значения в n_jobs стояли?

DRMPN · 2024-09-08T18:59:19Z

@DRMPN А какие значения в n_jobs стояли?

n_jobs = 1

DRMPN added bug Something isn't working core Core logic related to graph optimisation labels Sep 7, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Bug]: fit time is incorrect #1332

[Bug]: fit time is incorrect #1332

DRMPN commented Sep 7, 2024 •

edited

Loading

aPovidlo commented Sep 8, 2024

DRMPN commented Sep 8, 2024

[Bug]: fit time is incorrect #1332

[Bug]: fit time is incorrect #1332

Comments

DRMPN commented Sep 7, 2024 • edited Loading

Expected Behavior

Current Behavior

Possible Solution

Steps to Reproduce

Context [OPTIONAL]

aPovidlo commented Sep 8, 2024

DRMPN commented Sep 8, 2024

DRMPN commented Sep 7, 2024 •

edited

Loading