🛒 Rossmann Sales Forecasting with XGBoost

This project forecasts daily sales for Rossmann stores using historical data, store metadata, and engineered features. We use the XGBoost regression model to capture complex patterns and improve predictive accuracy.

📁 Dataset

Train Data: train.csv
Test Data: test.csv
Store Metadata: store.csv

Data Source: Rossmann Kaggle Competition

📌 Objective

Predict the Sales column using historical store data.
Create a model that generalizes well to unseen data (test set).
Submit predictions in submission.csv.

🛠️ Tools & Technologies

Python
Pandas, NumPy, Matplotlib, Seaborn
XGBoost
Scikit-learn for model selection and metrics

🧪 Features Used

🔹 Basic Info

Store, DayOfWeek, Promo, SchoolHoliday, StateHoliday, StoreType, Assortment, CompetitionDistance, Promo2

🔹 Date-Based

Year, Month, Day, WeekOfYear

🔹 Engineered

IsPromoMonth — True if the current month is a promo month for that store
IsHolidayWeek — True if a holiday (school/state) occurred in that week
CompetitionOpenTimeMonths — Number of months since a competitor opened
Promo2OpenTimeWeeks — Weeks since Promo2 started

🔹 Lag & Rolling Stats (only in training)

Sales_Lag1, Sales_Lag7, Sales_RollingMean3, Sales_RollingMean7

🚫 These features are excluded from test data since future sales are unknown.

🧱 Workflow

Load & Merge: Combine train.csv/test.csv with store.csv
Feature Engineering: Extract and transform useful features
Train/Test Split: Split train data for model evaluation
Train Model: Use XGBRegressor
Hyperparameter Tuning: GridSearchCV (optional)
Predict: Apply best model to processed test data
Submit: Create submission.csv

Actual vs Predicted Sales (scatter plot)
Predicted Sales Trends (by Date or Store)
Feature Importance from XGBoost

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.ipynb_checkpoints		.ipynb_checkpoints
.gitattributes		.gitattributes
.gitignore		.gitignore
Cleanned_data.csv		Cleanned_data.csv
README.md		README.md
Rossmann_sales_forecast.ipynb		Rossmann_sales_forecast.ipynb
final_test.csv		final_test.csv
sample_submission.csv		sample_submission.csv
store.csv		store.csv
submission.csv		submission.csv
test.csv		test.csv
train.csv		train.csv
xgboost_best_params.joblib		xgboost_best_params.joblib

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🛒 Rossmann Sales Forecasting with XGBoost

📁 Dataset

📌 Objective

🛠️ Tools & Technologies

🧪 Features Used

🔹 Basic Info

🔹 Date-Based

🔹 Engineered

🔹 Lag & Rolling Stats (only in training)

🧱 Workflow

About

Uh oh!

Releases

Packages

Languages

sabin74/rossmann_sales_forecast

Folders and files

Latest commit

History

Repository files navigation

🛒 Rossmann Sales Forecasting with XGBoost

📁 Dataset

📌 Objective

🛠️ Tools & Technologies

🧪 Features Used

🔹 Basic Info

🔹 Date-Based

🔹 Engineered

🔹 Lag & Rolling Stats (only in training)

🧱 Workflow

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages