Repositori ini berisi proyek analisis data cuaca yang mendalam, menggunakan teknik analisis dan machine learning. Dataset mencakup informasi global seperti suhu, kelembapan, dan tekanan. Tujuannya adalah mengeksplorasi pola dan tren cuaca, serta membangun model prediktif untuk peramalan cuaca yang akurat dan berguna.
Proyek ini melalui beberapa tahap analisis, termasuk:
- Loading dan Cleaning Data: Memuat data dan melakukan pembersihan untuk memastikan kualitas data.
- Exploratory Data Analysis (EDA): Menganalisis data secara visual untuk menemukan pola dan anomali.
- Feature Engineering: Membuat fitur baru yang meningkatkan performa model.
- Modeling: Menggunakan berbagai teknik machine learning untuk membangun model prediksi.
- Model Evaluation: Mengevaluasi kinerja model menggunakan berbagai metrik.
- Deployment: Menerapkan model untuk prediksi di dunia nyata.
- Real-Time Data Processing: Menjelajahi penggunaan alat untuk pemrosesan data cuaca secara real-time.
- Analisis deskriptif dan visualisasi data cuaca.
- Model prediksi suhu menggunakan teknik regresi dan ensemble.
- Clustering lokasi berdasarkan pola cuaca.
- Integrasi dengan antarmuka pengguna untuk visualisasi hasil analisis.
- Implementasi untuk pemrosesan data secara real-time.
Proyek ini menggunakan:
- Python
- Pandas
- NumPy
- Matplotlib dan Seaborn untuk visualisasi
- Scikit-learn untuk machine learning
- XGBoost untuk model prediktif
Untuk menjalankan proyek ini, Anda perlu menginstal dependensi berikut:
pip install -r requirements.txt