- Carla Valeria Baca - Data Engineer
- Aldana Mariel Lavergne - Data Engineer
- Sofia Mignani - Data Analyst
- Juan José Ordoñez - Data Engineer
- Antonella Castillo - Data Analyst
This initiative addresses the inventory challenges faced by DRINK'S E CIA, a beverage distribution company. Through data analysis and the implementation of optimization models, we aim to enhance inventory management efficiency, reduce costs, and optimize inventory turnover.
DRINK'S & CIA approached us to conduct an in-depth analysis of their data with the goal of optimizing their inventory management. Through our specialized consultancy and the use of advanced data analysis techniques, we identified areas for improvement and proposed solutions that resulted in efficient inventory management and significant cost reductions.
The primary challenge we face is implementing an efficient inventory management system. However, there are several significant obstacles we must overcome to achieve this. One of the main obstacles is the lack of deep knowledge about inventory management. Relevant information is scattered across various Excel files, leading to a lack of data uniformity. This lack of clarity can have negative consequences for the company, such as excess or shortage of products, stock issues, and lost sales.
- Analyze and optimize inventory management.
- Reduce costs.
- Optimize inventory turnover.
- Identify patterns and trends in product sales.
- Provide valuable insights for decision-making.
Original Source: Inventory Dataset available on Kaggle
- Sales
- Initial Inventory
- Product
- Purchase
- Final Inventory
- Purchase Details
- Automation Watchdog
- Final CSVs
- Entity-Relationship Diagram
- EDA-ETL
- Images
- README
This folder contains the (.ipynb) file for the incremental data loading automation process from Python to the InventarioBD database in SQL Server Management.
This folder contains images related to the Entity-Relationship Diagram (ERD) of the InventarioDB database, generated in Drawio and SQL Server Management.
Here, the six (.ipynb) files corresponding to the EDA and ETL processes of each dataframe in the database were uploaded.
Technology Stack 🔭
- Microsoft SQL Server: Management and storage of relational databases.
- Python: Programming language for data analysis and process automation.
- Pandas: Python library for data manipulation and analysis.
- NumPy: Python library for numerical calculations and array analysis.
- Power BI: Data visualization tool for creating interactive dashboards.
- Visual Studio Code: Development environment for writing and debugging code.
- GitHub: Platform for version control and collaboration on code projects.
- Seaborn: Python library for data visualization built on Matplotlib.
- Google Cloud Platform (GCP): Cloud service provider for scalable data storage, computing, and analytics solutions.
- Draw.io: Tool for creating entity-relationship diagrams and other graphical diagrams.
- Canvas: Tool for graphic design and creating visual content.
- Baca Carla Valeria - Ingeniera de datos
- Lavergne Aldana Mariel - Ingeniera de Datos
- Mignani Sofia - Analista de datos
- Ordoñez Juan José - Ingeniero de datos
- Castillo Antonella - Analista de datos
Esta iniciativa aborda los desafíos de inventario que enfrenta Distribuidora DRINK´S E CIA, una empresa de bebidas. A través del análisis de datos y la implementación de modelos de optimización, pretendemos mejorar la eficiencia en la gestión de inventarios, reducir costos y optimizar la rotación del inventario.
DRINK’S & CIA, nos contactó para realizar un análisis exhaustivo de sus datos con el objetivo de optimizar la gestión de su inventario. A través de nuestra consultoría especializada y el uso de técnicas avanzadas de análisis de datos, pudimos identificar áreas de mejora y proponer soluciones que resultaron en una gestión de inventarios eficiente y una reducción significativa de costos.
El principal reto que enfrentamos es la implementación de un sistema de gestión de inventario eficiente. Sin embargo, existen varios obstáculo significativos que debemos superar para lograrlo.Uno de los principales obstáculos es la falta de conocimiento profundo sobre la gestión de inventarios. La información relevante se encuentra dispersa en diferentes archivos de Excel, lo que hace que no haya una uniformidad en los datos. Esta falta de claridad puede tener consecuencias negativas para la empresa. Como el exsezo o escases de productos, problemas de stock y pérdidas en la ventas.
- Analizar y optimizar la gestiín de inventarios.
- Reducir costos.
- Optimizar la rotación de inventario.
- Identificar patrones y tendencias en la venta de los productos.
- Proporcionar insights valiosos para la toma de desiciones.
Fuente original: Dataset Inventory esta disponible en Kaggle
- Ventas
- Inventario inicial
- Producto
- Compra
- Inventario final
- Detalle de comprea
- Automatización Whatchdog
- CSV Finales
- Diagrama Entidad-Relación
- EDA-ETL
- Imágenes
- README
En esta carpeta se encuentra el archivo (.ipynb) del proceso de automatización de carga incremental de datos desde Python hacia la base de datos InventarioBD en SQL Server Management.
Aquí se guardaron los seis archivos finales (.csv) correspondiente a cada dataframe luego del proceso de ETL.
Carpeta contenedora de imágenes correspondiente al DER de la base de datos InventarioDB, generados en Drawio y en SQL Server Management.
Aquí se cargaron los seis archivos (.ipynb) correspondientes a los procesos de de EDA y ETL de cada dataframe de la base de datos.
Carpeta contenedora de imágenes varias que se usaron durante el armado del proyecto y de los archivos en general.
Stack Tecnológico 🔭
- Microsoft SQL Server: Gestión y almacenamiento de bases de datos relacionales.
- Python: Lenguaje de programación para análisis de datos y automatización de procesos.
- Pandas: Biblioteca de Python para manipulación y análisis de datos.
- NumPy: Biblioteca de Python para cálculos numéricos y análisis de matrices.
- Power BI: Herramienta de visualización de datos para crear dashboards interactivos.
- Visual Studio Code: Entorno de desarrollo para escribir y depurar código.
- GitHub: Plataforma para el control de versiones y colaboración en proyectos de código.
- Seaborn: Biblioteca de Python para visualización de datos basada en Matplotlib.
- Google Cloud Platform (GCP): Proveedor de servicios en la nube para almacenamiento de datos, computación y soluciones de análisis escalables.
- Draw.io: Herramienta para crear diagramas de entidad-relación y otros diagramas gráficos.
- Canvas: Herramienta para el diseño gráfico y creación de contenido visual.
Este stack refleja un enfoque robusto y versátil para el análisis de datos, gestión de bases de datos, y visualización, utilizando tanto herramientas de desarrollo como plataformas colaborativas.