Bienvenid@ a mi

PORTFOLIO DE PROYECTOS

Mi nombre es Oswaldo

GRACIAS POR SU VISITA

PROYECTOS, CODIGOS, EXPERIENCIA.

PREDICTOR DE SALARIOS PARA DESARROLADORES WEB

Basado en la Encuesta para desarrolladores de Stack Overflow 2018

Life-Cycle Project

👉 DESCRIPCIÓN GENERAL

El proyecto muestra la construcción de una aplicación web interactiva denominada Predictor de Salarios, el proyecto fue desarrollado en el lenguaje de programación Python con librerías como Pandas, Numpy y Matplotlib para el Análisis exploratorio de Datos, limpieza, extracción de características, etiquetado y visualización de los datos.

Así mismo el proyecto reúne conocimientos sobre los algoritmos de Machine Learning, como Regresión Lineal, Árbol de Decisiones y Bosque Aleatorio que fueron los modelos usados en la construcción, entrenamiento y evaluación del proyecto a través de la librería Scikit-learn.

Para la integración del proyecto como una aplicación web usamos Streamlit que es un framework para Machine Learning y finalmente la implementación de la aplicación en la nube se la hizo mediante Keroku que es una plataforma de servicios en la nube (concidos como PaaS o Platform as a Service).

👉ESTABLECER EL CONTEXTO EMPRESARIAL

El área de Recursos Humanos de una empresa necesita mejorar el proceso de renumeración de sueldos a sus trabajadores al predecir el salario de los empleados en función del número de años de experiencia, el nivel de educación y el área de trabajo.

💪 El proyecto tiene el siguiente flujo de trabajo

Life-Cycle Project

💪CODIGO FUENTE DEL PROYECTO

👇 Porfavor vea el código pinchando en la imagen

👉 OBJETIVOS DE LA APP - PREDICTOR DE SALARIOS

Realizar la predicción de salarios para desarrolladores web en función de características de entrada como el País, el nivel de educación y los años de experiencia, la aplicación hace uso de estos valores de entrada para calcular la predicción del salario basándose en el modelo de Regresión Lineal entrenado y validado en el codigo desarrollado.

Así mismo la aplicación tiene la funcionalidad de generar graficas del conjunto de datos, visualizando 3 graficas que ayudan a comprender los datos analizados.

La aplicación utiliza un conjunto de datos de una encuesta realizada en Estados Unidos, la elección del conjunto de datos fue por que los datos son de caracter público y cualquier persona puede acceder a este, sin embargo el modelo puede fácilmente adaptado a un conjunto de datos de cualquier base de datos de la empresa interesada en el modelo.

Normalmente, los modelos de Machine Learning se crean para que se puedan utilizar para predecir un resultado (valor binario, es decir, 1 o 0 para la clasificación, valores continuos para la regresión, etiquetas para la agrupación en clústeres, etc.

👉RESULTADOS - PUESTA EN PRODUCCION DE LA WEB/APP PREDICTOR DE SALARIOS

👇 Haga click en la imagen e interactue con la Web App

🚀 CONTEXTO DEL DATASET: Encuesta para desarrolladores de Stack Overflow 2018

Cada año, en Stack Overflow se consulta a la comunidad de desarrolladores sobre todo, desde sus tecnologías favoritas hasta sus preferencias laborales. La encuesta realizada en 2018 marca el octavo año que se publican los resultados de la Encuesta anual para desarrolladores.

La encuesta cubre algunos temas nuevos que van desde la inteligencia artificial hasta la ética en la codificación. También descubrimos que los grupos subrepresentados en tecnología respondieron a nuestra encuesta a tasas incluso más bajas de lo que esperaríamos de su participación en la fuerza laboral. ¿Quiere profundizar en los resultados usted mismo y ver qué puede aprender sobre salarios, aprendizaje automático o diversidad en tecnología?.

El resultado de esta encuesta para desarrolladores de 2018 está organizado en un archivo llamado survey_results_public.csv que contiene los principales resultados de la encuesta, un encuestado por fila y una columna por pregunta.

Hay 98,855 respuestas en esta publicación de datos públicos. Estas respuestas son las que consideramos “calificadas” para fines analíticos. Se iniciaron aproximadamente 20,000 respuestas, pero no se incluyeron aquí porque los encuestados no respondieron suficientes preguntas, o solo respondieron preguntas con información de identificación personal. De las respuestas calificadas, 67,441 completaron la encuesta completa.