Aprende a crear un modelo en un Jupiter Notebook dentro de Watson Studio!!
Ojo: Esta es la parte 2 de 3 de nuestro taller de Data Science.
- Damos clic en “Add to project”.

- Elegimos “Notebook” como “Asset Type”.

- Ahora seleccionamos la pestaña “From URL”. Le damos un nombre original a nuestra Jupyter Notebook, elegimos la opción “Python 3.6” en “Enviroment” y en URL pegamos la siguiente dirección: https://raw.githubusercontent.com/ibmdevelopermx/DataScience/master/notebooks/Telco-customer-churn-ICP4D.ipynb
Y damos clic en “Create Notebook”.

- Una vez que cargue nuestra Jupyter Notebook, podemos empezar a correr las celdas.

- Tras correr la primera, regresamos a nuestro proyecto. Seleccionamos la pestaña “Assets” y en el apartado “Notebooks”, buscamos nuestro notebook. Damos clic en el candado “Unlock notebook” y en la ventana emergente, damos clic en “Unlock”.

- Ahora damos clic en el menú de “hamburguesa” (aparece al pasar el puntero sobre él). Y seleccionamos la opción “Stop Kernel”. En la ventana emergente, damos clic en “Stop”. (Esto es para no gastar los recursos de memoria asignados a esta NOTEBOOK).

- Damos clic en nuestra “Notebook”. Una vez dentro de ésta, damos clic en el lápiz para editar.

- Damos clic en la celda del paso 2. Ahora seleccionamos el ícono “01/00” “Find and add data” del lado superior derecho de nuestra Notebook. Da clic en la pestaña “Files”, damos clic en “Insert to code” y seleccionamos la opción “Insert pandas DataFrame”.

- Hecho esto, corremos la segunda celda. Nos daremos cuenta de que se despliega una tabla según los parámetros de la celda.

- Antes de correr la tercera celda, debemos asegurarnos de que la variable “n” en “df_data_n” sea igual en la segunda y tercera celdas. Ejemplo: en mi caso, el resultado del proceso de la celda 2, dio como resultado “df_data_2”, por lo que en la tercera celda, “df” debe tener asignado el valor “df_data_2”.

- A continuación, seguimos ejecutando las celdas hasta llegar al apartado 3.0 “Crear un modelo”.
- En esta sección, se realiza la separación de datos de prueba y de entrenamiento.

- En el apartado 3.5, se crea la “pipeline” y el modelo utilizando el algoritmo clasificador “Random Forest”.

- Lo primero que debemos hacer, es darle un nombre fácilmente identificable a nuestro modelo. Podemos usar nuestras iniciales y un número o la fecha.

- En las credenciales, cambiamos el “url”, la “apikey” y la “instance_id” por tus propias credenciales, para encontrarlas, en la página del servicio de “Watson Machine Learning”, damos clic en el apartado de “Service Credentials” y desplegamos la que tengamos generada o creamos una nueva credencial.

- Corremos la celda siguiente.
- En las siguientes dos celdas (4.2 y 4.3), cambiamos los valores “project_id” y “Access_Token” por nuestros valores. Para obtener el “Project ID”, simplemente vamos al “Overview” de nuestro projecto y copiamos, del “URL” dicho ID.

- Ahora, para obtener el “Access Token”, vamos a la pestaña de “Settings”, buscamos el apartado de “Access Token” y damos clic en “New Token”.

- Para crear nuestro “Token”, le vamos a dar un nombre que identifiquemos fácilmente, y en el apartado de “Access role for project”, seleccionamos la opción de “Editor” y damos clic en “Create”.

- Hecho esto, vamos a dar clic en el menú de “hamburguesa” (aparece al pasar el mouse sobre él) y seleccionamos la opción “view”.

- Ahora copiamos el valor del token y lo reemplazamos en nuestra Jupyter Notebook, así como con el valor de nuestro “project ID” en las celdas de los apartados 4.2 y 4.3 de nuestra “Jupyter Notebook”

- Hecho esto ya habrás terminado de crear tu modelo.
Y listo! Puedes continuar con el siguente lab.
Te invitamos a explorar otros talleres y manuales en el siguiente enlace de Github. https://github.com/ibmdevelopermx