Problemática central
Para seleccionar la temática a seguir y encontrar el problema que se va a resolver se elaboró una lluvia de ideas, donde se tomaron distintos temas, que se presentan a continuación:
- Clasificación de películas para mayores de 18.
- Predecir el éxito de taquilla de una película.
- Predecir las nominaciones a premios (Premios de la academia, Oscar).
- Predecir gustos por edad, género, etc.
- Predecir puntuación en ciertas páginas(IMBD, Rottentomatoes, entre otras).
Para elegir la que se va utilizar se analizó la utilidad de la predicción o clasificación, posibilidad de realizar con los datos obtenidos y la complejidad de realizarlo en base a los conocimientos que posee el grupo.
En base a lo anterior se eligió la opción de “predecir las nominaciones a premios(Oscar)”, debido a que es un tema interesante de predecir, también se poseen datos de ganadores antiguos de los premios, además de sus características, palabras clave y el cast de las películas(director, actores, etc).
Para avanzar en este tema se decidió primero lograr la clasificación de películas, en base a los datos anteriores como, tema de la película, palabras clave de ella, directores, actores, etc. Esto se realizará juntando datos de distintos dataset, y segregando la información importante para esta clasificación .
Para luego con la clasificación entrenar el programa para que pueda predecir los nominados y ganadores de los Oscar, en base a las características anteriores y a la review, palabras clave de las películas que serán predichas por el programa previamente entrenado como ganadoras o nominadas a los premios Oscar.