Hito 2

En conclusión para el Hito 2 se logró el entrenamiento de diversos clasificadores, obteniéndose resultados, preliminares, bastante buenos para Decision Tree, Gaussian Naive Bayes (Sub-Sampling) y Gaussian Naive Bayes (Over-Sampling), queda probar distintos grados (ajustar) de Over y Sub Sampling con el fin de obtener mejores resultados y probar nuevos clasificadores para el Hito 3.

Como objetivos futuros se plantea probar la generalización de los clasificadores obtenidos, ampliar los datos del data set a otras categorías, modificar atributos con el fin de mejorar el rendimiento del clasificador y tratar de aplicar los nuevos contenidos vistos en catedra.

Hito 3

Cerrando el proyecto, se puede concluir que predecir la fama y el éxito de un producto no es tarea fácil, se requiere un DataSet etiquetado previamente, a consciencia por un experto, con la clase objetivo, “Producto Exitoso”, se necesitan datos actuales y mucho más enfocados a los productos que las reviews, la hipótesis planteada se descarta. Con el DataSet adecuado se podría entrenar un clasificador que entregue una buena idea del posible éxito de un producto emergente.

Por otro lado se pudo apreciar que el Decision Tree trabaja con Related y Word Count por separado, que KNN utiliza el análisis de sentimiento aparte del Also Bought y que el clasificador, Naive Bayes trabaja fuertemente con el análisis de sentimiento.