Notice: wp_add_inline_script ha sido llamada de forma incorrecta. No pasar etiquetas <script> a wp_add_inline_script(). Por favor, visita Depuración en WordPress para más información. (Este mensaje fue añadido en la versión 4.5.0). in /var/www/html/wordpress/wp-includes/functions.php on line 5665

Marco Capo defenderá su tesis doctoral el martes, 30 de abril

  • La defensa tendrá lugar en la Facultad de Informática de la Universidad del País Vasco, situada en el Campus de Donostia/San Sebastián, a las 11:00 am 

Marco Capo se incorporó al Basque Center for Applied Mathematics en 2015 como estudiante de doctorado (beca Predoc Severo Ochoa 2014). Se licenció en Matemáticas en la Universidad Simón Bolívar (Venezuela) en 2012 y tiene un Máster en Modelado Matemático en Ingeniería del Programa Erasmus Mundus MathMods. Este máster internacional de dos años es otorgado conjuntamente por la Universidad de L’Aquila (Italia), la Universidad de Niza (Francia) y la Universidad de Hamburgo (Alemania).

Su tesis doctoral ha sido dirigida por el Prof. Jose Antonio Lozano, Director Científico de BCAM y líder de la línea de investigación del centro en Machine Learning, y por el Dr. Aritz Pérez, miembro del mismo grupo.

En nombre de todos los miembros de BCAM queremos desear mucha suerte a Marco en la defensa de su tesis.

 

PhD Thesis title: K-means for massive data

The K-means algorithm is undoubtedly one of the most popular clustering analysis techniques, due to its easiness in the implementation, straightforward parallelizability and competitive computational complexity, when compared to more sophisticated clustering alternatives. However, the progressive growth that data generation has seen in the last years represents a significant challenge for this algorithm, as its time complexity grows linearly with respect to both the number of instances, n, and dimensionality of the problem, d. This fact hinders its scalability on such massive data sets. Another major downside of the K-means algorithm corresponds to its high dependence on the initial conditions, which not only may affect the quality of the obtained solution, but may also have a major impact on its computational load. In this dissertation, we propose different approximations to the K-means problem that tackle all these difficulties.