Get it on Google Play

Formación machine learning: Algoritmos de machine learning por tipo de aplicación

04-01-2017
 

Cuando queremos empezar a aplicar algoritmos de Machine Learning en nuestros datos corporativos, lo primero es escoger que algoritmos serán mas apropiados. En el post anterior “Machine Learning con Java y Weka” vimos como podíamos utilizar las librerías Weka para aplicar los algoritmos de Machine Learning en nuestras aplicaciones. En este post vamos a ver como elegir los algoritmos en función de cada situación.

Vamos a elegir los tipos de algoritmos a utilizar en función de dos variables: Si las variables son discretas(Hay un número de valores de salida concreto, por ejemplo, sol, nublado, etc.) o las variables son continuas(Por ejemplo, el precio de un inmueble). La segunda variable va a ser si el tipo de aprendizaje va a ser supervisado(Las posibles salidas son conocidas y definidas) o no supervisado(Las posibles salidas no están definidas, el sistema las deducirá solo).

En la siguiente imagen encontramos la clasificación:

Machine Learning clasification algorithm

Machine Learning clasification algorithm

Algoritmos de clasificación

Este tipo de algoritmos trabajan con variables discretas, tanto las variables independientes(Valores que se conocen) como la variable dependiente(Valor que se estima). Además los posibles valores para la variable dependiente se deben conocer.

En este tipo de algoritmos encontraríamos los clasificadores lineales, arboles de decisión, clasificadores cuadráticos o el ‘k-nearest neighbor’ entre otros.

Algoritmos de regresión

Los algoritmos de regresión se diferencian de los de clasificación en que los valores de la variable dependiente no se conocen.

En este tipo de algoritmos encontraríamos la regresión lineal simple, la regresión múltiple o Lasso entre otros.

Algoritmos de clusterización

Este tipo de algoritmos difieren de los de clasificación en que en estos no se conocen los posibles valores de la variable de salida. Básicamente se trata de agrupar elementos.

En este tipo de algoritmos encontraríamos: hierarchical clustering, k-means clustering, Distribution-based clustering o density-based clustering entre otros.

Reducción de dimensiones

Este tipo de algoritmos están destinados a reducir el número de variables aleatorias para después poder aplicar alguno de los anteriores tipos de algoritmos. Dicho de otra manera, se trata de separar el grano de la paja para quedarte solamente con las variables que realmente afectan a la variable dependiente.

En este tipo de algoritmos encontramos: Principal component analysis(PCA), Kernel PCA, Graph-based kernel PCA, Linear discriminant analysis(LDA) o Generalized discriminant analysis(GDA) entre otros.

Las redes neuronales o Deep Learning

Redes neuronales

Redes neuronales

Se trata de simular el comportamiento del cerebro anidando diferentes algoritmos donde la entrada de unos es la salida de otros. No es un algoritmo en si mismo sino la agrupación que consigue mejores resultados.

 

Leave a Reply