Antes de responder a la pregunta ¿qué es Machine Learning?, plantéate otra pregunta, ¿qué es un perro?, o ¿qué es un árbol?
Puede parecer una tontería, pero es difícil dar una definición a las cosas que sabemos. Todo el mundo sabe lo que es un perro y lo que es un árbol, pero encontrar la definición adecuada es difícil, sin embargo, lo hemos aprendido.
Cuando somos pequeños, vemos un animal y preguntamos a nuestros padres ¿es un perro?, y nos responde sí. Vemos un animal parecido, un gato, y volvemos a preguntar, y nos dicen que no, nos corrigen. Así ocurre con una serie de animales repetidas veces.
Con ese proceso aprendizaje no aprendemos lo que es un perro por definición, sino que lo aprendemos a base de aprendizaje y error. Nuestro cerebro se pone a funcionar e identifica patrones que nos permiten discernir si es un perro o si no lo es, si es un árbol o si no lo es, etc.
Así es exactamente cómo funcionaría el Machine Learning.
La clave es que el ser humano posee mucho más conocimiento del que conseguimos expresar, y lo que hace el Machine Learning al final es identificar y aprender patrones en datos para poder realizar predicciones.
No es más que un conjunto de algoritmos qué realizan este acto de aprender. Para ello hay que entrenar un modelo, lo que se hace de la misma forma que si enseñáramos a un niño. Y a partir de ahí, dejarle libre para que tome sus propias decisiones.
Qué NO es Machine Learning
Se suele confundir el Machine Learning con otros conceptos, que vamos a detallar a continuación.
· Big Data
No se relaciona para nada con el Machine Learning, ya que no es más que el almacenamiento y el procesado de grandes volúmenes de datos.
El Big Data no es necesario para aplicar Machine Learning y viceversa, ya que el Machine Learning puede aplicarse con pequeños conjuntos de datos, y también en el mundo del Big Data.
· Minería de datos o Data mining
La minería de datos consiste en extraer valor de los datos, y en este caso sí que se relaciona con el Machine Learning, como vemos en el gráfico.
Igual que se extrae el oro de una mina, los datos tienen su valor y hay que extraerlo. La mina de oro de por sí no vale de nada si no extraemos el oro, igual ocurre con los datos en crudo, que tampoco sirven para nada si no extraemos información de ellos.
No obstante, esta extracción de valor puede utilizarse con algoritmos de Machine Learning o no.
Por ejemplo, extraer una media del saldo medio de los clientes de una base de datos de un banco, ya se está extrayendo valor de esos datos, no necesariamente hay que aplicar un algoritmo de Machine Learning.
Evidentemente, si conseguimos hacer una predicción del saldo que van a tener el año que viene los clientes con una técnica de Machine Learning, se estará extrayendo muchísimo más valor dentro de la minería de datos.
· Inteligencia Artificial
Como vemos en el gráfico, engloba todo el Machine Learning y va más allá.
La Inteligencia Artificial consiste en resolver problemas mediante máquinas, mejorando al ser humano, pero no necesariamente ni únicamente con algoritmos de Machine Learning.
· Deep Learning
Es un subconjunto dentro de Machine Learning, como vemos en la imagen, de algoritmos que intentan emular el cerebro humano a través de redes neuronales. Es un conjunto de algoritmos más poderosos.
Machine Learning vs Inteligencia Artificial
Para finalizar vamos a ver un ejemplo para comparar la Inteligencia Artificial y el Machine Learning, que son los conceptos que más se confunden habitualmente.
Un ejemplo de Inteligencia Artificial es cuando hablamos a nuestro móvil y le preguntamos al asistente de voz cuál va a ser la temperatura en una ciudad determinada.
Lo que hace la Inteligencia Artificial es transformar la señal de voz a texto, que se transforma a un código binario, que se envía un servidor, que da una respuesta, la cual se vuelve a codificar y se transforma en una señal de voz, que sale a través del teléfono móvil respondiendo a la pregunta que habíamos hecho.
En resumen, la máquina está mejorando a un ser humano, facilitándonos la vida.
Un ejemplo del Machine Learning, sería, por ejemplo, clasificar sonidos de animales, de forma que consiga, simplemente con el sonido que emite un animal, conseguir detectar de qué animal se trata.
Para ello lo que tendríamos que hacer es entrenar un algoritmo con muchísimos sonidos de estos animales, y una vez esté entrenado, en teoría, debería funcionar con animales a los que no haya oído nunca y poder clasificarlos correctamente.