Minería de datos y aprendizaje automático

Código Asignatura:
1416
Nº Créditos ECTS:
6
Duración:
Semestral
Idioma:
Castellano
Plan de estudios:
Profesor(es):

Descripción

Minería de Datos y Aprendizaje Automático es una asignatura optativa que consta de 6 créditos y que dotará al estudiante de conceptos relacionados con la Minería de Datos (más conocido como Data Mining, su nombre en inglés) y el Proceso de Descubrimiento de Conocimiento en Bases de Datos (más conocido por sus siglas KDD, de su nombre en inglés Knowledge Discovery in Databases).

La asignatura comienza con un tema que tiene como objetivo introducir los conceptos básicos de Data Mining. A continuación se presenta el proceso de KDD y sus diferentes fases. Tras esta primera parte introductoria se describen las etapas iniciales del proceso de KDD. En la parte central de la asignatura se presentan las técnicas y algoritmos de Data Mining más utilizados. Finalmente, se analizará la forma de ejecutar un proyecto real de Data Mining.

No existe ningún prerrequisito formal de matrícula para cursar la asignatura de Minería de Datos y Aprendizaje Automático, aunque es recomendable contar con los conocimientos adquiridos en las asignaturas de Bases de Datos y Bases de Datos Avanzadas, que facilitarán la comprensión de las técnicas estudiadas.

Antes de matricular la asignatura, verifique los posibles requisitos que pueda tener dentro de su plan. Esta información la encontrará en la pestaña "Plan de estudios" del plan correspondiente.

Competencias generales

El objetivo de la asignatura es dotar al estudiante de los conceptos sobre los que se fundamenta la minería de datos. La asimilación de estos conceptos permitirá al estudiante comprender la utilidad y funcionalidad de estas técnicas. Con esta asignatura se pretende que el estudiante llegue a:

  • Conocer los fundamentos de la Minería de Datos.
  • Conocer el proceso de KDD.
  • Conocer las fases iniciales del proceso de KDD.
  • Conocer las técnicas y algoritmos de Data Mining.
  • Conocer el proceso de implantación de un proyecto de Data Mining.
  • Conocer los aspectos sociales y éticos de Data Mining, y las tendencias futuras en este área.

Competencias específicas

  • Conocer la Minería de Datos y sus fases.
  • Conocer las diferentes técnicas de Data Mining: Clustering, Decision, Clasificación y Regresión.

Metodología

La metodología adoptada para el aprendizaje y evaluación de los contenidos de esta asignatura se encuentra adaptada a la modalidad de enseñanza a distancia de UDIMA.

Además del estudio del material proporcionado para el estudio de la asignatura, se encuentran programadas una serie de actividades de aprendizaje y de evaluación continua para que el estudiante consolide los conocimientos adquiridos. Dichas actividades se encuentran planificadas en el "Cronograma de Actividades Didácticas", y definidas en el "sistema de evaluación", apartados ambos que figuran en la guía docente de la asignatura.

Las dudas que puedan surgir tras el estudio razonado de las unidades didácticas y del material complementario deben plantearse en los foros de tutorías activados en el Aula Virtual.

Dedicación requerida

Se estima que la lectura y comprensión de los contenidos teóricos abarcados en las diversas unidades didácticas ocupará aproximadamente unas 60 horas, mientras la realización de las Actividades de Evaluación Continua (AECs), las Actividades de Aprendizaje y la realización de los Controles, llevará unas 75 horas aproximadamente. También se puede considerar que, con el empleo de unas 15 horas por parte del alumno de cara a preparar el examen final presencial, será suficiente para consolidar los conocimientos y habilidades adquiridas durante el trascurso de la asignatura.

Tutorías

Las dudas conceptuales que surjan tras el estudio razonado de las unidades del manual y/o del material complementario deben plantearse en los Foros de Tutorías disponibles en el Aula Virtual.

No obstante, está a disposición de los estudiantes un horario de tutorías telefónicas o consultas mediante correo electrónico.

Se quiere destacar la importancia de los foros como principal canal de comunicación con el profesor y con los compañeros del aula, además de ser una herramienta primordial para el intercambio de conocimientos, facilitando así el aprendizaje de los conceptos asociados a la asignatura.

La participación en las tutorías, que serán adaptadas en función de las características y necesidades de cada estudiante, también es muy recomendable. Estas sesiones de tutorización se realizarán prioritariamente utilizando los foros virtuales o el teléfono.

A continuación se recogen diferentes recursos de apoyo para la metodología de la asignatura:

Aula Virtual: Por medio del aula el estudiante se puede comunicar a cualquier hora con su profesor y con sus compañeros.

Materiales didácticos

Para el desarrollo del aprendizaje teórico, sobre el que versará el examen final, se proporcionará al estudiante un manual constituido por unidades didácticas, que se corresponden con la descripción de contenidos de la asignatura. Este manual podrá tener diferentes formatos dependiendo de la asignatura.

La bibliografía recomendada y los materiales complementarios asociados al desarrollo de cada asignatura serán facilitados en el Aula Virtual al hilo del desarrollo de las unidades didácticas.

La UDIMA también cuenta con múltiples recursos para el aprendizaje de sus estudiantes, como pueden ser:

Librería Virtual e-brary: Nuestros alumnos tienen a su disposición una librería virtual con más de 65.000 títulos.

Youtube: UDIMA dispone de su propio canal donde los profesores pueden colgar vídeos interesantes para la formación de los estudiantes.
(www.youtube.com/universidadudima)

Manual de la asignatura:
Lara Torralbo, J. A. "Manual de Minería de Datos", Ed: UDIMA (2013).

Contenidos de la asignatura

Unidad 1. Introducción a la Minería de Datos.
Unidad 2. El proceso de KDD.
Unidad 3. Modelos de Data Mining.
Unidad 4. Clasificación: Árboles de decisión y redes de neuronas artificiales.
Unidad 5. Clasificación: Técnicas bayesianas y técnicas basadas en casos.
Unidad 6. Clustering: Técnicas particionales.
Unidad 7. Clustering: Técnicas jerárquicas y técnicas basadas en densidad.
Unidad 8. Asociación, Regresión y Detección de atípicos.
Unidad 9. Minería de Datos no convencionales.
Unidad 10. Caso de Estudio: aplicación de la Minería de Datos en el dominio de la medicina.

Sistema de evaluación

El sistema de evaluación del aprendizaje de la UDIMA contempla la realización de diferentes tipos de actividades de evaluación y aprendizaje. El criterio de valoración establecido se detalla a continuación:

Actividades de aprendizaje
10%
Controles
10%
Actividades de Evaluación Continua (AEC)
25%
Examen final presencial
55%
TOTAL 100%