Web Mining – es el uso de las técnicas de data mining para descubrir patrones desde la Web. Según el objetivo del análisis , el Web Mining se puede dividir en tres tipos, que son Web usage mining, Web content mining y de la Web structure mining.

Web Usage Mining
Es la aplicación que utiliza el Data Mining para analizar y descubrir patrones del comportamiento del usuario sobre la Web. Esta data va grabando el comportamiento del usuario cuando navega o hace transacciones en un Web Site. Esta es una actividad que implica el descubrimiento automático de patrones de unos o más servidores del Web. Hay organizaciones que generan y recogen a menudo grandes volúmenes de datos; la mayoría de esta información es generada automáticamente por los servidores Web y recogida en registro del servidor. Analizar estos datos puede ayudar a estas organizaciones a determinar el valor de clientes, estrategias cruzadas de la comercialización a través de productos y de la eficacia de campañas promocionales, el etc.
Las primeras herramientas del análisis Web proporcionaron simplemente mecanismos de reporte de la actividad del usuario según lo registrado en los servidores. Usando tales herramientas, era posible determinar información tal como el número de accesos al servidor, los tiempos o los intervalos del tiempo de las visitas, así como los nombres de dominio y URLs de los usuarios del servidor del Web. Sin embargo, en general, estas herramientas proporcionan muy poco o nada de análisis sobre los archivos  y directorios accesados por el usuario dentro del Web. Ahora se están desarrollando sofisticadas técnicas para el descubrimiento y el análisis de patrones . Estas herramientas se dividen en dos categorías principales: Pattern Discovery Tools y Pattern Analysis Tool.
Web Content Mining
Es el proceso para descubrir información útil del contenido de una página Web page. El tipo de contenido Web puede consistir de texto, imagen, audio o video. El Web Content mining algunas veces es llamado Web Text mining, porque el contenido de texto es el área más extensamente investigada. Las tecnologías que se utilizan normalmente en el Web Content Mining son el NLP (Natural Languag Procession) e IR (information rEtrieval). Se puede obtener datos acerca de que forma de escribir es más atractiva para el usuario, de si la catalogación que usamos sirve para mejorar un ranking, si los temas que se tratan interesan o no, etc
Web Structure Mining
Es el proceso de analizar en forma gráfica la estructura del nodo y conexión de un Web site. Según el tipo de datos estructurales de la Web, el Web Strucutre Mining se puede dividir en dos clases.
 La primera clase de Web Structure Mining está extrayendo patrones de hyperlinks en la Web. Un hyperlink es un componente estructural que conecta el Web page a otra Web. La otra clase está examinando la estructura del documento. Usar la estructura tipo arbol para analizar y describe las etiquetas del HTML (lengua hiperactiva del margen de beneficio del texto) o de XML (Extensible Markup Language) dentro de la página Web.
Obtenemos información acerca de si los usuarios encuentran la información, si la estructura de sitio es demasiado ancha o demasiado profunda, si los elementos están colocados en los lugares adecuados dentro de la página, si la navegación se entiende, cuáles son las secciones menos visitadas y su relación con el lugar que ocupan en la página central.

Tags: , , ,