Publication:
Desarrollo de una aplicación para búsqueda y extracción de texto desde la web para el análisis de los sentimientos

Date
2018
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Católica de la Santísima Concepción
Research Projects
Organizational Units
Journal Issue
Abstract
El Procesamiento Del Lenguaje Natural (PLN) es una disciplina de la Inteligencia Arti cial que se ocupa de la formulación e investigación de mecanismos computacionales para la comunicación entre hombre-máquina mediante el uso de Lenguajes Naturales que pueden ser escritos, hablados y gestuales. Una arista del PLN es el Análisis de los Sentimientos, esta se puede descomponer en dos enfoques, el primero es el análisis afectivo, donde se desarrollan y aplican técnicas para estimar el aspecto emotivo de un texto en particular basados en teorías psicológicas. El segundo es el análisis de polaridad donde se estima el nivel de polaridad presente en los textos, estos pueden ser clasi cados en 4 niveles, positivo, negativo, neutro y ambiguo. El presente proyecto tiene por objeto el desarrollo de una aplicación extractora de datos desde la Web y APIs públicas para apoyar en la fase inicial del proceso de análisis de los sentimientos correspondiente a la búsqueda y extracci ón de datos, esta aplicación se basa en el concepto de Scraping. La aplicación cuenta con 3 servicios, un servicio de extracción de textos desde Twitter mediante el ingreso de una cadena de búsqueda, un servicio de creación de extractores personalizando sus características para extraer textos desde páginas web especí cas y un servicio de almacenamiento de extractores para volver a utilizarlos. Durante el transcurso de este documento se muestran distintas etapas del proyecto, desde bibliografía y de niciones de conceptos generales, hasta las etapas de desarrollo de la aplicación Text Extraction Community (TECO).
Description
Simposio de habilitación profesional para optar al grado académico de Licenciado en Ciencias de la Ingeniería y al título de Ingeniero Civil Informático
Keywords
Desarrollo de aplicaciones informáticas, Ciencias de la comunicación, Emociones, Ingeniería Civil Informática, Facultad de Ingeniería
Citation