Extração de dados web como suporte na elaboração de indicadores do turismo de Minas Gerais: uma iniciativa em Big Data

Biblioteca Digital - UFMG

Extração de dados web como suporte na elaboração de indicadores do turismo de Minas Gerais: uma iniciativa em Big Data

Show full item record

Title: Extração de dados web como suporte na elaboração de indicadores do turismo de Minas Gerais: uma iniciativa em Big Data
Author: Rafael Almeida de Oliveira
Orientador: Renata Maria Abrantes Baracho Porto
Banca:
Orientador: Renata Maria Abrantes Baracho Porto
Membro: Nelson Antonio Quadros Vieira Filho; Max Cirino de Mattos; Catia Rodrigues Barbosa
Subject: Ciência da Informação Teses.; Turismo e Estado Teses.; Sites da Web Indicadores Teses.; Gerenciamento da informação Teses.
Palavra-chave: Big Data; Extração de dados; Turismo; Políticas públicas; Recuperação da informação
Date: 06-03-2017
Publisher: UFMG
Abstract: A pesquisa teve como objetivo estudar o fenômeno Big Data e a possibilidade de utilização de ferramentas de extração de dados em ambiente web para auxiliar na elaboração de indicadores referente ao turismo em Minas Gerais. Primeiramente, realizou-se uma fundamentação teórica sobre conceitos fundamentais da ciência da informação para a contextualização do tema, além de pontuar o papel das ferramentas de extração de informações via web. Após essa etapa, foi realizado um estudo de caso com uma ferramenta de extração de dados denominada Import.io para coletar dados do site de viagens TripAdvisor, buscando as principais informações dos atrativos turísticos de Minas Gerais transformando-as em um banco de dados estruturado. Assim, foi possível analisar informações como a oferta de atrativos por categorias no estado e por município, o número de avaliações, o perfil dos visitantes, o nível de satisfação e o período de maior visitação de cada um dos atrativos. Para comprovar a utilidade das informações capturadas foi realizado um acompanhamento dos dados referentes ao Conjunto Arquitetônico da Pampulha com o objetivo de avaliar um possível impacto do seu reconhecimento como patrimônio mundial da humanidade na percepção dos visitantes. Os resultados mostraram que é possível utilizar a extração de dados disponibilizados em espaço web para a criação de indicadores de monitoramento do turismo que auxiliem o poder público na tomada de decisão. Constatou-se também a necessidade de uma maior discussão sobre a forma de disponibilização dos dados por parte das plataformas online para órgãos governamentais, visando dar utilidade à informação que possam beneficiar o público final. A metodologia apresentada poderá auxiliar as esferas públicas em extrair informações estratégicas que estão disponibilizadas na web, com baixo custo, otimizando ações e garantindo uma melhoria no uso de recursos
Resumo em lingue estrangeira: The research aims to study the phenomenon called Big Data and the possibility of using web data extraction tools (web scrapers) to help the development of indicators about tourism in Minas Gerais State (Brazil). For that, it was carried out a bibliographical review of authors related to information science to contextualize the subject, as well as to emphasize the role of web information extraction tools. After this step, we used a case study with a web scraper tool to collect data from TripAdvisor, searching for key information about Minas Gerais tourist attractions and turning them into a structured database. Thus, it was possible to analyse information such as the division of tourist attractions by categories from the state and municipalities, the number of evaluations, visitors' profiles, satisfaction levels, and the period of most visits at each of the attractions. To prove the use of the information captured it was carried out a follow-up of the data concerning the Pampulha Architectural Complex with the objective of evaluating a possible impact of its recognition as a world heritage site in the visitors perception. The results showed that it is possible to use data from the platform to monitor actions and create indicators that aim to assist public decision-making. However, there is still need for further discussion about the availability of data delivered by online companies to the final public, which could be used by government agencies. We expect this methodology to assist the state authorities and municipalities to extract strategic information that is already available on the web at low costs, improving actions and ensuring an improvement in the use of public resources in tourism policies
URI: http://hdl.handle.net/1843/ECIP-AN2PRB

Files in this item

Files Size Format View
disserta__o___rafael_oliveira___entrega.pdf 2.566Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record