O C-ORAL-BRASIL e o estudo da fala informal: um novo olhar sobre o tópico no português brasileiro

Biblioteca Digital - UFMG

O C-ORAL-BRASIL e o estudo da fala informal: um novo olhar sobre o tópico no português brasileiro

Show full item record

Title: O C-ORAL-BRASIL e o estudo da fala informal: um novo olhar sobre o tópico no português brasileiro
Author: Maryuale Malvessi Mittmann
Orientador: Tommaso Raso
Banca:
Presidente: Tommaso Raso
Membro: Heliana Ribeiro de Mello; Maria Elizabeth Fonseca Saraiva; Gabriel de Avila Othero; Joao Antonio de Moraes
Subject: Lingüística Teses.; Língua portuguesa Português falado Brasil Teses.; Atos de fala (Lingüística) Teses.; Linguística de corpus Teses.; Enunciação Teses.; Análise prosódica (Linguística) Teses.
Palavra-chave: C-ORAL-BRASIL; Português Brasileiro
Date: 24-09-2012
Publisher: UFMG
Abstract: Este trabalho trata da estrutura informacional da variedade mineira do PB falado, com enfoque no Tópico, a partir de um corpus de fala informal, o C-ORAL-BRASIL. São dois os objetivos gerais: (I) Contribuir com o projeto C-ORAL-BRASIL, através da gravação de sessões de fala espontânea (diálogos, conversações e onólogos), transcrição, segmentação, alinhamento, etiquetagem e validação da seção informal do corpus. (II) Contribuir com estudo da estrutura informacional do português brasileiro falado, através da investigação das características do Tópico. A perspectiva que fundamenta a pesquisa é a da Teoria da Língua em Ato (TLA). A TLA entende que o ato de fala é a atividade fundamental da comunicação, e que o enunciado é a sua realização linguística, devendo ser tomado como unidade de referência para o estudo da fala espontânea. Enunciados são delimitados no fluxo da fala através de fronteiras prosódicas que os falantes percebem comoconclusivas (terminais); podem ser constituídos de uma ou mais unidades entonacionais. No último caso, as unidades menores são delimitadas por fronteiras prosódicas que os falantes percebem como não conclusivas (não terminais). A segmentação prosódica da fala é a base para a estruturação informacional: unidades do padrão prosódico correspondem a unidades do padrão informacional. As unidades mais importantes de um padrão informacional são o Comentário e o Tópico (há outras, que cumprem funções de natureza textual ou dialógica). O Comentário é a unidade mínima necessária de um padrão informacional, pois veicula a força ilocucionária, sendo suficiente para formar um ato de fala. O Tópico tem a função de delimitar o domínio dereferência em relação ao qual a ilocução expressa no Comentário deve ser interpretada. O corpus de pesquisa utilizado neste trabalho, o C-ORAL-BRASIL informal, foi construído de modo a permitir o estudo da estrutura informacional da fala a partir da sua segmentação prosódica.As transcrições das sessões de fala espontânea gravadas foram segmentadas prosodicamente, assinalando as fronteiras prosódicas de tipo terminal e não terminal. Como parte do objetivo geral (I), realizou-se a validação estatística desta anotação prosódica do corpus, através da verificação do acordo entre anotadores através do teste Kappa. O resultado mostrou um acordo geral de 0.9 na anotação das fronteiras de tipo terminal e de 0.7 para as fronteiras não terminais, um resultado de grande relevância estatística. Para cumprir o objetivo (II), um subcorpus foi extraído do C-ORAL-BRASIL e cada unidade entonacional recebeu etiquetagem da função informacional, de acordo com as unidades propostas pela TLA. Verificou-se que a estrutura informacional da fala será mais ou menos complexa dependendo do tipo de situação comunicativa. Quando a interação entre os participantes é pouco ancorada no contexto imediato, os enunciados tendem a ser mais complexos, e há maior ocorrência do Tópico. O Tópico é mais comumente realizado através de um sintagma nominal (39,5%) ou verbal (37,7%). No primeiro caso, o SN é tipicamente preenchido por substantivos, mas há uma forte predominância do uso de pronomes demonstrativos em diálogos, e pronomes pessoais em monólogos. No segundo caso, há um uso predominante de sintagmas verbais que expressam situações hipotéticas em conversações e diálogos, enquanto nos monólogos é mais relevante que o Tópico delimite o domínio temporal, através de SV temporais. Quanto às propriedades prosódicas, o Tópico pode ser executado em PB com quatro diferentes formas prosódicas (tipos 1, 2, 3 e 4), sendo o Tipo 2 o mais comum (47%) e o Tipo 3 o mais raro (5%). De modo geral, esta pesquisa ofereceu uma nova perspectiva para o estudo da fala, evidenciando o uso de novos métodos que possibilitam o aprofundamento do conhecimento sobre a organização da informação na língua falada e de como o contexto influencia o uso de estruturas linguísticas específicas.
Resumo em lingue estrangeira: This work addresses the information structure of the of the Minas Gerais variety of spoken Brazilian Portuguese (BP), focusing on Topic (TOP), based on the C-ORAL-BRASIL informal speech corpus. The general goals are two: (I) To contribute to the project C-ORALBRASILby recording sessions of spontaneous speech, by transcribing and segmenting, by performing text-to-speech alignment, by tagging and, more importantly, by validating the informal section of the corpus. (II) To contribute to the study of informational structure of spoken BP through the investigation of characteristics of the TOP. The perspective thatunderlies the research is the Theory of Language into Act (L-Act). According to L-Act, the speech act is the fundamental communication activity and the utterance is its linguistic realization, therefore, the utterance is the reference unit for the study of spontaneousspeech. Utterances are delimited in the speech flow by prosodic boundaries that speakers perceive as conclusive (terminal); it may consist of one or more intonational units. In the latter case, the smaller units are delimited by prosodic boundaries that speakers perceive asnon conclusive (non-terminal). Prosodic parsing is the basis for structuring speech: prosodic units correspond to information units. The more important units of an information pattern are Comment (COM) and Topic (there are others, fulfilling textual or dialogic functions). The COM is the single unit necessary to form an information pattern,because it conveys the illocutionary force, being sufficient to perform a speech act. The TOP has the function of defining the domain of reference in which the illocution expressed in the COM must be interpreted. Regarding the research corpus, this work contributed to thecompilation of the informal C-ORAL-BRASIL. The spontaneous speech transcriptions of the recorded sessions were prosodically segmented, marking the prosodic boundaries of terminal and non-terminal types. As part of the overall goal (I), a statistical validation of this prosodic annotation was conducted, by checking the agreement between annotators through the Kappa test. The results showed a general agreement of 0.9 on the annotation of terminal boundaries and 0.7 for non terminal boundaries, a result of great statistical relevance. To fulfill the objective (II), a subcorpus of C-ORAL-BRASIL was extracted and eachunit received intonational tagging regarding its information function according to the L-Act categories. It was found that the information structure of speech will be more or less complex depending on the communicative situation. When the interaction amongparticipants is less anchored in immediate context, utterances tend to be more complex, with more occurrences of TOP. The TOP is most commonly accomplished through a noun (39.5%) or verb (37.7%) phrase. In the first case, the NP is typically filled by nouns and itsdeterminers, but there is a high occurrence of demonstrative pronouns in dialogues, and personal pronouns in monologues. In the second case, there is a predominant use of VP to express hypothetical situations in conversations and dialogues, while in monologues it is more relevant that the TOP delimits a temporal domain of reference. As for the prosodicproperties, TOP on BP can be performed with four different prosodic forms (types 1, 2, 3 and 4), with type 2 been the most common (47%) and type 3 the rarest (5%). Overall, this study provided a new perspective to the study of speech, emphasizing the use of new methodsthat enable a deeper understanding about the organization of information in spoken language and how context influences the use of specific linguistic structures.
URI: http://hdl.handle.net/1843/LETR-97YMKT

Files in this item

Files Size Format View
mittmann_2012_.pdf 14.46Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record