Pesquisa

Atualmente estou desenvolvendo os seguintes projetos de pesquisa:

A tipologia de Classe de Palavras

Resumo

No presente projeto parte-se da tipologia de Classes de Palavra formulada por Croft (1991, 2000 e 2001) e das críticas apontadas por Broschardt (1997) e Bisang (2008) para investigar, em um conjunto de línguas selecionadas de acordo com métodos específicos de amostragem, o comportamento de palavras que denotam entidades, propriedades e eventos em diferentes contextos (referenciação, modificação e predicação). Essa investigação tem por objetivo o de refinar o que se conhece até o momento a respeito da Tipologia de Classes de Palavra. Toma-se por hipótese que existem dois níveis de marcação relacionado a isso nas línguas: um referente ao tipo de denotação da palavra e outro referente à função sintatico-pragmática em que a palavra se encontra. Esses níveis podem coincidir na morfologia das línguas, serem totalmente independentes ou inexistirem parcial ou totalmente. A partir da investigação, serão verificadas a distribuição de línguas que seguem cada uma das possibilidades de realização desses níveis e se há contextos ou tipos de denotação que trans-linguisticamente favorecem a marcação.

Demais participantes

Detecção framework free de Palavras Gramaticais e a Tipologia Morfológica das Línguas

Resumo

Este projeto é parte de uma pesquisa mais ampla a respeito de se fazer Tipologia Linguística com base em modelos probabilísticos de gramática. Trata-se de uma forma inovadora de se solucionar o problema da correspondência em Tipologia Linguística (Corbett 2008, Haspelmath 2007), que se formula como a dificuldade de se tratar categorias e parâmetros linguísticos como comparáveis entre as línguas.

O pesquisa se pauta em uma nova metodologia, em que consideramos gramáticas como modelos matemáticos que preveem a probabilidade de determinadas combinações de morfemas em uma língua (Goldsmith 2002, 2015). A partir dessas probabilidades acredita-se ser possível derivar uma série de características das línguas. Essas características seriam estabelecidas de forma livre de arcabouço teórico descritivo (framework free), o que as tornaria compatíveis para comparação trans-linguística desde que o mesmo algoritmo que deriva o modelo gramática de uma língua A também derive os modelos de gramática de línguas B, C e D em uma comparação entre línguas A, B, C e D.

Aqui pretende-se realizar um estudo exploratório da tipologia morfológica de 8 diferentes línguas selecionadas a partir de uma metodologia de amostragem que afaste os vieses genéticos, geográficos e históricos. Este estudo envolverá a modelagem das gramáticas dessas línguas com base em gramáticas de n-gramas devidamente suavizadas (Pereira, 2000; Knesser & Ney, 1995) e a aplicação de algoritmos de associação e agrupamento para determinar os paradigmas associados a raízes (palavras gramaticais) de uma língua e suas respectivas probabilidades. O número de grupos formados, as probabilidades de cada combinação, a extensão dos paradigmas, a existência de fusão e a presença de clíticos serão aspectos levados em conta para se estabelecer uma tipologia. Essa seria a primeira tentativa de tipologia morfológica baseada em categorias obtidas por total indução.

Demais Participantes

Traços de animacidade, definitude e especificidade em alguns fenômenos morfossintáticos

Resumo

Animacidade, definitude e especificidade são traços semânticos comumente associados a diversos fenômenos nas línguas. No caso específico do Português Brasileiro (doravante, PB), muitos estudos têm associado esses traços à fenômenos de distribuição dos diferentes pronomes da língua.

Aqui introduzimos estudos estatísticos para testar a significância desses traços em dois fenômenos bastante emblemáticos do PB. O primeiro estudo é relacionado à distribuição dos pronomes possessivos sua(s)/seu(s) versus dela(s)/dele(s). O segundo, à distribuição dos clíticos dentre as estratégias de retomada anafórica.

Demais participantes