Profa. Dra. Maria Clara Paixão de Sousa

É Professora da Universidade de São Paulo, junto ao Departamento de Letras Clássicas e Vernáculas da Faculdade de Filosofia, Letras e Ciências Humanas, desde 2008. É doutora em Linguística pela Universidade Estadual de Campinas (2004), com pós-doutorado na mesma universidade (2004-2006), na Universidade de São Paulo (2007), e na Universidade de York (2015). Tem publicado e orientado trabalhos nas áreas de Sintaxe, Linguística histórica, Filologia e Linguística computacional. Fez parte das equipes fundadoras do Corpus Tycho Brahe, o primeiro corpus sintaticamente anotado do Português (1998-2007) e da Biblioteca Digital Brasiliana USP (2007-2012); coordenou o I Seminário Internacional em Humanidades Digitais no Brasil (2013), foi uma das fundadoras da AHDig, Associação das Humanidades Digitais (2013), e membro do Comitê Executivo da Global Outlook Digital Humanities (GO::DH) (2014-2015). Atua hoje principalmente como professora das disciplinas Sintaxe do Português e Filologia Portuguesa no curso de Letras da Universidade de São Paulo; como coordenadora do projeto M.A.P. - Mulheres na América Portuguesa: Mapeamento de escritos de mulheres e sobre mulheres no espaço atlântico português a partir de métodos das Humanidades Digitais (http://www.nehilp.org/~nehilp/HD/MAP); como líder do grupo de pesquisas Humanidades Digitais (http://humanidadesdigitais.org); como membro do NEHiLP - Núcleo de Apoio à Pesquisa em Etimologia e História da Língua Portuguesa (http://www.nehilp.org); e como editora da revista Filologia e Linguística Portuguesa (https://www.revistas.usp.br/flp/).

Email: mariaclara@usp.br 
Currículo Lattes

 

Projetos de Pesquisa

2018 - atual

M.A.P. (Mulheres na América Portuguesa): Mapeamento de escritos de mulheres e sobre mulheres no espaço atlântico português a partir de métodos das Humanidades Digitais

Descrição: O Projeto tem como objetivo central sistematizar e tornar visível para pesquisas futuras um conjunto de fontes documentais imensamente importantes para os estudos filológicos e para os estudos da história da língua, da história social, da história da escrita e da leitura, e da história das mulheres no Brasil, por meio da construção de um catálogo eletrônico de documentos escritos por mulheres e documentos escritos sobre mulheres (contendo sua ‘fala’ na forma de discurso relatado) na América Portuguesa. A metodologia seguida no Projeto trata essa documentação a partir de duas premissas: primeiro, importa-nos, centralmente, a literalidade da expressão e a literalidade do relato da expressão, sendo esta uma investigação originária do campo da filologia e da linguística histórica. Segundo, do ponto de vista computacional, partimos do compromisso com as tecnologias transferíveis e o acesso aberto, sendo nosso objetivo a difusão e democratização da informação encerrada na documentação trabalhada. O Catálogo Mulheres na América Portuguesa pretende assim compor um mapa polifônico de vozes quase nunca escutadas, dirigido tanto aos especialistas de áreas como a filologia e a história, como a um público leitor mais amplo.
 

2014 - Atual

Histórias do Brasil: Trajetória editorial e mapeamento linguístico de relatos de viagens quinhentistas em um corpus anotado de informações ligadas

Descrição: O projeto (cf. http://historiasdobrasil.net) estudará três obras fundamentais da literatura quinhentista sobre o Brasil ? a ?História da Província Santa Cruz? de Magalhães de Gandavo (1576), o ?Tratados da terra e gente do Brasil? de Fernão Cardim (1584) e ?Notícias do Brasil? de Gabriel Soares de Sousa (1584) ? sob as perspectivas linguística e filológica, buscando explorar o diálogo estrutural e temático tradicionalmente observado entre elas, mas nunca sistematicamente pesquisado. Da perspectiva filológica, recuperaremos a complexa trajetória editorial de cada uma das obras, sistematizando seus campos bibliográficos desde seu surgimento no século XVI até os dias atuais. Da perspectiva linguística, mapearemos computacionalmente a estrutura sintática e informacional de cada texto e de suas diferentes versões ao longo do tempo, estudando aspectos gramaticais relevantes dos textos e a maneira como estes interagem com a estrutura da informação, numa abordagem comparativa e diacrônica. O projeto produzirá, com isso, um portal de informações ligadas, formando em torno das obras uma rede lógica aprofundada em diversas camadas de análise, graças à aplicação conjunta de técnicas de anotação linguística e web-semântica. Há um duplo efeito na construção dessa rede: de um lado, os fragmentos dispersos de informação sobre as obras passarão a compor um conjunto coeso, com repercussões positivas em diferentes áreas de pesquisa (e, acreditamos, na área da educação). De outro lado, a rede constituirá, em si, uma nova camada a depositar-se sobre as representações editoriais historicamente acumuladas sobre esses textos. Consideramos fundamental refletir criticamente sobre os efeitos dessa representação computacional, e conduziremos paralelamente a prática e a problematização dessa construção. Assim, tanto ao situar-se na confluência entre as humanidades e a computação, como ao adotar uma postura crítica sobre os produtos dessa confluência, o projeto se insere no campo das Humanidades Digitais, e é conduzido no âmbito do Grupo de Pesquisas pioneiro nesse campo no país.

 

2017 - 2018

"Agora andam me jurando a pele...": Escritos de mulheres e escritos sobre mulheres na América Portuguesa

Descrição: Os escritos feitos por mulheres ao longo dos primeiros séculos da formação da América Portuguesa chegaram até nós por diferentes acidentes históricos; daí sua natureza rara e fortuita. Este projeto pretende buscar e catalogar, em arquivos nacionais e estrangeiros, documentos escritos por mulheres ao longo dos séculos XVI, XVII e XVIII, de modo a torná-los visíveis para pesquisas futuras nos campos da história do Brasil e da filologia portuguesa. A este primeiro objetivo junta-se, por força da contingência da raridade dos documentos a serem prospectados, um objetivo auxiliar mas não menos importante: o de buscar e catalogar textos coetâneos escritos sobre mulheres. O principal produto do projeto é um catálogo digital de documentos de tipologias diversas, ou escritos por mulheres ou que contenham sua ?fala? na forma de discurso relatado. A relevância do projeto está em resultar nessa organização preliminar (e inédita) em torno de uma documentação a um tempo muito escassa e imensamente importante para a compreensão da história da formação do Brasil.

 

2012 - 2017

Vésperas Brasilianas: uma agenda para os estudos sintáticos do Português Brasileiro nos primeiros séculos

Descrição: Este projeto, vinculado ao Projeto Temático "História do Português Paulista", tem como objetivo central apresentar uma agenda para os estudos sintáticos dos primeiros séculos do Português Paulista (XVI e XVII). Paralelamente será apresentado um estudo dos mesmos fenômenos sintáticos em textos portugueses dos séculos XV, XVI e XVII. A agenda é composta pela análise da estrutura argumental e valência verbal, preposições, concordância verbal e nominal e estratégias de junção.

 

2011 - 2017

Projeto MaCLinC: Matemática, Computação, Linguagem e Cérebro

Descrição: Um dos maiores e mais urgentes desafios da comunidade científica do século 21 é processar, modelar e explicar a enorme massa dos dados produzidos nos laboratórios de pesquisa. Para isso são necessárias novas ideias e o desenvolvimento de novas estruturas matemáticas. O objetivo do Projeto-USP "Matemática, Computação, Linguagem e Cérebro" (MaCLinC) é alcançar uma compreensão teórica profunda de fenômenos centrais em linguística e em neurociência, através do desenvolvimento de novos modelos e resultados matemáticos. A escolha da linguística apoia-se em mais de 20 anos de experiência que fez do Numec um grupo internacionalmente reconhecido na modelagem matemática da aquisição e mudança linguística. Apoia-se também na existência do Corpus Histórico do Português Anotado Tycho Brahe. A neurociência é atualmente um campo em rápido desenvolvimento com uma clara necessidade de uma nova e original modelagem matemática. O campo é caracterizado por uma grande variedade de fenômenos envolvendo escalas muito diferentes e padrões de interação complexos. Essas características implicam que um tratamento eficiente dos dados e fenômenos passa necessariamente pela modelagem estocástica. Os modelos matemáticos e ferramentas já desenvolvidos por nossa equipe para o estudo de fenômenos linguísticos são candidatos naturais também para a análise de dados em neurociência. Com efeito, tanto os modelos linguísticos, quanto os modelos em neurociência são baseados em medidas de probabilidade definidas em grafos. No primeiro caso esses grafos são árvores de contextos representando dependências linguísticas. No segundo caso os modelos envolvem grafos mais complexos que descrevem a interação dos neurônios ou grupos de neurônios.Os resultados da equipe na área de seleção de modelos - tanto para modelos descritos por árvores de contextos, quanto para campos aleatórios apoiados em grafos de interação - oferecem uma base natural para futuros desenvolvimentos nessas áreas. Linguística e neur. 

 

Grupos de Pesquisa

A língua portuguesa no tempo e no espaço

site / DGP

Etimologia da Língua Portuguesa

site / DGP

Gramáticas: história, descrição e discurso

site / DGP

História do Português Paulista

site / DGP

Humanidades Digitais

site / DGP