Profa. Dra. Flaviane Romani Fernandes Svartman

Possui graduação em Linguística pela Universidade Estadual de Campinas e Doutorado em Linguística pela mesma instituição, com período sanduíche na Universidade de Lisboa. Atualmente é professora na área de Filologia e Língua Portuguesa, junto ao Departamento de Letras Clássicas e Vernáculas da Faculdade de Filosofia, Letras e Ciências Humanas da Universidade de São Paulo. Tem experiência na área de Linguística, com ênfase em Teoria e Análise Linguística. Suas investigações concernem ao estudo da fonologia e da fonética da língua portuguesa, com especial interesse na prosódia, na interface sintaxe-fonologia e na comparação entre variedades do português.

Email: flavianesvartman@usp.br 
Currículo Lattes


Projetos de Pesquisa

2022 - Atual

Processamento de linguagem natural e fraseamento prosódico em português brasileiro

Descrição: O projeto "Processamento de linguagem natural e fraseamento prosódico em português brasileiro", vinculado ao Projeto TaRSila (Tarefa de Anotação para o Reconhecimento e Síntese de fala da Língua Portuguesa)1 do Núcleo de Processamento de Lingua- gem Natural do Centro de Inteligência Artificial - C4AI 2 da Universidade de São Paulo, colaboração IBM/FAPESP/USP (processo FAPESP 2019/07665-4) (COZMAN, 2019-atual), visa ao estudo do fraseamento prosódico em dados de fala não lida do dialeto paulista do português brasileiro (doravante, PB). Para o alcance desse objetivo, valer-nos-emos da análise de dados de fala anotados do corpus CORAA (Corpus de Áudios Anotados) do Projeto TaRSila do C4AI. Tal corpus, em construção por membros da equipe de processa- mento de fala do C4AI da qual a proponente deste projeto faz parte, será composto de arquivos de áudio transcritos e segmentados em unidades entoacionais, com vistas também a prover recursos para o desenvolvimento de tarefas como reconhecimento automático de fala, síntese multifalantes, identificação do falante e clonagem de voz.

 

2020 - Atual

Estudo SPIRA: Sistema de detecção Precoce de Insuficiência Respiratória por meio de análise de Áudio

Descrição: O projeto tem como objetivo produzir ferramentas computacionais de suporte ao Português do Brasil que possibilitem aplicativos de última geração.Concentra-se tanto na modalidade escrita quanto falada do Português, com foco em três tarefas principais: (1) com uma perspectiva sintática, pretende-se produzir um corpus multi-gênero com milhões de palavras de textos anotados para a construção de modelos robustos de análise; (2) com uma perspectiva de modelo de linguagem, pretende-se gerar um pipeline para a construção de modelos neurais baseados em contexto, com aplicações em inferência de linguagem natural; e (3) para a linguagem falada, pretende-se construir corpora multi-tarefa para reconhecimento de fala, síntese multi-locutor, identificação de locutor, clonagem de voz e classificação de fala como biomarcador, produzindo uma base de português brasileiro falado gravado e transcrito. Cada tarefa envolve trabalhos que cruzam com outras frentes. Por exemplo, a fala transcrita e os modelos neurais devem ser usados ​​pela iniciativa sintática para treinar modelos de análise baseados em neurônios; os modelos de análise podem fornecer mais dados para a inferência de linguagem natural e ferramentas baseadas na fala; os dados de fala serão usados ​​para desenvolver modelos neurais de fala como um biomarcador. As aplicações iniciais serão no diagnóstico de doenças com base na fala, mineração de opinião e detecção de notícias falsas. É dada ênfase à construção e utilização de recursos abertos e de código aberto, de forma a partilhar os recursos dentro e fora deste projecto.

 

2018 - Atual

Centro de Inteligência Artificial (Center for Artificial Intelligence) - C4AI

Descrição: O projeto tem como objetivo produzir ferramentas computacionais de suporte ao Português do Brasil que possibilitem aplicativos de última geração.Concentra-se tanto na modalidade escrita quanto falada do Português, com foco em três tarefas principais: (1) com uma perspectiva sintática, pretende-se produzir um corpus multi-gênero com milhões de palavras de textos anotados para a construção de modelos robustos de análise; (2) com uma perspectiva de modelo de linguagem, pretende-se gerar um pipeline para a construção de modelos neurais baseados em contexto, com aplicações em inferência de linguagem natural; e (3) para a linguagem falada, pretende-se construir corpora multi-tarefa para reconhecimento de fala, síntese multi-locutor, identificação de locutor, clonagem de voz e classificação de fala como biomarcador, produzindo uma base de português brasileiro falado gravado e transcrito. Cada tarefa envolve trabalhos que cruzam com outras frentes. Por exemplo, a fala transcrita e os modelos neurais devem ser usados ​​pela iniciativa sintática para treinar modelos de análise baseados em neurônios; os modelos de análise podem fornecer mais dados para a inferência de linguagem natural e ferramentas baseadas na fala; os dados de fala serão usados ​​para desenvolver modelos neurais de fala como um biomarcador. As aplicações iniciais serão no diagnóstico de doenças com base na fala, mineração de opinião e detecção de notícias falsas. É dada ênfase à construção e utilização de recursos abertos e de código aberto, de forma a partilhar os recursos dentro e fora deste projecto.

 

2018 - Atual

Variação e fraseamento prosódico em português: comparações entre variedades brasileiras e africanas

Descrição: O projeto ?Variação e fraseamento prosódico em português: comparações entre variedades brasileiras e africanas? tem como objetivo geral o estudo prosódico comparativo entre variedades do português brasileiro (PB) e variedades africanas de português faladas em Guiné-Bissau (PGB) e Angola (PA). No alcance desse objetivo geral, este projeto tem como objetivos específicos: a constituição de bases de dados anotados prosodicamente do PB, do PGB e do PA; (ii) a análise qualitativa e quantitativa desses dados, no que concerne ao estudo do fraseamento prosódico e da configuração dos contornos nucleares das sentenças que os compõem; (iii) a comparação, entre as referidas variedades de português, dos resultados obtidos da análise realizada; e (iv) a aplicação de modelagens estatísticas que garantam confiabilidade, em termos de relevância estatística, às conclusões extraídas a partir dos resultados quantitativos obtidos da análise dos dados. Com o desenvolvimento dessa pesquisa, pretendemos trazer contribuições: (a) para os estudos sobre prosódia e variação em português, tema que ainda merece ser melhor explorado pelos estudos linguísticos, no que diz respeito especialmente ao fraseamento prosódico e a entoação e considerando variedades africanas do português; e (b) para os estudos sobre prosódia das línguas românicas de uma maneira geral.

 

2018 - Atual

Do português pré-clássico às variantes modernas: contribuições para o estudo da sintaxe e interfaces

Descrição: O projeto pretende continuar a investigação sobre as gramáticas do português no percurso do tempo focalizando a sintaxe da negação em português e a natureza do operador "não", os pronomes clíticos e suas relações entre polaridade sentencial e fronteamento na diacronia do português.

 

Grupos de Pesquisa

Estudos de prosódia em português: comparações entre as variedades brasileira e africanas (Líder)

site / DGP