LinComp
LinComp
[editar | editar código-fonte]Este grupo visa desenvolver pesquisas em um âmbito multidisciplinar, entre a linguística, computação e inteligência artificial. Pretendemos investigar fenômenos linguísticos em um nível teórico e sua aplicação prática para o processamento automático de língua natural. Procuramos envolver os estudos linguísticos teóricos e descritivos em diferentes níveis de análise, assim como a coleta de dados linguísticos segundo a Linguística de Corpus.
Coordenador: Prof. Dr. Tiago Martins da Cunha
Contato: tiagotmc_AT_unilab_DOT_edu_DOT_br
Objetivos 2015
[editar | editar código-fonte]Construir um corpus de textos representativo das variações do português africano (Angola, Guiné-Bissau, Moçambique, São Tomé e Príncipe) e brasileiro (Nordeste).
Etiquetar morfossintaticamente o corpus construído
Revisar atribuição de etiquetas e tornar o corpus padrão ouro
Cronograma de Tarefas
[editar | editar código-fonte]- Estudos bibliogáficos iniciais
Times de atuação
[editar | editar código-fonte]Corpus
Estudos teóricos de elementos para compor o corpus
Líder: Marlene José
Coleta
Estudos metodologicos e logístico para composição do corpus
Líder: Jéssica Bandeira
Banco
Estudos de formatação dos dados do corpus
Líder:Bruno Cá
Encontro
[editar | editar código-fonte]07.07.2015 - Encontro para divisão de times
21.07.2015 - Encontro para revisão literária e tirar dúvidas
24.07.2015 - Reunião de Planejamento para os times de Corpus/Coleta/Banco.
Planejamento
[editar | editar código-fonte]Time Corpus
[editar | editar código-fonte]- Revisão de literatura
- Estudo de caso
- Escolha de etiquetas e legendas para UNILAB_mark01
Time Coleta
[editar | editar código-fonte]- Revisão Literária
- Elaboração de documento de permissão dos sujeitos (comissão de ética)
- Coleta de assinaturas
Time Banco
[editar | editar código-fonte]- Limpeza de dados
- Atribuição de marcações de formatação