Abstracts Category : Other

Add abstract

Want to add your dissertation abstract to this database? It only takes a minute!

Search abstract

Search for abstracts by subject, author or institution

Share this abstract

[en] A MACHINE LEARNING APPROACH FOR PORTUGUESE TEXTCHUNKING

by CARLOS DE GUILHERME

Institution: Pontifical Catholic University of Rio de Janeiro
Year: 2017
Keywords: [pt] APRENDIZADO DE MAQUINA; [en] MACHINE LEARNING; [pt] PROCESSAMENTO DE LINGUAGEM NATURAL; [en] NATURAL LANGUAGE PROCESSING; [pt] APRENDIZADO DE TRANSFORMACOES GUIADO PORENTROPIA; [pt] SEGMENTACAO TEXTUAL; [pt] ANALISE SINTATICA SUPERFICIAL
Posted: 02/01/2018
Record ID: 2161519
Full text PDF: http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=29117


Abstract

[pt] A segmentao textual uma tarefa deProcessamento de Linguagem Natural muito relevante, e consiste nadiviso de uma sentena em sequncias disjuntas de palavrassintaticamente relacionadas. Um dos fatores que contribuemfortemente para sua importncia que seus resultados so usadoscomo significativos dados de entrada para problemas lingusticosmais complexos. Dentre esses problemas esto a anlise sintticacompleta, a identificao de oraes, a anlise sinttica dedependncia, a identificao de papis semnticos e a traduoautomtica. Em particular, abordagens de Aprendizado de Mquinapara estas tarefas beneficiam-se intensamente com o uso de umatributo de segmentos textuais. Um nmero respeitvel de eficazesestratgias de extrao de segmentos para o ingls foi apresentadoao longo dos ltimos anos. No entanto, at onde podemos determinar,nenhum estudo abrangente foi feito sobre a segmentao textual parao portugus, de modo a demonstrar seus benefcios. O escopo destetrabalho a lngua portuguesa, e seus objetivos so dois.Primeiramente, analisamos o impacto de diferentes definies desegmentao, utilizando uma heurstica para gerar segmentos quedepende de uma anlise sinttica completa previamente anotada. Emseguida, propomos modelos de Aprendizado de Mquina para a extraode segmentos textuais baseados na tcnica Aprendizado deTransformaes Guiado por Entropia. Fazemos uso do corpus Bosque,do projeto Floresta Sint(c)tica, nos nossos experimentos.Utilizando os valores determinados diretamente por nossaheurstica, um atributo de segmentos textuais aumenta a mtrica Fbeta igual 1 de um sistema de identificao de oraes para oportugus em 6.85 e a acurcia de um sistema de anlise sintticade dependncia em 1.54. Ademais, nosso melhor extrator de segmentosapresenta um F beta igual 1 de 87.95 usando anotaoes automticasde categoria gramatical. As descobertas indicam que, de fato, ainformao de segmentao textual derivada por nossa heurstica relevante para tarefas mais elaboradas cujo foco o portugus.Alm disso, a eficcia de nossos extratores comparvel dossimilares do estado-da-arte para o ingls, tendo em vista que osmodelos propostos so razoavelmente simples. [en] Text chunking is a very relevant Natural LanguageProcessing task, and consists in dividing a sentence into disjointsequences of syntactically correlated words. One of the factorsthat highly contribute to its importance is that its results areused as a significant input to more complex linguistic problems.Among those problems we have full parsing, clause identification,dependency parsing, semantic role labeling and machine translation.In particular, Machine Learning approaches to these tasks greatlybenefit from the use of a chunk feature. A respectable number ofeffective chunk extraction strategies for the English language hasbeen presented during the last few years. However, as far as weknow, no comprehensive study has been done on text chunking forPortuguese, showing itsAdvisors/Committee Members: RUY LUIZ MILIDIU.

Add abstract

Want to add your dissertation abstract to this database? It only takes a minute!

Search abstract

Search for abstracts by subject, author or institution

Share this abstract

Featured Books

Book cover thumbnail image
Electric Cooperative Managers' Strategies to Enhan...
by White, Michael Edward
   
Book cover thumbnail image
Bullied! Coping with Workplace Bullying
by Gattis, Vanessa M.
   
Book cover thumbnail image
The Filipina-South Floridian International Interne... Agency, Culture, and Paradox
by Haley, Pamela S.
   
Book cover thumbnail image
Solution or Stalemate? Peace Process in Turkey, 2009-2013
by Yurtbay, Baturay
   
Book cover thumbnail image
Performance, Managerial Skill, and Factor Exposure...
by Avci, S. Burcu
   
Book cover thumbnail image
The Deritualization of Death Toward a Practical Theology of Caregiving for the ...
by Gibson, Charles Lynn
   
Book cover thumbnail image
Emotional Intelligence and Leadership Styles Exploring the Relationship between Emotional Intel...
by Olagundoye, Eniola O.
   
Book cover thumbnail image
Commodification of Sexual Labor Contribution of Internet Communities to Prostituti...
by Young, Jeffrey R.
   
Book cover thumbnail image
The Census of Warm Debris Disks in the Solar Neigh...
by Patel, Rahul I.
   
Book cover thumbnail image
Risk Factors and Business Models Understanding the Five Forces of Entrepreneurial R...
by Miles, D. Anthony