Add abstract
Want to add your dissertation abstract to this database? It only takes a minute!
Search abstract
Search for abstracts by subject, author or institution
Want to add your dissertation abstract to this database? It only takes a minute!
Search for abstracts by subject, author or institution
[en] A MACHINE LEARNING APPROACH FOR PORTUGUESE TEXTCHUNKING
by CARLOS DE GUILHERME
Institution: | Pontifical Catholic University of Rio de Janeiro |
---|---|
Year: | 2017 |
Keywords: | [pt] APRENDIZADO DE MAQUINA; [en] MACHINE LEARNING; [pt] PROCESSAMENTO DE LINGUAGEM NATURAL; [en] NATURAL LANGUAGE PROCESSING; [pt] APRENDIZADO DE TRANSFORMACOES GUIADO PORENTROPIA; [pt] SEGMENTACAO TEXTUAL; [pt] ANALISE SINTATICA SUPERFICIAL |
Posted: | 02/01/2018 |
Record ID: | 2161519 |
Full text PDF: | http://www.maxwell.vrac.puc-rio.br/Busca_etds.php?strSecao=resultado&nrSeq=29117 |
[pt] A segmentao textual uma tarefa deProcessamento de Linguagem Natural muito relevante, e consiste nadiviso de uma sentena em sequncias disjuntas de palavrassintaticamente relacionadas. Um dos fatores que contribuemfortemente para sua importncia que seus resultados so usadoscomo significativos dados de entrada para problemas lingusticosmais complexos. Dentre esses problemas esto a anlise sintticacompleta, a identificao de oraes, a anlise sinttica dedependncia, a identificao de papis semnticos e a traduoautomtica. Em particular, abordagens de Aprendizado de Mquinapara estas tarefas beneficiam-se intensamente com o uso de umatributo de segmentos textuais. Um nmero respeitvel de eficazesestratgias de extrao de segmentos para o ingls foi apresentadoao longo dos ltimos anos. No entanto, at onde podemos determinar,nenhum estudo abrangente foi feito sobre a segmentao textual parao portugus, de modo a demonstrar seus benefcios. O escopo destetrabalho a lngua portuguesa, e seus objetivos so dois.Primeiramente, analisamos o impacto de diferentes definies desegmentao, utilizando uma heurstica para gerar segmentos quedepende de uma anlise sinttica completa previamente anotada. Emseguida, propomos modelos de Aprendizado de Mquina para a extraode segmentos textuais baseados na tcnica Aprendizado deTransformaes Guiado por Entropia. Fazemos uso do corpus Bosque,do projeto Floresta Sint(c)tica, nos nossos experimentos.Utilizando os valores determinados diretamente por nossaheurstica, um atributo de segmentos textuais aumenta a mtrica Fbeta igual 1 de um sistema de identificao de oraes para oportugus em 6.85 e a acurcia de um sistema de anlise sintticade dependncia em 1.54. Ademais, nosso melhor extrator de segmentosapresenta um F beta igual 1 de 87.95 usando anotaoes automticasde categoria gramatical. As descobertas indicam que, de fato, ainformao de segmentao textual derivada por nossa heurstica relevante para tarefas mais elaboradas cujo foco o portugus.Alm disso, a eficcia de nossos extratores comparvel dossimilares do estado-da-arte para o ingls, tendo em vista que osmodelos propostos so razoavelmente simples. [en] Text chunking is a very relevant Natural LanguageProcessing task, and consists in dividing a sentence into disjointsequences of syntactically correlated words. One of the factorsthat highly contribute to its importance is that its results areused as a significant input to more complex linguistic problems.Among those problems we have full parsing, clause identification,dependency parsing, semantic role labeling and machine translation.In particular, Machine Learning approaches to these tasks greatlybenefit from the use of a chunk feature. A respectable number ofeffective chunk extraction strategies for the English language hasbeen presented during the last few years. However, as far as weknow, no comprehensive study has been done on text chunking forPortuguese, showing itsAdvisors/Committee Members: RUY LUIZ MILIDIU.
Want to add your dissertation abstract to this database? It only takes a minute!
Search for abstracts by subject, author or institution
Electric Cooperative Managers' Strategies to Enhan...
|
|
Bullied!
Coping with Workplace Bullying
|
|
The Filipina-South Floridian International Interne...
Agency, Culture, and Paradox
|
|
Solution or Stalemate?
Peace Process in Turkey, 2009-2013
|
|
Performance, Managerial Skill, and Factor Exposure...
|
|
The Deritualization of Death
Toward a Practical Theology of Caregiving for the ...
|
|
Emotional Intelligence and Leadership Styles
Exploring the Relationship between Emotional Intel...
|
|
Commodification of Sexual Labor
Contribution of Internet Communities to Prostituti...
|
|
The Census of Warm Debris Disks in the Solar Neigh...
|
|
Risk Factors and Business Models
Understanding the Five Forces of Entrepreneurial R...
|
|