Para vocês que nunca viram, esta é uma árvore de análise sintática de Chomsky, a frase em Analise é "O João comprou todos os livros."
Morfossintaxe em ação!!
segunda-feira, 19 de novembro de 2012
Opa Chomsky style!
Para vocês que nunca viram, esta é uma árvore de análise sintática de Chomsky, a frase em Analise é "O João comprou todos os livros."
O algoritmo da linguagem
O
algoritmo da linguagem
O
parser da linguagem
As pessoas sempre tiveram medo de que suas criações pudessem superar
a sua inteligência. Quando a Inteligência Artificial surgiu em 1950,
parecia que esse fato iria se tornar realidade. As pessoas aceitavam o fato
do computador calcular o número pi com milhares de casas mas o fato deles
provarem teoremas e jogar xadrez era inaceitável. Com os computadores
resolvendo tarefas complexas como essas, parecia questão de tempo programar
o computador para realizar tarefas humanas corriqueiras, como a fala. No entanto,
a principal lição desses 52 anos de IA é que os problemas
difíceis são fáceis e os problemas fáceis difíceis.
Compreender
uma frase é um dos problemas fáceis difíceis. Quando nos
comunicamos com os computadores precisamos usar a língua dele, pois ele
não entende a nossa. Em 1965, Joseph Weizenbaum escreveu um programa
denominado ELIZA, que chamou bastante atenção por ser capaz de
se comunicar com o ser humano. Mas, na verdade, o que ele fazia era procurar
algumas palavras-chave numa linha fornecida, encontrar uma resposta pré-fabricada
em uma lista e inserir fragmentos da linha fornecida sem sua resposta.
Na
verdade, antes dos computadores começarem a se comunicar com o homem,
é necessário que os cientistas consigam descobrir como o nosso
cérebro processa a linguagem.
Para
compreendermos uma frase, o primeiro passo é analisá-la. No entanto,
não é fazer uma análise gramatical como aquelas que aprendemos
na escola, mas encontrar sujeitos, verbos, objetos, etc. agrupando-os em sintagmas,
semelhantemente ao que ocorre inconscientemente.
Segundo
Pinker (2002, p. 247-8), "a gramática em si é um mero código
ou protocolo, uma base de dados estática que especifica que tipos de
sons correspondem a que tipos de significado numa determinada língua."
Tanto a fala quanto a compreensão, compartilham uma mesma base de dados
gramaticais, no entanto, precisamos de um "programa mental" que especifique
o que a mente tem que fazer passo a passo, que analise a estrutura da frase
durante a compreensão da linguagem. A esse programa damos o nome de parser.
A melhor maneira de entendermos como a compreensão funciona é acompanharmos o parsing de uma simples sentença, gerada por uma minigramática Pinker (2002, p. 248):
"S - NP VP
'Uma frase pode ser formada de um sintagma nominal e um sintagma verbal.'
NP - (det) N (PP)
'Um sintagma nominal pode ser formado de um determinante opcional, um substantivo e um sintagma preposicional opcional.'
VP - V NP (PP)
'Um sintagma verbal pode ser formado de um verbo, um sintagma nominal e um sintagma preposicional opcional.'
PP - P NP
'Um sintagma preposicional pode ser formado de uma preposição e um sintagma nominal.'
N - menino, menina, cão, gato, sorvete, doce, sanduíche
'Os substantivos do dicionário mental incluem menino, menina...'
V - come, adora, morde
'Os verbos do dicionário mental incluem come, adora, morde.'
P - com, em , ante
'As preposições incluem com, em, ante.'
det - um, o certo
'Os determinantes incluem um, o, certo.'"
O
parser monta uma árvore de cima para baixo na tentativa de identificar
os elementos da frase. Supondo a frase O menino vê televisão, a
primeira palavra que chega ao parser é o, ela acessa o dicionário
mental e encontra uma regra que determina o seu posicionamento no primeiro ramo
da árvore, como determinante. Como todas as palavras fazem parte de um
sintagma maior, ele identifica o NP, observando o que está à direita
do o. Como NPs não ficam soltos, sem frase, é preciso buscar os
outros componentes da sentença, usando a regra para sentenças.
O
ramo solto N equivale a um substantivo, quando o parser encontra a palavra menino,
confirma a sua expectativa. Com o NP completo, resta completar o S. Quando encontra
o verbo vê, o parser confirma a presença do VP. O parser sabe agora
que precisa completar o VP com um sintagma nominal. A próxima palavra
é televisão, que se encaixa no ramo vazio do NP, completando a
frase.
À
medida que completa os sintagmas, o parser apaga as partes da memória
e mantém o todo. Com a união dos galhos, ele constrói o
significado da sentença, utilizando as definições do dicionário
mental e os princípios que regem sua combinação. Combinando
a semântica do sujeito com a semântica do VP, conseguimos compreender
a frase.
No
percurso do parser, encontramos duas idéias do campo da computação:
a memória (temos que manter em mente os sintagmas até completá-los)
e a tomada de decisão (quando uma palavra ou sintagma se encontra do
lado direito de duas regras diferentes, temos que decidir qual usar para construir
o próximo ramo da árvore). Conforme a primeira leia da Inteligência
Artificial (os problemas difíceis são fáceis e os fáceis
são difíceis), verifica-se que a parte da memória é
difícil para as pessoas e fácil para o computador, e a tomada
de decisão é fácil para as pessoas e difícil para
o computador.
Um
parser exige vários tipos de memória, mas a mais óbvia
é a necessária para sintagmas incompletos. Os computadores, geralmente,
usam a estrutura de pilha para fazer esse tipo de armazenamento. Também
as pessoas têm que utilizar um pouco de sua memória de curto prazo
para sintagmas soltos, mas essa memória é limitada a média
geral de sete mais ou menos dois elementos.
Quanto
mais rápido a frase puder ser agrupada em sintagmas completos, mais compreensível
ela será. Como exemplo, temos as árvores ramificadas à
direita ou à esquerda (dependendo da geometria de suas árvores
de estruturas sintagmáticas). Nessas árvores, fazendo o percurso
da esquerda para a direita, somente um dos galhos ficam incompletos por vez.
Existe
ainda um outro tipo de geometria, chamada de cebolas ou bonecas russas, que
torna a compreensão das frases mais difícil. Nesse caso, frases
são encaixadas dentro de outras frases como no exemplo (PINKER, 2002,
p.257): "A rapidez que o movimento que a asa que o beija-flor tem tem tem
é notável."
Por
que é mais difícil interpretar frases que são como cebolas
ou bonecas russas? Segundo Pinker (2002), o que atrapalha o parser humano não
é a quantidade de memória mas o tipo de memória. Quando
um tipo de sintagma tem de ser lembrado mais de uma vez - de maneira que tanto
ele quanto o tipo de sintagma idêntico a ele, onde ele está inserido,
tenham que ser completados em ordem - não existe lugar suficiente na
lista de controle e eles podem ser completados inadequadamente.
Diferente
da memória, a tomada de decisão é mais fácil para
o computador do que para as pessoas. Existem muitas ambigüidades na língua,
como substantivos que, dependendo da frase, podem aparecer como verbos e sintagmas,
que podem assumir posições diferentes na frase. Essas ambigüidades
criam para o parser um número enlouquecedor de bifurcações
em cada passo da formação da árvore. O computador consegue
testar todas essas possibilidades e retornar uma única árvore
e seus significados associados.
Mas
neste ponto existe um problema, os parsers de computador são meticulosos
demais e acabam encontrando ambigüidades que os seres humanos não
encontrariam. Como os parsing humanos eliminam essas ambigüidades improváveis?
Uma das respostas é que o nosso cérebro seria como o computador
e testaria todas as possibilidades, eliminando de alguma forma as alternativas
improváveis. A outra é que o parser humano aposta em uma alternativa
mais provável de ser a verdadeira e avança com uma interpretação
única até onde for possível. Na computação
damos o nome, respectivamente, de busca em largura e busca em profundidade para
esses procedimentos.
A
busca em profundidade seria a mais provável de acontecer, já que
existem ambigüidades muito sutis que nunca são reconhecidas. Com
uma só árvore na cabeça economiza-se espaço de memória,
ao preço de ter de reiniciar o processo se a aposta for na árvore
errada. Mas qual seria o critério para a escolha dessa árvore
única? Uma das possibilidades é que toda a inteligência
humana é usada para resolver esse problema, fazendo o parsing da frase
de cima para baixo. Dessa maneira, se as pessoas conseguissem deduzir o significado
da frase de antemão, prevendo as intenções do falante,
nem chegaria a construir esse galho da árvore. Mas usar toda a inteligência
humana tornaria o processo muito lento, dessa forma pesquisas ainda tentam descobrir
quanto da inteligência é utilizada nesse processo.
Apesar
da descrição da linguagem em árvores, uma frase não
é apenas uma árvore. Até o início dos anos 60 quando
Chomsky propôs as transformações de estruturas profundas
em estruturas de superfície, os psicólogos tentavam descobrir
algum tipo de impressão digital dessa transformação utilizando
técnicas de laboratório.
Segundo Chomsky, a estrutura superficial é a manifestação física do enunciado. Como um mesmo significado pode ser veiculado através de padrões muito diferentes de sons e letras, não pode existir uma relação simples entre estrutura superficial e significado. A estrutura profunda deve estar relacionada à estrutura superficial por regras que especificam como o significado se projeta na fala e explicam, entre outras coisas, a paráfrase e a ambigüidade. Chomsky criou uma regra acerca desses sistemas de regras.
Segundo Chomsky, a estrutura superficial é a manifestação física do enunciado. Como um mesmo significado pode ser veiculado através de padrões muito diferentes de sons e letras, não pode existir uma relação simples entre estrutura superficial e significado. A estrutura profunda deve estar relacionada à estrutura superficial por regras que especificam como o significado se projeta na fala e explicam, entre outras coisas, a paráfrase e a ambigüidade. Chomsky criou uma regra acerca desses sistemas de regras.
Sem
conseguir nenhuma comprovação científica, os estudos foram
abandonados por muitos anos. No entanto, as técnicas de laboratório
se sofisticaram, e a descoberta de algo parecido com uma operação
transformacional na mente e no cérebro das pessoas tornou-se um dos achados
recentes mais interessantes da psicologia da linguagem.
Dessa
forma, podemos afirma que a fala é algo bem diferente de O menino vê
televisão, e que para compreender uma frase é preciso bem mais
do que um mero parsing. A informação semântica obtida de
uma árvore é apenas uma das premissas de que a compreensão
faz uso, dentro de uma complexa cadeia de inferências sobre as intenções
do falante. (PINKER, 2002) Referencia:
ALLEN, James. Natural language understanding. California: Benjamin/Cummings , 1987.
MILLER, George A. The science of words. New York: Scientific American Library, 1996.
PINKER, Steven. O instinto da linguagem: como a mente cria a linguagem. São Paulo: Martins Fontes, 2002.
SCARPA, Ester Mirian. Aquisição da linguagem. In: MUSSALIM, Fernanda; BENTES, Ana Cristina. Introdução à lingüística: domínios e fronteiras. São Paulo: Cortez, 2001. v.2.
STILLINGS, Neil A. Cognitive Science: an introduction. Cambridge: Massachusetts Institute of Technology, 1989.
Estudo extraído:
http://www.nce.ufrj.br/ginape/publicacoes/trabalhos/t_2002/t_2002_renato_aposo_e_francine_vaz/algoritmo.htm
quinta-feira, 15 de novembro de 2012
Definindo Morfossintaxe
Na sua vida escolar você aprendeu
(ou talvez ainda continue aprendendo) sobre os distintos fatos
linguísticos, dentre eles: substantivo, adjetivo, sujeito, predicado,
adjunto adverbial, etc. Contudo, é bem provável que não tenha aprendido
como tais assuntos se dividem dentre as partes da gramática, tampouco
acerca do que realmente seja morfossintaxe.
Em razão disso, dispomo-nos a levar a você os conhecimentos necessários
sobre um assunto de tamanha importância – muitas vezes cobrado em
provas de concursos e exames de vestibulares.
Desta feita, a morfossintaxe nada mais é do que a análise morfológica e sintática,
realizada simultaneamente. Mas para que sua compreensão seja efetivada
de forma plausível, faz-se necessário entender, antes de tudo, que a
análise morfológica diz respeito às dez classes gramaticais; e a análise
sintática faz referência às funções desempenhadas por uma dada palavra,
estando ela inserida num contexto oracional.
Assim, colocando em prática tudo o que dissemos, analisemos o exemplo em questão, levando em consideração ambas as análises:
Os alunos foram vencedores.
Morfologicamente, temos:
Os – artigo definido (plural)
alunos – substantivo
foram – verbo ser (flexionado no pretérito perfeito do modo indicativo)
vencedores – neste contexto representa um adjetivo, mas pode também atuar como substantivo.
alunos – substantivo
foram – verbo ser (flexionado no pretérito perfeito do modo indicativo)
vencedores – neste contexto representa um adjetivo, mas pode também atuar como substantivo.
Sintaticamente, concluímos que:
Os alunos – sujeito simples
foram vencedores – predicado nominal, em função do verbo de ligação
vencedores – predicativo do sujeito
foram vencedores – predicado nominal, em função do verbo de ligação
vencedores – predicativo do sujeito
É preciso, pois, estabelecer a diferença entre classe e função para
entender como se processa a morfossintaxe, pois uma palavra pode
transitar entre uma posição e outra.
Vânia Duarte
Graduada em Letras
Referencia: http://www.brasilescola.com/gramatica/morfossintaxe.htm
quarta-feira, 31 de outubro de 2012
Primeiros Passos!
Introdução
O Blog Morfo in action, como o nome já indica, tem a finalidade de apresentar a morfossintaxe de uma perspectiva simples e resumida em uso prático, utilizando-se das discussões em sala de aula. O conteúdo será disposto em textos e videos.
Objetivos
Objetivo Geral:
Nosso
objetivo é divulgar informações sobre Morfossintaxe, de maneira
didática e simplificada, para que alunos que buscam conhecer melhor este
assunto. E também, apresentar textos; a aplicação e muito mais.
Objetivos Específicos:
- Apresentar o assunto de maneira convidativa. Despertando a curiosidade nos alunos pesquisadores;
- Divulgar e explicar o funcionamento da morfossintaxe.
Justificativa
O
blog foi criado com o intuito de apresentar este movimento em ação;
dinamizar o conteúdo através de textos, imagens, e documentários; E,
finalmente, explicar como realizar boas analises.
Metodologia
Utilizaremos como método de estudo, Textos, imagens, vídeos e algumas obras referentes ao assunto;
As Referencias bibliográficas serão inseridas adjacentes ao conteúdo.
Assinar:
Postagens (Atom)