21.5.10

 

Como surgem as palavras?

Como é que se chama o nome dissoOcomo os físicos estudam o nascimento de palavras

Artigo publicado na CH 270 (maio/2010)
 palavras270.pdf — PDF document, 3388Kb
Ciência Hoje • vol. 45 • nº 270
Como nascem as novas palavras? Pode parecer curioso, mas lidar com um problema desse gênero não é tão estranho para os físicos, para quem isso pode ser feito por meio de um jogo simples, implementado por meio de computadores, no qual agentes artificiais trocam palavras na tentativa de se comunicar.
Apenas um jogo? Não. Estratégia semelhante pode ser usada em situações nas quais seja necessário ter máquinas capazes de se adaptarem a um ambiente, como robôs destinados tanto a explorar lugares desconhecidos quanto a cumprir tarefas que não podem ser programadas com antecedência.
Edgardo Brigatti
Polo Universitário de Volta Redonda, Universidade Federal Fluminense
Itzhak Roditi
Coordenação de Física Teórica, Centro Brasileiro de Pesquisas Físicas (RJ)

Aqui está você, que nos lerá, esperamos, nos próximos minutos. Para cumprir essa operação tão comum, você, leitor, deverá confiar em várias e refinadas habilidades. Entre elas, uma das mais óbvias: conhecer as palavras presentes no texto – e, quando dizemos conhecer uma palavra, entendemos a dupla composta por um signo gráfico e seu significado. Mas, olhe, pode relaxar: esse texto não é técnico; além disso, você deve conhecer talvez umas 60 mil palavras.
Agora, o fato de uma pessoa comum conhecer, com tanta naturalidade, milhares de palavras é realmente impressionante. Basta pensar na enorme dificuldade que é tentar ensinar a um chimpanzé ou papagaio uma dezena delas. Embora essa capacidade de os humanos manterem – sem muito esforço – um vocabulário tão rico seja uma competência bem específica entre as nossas diferentes habilidades linguísticas, se quisermos estudá-la é necessário refletir um pouco mais sobre aspectos gerais da linguagem.
Reflexão filosófica
A palavra linguagem nos remete à capacidade humana de adquirir e usar uma língua para comunicar e realizar interações sociais. Mas não só. A linguagem é a estrutura primitiva por meio da qual podemos organizar conceitualmente nossa experiência. Ela está tão intimamente ligada com nossa representação do mundo – e tão intrinsecamente conexa com a possibilidade de pensar – que, sem ela, nem parece possível formular reflexões conscientes.
Os debates de natureza filosófica sobre essas questões são muito antigos. Exemplo paradigmático – embora, em sua perspectiva, radical – é a reflexão gerada, no começo do século passado, entre o grupo de pensadores do chamado Círculo de Viena e a filosofia da linguagem desenvolvida na Universidade de Cambridge. Entre esses filósofos, a tentativa de associar a linguagem às estruturas básicas do pensamento – ou seja, da lógica, e, por meio dela, de forma unívoca, às realidades visíveis – encontrou grande esforço de síntese.
Nesses ambientes, transitava um jovem austríaco, Ludwig Wittgenstein (1889-1951). Depois de ter produzido obra fundamental para os destinos dessas diretrizes filosóficas, retirou-se da atividade acadêmica, para se dedicar ao ensino básico no interior da Áustria.
Anos depois, ao voltar à reflexão filosófica, renegou todo o esforço da fase mais jovem e passou a repensar as estruturas linguísticas em termos de uma atividade puramente convencional, fruto do empenho cotidiano de homens envolvidos com a resolução de problemas comuns. O paradigma da linguagem parou de ser a lógica pura, para se manifestar em jogos ingênuos e simples.
Essa abrupta mudança na perspectiva desse filósofo incorpora exemplarmente as alternativas em torno das quais se continua debatendo o pensamento contemporâneo sobre linguagem.
Trabalho interdisciplinar
Nos últimos tempos, a reflexão dos linguistas vem se estruturando de forma mais pragmática, esforçando-se em identificar fatos sobre os quais seja mais simples convergir a um acordo. Um dos aspectos que influenciaram essas novas diretrizes é o fato de as habilidades linguísticas serem habilidades cognitivas. Se refletirmos sobre os processos que permitem a um indivíduo fazer uso da linguagem, podemos diferenciar vários sistemas que interagem nessa operação – mas todos esses sistemas são identificáveis com alguma forma de atividade cerebral. Podemos reconhecer um sistema de cálculo, capaz de manipular símbolos, que, por sua vez, se relaciona com um sistema semântico, e, enfim, há os sistemas tanto sensorial quanto motor, que permitem articular a voz e a escuta.
Para o sistema de produção e percepção da linguagem, não há descontinuidade profunda entre animais e humanos. No entanto, no sistema de computação interno está o verdadeiro diferencial dos humanos. Em particular, o que mais impressiona é sua capacidade de recombinar unidades de significado em uma variedade sem limite de estruturas maiores, cada uma diferente no significado final.
Mas linguagem não é simplesmente uma habilidade cognitiva que se manifesta em nível individual. Para se dar conta disso, basta observar que a linguagem existe porque precisamos falar. A linguagem é a espinha dorsal da interação social dos homens. E, de fato, as habilidades linguísticas geram um dispositivo para a ação comum.
Essa coleção enciclopédica de significados baseados em palavras que cada um de nós tem emerge do espaço comum no qual a comunidade de falantes se encontra; emerge por meio de práticas, experiências e saberes convividos. Nessa intuição, a língua é a tríade ‘forma-significado-comunidade’, na qual a dupla ‘forma-significado’ se define por convenção por meio dos eventos comunicativos. Os significados são, em potência, indeterminados, mas, no ato, fixados social mente no momento da fala.
A pluralidade dessas perspectivas evidencia a necessidade de um trabalho interdisciplinar. Linguistas, biólogos, psicólogos, sociólogos, cientistas da informação, entre outros, são chamados a se empenhar em um programa colaborativo de pesquisa. Entre esses pesquisadores, os físicos também podem contribuir.
A seguir, vamos ilustrar essas ideias, apresentando um problema relativo a estudos dos autores deste artigo que vêm sendo explorados por vários grupos de pesquisadores.
Fenômeno de ordenamento
Se quisermos explorar como as interações sociais são responsáveis por gerar o triângulo linguístico ‘forma-significado-comunidade’, uma primeira pergunta surge naturalmente: como nascem novas palavras?
Para se convencer de que a geração de neologismos existe, é suficiente olhar um dicionário. Perceberemos como, a cada ano, milhares de palavras novas aparecem. Outro exemplo pode vir da comparação de jornais mais antigos com os atuais, nos quais palavras ou estruturas sintáticas mudam e se difundem substituindo as antigas. Ou, mais simplesmente, é suficiente prestar atenção em como continuamente ouvimos novas expressões, muitas vezes estritamente relacionadas com particulares grupos sociais. Assim como cantores de funk em bailes de comunidades cariocas fixam novas gírias, também cientistas nos laboratórios inventam palavras técnicas e especializadas.
Pode parecer curioso, mas lidar com um problema desse gênero não é tão estranho para físicos. Abstraindo um pouco desses exemplos, nos deparamos com quê? Um conjunto de indivíduos, cada um deles caracterizado por uma memória que contém um elenco de palavras que são trocadas, fixando-as ou reinventando-as, seguindo uma cadeia de interações sociais. O sistema começa com cada indivíduo tendo na memória uma coleção de palavras para designar o mesmo conceito. Com o passar do tempo, o sistema converge na adoção de uma única palavra.
É fácil enxergar forte analogia entre esse problema e fenômenos em que unidades caracterizadas por algum traço específico interagem entre si, mudando esse traço. Começando com um estado desordenado, emergem conjuntos homogêneos caracterizados por ter o mesmo traço. Posto nesses termos, podemos reconhecer aí o chamado fenômeno de ordenamento, problema clássico de uma área da física conhecida como mecânica estatística. Exemplo paradigmático desse fenômeno é a imantação de um pedaço de ferro. Mas um grande enxame de pássaros que desenha, no céu, figuras complicadas, sincronizadas e dinâmicas também exemplifica bem a formação espontânea de estruturas ordenadas.
O pedreiro e o tijolo
O primeiro problema que temos que enfrentar é como definir um indivíduo, o que faremos por meio de uma memória. O fator mais relevante em relação à memória é sua natureza aberta. Ou seja, as unidades linguísticas – nesse caso, as palavras – são de natureza puramente convencional; portanto, são arbitrárias e, por isso, a priori, ilimitadas. Isso significa que devemos usar memórias capazes, em principio, de acumular um número ilimitado de palavras.
A total liberdade que a unidade linguística tem na memória de cada indivíduo é limitada só por meio das interações com a comunidade. Essas interações reduzem a arbitrariedade dos signos e levam a comunidade ao consenso. Essas considerações inspiram-se diretamente nas intuições de Wittgenstein – estamos aqui olhando a linguagem como produto de um treinamento para reagir de forma específica a um signo específico, e consideramos que seja esse treinamento que define os significados das palavras por meio do uso.
Definimos nosso indivíduo e sua memória. Falta, então, definir coerentemente um conjunto de regras para as interações entre indivíduos. Para isso, consideramos o que pode acontecer em um jogo linguístico simplificado, como o caso de um mestre de obra que pede um tijolo a um pedreiro que não fala a mesma língua dele. Ao ouvir a palavra tijolo, o pedreiro levará para o mestre de obra uma pedra ou uma espátula... até que, ao trazer um tijolo, constatará que aquela palavra corresponde àquele objeto. Dali em diante, o pedreiro usará a palavra tijolo para indicar esse objeto e deixará de considerar outras possíveis expressões.
Jogo de nomeação
Inspirados nesse exemplo, vamos estabelecer as regras do jogo para a simulação computacional do problema. A cada momento, escolhemos um indivíduo (falante) que comunica uma palavra a outro (ouvinte). Quando o ouvinte tem na própria memória a palavra transmitida, ele apaga todas as outras e mantém apenas aquela que permitiu o sucesso da comunicação. A mesma operação ocorre na memória do falante. Os dois indivíduos, então, ficam com uma memória na qual se conserva uma única palavra. Nesse caso, o jogo foi um sucesso. Ao contrário, se o ouvinte não tiver essa palavra, o jogo falha, e ele inclui a palavra no conjunto de sua memória (figura 1).
Podemos notar como um jogo com as regras enunciadas acima, extremamente simples, captura elementos essenciais típicos das interações sociais: a presença de memórias, o efeito da aprendizagem e da realimentação.
Esse conjunto de regras gera uma dinâmica caracterizada por um período de crescimento e difusão de palavras novas, seguido por repentina mudança na direção do uso de uma única palavra até a população chegar ao consenso. A partir daí, aquela única palavra será sempre utilizada para se referir àquele conceito.
Na literatura especializada, o modelo que acabamos de apresentar é chamado ‘jogo de nomeação’ e tem sido objeto de estudos e generalizações capazes de engendrar resultados interessantes.
Auto-organização
Em primeiro lugar, por meio dessa abordagem, podemos obter uma forma eficaz e econômica para testar regras que podem gerar essa dinâmica – existindo interesse na busca por regras mínimas e pelas mais aptas a gerar consenso. Isso tem importância, seja explicativa dos fenômenos naturais de fixação de novo vocabulário, seja aplicativa, sugerindo possíveis algoritmos a serem usados para gerar linguagens artificiais para, por exemplo, permitir a comunicação entre robôs.
No estudo de sistemas físicos caracterizados por um número gigantesco de detalhes, sobre os quais é impossível ter controle, é necessário introduzir métodos que identifiquem comportamentos gerais. Por exemplo, é virtualmente impossível prever os detalhes específicos de como se romperá uma vidraça golpeada por um projétil. Por isso, no lugar de procurar explicar o comportamento de uma vidraça em especial, quebram-se milhares de vidraças e, coletados os dados e analisados estatisticamente, olha-se o que é possível reconhecer como propriedades comuns a todas as vidraças quebradas.
Como também não é exatamente desejável quebrar tantas vidraças, recorre-se a grande número de simulações computacionais, coletam-se os dados e analisa-se estatisticamente o conjunto das diferentes realizações, para entender como se comportam as grandezas em exame. Essas distribuições é que poderão ser comparadas com os dados reais. Por isso, no lugar de investigarmos a história particular de um dado sistema, nos concentramos nas propriedades gerais que não mudam no conjunto formado por grande número de cópias desse sistema.
Devemos também salientar outra propriedade típica da evolução desses sistemas: a presença de auto-organização. Com essa expressão, entendemos processos em que, no lugar de um controle central que manda cada indivíduo cumprir uma tarefa, um sistema descentralizado de interações seleciona livremente as operações que, somando-se em um processo coletivo, resultam ser as corretas para o surgimento de novas estruturas. Trata-se de um controle sem hierarquia.
Essa ideia talvez pudesse aterrorizar o chefe executivo de uma grande empresa, que nunca deixaria um sistema operar desse jeito. Ou seja, o próprio sistema, sem a necessidade de gastar energia, julgando e dirigindo outros indivíduos por meio de autoridade, encontra uma forma autônoma de gerar informações e estruturas.
Natural, elegante e... única?
Para concluir, vamos rapidamente mencionar como tudo isso não é uma simples brincadeira, mas tem utilidade direta na implementação de linguagens artificiais. Efetivamente, grande atrativo desses estudos é que eles podem ser implementados diretamente em sistemas reais, formados por meio de robôs que interagem. Esses robôs são equipados com um programa para a localização de objetos e para a troca de palavras, com regras e estruturas similares àquelas apresentadas aqui no modelo teórico.
Operando por meio desses algoritmos, essas máquinas conseguem definir um conjunto de palavras (léxico) associado aos objetos e se comunicar – sem intervenção externa e sem a necessidade de definir a priori o vocabulário. Isso tem, sem dúvida, grandes vantagens para situações nas quais seja necessário ter máquinas capazes de se adaptar, reinventando constantemente as próprias estruturas comunicativas, como para robôs destinados a explorar lugares desconhecidos ou a cumprir tarefas que não podem ser programadas com antecedência.
Os fenômenos da vida são complicados, confusos, surpreendentes. E a emergência das linguagens nos humanos é um exemplo paradigmático no qual parecem estar em jogo propriedades bem distantes da exatidão da trajetória de um planeta ou de outros cânones da física moderna. No lugar de nos preocuparmos com precisão e eficiência perfeitas, temos que refletir sobre como os sistemas viventes dão um jeito para funcionar. A existência de restrições pode se transformar em uma possibilidade de criação de estruturas inesperadas, mostrando como certos problemas complexos encontram uma solução natural, intrinsecamente elegante. E, quem sabe, a única possível.
Sugestões para leitura
Revista MultiCiência – edição ‘A mente humana’, n. 3, outubro de 2004. Disponível em http://www.multiciencia.unicamp.br/artigos_03/a_02_.pdf
Baronchelli, A.; Felici, M.; Caglioti, E.; Loreto, V.; Steels, L. ‘Sharp transition towards shared vocabularies in multi-agent systems ‘ Journal of Statistical Mechanics. P06014 (2006) Disponível em http://arxiv.org/pdf/physics/0509075 
BRIGATTI, E.; RODITI, I. ‘Conventions spreading in open-ended systems’New Journal of Physics v. 11, p. 023018 (2009). Disponível em http://iopscience.iop.org/1367-2630/11/2/023018?fromSearchPage=true  
Na internet:
Projeto Talking Heads (em inglês): http://talking-heads.csl.sony.fr/

Marcadores: ,


Comments: Postar um comentário



<< Home

This page is powered by Blogger. Isn't yours?