Biquipédia:De la máquina de Cecílio/pt

Ourige: Biquipédia, la anciclopédia lhibre.
Saltar para a navegação Saltar para a pesquisa

Taberna  · Portal de la quemunidade  · FAQ  · Ambaixada


Atalho:
BP:MC

Este texto é um ensaio.

A máquina de Cecílio é um script em JavaScript desenvolvido por Cecílio entre 31 de dezembro de 2008 e 17 de janeiro de 2010 com a participação de outros utilizadores que à data editavam ativamente a mwl.wikipedia. O processo de construção desta máquina ficou registado em fonte. As instruções para o uso desta máquina estão em instruções.

Esta máquina está acessível em WWW sob o endereço https://student.dei.uc.pt/~crpires/tradutor/Tradutor.html

A máquina foi batizada de "tradutor".

Tradução?[eiditar código-fuonte]

A tradução é a transformação de um texto em uma língua (origem) em outra (alvo). Como uma língua se caracteriza pelo seu léxico e sintaxe, na tradução tem-se então de gerar uma sequência de palavras do léxico da língua alvo, sequência essa que deve ser bem formada segundo a sintaxe dessa língua. Resta saber se o texto gerado contém, na língua alvo, a mesma informação, ideias e emoções que o texto na língua origem. Isto é um problema de semântica, que pressupõe não só um conhecimento profundo de ambas as línguas, como também um conhecimento do assunto exposto no texto e do ambiente cultural dos públicos origem e alvo.

A tradução sempre foi executada por humanos, logo sujeita de muitos erros. Mesmo os tradutores mais sábios e experientes falham por vezes na transformação semântica: de longe a mais difícil de executar e que, tanto quanto exigir conhecimento das línguas, exige um conhecimento profundo do assunto exposto, o que força amiúde o tradutor a um trabalho de investigação nessa área.

Recentemente a computação tem desenvolvido métodos de tradução mecânica, que buscam substituir o tradutor humano por uma máquina. Esta substituição pode ser parcial, mas jamais total. Uma máquina jamais será capaz de executar a transformação semântica melhor que todos os programistas, linguistas e tradutores que participaram na sua construção, e como estes são suscetíveis a errar, assim a máquina será. A transformação semântica segue sendo um processo em que a intervenção humana é indispensável. Uma máquina poderá ser boa em transformação lexical, eventualmente em transformação sintática, mais jamais em transformação semântica.

Capacidade tradutora da máquina[eiditar código-fuonte]

A fonte deixa-nos aperceber que a máquina de Cecílio será essencialmente um dicionário, ou seja uma tabela de duas colunas: na da esquerda a expressão transformanda, na da direita a transformada. Um conjunto de expressões regulares resolve casos repetitivos. As expressões na coluna esquerda são muito curtas. Na verdade, todas elas se resumem a uma palavra, com a exceção de "caspa do cabelo", "um calor", "o calor", "terra gelada", "em baixo", "em cima" e outros poucos casos evidentemente avulsos.

Assim, fora o caso da "caspa do cabelo" e outras poucas mais, sendo A, B expressões em português, vale (A B)' = A' B', em que A' é a transformada de A pela máquina de Cecílio. Exemplo: (Eu não sou mirandês)' = Eu' não' sou' mirandês' = You nó sou mirandés.

Resulta portanto que a máquina tem capacidade de transformação sintática nula. Mas a sintaxe do mirandês, não é a do português:

Também a sintaxe do mirandês apresenta muitas características próprias quer em relação ao português quer em relação ao castelhano, afirmação que contraria reiteradas e habituais afirmações que a esse respeito são feitas, sobretudo no que respeita à sintaxe do português e do mirandês. Essas afirmações, porém, apenas se devem à falta de estudo e de conhecimento da língua mirandesa no domínio da sintaxe.[1]

Outra falha da máquina como dicionário mecânico é ser totalmente incapaz em resolução de ambiguidades. Por exemplo, "Nós comemos", deverá ser transformada em "Nós comemos" ou "Nós comimos"? Não é claro. Mas quanto a "Ontem comemos"? Em "Onte comimos", obviamente. À máquina não lhe parece assim tão óbvio.

Consequências do uso indiscriminado da máquina[eiditar código-fuonte]

Se tudo quanto saia da máquina permanece sintaticamente português, como semânticamente também, resulta que, o que quer que saia desta máquina, ou é mirandês profundamente mal escrito - ferido nos seus corações sintáticos e semânticos - ou é português disfarçado de mirandês - português que, fora a excêntrica ortografia, segue sendo português, bom português, supõe-se. Uma coisa que, no fim, não é nem deixa de ser, para ser uma coisa que nunca se quis que fosse. Uma possível consequência da leitura duma Wikipédia assim escrita é a repulsa por parte dos falantes nativos do mirandês: eles não identificam esta linguagem com a sua língua. Uma outra consequência, mais preocupante, é a de aceitação, caso em que a leitura de conteúdo assim escrito induzirá nos falantes de mirandês assimilação da sintaxe e da semântica do português - língua dominante -, contribuindo para a morte desta língua menor e em perigo.

Outra falha desta máquina é ela ser vocabularmente permissiva. Tudo quanto entre nela sairá mais ou menos transformado, mas sempre aceite. Assim, a máquina transformará entre em antre, mas também entredilacerar-se em antredilacerar-se. É duvidoso que o vocábulo antredilacerar-se exista em mirandês. É duvidoso que exista mesmo em mirandês um vocábulo equivalente ao português "entredilacerar-se".

As instruções avisam que o mirandês foi uma língua rural e que, durante séculos, só se transmitiu pela via oral, não possui determinados vocábulos mais sofisticados comuns entre nós. E segue-se uma curta lista de vocábulos que não existem em mirandês. Mas eles não são todos. Esta é uma grande falha do mirandês para que nele se escreva uma enciclopédia: o mirandês não é uma língua de expressão universal. Há mesmo muita coisa que não se consegue dizer em mirandês, o seu léxico é muito pobre, a literatura quase inexistente.

as línguas asturo-leonesas, e também o mirandês, ficaram excluídas dos grandes movimentos culturais dos séculos XV-XVI, como o humanismo e o renascimento, que permitiram o enorme salto dado pelas línguas do poder, ditas nacionais.[1]

Tornar o mirandês uma língua de expressão universal, fazê-lo reviver na verdade, é uma obra de engenharia linguística que necessita de profissionais de linguística para ser levada a cabo. Foi assim com o hebraico moderno.

Tomemos, por exemplo, o dilema: Miranda vive isolada do mar. No mirandês o léxico ligado ao mar é quase inexistente. Por outro lado as Astúrias estão muito viradas para o mar. Haverá maior senso em criar novos vocábulos mirandeses ligados ao mar provindos do asturiano ou do português?

A máquina de Cecílio transforma qualquer texto válido em português num texto que, a ser considerado válido em mirandês, estará cheio de vocábulos que nunca antes foram usados pelos falantes da língua mirandesa. Vocábulos esses que provêm direitamente do português, sem maior cuidado que toucá-los morfologicamente de forma a parecerem mirandeses, por abstrusos que aos mirandeses possam parecer.

Talvez seja possível traduzir enunciados sofisticados de português para mirandês, apesar da pobreza lexical desta. Talvez fazendo uso de frases longas e explicativas no lugar de vocábulos singulares. Mas a máquina de Cecílio não é dessas.

Do ponto de vista vocabular, o uso massivo da máquina de Cecílio fez da Biquipédia, como um todo, um caso de pesquisa inédita na área da linguística.

A máquina acessível em WWW[eiditar código-fuonte]

A máquina de Cecílio de que até aqui se falou é a máquina teórica, a que está em fonte.

E a máquina em https://student.dei.uc.pt/~crpires/tradutor/Tradutor.html? Exatamente a mesma não é, o que se pode confirmar inserindo nela a palavra "Cecílio". Bom, fora esse pormenor, será a mesma?

Pergunte-se de outra maneira: e se for diferente? Se for diferente, poderá ser melhor? Pode executar-se um número muito grande de experiências e verificar que, fora o caso de "caspa do cabelo" e outros poucos mais, a regra (A B)' = A' B' vale para esta máquina também. Mas os números muito grandes são sempre penosos. Pode-se restringir o número de experiências a certos casos em que a máquina, a ser transformante capaz, deveria violar (A B)' = A' B', mas não o faz.

Por exemplo, em português dá-se amiúde a mesóclise do pronome pessoal: "fá-lo-ia", "sabê-lo-á". Este fenómeno não existe em mirandês. No entanto as transformadas pela máquina são "fá-lo-iba" e "sabé-lo-ei", enquanto que as transformadas corretas deveriam ser "fazerie-lo" e "saberá-lo".

Além da incapacidade de transformação sintática, a máquina prática transforma também qualquer vocábulo português em qualquer abstrusidade pseudomirandesa. Exemplos: pernóstico, peripatético, etc. etc.

Conclusão[eiditar código-fuonte]

O que quer que a máquina de Cecílio gere, não deve ser considerado algo em língua mirandesa nem sintaticamente, nem semanticamente e, eventualmente, carregado de um léxico estranho ao mirandês.

A máquina poderá auxiliar um tradutor humano fluente tanto em português como em mirandês, substitui-lo nunca, enquanto o resultado que se pretender obter for um texto escrito em mirandês.

É de notar o comentário do próprio Cecílio sobre a sua máquina:

La traduçon outomática siempre ten erros i falta-le la sensiblidade houmana. (A tradução automática tem sempre erros e falta-lhe a sensibilidade humana.)[2][3]

É um nativo de mirandês que o diz. Curioso que aos lusófonos que tanto adicionaram a mwl.wikipedia não lhes haja impressionado a falta de sensibilidade humana do conteúdo por si adicionado. Natural, quando se lê algo que, apesar da estranha aparência, está, no fim de contas, escrito na própria língua que tão bem se conhece.

Refréncias