Gramática libre de cuntesto

Ourige: Biquipédia, la anciclopédia lhibre.
Saltar para a navegação Saltar para a pesquisa

An Lenguaige formal, ua gramática libre-de l-cuntesto (GLC) ye ua gramática formal an que cada regra de porduçon ye de la forma

Bw

adonde B ye un único simblo nó-treminal(Bariábel), i w ye ua cadeia de treminales i/ó bariables (w puode ser la cadeia bazie).

Las lenguaiges geradas por gramáticas libres-de l-cuntesto son coincidas cumo Lenguaiges libres-de l-cuntesto.

Gramáticas libres-de l-cuntesto son amportantes an Lenguística para çcriçon de la strutura de sentenças i palabras an Léngua natural. An Ciéncia de la cumputaçon ye amportante para çcriçon de la strutura de Lenguaiges de porgramaçon i outras lenguaiges artificiales.

An Lenguística, alguns outores úsan l termo Gramática de strutura de frase para se referir la gramáticas libres-de l-cuntesto, cumo gramáticas de strutura de la frase son defrentes de gramáticas de dependéncia. An Ciéncia de la cumputaçon, la notaçon mais popular para gramática libre-de l-cuntesto ye la Forma de Backus-Naur(BNF).

Stória[eiditar | eiditar código-fuonte]

Zde l tiempo de Pāṇini, pul menos, lenguistas ten çcrito las gramáticas de las lenguaiges an tenermos de sues struturas de bloco, i çcrito cumo las sentenças son custruídas recursibamente a partir de frases menores, i eibentualmente a partir de palabras ó eilemientos de palabras andebiduales.

Ua propiadade eissencial dessas struturas de bloco ye qu'ounidades lógicas nunca se subreponen. Por eisemplo, la sentença:

João, cujo carro azul staba na garaige, caminou até la loija berde.
John, whose blue car was in the garage, walked to the gren store.

puode ser logicamente posta antre parenteses cumo se segue:

(João, ((cujo carro azul) (staba (na garaige)))), (caminou (até (la loija berde))).
(John, ((whose blue car) (was (in the garage)))), (walked (to (the gren store))).

Ua gramática libre-de l-cuntesto proporciona un macanismo matemático simples i perciso para çcriçon de ls métodos an qu'alguas lenguaiges naturales son custruídas a partir de blocos menores, caturando la "strutura de bloco" de las sentenças dua maneira natural. Sue simplicidade faç l formalismo passible dun rigoroso studo matemático. Amportantes caratelísticas de sintaxe de lenguaige natural cumo cuncordáncia nun fázen parte dua gramática libre-de l-cuntesto, mas la strutura recursiba básica de sentenças, la maneira pula qual cláusulas son amarradas an outras cláusulas, i l modo pul qual listas d'adjetibos i adbérbios son absorbidos por sustantibos i berbos, son çcritos percisamente.

L formalismo de las gramáticas libres-de l-cuntesto fui zambolbido ne ls meados de ls anhos 1950 por Noan Chomsky, i tamien sue classeficaçon cumo un tipo special de gramática formal (la qual el chamou de gramática de strutura de frase).[1]

Ne l modelo de la Gramática geratiba de Chomsky, la sintaxe de lenguaige natural era çcrita por un cunjunto de regras libres-de l-cuntesto cumbinadas cun regras de trasformaçon.

An trabalhos posteriores (i.g. Chomsky 1981), l'eideia de formulaçon dua gramática que cunsistisse de splícita rescrita de regras fui abandonada. An outros modelos geratibos (i.g. Generalized Phrase Struture Grammar (Gazdar eit al. 1985)), gramáticas libres-de l-cuntesto fúrun tomadas cumo l macanismo de to la sintaxe, eliminando las trasformaçones.

Struturas de bloco fúrun antroduzidas an lenguaiges de porgramaçon de cumputadores pul porjeto Algol (1957-1960), que cumo cunsequéncia, tamien cuntou cun ua gramática libre-de l-cuntesto para çcriçon de la sintaxe resultante Algol. Esto tornou-se ua caratelística padron de las lenguaiges de cumputadores, i la notaçon para gramáticas ousadas an çcriçones cuncretas de lenguaiges de cumputadores tornórun-se coincidas por Forma de Backus-Naur.

La caratelística de "strutura de bloco" que las gramáticas libres-de l-cuntesto caturórun ye tan fundamental para gramática que ls tenermos de sintaxe i gramática son frequentemente eidantificados cumo regras de las gramáticas libres-de l-cuntesto, specialmente an ciéncia de la cumputaçon. Restriçones formales nun caturadas pula gramática son, anton, cunsidradas partes de la "semántica" de la lenguaige.

Gramáticas libres-de l-cuntesto son simples l suficiente para permitir la custruçon d'eficientes algoritmos d'análeze, ls quales, para ua dada cadeia, detreminan se i cumo essa cadeia puode ser gerada pula gramática. L Algoritmo Earley ye un eisemplo dun algoritmo de l tipo, anquanto ls amplamentes ousados Analisador sintático LR i Analisador sintático LL son algoritmos mais simples que lidan cun subconjuntos mais restritibos de gramáticas libres-de l-cuntesto.

Defeniçones Formales[eiditar | eiditar código-fuonte]

Ua gramática libre-de l-cuntesto G ye defenida por ua 4-tupla:

adonde

1. ye un cunjunto fenito; cada eilemiento ye chamado simblo nó-treminal ó bariable. Cada bariable repersenta un tipo defrente de cláusula ó frase nua sentença. Las bezes, bariables tamien son chamadas de catadories sintáticas. Cada bariable define ua sub-lenguaige de la lenguaige defenida por .

2. ye un cunjunto fenito de treminales, çjunto de , l qual ourigina l rial cuntenido de la sentença. L cunjunto de treminales ye l'alfabeto de la lenguaige defenida pula gramática .

3. ye un relaçon fenita de para . Ls nembros de son chamados regras de sustituiçon ó porduçones de la gramática. (tamien, quemumente simbolizada por )

4. ye la bariable enicial (ó simblo enicial), ousado para repersentar to la sentença (ó porgrama). Debe ser un eilemiento pertencente la .

L'asterisco repersenta l'ouparaçon Fecho de Klene ó streilha.

Aplicaçon de regra[eiditar | eiditar código-fuonte]

Para qualquiera cadeia , dezimos que porduç , scrito cumo , se cun i tal que i . Por cunseguinte, ye l resultado de l'aplicaçon de la regra para .

Aplicaçon de regra repetitiba[eiditar | eiditar código-fuonte]

Para to an algums libros-testo), se tal que

Lenguaige Libre-de l-cuntesto[eiditar | eiditar código-fuonte]

La lenguaige de la gramática ye l cunjunto

Ua lenguaige ye dita ser ua lenguaige libre-de l-cuntesto (LLC), se eisiste ua GLC , tal que .

GLCs Apropiadas[eiditar | eiditar código-fuonte]

Ua gramática libre-de l-cuntesto ye dita ser apropiada, se

  • eilha nun ten simblos inalcançábeis:
  • eilha nun ten simblos amprodutibos:
  • eilha nun ten i-porduçones: i
  • eilha nun ten ciclos:

La gramática , cun porduçones

S → aSa,
S → bSb,
S → i,

ye libre-de l-cuntesto. Ua deribaçon típica nessa gramática ye S → aSa → aaSaa → aabSbaa → aabbaa. Esso torna claro que . La lenguaige ye libre-de l-cuntesto, antretanto, puode ser probado qu'eilha nun ye regular.

Eisemplos[eiditar | eiditar código-fuonte]

Parenteses bien formados[eiditar | eiditar código-fuonte]

L'eisemplo canónico dua gramática libre-de l-cuntesto ye la correspondéncia de parenteses, que repersenta l causo giral. Eesisten dous simblos treminales "(" i ")" i ua bariable S. Las regras de porduçon son

S → SS
S → (S)
S → ()

La purmeira regra permite S se multiplicar; la segunda regra permite que S seia anclusa antre parenteses; i la terceira regra finaliza la recurson.

Ampeçando cun S, i aplicando las regras, puode-se custruir:

S → SS → SSS → (S)SS → ((S))SS → ((SS))S(S)
→ ((()S))S(S) → ((()()))S(S) → ((()()))()(S)
→ ((()()))()(())

Parenteses i colchetes amarrados bien formados[eiditar | eiditar código-fuonte]

Un segundo eisemplo canónico ye, dous defrentes tipos de correspondéncia amarrada de parenteses, çcrito pulas porduçones:

S → SS
S → ()
S → (S)
S → []
S → [S]

cun simblos treminales [ ] ( ) i bariable S.

La seguinte sequéncia puode ser deribada a partir dessa gramática:

([ [ [ ()() [ ][ ] ] ]([ ]) ])

Antretanto, nun hai gramática libre-de l-cuntesto que puoda gerar todas las sequéncias de la correspondéncia de dous defrentes tipos de parenteses, cunsidrando qu'eilhes dében corresponder andependiente de l'eisisténcia de l'outro tipo de parentese, por eisemplo:

[ [ [ [(((( ] ] ] ]))))(([ ))(([ ))([ )( ])( ])( ])

Spressones Algébricas[eiditar | eiditar código-fuonte]

Eiqui esta ua gramática libre-de l-cuntesto para correçon sintática de spressones algébricas na forma anfixa, culas bariables x, y i ç:

  1. S ? x
  2. S ? y
  3. S ? ç
  4. S ? S + S
  5. S ? S - S
  6. S ? S * S
  7. S ? S / S
  8. S ? ( S )

Essa gramática puode, por eisemplo, gerar la cadeia

( x + y ) * x - ç * y / ( x + x )

cumo segue:

S (l simblo enicial)
→ S - S (pula regra 5)
→ S * S - S (pula regra 6, aplicado al S mais la squierda)
→ S * S - S / S (pula regra 7, aplicado al S mais la dreita)
→ ( S ) * S - S / S (pula regra 8, aplicado al S mais la squierda)
→ ( S ) * S - S / ( S ) (pula regra 8, aplicado al S mais la dreita)
→ ( S + S ) * S - S / ( S ) (etc.)
→ ( S + S ) * S - S * S / ( S )
→ ( S + S ) * S - S * S / ( S + S )
→ ( x + S ) * S - S * S / ( S + S )
→ ( x + y ) * S - S * S / ( S + S )
→ ( x + y ) * x - S * y / ( S + S )
→ ( x + y ) * x - S * y / ( x + S )
→ ( x + y ) * x - ç * y / ( x + S )
→ ( x + y ) * x - ç * y / ( x + x )

Note que, por baixo bárias scolhas fúrun feitas, scolhas que dízen qual será la regra que bai ser scrita. Essas scolhas parécen bien arbitrárias. Na rialidade, eilhas son, ne l sentido de que la cadeia gerada siempre ye la mesma. Por eisemplo, la segunda i terceira porduçones

→ S * S - S (pula regra 6, aplicada al S mais la squierda)
→ S * S - S / S (pula regra 7, aplicada al S mais la dreita)

poderie ser feita na orde cuntrária:

→ S - S / S (pula regra 7, aplicada al S mais la dreita)
→ S * S - S / S (pula regra 6, aplicada al S mais la squierda)

Eigualmente, muitas scolhas fúrun feitas arriba de qual regrar aplicar la cada S selecionado. Mudar las scolhas feitas i nun solo l'orde an qu'eilhas fúrun feitas giralmente afeta qual cadeia ye gerada al final.

Bamos mirar para esso mais detalhadamente. Cunsidre l Arble d'análeze sintática dessa deribaçon:

       S
       |
       /|\
      S - S
     /    \
     /|\   /|\
    S * S  S / S
   /   |  |   \
   /|\  x /|\  /|\
  ( S )  S * S ( S )
   /    |  |   \
  /|\    ç  y  /|\
 S + S        S + S
 |  |        |  |
 x  y        x  x

Ampeçando ne l topo, passo a passo, un S na arble ye spandido, até que nun eisista mais S's(bariables) la séren spandidas. Pegando ua defrente orde de spanson eirá porduzir ua deribaçon defrente, mas na mesma arble sintática. L'arble sintática eirá solo mudar se nós pegarmos ua defrente regra para aplicar an algua posiçon na arble.

Mas, puode ua arble sintática defrente porduzir la mesma cadeia, que ye ( x + y ) * x - ç * y / ( x + x ) nesse causo? Si, para esse causo an particular, esso ye possible. Gramáticas cun essa propiadade son chamadas ambígua.

Por eisemplo, x + y * ç puode ser porduzido cun essas dues arbles sintáticas defrentes:

      S          S
      |          |
     /|\         /|\
     S * S        S + S
    /    \      /    \
   /|\    ç     x    /|\
   x + y            y * ç

Antretanto, la lenguaige çcrita por essa gramática nun ye inerentemente ambígua: ua gramática altarnatiba nun ambígua puode ser dada pa la lenguaige, por eisemplo:

T → x
T → y
T → ç
S → S + T
S → S - T
S → S * T
S → S / T
T → ( S )
S → T

(mais ua beç, pegando S cumo simblo enicial).

Forma Normal[eiditar | eiditar código-fuonte]

To gramática libre-de l-cuntesto que nun gera ua cadeia bazie puode ser trasformada nua que nanhue regra ten la cadeia bazie cumo perduto [ua regra cun i cumo perduto ye chamada i-porduçon]. Se eilha nun gera la cadeia bazie, eilha eirá necessariamente ancluir la regra Falhou a verificação gramatical (função desconhecida: "\eipsilon"): {\displaystyle S \rarr \eipsilon} , mas nun hai necidade d'outra i-regra. To gramática libre-de l-cuntesto sin i-porduçon ten ua gramática eiquibalente na Forma Normal de Chomsky ó Forma Normal de Greibach. "Eiquibalente" eiqui senefica que dues gramáticas gírun la mesma lenguaige.

Por causa de la special simplicidade de las regras de porduçon de gramáticas na Forma Normal de Chomsky, essa forma normal ten amplicaçones teóricas i práticas. Por eisemplo, dada la gramática libre-de l-cuntesto, alguien puode ousar la Forma Normal de Chomky para custruir un algoritmo de tiempo polinomial que decida se la cadeia dada stá na lenguaige repersentada pula gramática (l Algoritmo CYK).

Porblemas Andecidíbeis[eiditar | eiditar código-fuonte]

Alguas questones que nun son decidibles por classes de gramáticas mais amplas se tornan decidibles cun gramáticas libres-de l-cuntesto; i.g. l teste de bacuidade dua gramática (saber se la gramática gera algua cadeia, qualquiera que seia eilha), ye andecidible para classe de Gramática sensibles al cuntesto, mas ye decidible para gramáticas libre-de l-cuntesto.

Inda assi, muitos porblemas permanecen andecidibles. Eisemplos:

Ounibersalidade[eiditar | eiditar código-fuonte]

Dado ua GLC, eilha gera la lenguaige que cuntén todas las possibles cadeias la séren geradas pul cunjunto de simblos treminales que son ousados an sues regras?

Eigualdade de lenguaige[eiditar | eiditar código-fuonte]

Dadas dues GLCs, eilhas gírun la mesma lenguaige?

Lenguaige anclusa[eiditar | eiditar código-fuonte]

Dadas dues GLCs, la purmeira gramática puode gerar todas las cadeias que la segunda gera?

Star nun nible mais baixo de l'hierarquia de Chomsky[eiditar | eiditar código-fuonte]

Dada ua Gramática sensible al cuntesto, eilha çcribe ua lenguaige libre-de l-cuntesto? Dada ua GLC, eilha çcribe ua lenguaige regular?

Cada un desses porblemas ye andecidible.

Stensones[eiditar | eiditar código-fuonte]

Ua maneira óbbia para stender l formalismo de gramática libre-de l-cuntesto ye permitir que bariables téngan argumientos, ls balores que son passados culas regras. Esso permite caratelísticas dua lenguaige natural, tales cumo cuncordáncia i refréncia, analogamente al correto uso d'eidantificadores an lenguaige de porgramaçon, que dében ser spressos de maneira natural. I.g. agora, nós podemos facilmente spressar qu'an sentenças an anglés, l sujeito i berbo dében cuncordar an númaro.

An Ciéncia de la cumputaçon, eisemplos dessa abordaige ancluen Gramática de Afixos, Gramática d'atributos, Gramática andexada, i Ban Wijngaarden [[Gramática de dous lebles].

Stensones similares eisisten an lenguística.

Outra stenson ye permitir que treminales adicionales apareçan ne l lado squerdo de las regras, restringindo sue aplicaçon. Esso porduç l formalismo de Gramática sensible al cuntesto.

Aplicaçones Lenguísticas[eiditar | eiditar código-fuonte]

Chomsky einicialmente speraba superar las lemitaçones de gramáticas libres-de l-cuntesto al adicionar regras de trasformaçon.[1]

Tales regras son outro çpositibo padron an lenguística tradecional; i.g. passibaçon de la boç, an pertués. Grande parte de la Gramática geratiba ten se dedicado a ancontrar maneiras d'aprimorar ls macanismos çcritibos de regras de strutura de frase gramatical i trasformaçon de tal forma puodan ser spressas satamente ls tipos de cousas que puoden ser spressos an lenguaige natural. Permitir trasformaçones arbitrárias nun faç cun qu'esse oubjetibo seia atingido. Eilhes son mui mais poderosos, sendo Turing cumpletos la nun ser que restriçones seneficantes séian adicionadas (i.g. nun permitir trasformaçones qu'antroduzan i anton rescreban simblos nua maneira libre-de l-cuntesto. Posiçon giral de Chomsky subre la nó-gratuidade cuntesto de la lenguaige natural ten se mantido zde anton Posiçon giral de Chomsky subre la nó-libardade de cuntesto de la lenguaige natural ten se mantido zde anton,[2] antretanto sous eisemplos specificos a respeito de la nun adequaçon de GLCs an tenermos dua fraca capacidade geratiba fúrun mais tarde zaprobadas.[3] Girald Gazdar i Geoffrey Pullun ten çcutido qu'anque alguas custruçones nó-libres-de-cuntesto an lenguaige natural (cumo cross-serial dependencies na Suíça Germánica[2] i reduplication an Bambara[4]), la grande maiorie de las formas an lenguaige natural son, de fato libres de cuntesto.[3]

Beija tamien[eiditar | eiditar código-fuonte]

Algoritmos[eiditar | eiditar código-fuonte]

Notas[eiditar | eiditar código-fuonte]

  1. 1,0 1,1 Chomsky, Noan (Sep 1956). «Thre models fur the çcrition of language» (PDF). Anformation Theory, IEEE Trasationes (3): 113–124. doi:10.1109/TIT.1956.1056813  Cunsulte data an: |data= (ajuda)
  2. 2,0 2,1 Shieber, Stuart (1985). «Eibidence against the cuntext-freness of natural language» (PDF). Lenguistics and Philosophy (3): 333–343. doi:10.1007/BF00630917 
  3. 3,0 3,1 Pullun, Geoffrey K.; Girald Gazdar (1982). «Natural languages and cuntext-fre languages». Lenguistics and Philosophy (4): 471–504. doi:10.1007/BF00360802 
  4. Culy, Christopher (1985). «The Cumplexity of the Bocabulary of Bambara». Lenguistics and Philosophy (3): 345–351. doi:10.1007/BF00630918 

Referencias[eiditar | eiditar código-fuonte]

  • Chomsky, Noan (Set. 1956). "Thre models fur the çcrition of language". Anformation Theory, IEEE Trasationes 2 (3).
  • Chomsky, Noan (1957), Syntatic Strutures, Den Haag: Mouton.
  • Chomsky, Noan (1965), Aspets of the Theory of Syntax, Cambridge (Mass.): MIT Press.
  • Chomsky, Noan (1981), Letures on Gobernment and Binding, Dordrecht: Foris.
  • Gazdar, Girald; Klein, Ewan; Pullun, Geoffrey & Sag, Iban (1985), Generalized Phrase Struture Grammar, Cambridge (Mass.): Harbard University Press.

Ler mais[eiditar | eiditar código-fuonte]

  • Antrodution to the Theory of Cumputation. [S.l.]: PWS Publishing. 1997. ISBN 0-534-94728-X  Setion 2.1: Cuntext-Fre Grammars, pp. 91–101. Setion 4.1.2: Decidable porblems cuncerning cuntext-fre languages, pp. 156–159. Setion 5.1.1: Redutiones bie cumputation stories: pp. 176–183.
Teoria de autômatos: linguagem formal e gramática formal
Hierarquia
Chomsky
Gramática Linguagem Reconhecedor
Tipo-0 Irrestrita Recursivamente enumerável Máquina de Turing
-- -- Recursiva Máquina de Turing que sempre para
Tipo-1 Sensível ao contexto Sensível ao contexto Autômato linearmente limitado
Tipo-2 Livre de contexto Livre de contexto Autômato com pilha
Tipo-3 Regular Regular Autômato finito