A aplicación da informática á lingua permite crear ferramentas revolucionarias para mellorar o coñecemento do galego

Ordenadores de letras

A novas tecnoloxías están a chegar nos últimos anos ao noso idioma. O traballo desenvolvido desde diferentes institucións está a achegar toda unha serie de ferramentas informáticas que prometen revolucionar o traballo dos investigadores e facilitar en boa medida o emprego dos falantes ao longo dos vindeiros anos. Desde coñecer cal é o galego máis empregado ata as múltiples variantes históricas dunha palabra ou as diferentes

Hai xa tempo que a edición de dicionarios en formato CD-Rom no noso idioma é unha realidade. No entanto, estas propostas non son máis do que unha pequena parte das posibilidades que achega a informática á lingua. Xa só en falando de dicionarios, a rede ten unha boa oferta. Desde o da Real Academia, dispoñible no web da Xunta, ata o E-Estravís, para quen opta polo reintegracionismo, ou o Galizionario, que se desenvolve colectivamente no marcho do proxecto Wiktionary. Alén diso, existe un bo número de iniciativas destinadas a campos concretos, como é o dicionario de Pedagoxía (na Xunta), o dicionario técnico inglés-galego que desenvolve o Proxecto Trasno ou o da vestimenta tradicional que puxo na rede Manuel Souto como iniciativa persoal. Entre estes últimos, un dos máis recentes proxectos que se deu a coñecer foi o Dicionario Visual da Construción, un proxecto xa dispoñíbel na páxina do Colexio de Arquitectos.

A construción á vista
"O proxecto é unha iniciativa de Xosé González, secretario da delegación do Colexio de Arquitectos en Lugo", explica Antón Gómez Méixome, filólogo responsable de boa parte do traballo do Dicionario Visual da Construción. A idea inicial era adaptar para o galego unha obra catalá das mesmas características, con imaxes que amosan os diferentes elementos da construción. "Comezamos no ano 2000, e partimos de que cumpría informatizar todo o proxecto para flexibilizar a recuperación da información", explica Méixome. A adaptación tiña moitos problemas, e ao final introducíronse poucos termos galegos, unicamente aqueles que se derivaban das fichas incluídas na obra inicial. "Pareceunos que tomar coma base a obra catalá era moi boa, e fixemos o mínimo de fichas posibles. Rematámolo o pasado mes de novembro", explica o organizador do proxecto. "Somos conscientes de que quedou fóra moito léxico da construción tradicional galega de casas rurais, encoros e muíños, mais non podían entrar e tamén quixemos facer un dicionario moderno", apunta. De calquera xeito, o proxecto non se dá aínda por acabado. "Queremos amplialo coa incorporación doutras linguas coma o portugués, e pensamos incorporar tamén termos que non están". Para isto o equipo que desenvolve o proxecto ten claro que deben partir dunha base totalmente autónoma e deixar de empregar a guía do dicionario catalán. "Pensamos en reformular a idea e substituír as ilustracións por fotografías, que son máis axeitadas para o soporte informático".

Dicionarios para todos
De cara ao público xeral un dos proxectos que pode resultar máis interesante é o "Dicionario de Dicionarios", un CD ROM que permite desde o ano 2000 consultar simultaneamente a práctica totalidade de publicacións deste tipo sobre a nosa lingua publicadas entre 1863 e 1962. Un total de once dicionarios entre os que se inclúen vocabularios ata o de agora inéditos, como o realizado por Marcial Valladares ou Leiras Pulpeiro, que suman en conxunto ata 120.000 verbetes diferentes. O proxecto foi dirixido por Antón Santamarina desde o Instituto da Lingua Galega (ILG). "O 'Dicionario de dicionarios' é unha colleita en formato electrónico de todos os dicionarios que están fóra de circulación, que coinciden practicamente con todos os históricos realizados desde 1863". Entre as súas utilidades, permite ver os textos lexicográficos tal e como foron escritos. "Nos dicionarios modernos hai reescrituras de textos antigos, e nestas transmisións hai moitas alteracións, desaparecen moitas cousas, e deste xeito pódese ver a débeda duns con outros, por exemplo as citas das que se recollen as palabras", explica o director do proxecto. "En conxunto hai uns 130.000 lemas distintos acumulados, o que xa é un dicionario". Formas dialectais, vulgarismos, arcaísmos e formas que non recollen moitas obras de consulta actuais poden consultarse pola primeira vez de xeito electrónico.

Tesouros no computador
Outro proxecto que se elabora desde o ILG éo TILG (Tesouro Informatizado da Lingua galega), unha utilidade que ten a súa orixe no traballo para facer un dicionario que empezou hai xa dezasete anos o propio Antón Santamarina. "A maior parte dos dicionarios de galego fíxoos cada autor a partir da recollida de vocabulario da súa parroquia e logo o material foise transmitindo duns a outros, non se chegou a facer un dicionario de autoridades. A miña intención era facer un glosario electrónico para preparar un dicionario galego moderno", explica o coordinador do proxecto. Deste xeito, o proxecto recolle unha selección de textos literarios galegos desde 1612 (desde literatura oral a poesía), cun total de doce millóns de palabras. "Cando apareceron as ferramentas axeitadas para pór iso a disposición do público, púxeno", explica. O proxecto continúa aberto, incorporando novos textos, e a intención final continúa a ser elaborar un dicionario no que cada palabra vaia acompañada de citas literarias nas que se poida ver o seu emprego e contexto máis habitual.

Corpus de referencia
Un dos colectivos profesionais que máis está a expresar as posibilidades que achegan á lingua as novas tecnoloxías é o dos propios filólogos. Alén da aceleración de traballo que achega a informática á hora de facer dicionarios, por exemplo, Internet está a pór ao alcance de calquera investigador unhas posibilidades de consulta inéditas ata o momento. Unha ferramenta semellante ao TILG é o CORGA (Corpus de Referencia do Galego Actual), que desenvolveu o Centro de Investigación en Humanidades Ramón Piñeiro. "Os lingüistas chaman corpus a un conxunto de textos en formato electrónico, producidos en condicións naturais e escollidos coa intención de que sexan representativos dun determinado estado da lingua", explica o texto de presentación do proxecto. Este material permite estudar o comportamento de diferentes elementos lingüísticos e coñecer o emprego efectivo das diferentes formas do galego. "No uso de calquera lingua unhas poucas formas representan unha alta porcentaxe dos textos. Pola banda contraria hai formas que aparecen con secuencias medias da orde dunha vez por millóns ou unha vez por dez millóns", continúa a presentación do CORGA. Para contemplar tamén estas formas minoritarias, o proxecto recolle grandes cantidades de texto, publicado desde o ano 1975, incluíndo desde obras literarias ata artigos xornalísticos. Agora mesmo existen dúas versións desta aplicación, unha primeira que recolle dezasete millóns e medio de formas e outra organizada co estándar XML que ten polo de agora sete millóns que se poden consultar por separado ou en diferentes secuencias, permitindo o programa facer tamén buscas localizadas por datas ou por tipos de textos.

Filólogos e informáticos
Méixome recoñece que a existencia de filólogos con coñecementos de informática "é bastante excepcional" e recoñece que o seu é un caso de formación autodidacta. "O traballo con terminoloxía exixe cada vez máis coñecemento de ferramentas informáticas, o soporte electrónico non é só traballar en Word", sinala este estudoso do idioma. "Debemos pór a lingua a disposición do mundo enteiro e para iso está a rede", insiste, e apunta que acha de menos un maior apoio a este tipo de proxectos. "Falta formación tanto pola banda dos filólogos coma pola dos informáticos, non temos aplicacións coma os dicionarios que existen para outras linguas". Recoñece no entanto a importancia de proxectos coma o CORGA que "permite establecer unha medida moi boa emprego real do galego", o TILG ou o "Dicionario de dicionarios" mais apunta que "hai que ir a máis, todas as aplicacións e tipo dicionario teñen que se converter en aplicacións de axuda para o escritor. E se queremos ter ferramentas modernas, debemos optar claramente polo software libre", sentenza. Nun sentido semellante se manifesta Antón Santamarina. "O que sabe filoloxía ás veces non sabe de informática, eu andei un pouco ás cegas traballando con informáticos", recoñece, e sinala as limitacións que, a pesar do esforzo realizado, continúan a ter ferramentas coma os tradutores automáticos. De calquera xeito, recoñece que a aplicación da informática á lingua "é unha revolución total. No Renacemento a imprenta permitiu facer os primeiros dicionarios, agora non só se poden facer senón que melloran moitísimo e permiten consultas instantáneas, eu practicamente xa non emprego dicionarios de papel".

Máis e máis
As cousas non acaban, nin moito menos, aquí. O É-Galego permite aprender o noso idioma en liña. O 2.Mil corrixe automaticamente documentos escritos en Word e o Concordia adapta a través da rede calquera texto á reforma normativa de 2003. Vocabularios especializados en formato PDF, un dicionario de fraseoloxía, un programa para crear aplicacións educativas... As posibilidades son moitas. Entre os proxectos que veremos en breve está o un tradutor entre as linguas cooficiais do estado, no que traballan a empresa Imaxin, a Universidade de Vigo e diferentes empresas e institucións de fóra do país. Precisamente Imaxin revelouse nos últimos anos coma os auténticos pioneiros en Galicia á hora de elaborar ferramentas informáticas aplicadas á lingua e participou en boa parte dos proxectos que diferentes institucións realizaron neste campo. Un Corpus Técnico do Galego desenvolvido pola colaboración do Observatorio de Neoloxía da Universidade Vigo é outro dos vindeiros proxectos, que combinan coa creación un dicionario inglés-galego que se poderá ver a través do web. E é que os ordenadores cada vez se meten máis nas cousas de lingua.