A novas tecnoloxÃas están a chegar nos últimos anos ao noso idioma. O traballo desenvolvido desde diferentes institucións está a achegar toda unha serie de ferramentas informáticas que prometen revolucionar o traballo dos investigadores e facilitar en boa medida o emprego dos falantes ao longo dos vindeiros anos. Desde coñecer cal é o galego máis empregado ata as múltiples variantes históricas dunha palabra ou as diferentes
Hai xa tempo que a edición de dicionarios en formato CD-Rom no noso idioma é unha realidade. No entanto, estas propostas non son máis do que unha pequena parte das posibilidades que achega a informática á lingua. Xa só en falando de dicionarios, a rede ten unha boa oferta. Desde o da Real Academia, dispoñible no web da Xunta, ata o E-EstravÃs, para quen opta polo reintegracionismo, ou o Galizionario, que se desenvolve colectivamente no marcho do proxecto Wiktionary. Alén diso, existe un bo número de iniciativas destinadas a campos concretos, como é o dicionario de PedagoxÃa (na Xunta), o dicionario técnico inglés-galego que desenvolve o Proxecto Trasno ou o da vestimenta tradicional que puxo na rede Manuel Souto como iniciativa persoal. Entre estes últimos, un dos máis recentes proxectos que se deu a coñecer foi o Dicionario Visual da Construción, un proxecto xa dispoñÃbel na páxina do Colexio de Arquitectos.
A construción á vista
"O proxecto é unha iniciativa de Xosé González, secretario da delegación do Colexio de Arquitectos en Lugo", explica Antón Gómez Méixome, filólogo responsable de boa parte do traballo do Dicionario Visual da Construción. A idea inicial era adaptar para o galego unha obra catalá das mesmas caracterÃsticas, con imaxes que amosan os diferentes elementos da construción. "Comezamos no ano 2000, e partimos de que cumprÃa informatizar todo o proxecto para flexibilizar a recuperación da información", explica Méixome. A adaptación tiña moitos problemas, e ao final introducÃronse poucos termos galegos, unicamente aqueles que se derivaban das fichas incluÃdas na obra inicial. "Pareceunos que tomar coma base a obra catalá era moi boa, e fixemos o mÃnimo de fichas posibles. Rematámolo o pasado mes de novembro", explica o organizador do proxecto. "Somos conscientes de que quedou fóra moito léxico da construción tradicional galega de casas rurais, encoros e muÃños, mais non podÃan entrar e tamén quixemos facer un dicionario moderno", apunta. De calquera xeito, o proxecto non se dá aÃnda por acabado. "Queremos amplialo coa incorporación doutras linguas coma o portugués, e pensamos incorporar tamén termos que non están". Para isto o equipo que desenvolve o proxecto ten claro que deben partir dunha base totalmente autónoma e deixar de empregar a guÃa do dicionario catalán. "Pensamos en reformular a idea e substituÃr as ilustracións por fotografÃas, que son máis axeitadas para o soporte informático".
Dicionarios para todos
De cara ao público xeral un dos proxectos que pode resultar máis interesante é o "Dicionario de Dicionarios", un CD ROM que permite desde o ano 2000 consultar simultaneamente a práctica totalidade de publicacións deste tipo sobre a nosa lingua publicadas entre 1863 e 1962. Un total de once dicionarios entre os que se inclúen vocabularios ata o de agora inéditos, como o realizado por Marcial Valladares ou Leiras Pulpeiro, que suman en conxunto ata 120.000 verbetes diferentes. O proxecto foi dirixido por Antón Santamarina desde o Instituto da Lingua Galega (ILG). "O 'Dicionario de dicionarios' é unha colleita en formato electrónico de todos os dicionarios que están fóra de circulación, que coinciden practicamente con todos os históricos realizados desde 1863". Entre as súas utilidades, permite ver os textos lexicográficos tal e como foron escritos. "Nos dicionarios modernos hai reescrituras de textos antigos, e nestas transmisións hai moitas alteracións, desaparecen moitas cousas, e deste xeito pódese ver a débeda duns con outros, por exemplo as citas das que se recollen as palabras", explica o director do proxecto. "En conxunto hai uns 130.000 lemas distintos acumulados, o que xa é un dicionario". Formas dialectais, vulgarismos, arcaÃsmos e formas que non recollen moitas obras de consulta actuais poden consultarse pola primeira vez de xeito electrónico.
Tesouros no computador
Outro proxecto que se elabora desde o ILG éo TILG (Tesouro Informatizado da Lingua galega), unha utilidade que ten a súa orixe no traballo para facer un dicionario que empezou hai xa dezasete anos o propio Antón Santamarina. "A maior parte dos dicionarios de galego fÃxoos cada autor a partir da recollida de vocabulario da súa parroquia e logo o material foise transmitindo duns a outros, non se chegou a facer un dicionario de autoridades. A miña intención era facer un glosario electrónico para preparar un dicionario galego moderno", explica o coordinador do proxecto. Deste xeito, o proxecto recolle unha selección de textos literarios galegos desde 1612 (desde literatura oral a poesÃa), cun total de doce millóns de palabras. "Cando apareceron as ferramentas axeitadas para pór iso a disposición do público, púxeno", explica. O proxecto continúa aberto, incorporando novos textos, e a intención final continúa a ser elaborar un dicionario no que cada palabra vaia acompañada de citas literarias nas que se poida ver o seu emprego e contexto máis habitual.
Corpus de referencia
Un dos colectivos profesionais que máis está a expresar as posibilidades que achegan á lingua as novas tecnoloxÃas é o dos propios filólogos. Alén da aceleración de traballo que achega a informática á hora de facer dicionarios, por exemplo, Internet está a pór ao alcance de calquera investigador unhas posibilidades de consulta inéditas ata o momento. Unha ferramenta semellante ao TILG é o CORGA (Corpus de Referencia do Galego Actual), que desenvolveu o Centro de Investigación en Humanidades Ramón Piñeiro. "Os lingüistas chaman corpus a un conxunto de textos en formato electrónico, producidos en condicións naturais e escollidos coa intención de que sexan representativos dun determinado estado da lingua", explica o texto de presentación do proxecto. Este material permite estudar o comportamento de diferentes elementos lingüÃsticos e coñecer o emprego efectivo das diferentes formas do galego. "No uso de calquera lingua unhas poucas formas representan unha alta porcentaxe dos textos. Pola banda contraria hai formas que aparecen con secuencias medias da orde dunha vez por millóns ou unha vez por dez millóns", continúa a presentación do CORGA. Para contemplar tamén estas formas minoritarias, o proxecto recolle grandes cantidades de texto, publicado desde o ano 1975, incluÃndo desde obras literarias ata artigos xornalÃsticos. Agora mesmo existen dúas versións desta aplicación, unha primeira que recolle dezasete millóns e medio de formas e outra organizada co estándar XML que ten polo de agora sete millóns que se poden consultar por separado ou en diferentes secuencias, permitindo o programa facer tamén buscas localizadas por datas ou por tipos de textos.
Filólogos e informáticos
Méixome recoñece que a existencia de filólogos con coñecementos de informática "é bastante excepcional" e recoñece que o seu é un caso de formación autodidacta. "O traballo con terminoloxÃa exixe cada vez máis coñecemento de ferramentas informáticas, o soporte electrónico non é só traballar en Word", sinala este estudoso do idioma. "Debemos pór a lingua a disposición do mundo enteiro e para iso está a rede", insiste, e apunta que acha de menos un maior apoio a este tipo de proxectos. "Falta formación tanto pola banda dos filólogos coma pola dos informáticos, non temos aplicacións coma os dicionarios que existen para outras linguas". Recoñece no entanto a importancia de proxectos coma o CORGA que "permite establecer unha medida moi boa emprego real do galego", o TILG ou o "Dicionario de dicionarios" mais apunta que "hai que ir a máis, todas as aplicacións e tipo dicionario teñen que se converter en aplicacións de axuda para o escritor. E se queremos ter ferramentas modernas, debemos optar claramente polo software libre", sentenza. Nun sentido semellante se manifesta Antón Santamarina. "O que sabe filoloxÃa ás veces non sabe de informática, eu andei un pouco ás cegas traballando con informáticos", recoñece, e sinala as limitacións que, a pesar do esforzo realizado, continúan a ter ferramentas coma os tradutores automáticos. De calquera xeito, recoñece que a aplicación da informática á lingua "é unha revolución total. No Renacemento a imprenta permitiu facer os primeiros dicionarios, agora non só se poden facer senón que melloran moitÃsimo e permiten consultas instantáneas, eu practicamente xa non emprego dicionarios de papel".
Máis e máis
As cousas non acaban, nin moito menos, aquÃ. O É-Galego permite aprender o noso idioma en liña. O 2.Mil corrixe automaticamente documentos escritos en Word e o Concordia adapta a través da rede calquera texto á reforma normativa de 2003. Vocabularios especializados en formato PDF, un dicionario de fraseoloxÃa, un programa para crear aplicacións educativas... As posibilidades son moitas. Entre os proxectos que veremos en breve está o un tradutor entre as linguas cooficiais do estado, no que traballan a empresa Imaxin, a Universidade de Vigo e diferentes empresas e institucións de fóra do paÃs. Precisamente Imaxin revelouse nos últimos anos coma os auténticos pioneiros en Galicia á hora de elaborar ferramentas informáticas aplicadas á lingua e participou en boa parte dos proxectos que diferentes institucións realizaron neste campo. Un Corpus Técnico do Galego desenvolvido pola colaboración do Observatorio de NeoloxÃa da Universidade Vigo é outro dos vindeiros proxectos, que combinan coa creación un dicionario inglés-galego que se poderá ver a través do web. E é que os ordenadores cada vez se meten máis nas cousas de lingua.
Hai xa tempo que a edición de dicionarios en formato CD-Rom no noso idioma é unha realidade. No entanto, estas propostas non son máis do que unha pequena parte das posibilidades que achega a informática á lingua. Xa só en falando de dicionarios, a rede ten unha boa oferta. Desde o da Real Academia, dispoñible no web da Xunta, ata o E-EstravÃs, para quen opta polo reintegracionismo, ou o Galizionario, que se desenvolve colectivamente no marcho do proxecto Wiktionary. Alén diso, existe un bo número de iniciativas destinadas a campos concretos, como é o dicionario de PedagoxÃa (na Xunta), o dicionario técnico inglés-galego que desenvolve o Proxecto Trasno ou o da vestimenta tradicional que puxo na rede Manuel Souto como iniciativa persoal. Entre estes últimos, un dos máis recentes proxectos que se deu a coñecer foi o Dicionario Visual da Construción, un proxecto xa dispoñÃbel na páxina do Colexio de Arquitectos.
A construción á vista
"O proxecto é unha iniciativa de Xosé González, secretario da delegación do Colexio de Arquitectos en Lugo", explica Antón Gómez Méixome, filólogo responsable de boa parte do traballo do Dicionario Visual da Construción. A idea inicial era adaptar para o galego unha obra catalá das mesmas caracterÃsticas, con imaxes que amosan os diferentes elementos da construción. "Comezamos no ano 2000, e partimos de que cumprÃa informatizar todo o proxecto para flexibilizar a recuperación da información", explica Méixome. A adaptación tiña moitos problemas, e ao final introducÃronse poucos termos galegos, unicamente aqueles que se derivaban das fichas incluÃdas na obra inicial. "Pareceunos que tomar coma base a obra catalá era moi boa, e fixemos o mÃnimo de fichas posibles. Rematámolo o pasado mes de novembro", explica o organizador do proxecto. "Somos conscientes de que quedou fóra moito léxico da construción tradicional galega de casas rurais, encoros e muÃños, mais non podÃan entrar e tamén quixemos facer un dicionario moderno", apunta. De calquera xeito, o proxecto non se dá aÃnda por acabado. "Queremos amplialo coa incorporación doutras linguas coma o portugués, e pensamos incorporar tamén termos que non están". Para isto o equipo que desenvolve o proxecto ten claro que deben partir dunha base totalmente autónoma e deixar de empregar a guÃa do dicionario catalán. "Pensamos en reformular a idea e substituÃr as ilustracións por fotografÃas, que son máis axeitadas para o soporte informático".
Dicionarios para todos
De cara ao público xeral un dos proxectos que pode resultar máis interesante é o "Dicionario de Dicionarios", un CD ROM que permite desde o ano 2000 consultar simultaneamente a práctica totalidade de publicacións deste tipo sobre a nosa lingua publicadas entre 1863 e 1962. Un total de once dicionarios entre os que se inclúen vocabularios ata o de agora inéditos, como o realizado por Marcial Valladares ou Leiras Pulpeiro, que suman en conxunto ata 120.000 verbetes diferentes. O proxecto foi dirixido por Antón Santamarina desde o Instituto da Lingua Galega (ILG). "O 'Dicionario de dicionarios' é unha colleita en formato electrónico de todos os dicionarios que están fóra de circulación, que coinciden practicamente con todos os históricos realizados desde 1863". Entre as súas utilidades, permite ver os textos lexicográficos tal e como foron escritos. "Nos dicionarios modernos hai reescrituras de textos antigos, e nestas transmisións hai moitas alteracións, desaparecen moitas cousas, e deste xeito pódese ver a débeda duns con outros, por exemplo as citas das que se recollen as palabras", explica o director do proxecto. "En conxunto hai uns 130.000 lemas distintos acumulados, o que xa é un dicionario". Formas dialectais, vulgarismos, arcaÃsmos e formas que non recollen moitas obras de consulta actuais poden consultarse pola primeira vez de xeito electrónico.
Tesouros no computador
Outro proxecto que se elabora desde o ILG éo TILG (Tesouro Informatizado da Lingua galega), unha utilidade que ten a súa orixe no traballo para facer un dicionario que empezou hai xa dezasete anos o propio Antón Santamarina. "A maior parte dos dicionarios de galego fÃxoos cada autor a partir da recollida de vocabulario da súa parroquia e logo o material foise transmitindo duns a outros, non se chegou a facer un dicionario de autoridades. A miña intención era facer un glosario electrónico para preparar un dicionario galego moderno", explica o coordinador do proxecto. Deste xeito, o proxecto recolle unha selección de textos literarios galegos desde 1612 (desde literatura oral a poesÃa), cun total de doce millóns de palabras. "Cando apareceron as ferramentas axeitadas para pór iso a disposición do público, púxeno", explica. O proxecto continúa aberto, incorporando novos textos, e a intención final continúa a ser elaborar un dicionario no que cada palabra vaia acompañada de citas literarias nas que se poida ver o seu emprego e contexto máis habitual.
Corpus de referencia
Un dos colectivos profesionais que máis está a expresar as posibilidades que achegan á lingua as novas tecnoloxÃas é o dos propios filólogos. Alén da aceleración de traballo que achega a informática á hora de facer dicionarios, por exemplo, Internet está a pór ao alcance de calquera investigador unhas posibilidades de consulta inéditas ata o momento. Unha ferramenta semellante ao TILG é o CORGA (Corpus de Referencia do Galego Actual), que desenvolveu o Centro de Investigación en Humanidades Ramón Piñeiro. "Os lingüistas chaman corpus a un conxunto de textos en formato electrónico, producidos en condicións naturais e escollidos coa intención de que sexan representativos dun determinado estado da lingua", explica o texto de presentación do proxecto. Este material permite estudar o comportamento de diferentes elementos lingüÃsticos e coñecer o emprego efectivo das diferentes formas do galego. "No uso de calquera lingua unhas poucas formas representan unha alta porcentaxe dos textos. Pola banda contraria hai formas que aparecen con secuencias medias da orde dunha vez por millóns ou unha vez por dez millóns", continúa a presentación do CORGA. Para contemplar tamén estas formas minoritarias, o proxecto recolle grandes cantidades de texto, publicado desde o ano 1975, incluÃndo desde obras literarias ata artigos xornalÃsticos. Agora mesmo existen dúas versións desta aplicación, unha primeira que recolle dezasete millóns e medio de formas e outra organizada co estándar XML que ten polo de agora sete millóns que se poden consultar por separado ou en diferentes secuencias, permitindo o programa facer tamén buscas localizadas por datas ou por tipos de textos.
Filólogos e informáticos
Méixome recoñece que a existencia de filólogos con coñecementos de informática "é bastante excepcional" e recoñece que o seu é un caso de formación autodidacta. "O traballo con terminoloxÃa exixe cada vez máis coñecemento de ferramentas informáticas, o soporte electrónico non é só traballar en Word", sinala este estudoso do idioma. "Debemos pór a lingua a disposición do mundo enteiro e para iso está a rede", insiste, e apunta que acha de menos un maior apoio a este tipo de proxectos. "Falta formación tanto pola banda dos filólogos coma pola dos informáticos, non temos aplicacións coma os dicionarios que existen para outras linguas". Recoñece no entanto a importancia de proxectos coma o CORGA que "permite establecer unha medida moi boa emprego real do galego", o TILG ou o "Dicionario de dicionarios" mais apunta que "hai que ir a máis, todas as aplicacións e tipo dicionario teñen que se converter en aplicacións de axuda para o escritor. E se queremos ter ferramentas modernas, debemos optar claramente polo software libre", sentenza. Nun sentido semellante se manifesta Antón Santamarina. "O que sabe filoloxÃa ás veces non sabe de informática, eu andei un pouco ás cegas traballando con informáticos", recoñece, e sinala as limitacións que, a pesar do esforzo realizado, continúan a ter ferramentas coma os tradutores automáticos. De calquera xeito, recoñece que a aplicación da informática á lingua "é unha revolución total. No Renacemento a imprenta permitiu facer os primeiros dicionarios, agora non só se poden facer senón que melloran moitÃsimo e permiten consultas instantáneas, eu practicamente xa non emprego dicionarios de papel".
Máis e máis
As cousas non acaban, nin moito menos, aquÃ. O É-Galego permite aprender o noso idioma en liña. O 2.Mil corrixe automaticamente documentos escritos en Word e o Concordia adapta a través da rede calquera texto á reforma normativa de 2003. Vocabularios especializados en formato PDF, un dicionario de fraseoloxÃa, un programa para crear aplicacións educativas... As posibilidades son moitas. Entre os proxectos que veremos en breve está o un tradutor entre as linguas cooficiais do estado, no que traballan a empresa Imaxin, a Universidade de Vigo e diferentes empresas e institucións de fóra do paÃs. Precisamente Imaxin revelouse nos últimos anos coma os auténticos pioneiros en Galicia á hora de elaborar ferramentas informáticas aplicadas á lingua e participou en boa parte dos proxectos que diferentes institucións realizaron neste campo. Un Corpus Técnico do Galego desenvolvido pola colaboración do Observatorio de NeoloxÃa da Universidade Vigo é outro dos vindeiros proxectos, que combinan coa creación un dicionario inglés-galego que se poderá ver a través do web. E é que os ordenadores cada vez se meten máis nas cousas de lingua.