
Desarrollos y herramientas En esta sección se dará una breve descripción de los sistemas desarrollados por miembros del GIL, y que han servido como plataformas de investigación aplicada en los distintos proyectos en los que el GIL ha participado.
Agrupamientos semánticos El Generador de Agrupamientos Semánticos o Clustering es un conjunto de 6 algoritmos integrados en lo que denominamos algoritmo flexibilizado de alineamiento semántico, que permite obtener pares semánticos a partir de las definiciones incluidas en el banco terminológico. Axolotl Es un corpus paralelo español-náhuatl que recopila diversas fuentes con contenido paralelo en estas dos lenguas. http://www.corpus.unam.mx/axolotl Corpus Electrónico para el Estudio de la Lengua Escrita Ponemos a disposición de la comunidad interesada en los estudios de la adquisición de la lengua escrita una colección de 300 textos escritos por niños mexicanos. Los textos fueron recolectados cuando los alumnos iniciaban el segundo grado de educación básica (entre 7 y 8 años).
http://www.corpus.unam.mx/ceele
Corpus sobre trata de personas http://www.corpus.unam.mx/trata CEMC
Corpus del Español Mexicano Contemporáneo (1921-1974) El GIL tuvo la gran oportunidad de poner el línea uno de los más reconocidos y utilizados corpus de español mexicano. Este corpus fue producto del trabajo realizado en el proyecto del Diccionario del Español de México, de El Colegio de México A. C. Esperamos que el sitio del CEMC sea de gran utilidad para la comunidad científica interesada en el español de México. http://www.corpus.unam.mx:8080/cemc CHEM El Corpus Histórico del Español en México (CHEM) tiene el propósito de reunir un corpus diacrónico que dé cuenta de la conformación del dialecto mexicano a partir de los materiales que lingüistas, filólogos e historiadores han considerado clave para representar el español escrito en México entre los siglos XVI y XXI. http://www.corpus.unam.mx/chem COCIEM Modelo lingüístico integral del vocabulario básico de la ciencia en México fundado en el establecimiento de una serie de tipologías de sus componentes morfológicos, sintácticos y semánticos, su nivel de especialización y forma de difusión. http://www.corpus.unam.mx/cociem CORCODE Herramienta informática que permita la consulta de Contextos Definitorios de un corpus que reúna todas las definiciones que han surgido a través de los años de investigación en el GIL, para que cualquier usuario pueda tener acceso a ellas a través de internet. http://www.corpus.unam.mx/corcode/ CPLM
El Corpus Paralelo de Lenguas Mexicanas está formado por textos en español con sus respectivas traducciones en una o más lenguas de México.
CSMX El Corpus de las Sexualidades de México, está constituido por una amplia colección de documentos sobre el área de sexualidad, que van desde artículos especializados hasta obras literarias. Además de contar con herramientas que permiten explorar y analizar dichos documentos.. http://www.corpus.unam.mx/csmx DEBO Se elaboró el diseño general del diccionario y se realizó un sistema prototipo, denominado DEBO por sus siglas de Diccionario Electrónico de Búsqueda Onomasiológica DESCRIBE Extraer definiciones de internet a partir de texto libre en inglés. http://www.describe.com.mx/ ECODE Extraer Contextos Definitorios de textos de especialidad mediante patrones verbales. GECO El gestor de corpus es una aplicación web enfocada a la construcción colaborativa de corpus. Es un repositorio central de documentos que son automaticamente anotados con partes de la oración, con sus fuentes documentales para ser usado en nuestras diversas aplicaciones, a la vez que permite publicar un portal web de los corpus. http://www.corpus.unam.mx/geco Generador de palabras clave A partir de una definición alojada en el banco terminológico y utilizando un stop list, el Generador de Palabras Clave, entrega un conjunto de vocablos propuestos como palabras clave de la definición, es un generador semiautomático de palabras clave a partir de definiciones. Aplicaciones MBDAII Minería de Textos sobre el Sistema de Base de Datos Académica del Instituto de Ingeniería Aplicar las técnicas de Minería de Textos y procesamiento de Lenguaje Natural a la información proveniente de académicos del Instituto de Ingeniería de la UNAM, extraída del MBDAII. PROYECTO_UNAM
Página desarrollada para experimento de análisis de sentimientos en las opiniones durante la elección del nuevo rector de la unam www.corpus.unam.mx/proyecto_unam RST Se pone a disposición del usuario el RST Spanish Treebank, el primer corpus en español anotado con relaciones retóricas de la Rhetorical Structure Theory (RST). http://www.corpus.unam.mx/rst/ SABTEF El Sistema de Administración de Bancos Terminológicos Flexibles es una herramienta útil, gratuita y accesible, para realizar consultas de información especializada en áreas como la física, la lingüística y los fenómenos destructivos, para ayudar a la labor terminológica. http://www.corpus.unam.mx/SABTEF
SAUTEE Sistema Automático para Estudios Estilométricos permite analizar la aparición de diversos marcadores de estilo entre un conjunto de documentos, pudiendo visulizar la similitud estilisticsa de los mismos.
http://www.corpus.unam.mx/saute TERMEXT Extractor Terminológico Extraer automáticamente candidatos a término a partir de textos especializados de un texto plano. http://www.corpus.unam.mx/termext/
|