Archivo de la categoría: IST

FEMTI report on translation tasks.

«The Framework for Machine Translation Evaluation in ISLE is an attempt to organize the various methods that are used to evaluate MT systems, and to relate them to the purpose and context of the systems». 

FEMTI helps translators to use the most suitable MT system according to their necessities because here they can find evaluations and tests of each method. FEMTI does this basically introducing two clasifications «is to be thought of as forming a feedback loop which you may want to go through several times. The steps given here are meant to conform to those proposed in ISO/IEC 14598 for designing an evaluation. The second taxonomy concerns quality characteristics of MT systems which are potentially of interest».

The three main characteristics for the translation are:

  • Assimilation.

  • Dissemination

  • Communication

Deja un comentario

Archivado bajo IST

Translation examples by MT systems applied to closely and less related languages

Here are some examples of Machine translation. I’ve tried them with more or less the same result.

1 comentario

Archivado bajo IST, littera

International meetings on Computational linguistics.

Here we have three future or ongoing meetins on Computational Linguistics. I preffer to investigate and write on future than on past meetings in case anyone want to go ;).

This Conference is the 45th Annual Meeting of the Association for Computational Linguistics. It will be in Prague, Czech Republic, June 23rd–30th 2007. Here is the Conference Program.

«Human Language Technologies: The Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT 2007) will be held in Rochester, NY, April 22-27, 2007. The conference site will be the Hyatt Regency in downtown Rochester».

«La XXIII edición del Congreso Anual de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN) se celebrará en Sevilla los días 10, 11 y 12 de septiembre de 2007. Como en ediciones anteriores, la SEPLN pretende difundir la investigación y el desarrollo realizado por los investigadores en el campo del Procesamiento del Lenguaje Natural (PLN), facilitando a la comunidad científica y empresarial del sector un foro idóneo para mostrar las posibilidades reales de aplicación del PLN. Asimismo, la SEPLN desea conseguir el objetivo de anteriores ediciones de este congreso identificando las futuras directrices de la investigación básica y de las aplicaciones previstas por los profesionales, con el fin de contrastarlas con las necesidades reales del mercado. Igualmente el congreso pretende ser un marco propicio para introducir a otras personas interesadas en esta área de conocimiento.»



Deja un comentario

Archivado bajo IST, littera

Reasons to study Human Language Technologies

Automatic transcription of meetings, translation between languages (e.g.  Babel Fish), automatic answering of questions, text mining or acess to information through spoken human-computer dialogue… Human Language Technologies are everywhere in our society  Mobile phones or web pages use this new technology, «consequently, there is strong demand for graduates with the highly-specialised multi-disciplinary skills that are required in HLT, both as practitioners in the development of HLT applications and as researchers into the advanced capabilities required for next-generation HLT systems

  • «Create software products that  have some knowledge of human language«.  As Uskoreit says the most important idea is to create machines which are able to comunicate with people.
  • Having a wide range of areas to work. Also, lots of posibilities of finding a job.
  • «Become acquainted with new technologies applied to natural languages «. This will help the knowledge of the language that you use.

There are much more. For instance, here we have a list of the objectives for our subject on Human Language Tecnologies. The main objective is to create machines that can speak and listen so they can help us to comunicate.

Deja un comentario

Archivado bajo IST, littera

European Centres for Human Language Technology

Here we have three European Centres for Human Language Technology.

  • Centre for Human Language Technology and Bioinformatics.  «The Centre for Human language Technology and Bioinformatics of the University of Beira Interior was founded by Prof. Gaël Dias to investigate in the areas of Human Language Technology and Bioinformatics gathering researchers from Computer Science, Statistics, and Linguistics.»
  • National Centre for Language Technology. «Language is the key modality in communication. The National Centre for Language Technology conducts research into the processing of human language by computers, such as speech recognition and synthesis, machine translation, human-computer interfaces, information retrieval and extraction, the teaching and learning of languages using computers and software localisation and globalisation. Research in Human Language Technology (HLT) is interdisciplinary and includes Natural Language Processing (NLP) and Computational Linguistics (CL). HLT has substantial economic implications and potential. The centre carries out basic research and develops applications».
  • Language Technology Documentation Centre in Finland. «This site is being developed by and maintained by the Department of General Linguistics in the University of Helsinki. The Nordic language technology documentation project was financed partly by the Nordic Language Technology Research Program administered by NorFA, which later became NordForsk (…)  Language technology is a multidisciplinary field, which studies technical means and methods that can be used to process natural language with computers. Some well-known applications of language technology are for example automatic authoring tools (such as spell checking) and speech recognition. Language technology has also many other application areas, which are introduced in the Technologies section and in Language Technology world».

Deja un comentario

Archivado bajo IST, littera, Uncategorized

HANS USZKOREIT

I have never heard this name before but when I investigated on him, I realised that he is an interesting man.

As he says on his personal web site «I am a computional linguistist in Saarbrücken, Germany working as a Professor at Saarland University and as Scientific Director at the German Research Center for Artificial Intelligence (DFKI). I am also involved in two young  language technology entreprises as co-founder and advisor».

Uskoreit studied Linguistics and computer science at the Technical  University of Berlin and the University of Texas at Austin.  From 1982 until 1986, he worked at the artificial Intelligence center of SRI International in Menlo Park, Ca. During this time he was also affiliated with the Center for the Study of Language and Information at Stanford University. During six months in 1986, he worked for the Science Division of IBM. He also worked for IBM Germany as a project leader in the project LILOG. At the same time, he taught for the university of Stuttgart. In 1989 he became the head of the Language Technology Lab at the DKI. Since 2006, he serves as Chairman of the Board of Directors of the international initiative dropping knoweldge. He is now working on different projects of the DFKI. For more imformation about his CV.

He has published and co-published a lot of books and articles. Among others, we can mention «Categorial Unifocation Grammars»(1986) or «Language technology from a European Perspective» (2005).

Hans Uszkoreit thinks that Language Technologies «are information technologies that are specialized for dealing with the most complex information medium in our world: Human language». This is the reason, he continues, why they are called Human Language Technologies.

Deja un comentario

Archivado bajo IST, littera

Human Language Technologies.

 My new subject concerned with this blog is called Human Language technologies. In this article I will try to find two definitions of Human Languageg technologies done by scholars or relevants sites on the web.

  • As a very important site I have found a definition in the Wikipedia. The wikipedia says that «Language technology is often called Human Language Technology (HLT) and consists of computational linguistic (or CL) and speech technology as its core but includes also many  application oriented aspects of them. Language technology is closely connected to computer science and general linguistics.»
  • In a module about Human Language Technologies Piklu Gupta and Mathias Schulze say that «Human language technologies is a new term that embraces a wide range of areas of research and development in the sphere of what used to be called Language Technologies or Language Engineering».

I will work on Human Language Technologies in my next articles.

Deja un comentario

Archivado bajo IST, littera

Definitons: metadata, metacontent & content

Metadata, metacontent, data and content are really important factors which form the Internet’s language. As far as we are concerned, we take those items as if they were the background of the web pages. Here are some definitions:

  • Metadata:”Data about data. Metadata describes how and when and by whom a particular set of data was collected, and how the data is formatted. Metadata is essential for understanding information stored in data warehouses and has become increasingly important in XML-based on the Web aapplications.”
  • Metacontent: Even if deffining this term it`s not easy, this could be some kind of definition written by Joaquín Bravo Montero in his XML course: Un metacontenido no es más que la información relativa al contenido del documento, como su título, autor, amaño del archivo, fecha de creación, historial de cambios, palabras clave, y demás información asociada.”
  • Content: As it is defined in W3C, a web content is “a text equivalent for every non-text element. This includes: images, graphical representations of text, image map regions (…)Markup languages: There are many markup languages, such as HTML (Hypertext Markup Language), XML (Extensible Markup Language) , SGML (Standard General Markup Language). References: Marieke Guy, Andy Powell and Michael Day,”Improving the quality of metadata in Eprint archives” (january 2004).

1 comentario

Archivado bajo IST, littera

Literatura hipertextual

He estado experiementando con unas páginas sobre literaura hipertextual para una asignatura de la universidad. Aquí os dejo mi crítica:

             Es mi primera visita a unas páginas Web de una creación hipertextual. Me han parecido muy novedosas. No creo que este nuevo modelo de “literatura” pueda suplir a la clásica, sino que convivirá una temporada con ella hasta que la tecnología nos permita hacer cosas “más novedosas”. No obstante está claro que esta literatura no tiene espíritu de perpetuarse puesto que todos sabemos los problemas de la red: “todo pasa y nada queda, todo se modifica o se cae”. Quizás mi única crítica puede ir dirigida a  la calidad de los textos, tanto literaria como ética.

Las páginas que he visto son:

      Una página interesante y una nueva forma de leer el libro Rayuela de Julio Cortázar. Me ha gustado el diseño porque te mete de lleno en el texto y no pierdes el tiempo en la búsqueda. Me ha gustado mucho la segunda forma de leer el libro y más aún cuando he ido pinchando anárquicamente en cada capítulo según me iba pareciendo. Me gusta no solo hay dos libros sino todos los que quiera el lector empezando por donde quiera y seguir por donde quiera.La verdad es que para poderte enfrentar a un texto clásico reescrito en hipertexto tienes que leer primero el libro tal como lo pensó el autor para poder saborear la “descomposición” del mismo.

 No dejan de ser relatos, por muchos “hipervínculos” que contengan los textos. Relatos  más o menos interesantes, y con más y menos calidad. Quizá enganchen porque son fáciles de leer y relativamente cortos. Me llama la atención que no hay ningún hipertexto del actual año, da la sensación de que esto se ha acabado.

El hipertexto “En el tranvía” es el que más me ha gustado. Noto que es más novedoso y permite más independencia del lector. Al estar el texto original significado te permite leer dos textos a la vez.

            Más relatos, cortos y realmente malos para mi. La página está bien si puedes entrar a la primera y no se te cuelga. Los seis relatos de sexo son los más interesantes, para pasar solo un ratito. El diseño es el más bonito de las tres visitadas pero es la que menos me ha gustado.

Deja un comentario

Archivado bajo IST, littera

Literatura y soporte informático.

La literatura ha entrado en el mundo de la informática. En este articulo trataremos de ver de que manera condicionan los soportes informáticos la comunicación escrita y con ello nuestra manera de entender la literatura.

  • Respecto del autor, Internet ha abierto nuevas posibilidades de creación: Por una parte, el autor no necesita ninguna editorial para dar a conocer su obra. Simplemente deberá cambiar su texto al lenguaje HTML para que el ordenador pueda leerlo. No hay ningún otro problema en Internet. Además, el autor puede optar por un tipo de creación en colaboración .
  • En cuanto al soporte lo más importante tiene que ver con la idea de navegación de internet. El ordenador invita a un constante ejercicio de asociación dando continuos saltos por medio de enlaces.»La realidad virtual constituye una ruptura de la barrera que separa al observador de la representación, ruptura que se produce a partir de ciertas formas de simulación producidas informaticamente , que permiten que el individuo sienta como «real»e inmediata su relación con la «imagen»que está en la base de la «otra» realidad. (…) El soporte genera un nuevo tipo de comunicación que requiere un nuevo tipo de sujetos. Ya no hay una flecha que señale del emisor al receptor, la ineteractividad se subraya como clave y además en un plano de igualdad».
  • El nuevo soporte hace cambiar el mensaje. Ya no se habla solamente de texto, sino que puede haber una combinación entre texto sonido e imágenes. El término hipertexto sirve para diferenciar el texto impreso del digital. La base del hipertexto es la asociación y la no linealidad. «Consiste en la conexión de unos textos con otros, que relacionados entre si por enlaces electrónicos, dan lugar a recorridos diversosy alternativos, según el gusto y los intereses del usuario». Hablamos de hipermedia cuando además de textos conectamos imágenes y sonidos. Gracias a la hipertextualidad ha aparecido el libro electrónico.
  • El lector se conviert en protagonista en esta nueva comunicación, debe ser activo,  capaz de relacionar, asociar e incluso finalizar los argumentos. «El lector construye junto al autor, se convierte en co-credor de un tipo de obra necesariamente abierta»

Ante estos dos soportes diferentes (impreso y digital) estudiosos como Landow opinan que estamos ante «un cambio fundamental que afectará nuestra forma de conocer y expresar la realidad». Otros como Nuria Amat opinan que estamos ante «un procedimiento nuevo (…) llamado a convivir con el libro electrónico». Esta última sería la postura que se debería adoptar, ya que el hombre debería sacar el máximo partido a ambos soportes.

Fuente: Teoría de la Literatura: Unidad 4. Literatura y Soporte informático, Inma Ballano.

Deja un comentario

Archivado bajo IST, littera