Los sistemas cognitivos

27 enero 2008

A pesar del fracaso que han cosechado las exageradas promesas y pronósticos de la Inteligencia artificial, ha llegado a estar claro que el procesamiento de la información que realizan o (diría yo más bien) los procesos informacionales que tienen lugar en máquinas informáticas y organismos biológicos son de la misma naturaleza, lo que permite hablar de sistemas cognitivos en general.

cognitive.gif

Como su título indica, esta obra trata precisamente de los sistemas cognitivos, concepto o categoría emergente y central en un área donde diversas disciplinas científicas se cruzan y enriquecen entre sí: en especial, la computación y la neurociencia. 

Los sistemas cognitivos abarcan sistemas naturales o artificiales de procesamiento de la información capaces de percepción, aprendizaje, razonamiento, comunicación, actuación y comportamiento adaptativo. El libro reúne un conjunto de revisiones que repasan el estado y las perspectivas de la investigación sobre diversos aspectos de estos sistemas, desde el ángulo de la tecnología de la información, desde el de las ciencias de la vida y sobre todo desde la convergencia entre ambas, que así retoman una larga pero intermitente relación.

En efecto, la alianza entre computación y neurociencia con el fin de esclarecer los procesos informacionales y cognitivos que tienen lugar tanto en sistemas naturales como en artificiales constituye una vía esencial para la comprensión unificada y coherente del funcionamiento de la realidad, de su evolución y de sus niveles de agregación.

En este marco, se estudia el comportamiento emergente de una colectividad a partir del de los individuos componentes, la auto-organización y conducta adaptativa de los sistemas, los agentes autónomos, el aprendizaje social, etc. Tal vez pueda llegarse también (digo yo) a explicar el conocimiento como algoritmos de depuración y organización de la información. (Ver Algoritmos genéticos).

Es evidente, por otra parte, que la convergencia entre computación y neurociencia, no sólo va a permitir alcanzar una visión más fiable del mundo. También traerá consigo nuevas tecnologías, industrias y negocios, que crearán y satisfarán demandas de los mercados. Con ello aparecerán nuevas realidades y criaturas que sacudirán los códigos de valoración y conducta vigentes y transformarán el ambiente físico del planeta, no sin riesgos de diverso alcance para los homosapiens.

Por cierto, en neurociencia cognitiva y computacional está especializada la Scholarpedia.


Más acceso abierto (NIH)

24 enero 2008

Una noticia publicada hace días en Science (2008, 319:266), bajo el expresivo título de Uncle Sam’s Biomedical Archive Wants Your Papers, resume y explica la nueva disposición legal aprobada en E.U.A. a fines del año pasado sobre la publicación de los resultados de la investigación financiada por los National Institutes of Health (N.I.H.)

Dicha regulación convierte en obligatoria la anterior recomendación de que los autores remitan a N.I.H. sus artículos dentro de los doce meses posteriores a su publicación, para que sean depositados en el archivo abierto PubMed Central. La norma se justifica como forma de que los contribuyentes tengan acceso a la investigación que financian con sus impuestos, y los N.I.H. vigilarán que los científicos la cumplen.

Además, esta nueva práctica sitúa a los N.I.H. en sintonía con las otras grandes agencias angloamericanas de financiación de la investigación biomédica, que siguen una política similar: Howard Hughes Medical Institute, Wellcome Trust y U.K Medical Research Council. La diferencia es que los N.I.H. no ofrecen ayuda extra para sufragar los posibles costes adicionales del acceso abierto para el autor.

Esta medida es otra vuelta de tuerca en la dirección hacia un acceso más abierto al conocimiento científico. Es una iniciativa importante, por la dimensión, relevancia y liderazgo de los N.I.H., y porque la investigación biomédica es un sector decisivo: representa una proporción enorme de la edición científica y un ámbito donde las exigencias de evaluación a priori de la investigación (peer review, etc.) son críticas, no pueden cambiarse por accesibilidad.

Aunque el camino al acceso abierto no es sencillo ni lineal y el panorama se caracteriza por la coexistencia plural y duradera de modelos y sistemas comunicativos diferentes, yo creo que hay una tendencia de fondo hacia una mayor apertura, tendencia que responde a la propia naturaleza viral de la información, propensa a propagarse de suyo, y que se traduce, en historia de la ciencia, en lo que Willinsky ha llamado El principio de acceso.

Internet, obviamente, establece un nuevo concepto de publicidad, publicación o accesibilidad de la información, que no existía antes, y en relación con el cual cualquier obstáculo o laguna es percibida como restricción si el contenido no ha sido creado en origen (por el autor) para su explotación comercial. Que el intermediario cobre al usuario es difícil de explicar y de entender, salvo cuando es el creador quien reivindica la función comercial o industrial de su creación (como sucede, por antonomasia, en las patentes). El valor añadido que aporta y reclama por su cuenta el editor de Internet está en cuestión, sobre todo al repercutirse muy onerosamente como cobro a lectores consorciados (bibliotecas, instituciones, etc.)


ALFIN como disciplina

22 enero 2008
  • Johnston, B.; Webber, S. 2007. Cómo podríamos pensar: alfabetización informacional como una disciplina de la era de la información. Anales de Documentación, 10:491-504.

El objetivo de este trabajo es reivindicar que la alfabetización informacional debe ser una disciplina con entidad propia. Para Johnston y Webber ALFIN constituye un ámbito de conocimiento diferente de, y a medio camino entre, la Documentación y la Pedagogía. Además, en la sociedad de la información, tiene una relevante función social que cumplir, dando lugar a una práctica curricular independiente también de otras ramas del saber y contenidos docentes.

Los autores empiezan por inspirarse en las ideas de Vannevar Bush (As we may think) y en concreto en una frase suya que resulta entrañable por la fecha en que fue escrita (1945): «El mundo ha entrado en una época de mecanismos complejos y accesibles, y esto va a tener consecuencias».

Hay aspectos del artículo con los que estoy conforme:

  • Que ALFIN tiene trascendencia social y no sólo personal: la sociedad de la información como marco de la cuestión.
  • Que abarca algo más que destrezas, habilidades y técnicas instrumentales: valores, principios, reglas, responsabilidades, disposiciones intelectuales…
  • Que, en definitiva, si los agentes educativos (diríamos) quieren y pueden intervenir (ser activos) en la conformación de actitudes y aptitudes de los educandos para afrontar las complejidades de la era de la información, pues el asunto es relevante (no fácil).

Sin embargo, en otros puntos, discrepo a fondo:

  • Para empezar, en la terminología: si tan importante es el asunto, ¿por qué reducirlo, al menos en castellano, a «alfabetización» informacional, en lugar de llamarlo educación informacional? Es decir: educación para la sociedad de la información…
  • Aunque nada hay que objetar a la disciplina en cuestión como sector de investigación o campo de estudio, cuya duración y amplitud sólo el tiempo determinará, la verdad es que para ser impartida en la práctica yo prefiero verla asociada a los contenidos, como una enseñanza transversal, incorporada a las prácticas educativas ordinarias. O lo más vinculada y entrelazada con las mismas que sea posible, en todo caso.
  • Justo al contrario de lo que defienden los autores, podría decirse que la importancia de la educación informacional está en que penetre en todas las asignaturas y actividades educativas, porque las tecnologías y fenómenos característicos de la sociedad de la información afectan a toda la enseñanza en todos sus aspectos, y no es suficiente con «añadir» otra asignatura y dejar inalterado el conjunto.

Precisamente porque no es sólo una cuestión de métodos.


Entropía e información

17 enero 2008

entropy.jpg

Según Ben-Naim, la entropía puede ser fácilmente comprendida en términos de sentido común, como un concepto sencillo y familiar, y no tiene por qué ser una magnitud misteriosa e inaprehensible. Con talante divulgativo pero riguroso, con abundantes razonamientos y ejemplos, el libro prepara al lector para que descubra por él mismo qué es la entropía, cómo cambia y, lo más importante, por qué siempre cambia en un sólo sentido en cualquier proceso que sea espontáneo: aumentando. Para ello, Ben-Naim parte de la formulación atomística de la Segunda Ley de la Termodinámica, que tiene en cuenta la constitución corpuscular de la materia, sujeta a la mecánica estadística. También se basa el autor en las teorías matemáticas de la probabilidad y de la información.

Ben-Naim conduce al lector a la conclusión de que la entropía es «Missing information», la información que falta, la carencia o la pérdida de información, término que prefiere al de incertidumbre (uncertainty). Lo que cambia, aumentando, en los sistemas que evolucionan espontáneamente es, pues, la desinformación. En definitiva, la entropía no es más que información.

La información le parece a Ben-Naim una magnitud científica bien definida, que expresa de manera más clara y exacta que la idea de «desorden» qué es la entropía. La entropía es una medida de la ignorancia, sin que esto pueda interpretarse en términos subjetivistas o relativos al conocimiento humano de los sucesos, sino a la indeterminación probabilística.

Cualquier sistema, aislado y espontáneamente, pasa más tiempo en estados de elevada probabilidad que en estados de probabilidad baja. Por consiguiente, si está en un estado de baja probabilidad (por tanto, de elevada información) pasará a uno de probabilidad alta (menor información). La desinformación, la entropía, aumenta. Esto no es más que sentido común, según Ben-Naim: mera consecuencia del juego de las probabilidades en el universo de sucesos que ocurren en un sistema de partículas, una ley de la probabilidad más que una ley de la física.

Naturalmente, añado yo, hay segmentos anti-entrópicos de la realidad, crecientemente informacionales, que no evolucionan como sistemas aislados y espontáneos, sino consumiendo energía del exterior. Son muy improbables, pero haberlos, haylos.


eMolecules, sustancias químicas

13 enero 2008

Entre los sistemas de información sobre catálogos químicos existentes en Internet destaca eMolecules, que permite acceder a datos sobre siete u ocho millones de sustancias y facilita la adquisición comercial de las mismas. Fundada en 2005, es una herramienta de búsqueda libre y gratuita para el usuario, porque se financia mediante publicidad y a través de las empresas químicas con cuyos productos hace intermediación informativa.

molecules.gif

eMolecules apenas ofrece contenidos propios, es un motor de búsqueda, un buscador especializado en sustancias químicas. Rastrea, indiza y recupera información que aparece en catálogos comerciales de 150 empresas suministradoras de productos químicos y también en importantes fuentes de datos públicas como PubChemNIST Chemistry WebBook, National Cancer Institute, DrugBank, etc. Una vez identificada la sustancia, eMolecules remite o enlaza a las descripciones que figuran en esas fuentes y catálogos, con sus propiedades físicas, químicas, farmacológicas, biológicas, etc., o con la presentaciones y características comerciales según los proveedores que la venden.

No obstante, para bastantes de los catálogos comerciales que indiza, eMolecules no genera hipervínculos profundos a los datos de la sustancia: sólo da el número de referencia y el enlace al sitio web de la empresa. Supongo que estos proveedores son los que no han decidido «volcar» sus datos en el buscador. Las fuentes de datos públicas aparecen enlazadas en profundidad, salvo la EPA.

En eMolecules se puede buscar dibujando estructuras químicas y también mediante subestructuras comunes a diferentes moléculas relacionadas (con varios editores o applets de trazado), así como consultando por distintas formas textuales o codificadas del nombre de las sustancias. Además incluye algunos índices selectivos de varios tipos de compuestos. Las listas de resultados de una búsqueda se pueden refinar, filtrar, ordenar y editar. Registrándose con una cuenta personal es posible también archivar y compartir dichas listas, así como solicitar presupuestos a los proveedores.

Resulta interesante la página Cheminformatics 101, un resumen sobre informática documental química incluido entre las explicaciones About del buscador, donde se introduce al lector en las técnicas de representación de moléculas, de indización y recuperación subestructural, etc.

eMolecules, como ChemSpider, ChemFinder (ver post) y la propia PubChem, por supuesto, es del tipo de herramientas libremente accesibles que «desafian» hasta cierto punto a Chemical Abstracts o a CrossFire Beilstein por lo que se refiere a información comercial o factual. eMolecules no es ni mucho menos algo abierto en el sentido semifilantrópico que suele tener esta expresión cuando se habla de la edición científica. Pero, aunque no resulte desinteresado, es un canal más por el que información especializada se propaga con rapidez y facilidad a través de la Red.


El CERN Document Server

10 enero 2008

Uno de los «repositorios institucionales» más importantes y grandes es el CERN Document Server (CDS), que contiene ahora casi un millón de referencias y unos 350.000 documentos sobre física de altas energías y áreas relacionadas. arXiv, el archivo temático por antonomasia, alberga 450.000 eprints, y la base de datos HEP de SPIRES algo más de 500.000 referencias, teniendo ambas fuentes una cobertura disciplinar parecida a la del CDS. La cuarta gran fuente del sector, el Astrophysics Data System de SAO/NASA es mucho mayor (6.000.000 de referencias), pero su rango temático es más amplio, además de ser sólo bibliográfica.

cds.gif

En realidad, el CERN Document Server es una mezcla de repositorio y base de datos, pues incluye referencias y un subconjunto de documentos íntegros. Estos, además, pertenecen sólo en parte a la producción científica del CERN, correspondiendo el resto a otra literatura recopilada por la institución. Las fechas de publicación de los documentos y referencias se remontan a los orígenes del organismo, a mediados del siglo XX, pero el crecimiento reciente de CDS está siendo muy rápido. La incorporación se produce tanto por los envíos de los autores como por sistemas de recolección, selección e indización por parte del CERN.

La variedad en la tipología de los contenidos es también una nota característica del CERN Document Server. Aunque en cierta manera, tiene aspiraciones de plataforma de publicación, constituye la gran biblioteca electrónica de la institución, con toda la clase de materiales conservados en ella: preprints, artículos, tesis, informes, libros, congresos, revistas, estándares, presentaciones, videos, archivos sonoros, folletos, carteles, recortes de prensa, anuncios de conferencias, archivos históricos y administrativos, etc.

El CERN Document Server opera con un software propio, CDS Invenio, que se define compatible con OAI-PMH y es de uso libre bajo GNL. Dentro de la complejidad de las colecciones documentales que reúne, el sistema ofrece una razonable capacidad de recuperación, sin lenguajes controlados ni búsqueda por campos temáticos. Facilita alertas, feeds y un amplio rango de formatos de salida de referencias, e incluso software de conversión de formatos de documentos. También se pueden añadir reseñas y comentarios a las referencias, a modo de open review, y usar cestas de selección y archivo de referencias, personales y de grupo. Cualquier usuario puede crearse asimismo una cuenta de uso personal con facilidades ampliadas.

CDS es un recurso de enorme interés y riqueza en el campo de la HEP, pero nada uniforme y simple. Atiende tanto a la conservación y difusión de la producción científica del CERN como a la de bibliografía y documentación digital muy heterogénea, con diversa procedencia y carácter. Carece en su web de una explícita declaración de misión y objetivos. Por ello puede resultar útil un artículo como el siguiente, que figura entre la documentación de CDS Invenio:

Charles W. Bailey, por cierto, ha publicado hace poco un compendio o prontuario sobre repositorios institucionales: Institutional repositories: tout de suite [pdf].


Darwin, origen de la lucidez

1 enero 2008

Creo que no debe faltar en este blog un recuerdo para Charles Darwin, uno de los mayores desmitificadores o desveladores de falsas ilusiones en la historia de la humanidad, uno de los que más han contribuido a sustituir la vanidad crédula de los hombres por una humilde lucidez sobre su propia condición y lugar en el mundo. Dicho sea con permiso de Alfred Russell Wallace, cuasi alter ego, la influencia y significación de Darwin han sido, con razón, inmensas, como también han sido muchas y variadas las interpretaciones, las consecuencias y hasta las exageraciones derivadas de su obra y pensamiento.

charles_darwin_1880.jpg

 

A mí me gustaría destacar aquí tres aspectos:

  • Darwin podría decirse que inauguró la ciencia de lo complejo, por cuanto echó los cimientos del primer paradigma global para estudiar los sistemas biológicos, en una perspectiva compatible y coherente con las teorías físicas, promoviendo una visión unificada de la naturaleza.
  • Darwin hizo que el concepto de evolución pudiera llegar a servir como una categoría central para analizar el mundo en términos dinámicos pero no teleológicos: la realidad cambia, se transforma y se complica sin estar predeterminada ni tampoco dirigida a un propósito, sin responder a ningún diseño intencional.
  • Darwin descubrió que los homosapiens son un resultado de procesos naturales y no criaturas singulares protegidas de la divinidad, y por tanto ayudó a ver que tampoco son autores o forjadores heroicos de su destino, semidioses modernos.

Como el mayor de los naturalistas, Darwin nos invita a examinar también hoy con rigor científico el encaje que tiene de hecho y que debería tener la especie humana en el orden natural.

P.S. (11-02-08): Un interesante y breve resumen de sus aportaciones científicas se ha publicado con motivo de la preparación del bicentenario de su nacimiento y 150 aniversario del Origen de las especies el año que viene:

  • Padian, K. 2008. Darwin’s enduring legacy. Nature, 451(7179):632-634