Difusión de información en red

12 noviembre 2009

Informa SINC, el Servicio de Información y Noticias Científicas de la FECYT, que dos investigadores de la Universidad Carlos III de Madrid e IBM acaban de publicar en Physical Review Letters, una revista de primera línea, un estudio sobre la difusión de la información en las redes sociales. Creo que el trabajo está despertando bastante atención; desde luego a mí me interesa (con toda la modestia de mero aficionado) y, en un caso más de replicación de información en la red, me quiero hacer eco de ello.

Los autores explican al comienzo de su artículo que modelizar las dinámicas sociales como el resultado emergente de la interacción informativa entre individuos es habitual hoy en día, con la ayuda de la física estadística. Así se hace con fenómenos como la extensión de las epidemias, la difusión de las innovaciones, la formación de la opinión pública, las dinámicas culturales, los virus informáticos, la propagación de rumores o modas, el marketing viral, etc.

El artículo aborda en concreto los procesos de difusión de la información y la influencia en ellos de comportamientos humanos diferenciados. Y la principal conclusión parece ser que la información se propaga de una forma relativamente lenta casi siempre, lo que se debe a los muy diversos tiempos de respuesta de los individuos, cuya conducta altera cualitativamente la dinámica de la propagación informativa a nivel colectivo. Esta heterogeneidad parece deberse a la diferente relación entre la información y el individuo, que crea usuarios de respuesta rápida y de respuesta lenta.

El estudio supone un avance destacable en el análisis, medición y predicción matemáticas de los procesos de difusión de la información y, en definitiva, en la modelización científica de fenómenos humanos colectivos. Lo que más interesante me parece es la idea general de que los complejos sistemas psicosociales pueden estudiarse desde los procesos informacionales subyacentes, desde un punto de vista físico y naturalista.


Claude Shannon e Información

5 abril 2009

Otra figura a la que se debe reconocer que ha ampliado de manera significativa nuestra comprensión del mundo es Claude E. Shannon. También ha contribuido a transformarlo notablemente, desde luego, al menos los sistemas socioculturales, la vida de nuestra especie.

Claude Elwood Shannon (1916-2001) fue un ingeniero y matemático norteamericano que vivió plenamente el siglo XX. Estuvo vinculado a lo largo de su vida a instituciones y personas de la mayor relevancia científica: el M.I.T., Princeton, los Bell Laboratories, Vannevar Bush, Hermann Weyl, von Neuman, Alan Turing, etc. Su trayectoria intelectual arranca del temprano estudio del Álgebra de Boole, que empezó por aplicar a la Genética y, por supuesto, a la Electrónica.

Aunque fue un entusiasta constructor de artefactos, la transcendencia de Shannon está en sus aportaciones teóricas. Gracias a la lógica booleana impulsó la digitalización, el desarrollo de los códigos, circuitos y máquinas digitales. Y con su Teoría Matemática de la Comunicación (1948) fundó la Teoría de la información, rama de la Matemática aplicada que estudia cómo se comporta, las reglas según las cuales se maneja, representa, comunica y procesa la información.

Su trabajo hizo posible definir la información en términos matemática y operacionalmente precisos, medir su cantidad (bits) en diversos sectores y disciplinas, así como mejorar de forma drástica las técnicas para su transmisión y tratamiento. Convirtió la información en una entidad concreta y general, en una mercancía universal tratable de manera industrial. En una palabra, permitió construir las actuales tecnologías de la información y las comunicaciones (TICs).

Shannon introdujo, además, en su Teoría de la información, por analogía con la Termodinámica, un concepto de entropía que ha establecido una fecunda conexión intelectual, a través de nociones matemáticas y probabilísticas, entre las ideas de organización de los sistemas físicos y de cantidad de información.

Podría decirse por eso que, por un lado, Shannon, con su Teoría de la información, puso las bases conceptuales y matemáticas para el desarrollo de la sociedad de la información industrializada en la segunda mitad del siglo XX. O sea, que transformó el mundo, más que muchos otros científicos e intelectuales (y sea para bien, o para mal…)

Y, por otro lado, pero inseparablemente, su Teoría de la información nos permite comprender el mundo mejor, pues se aplica en muy diversos campos y sectores: la economía, el lenguaje, psicología, biología, física, etc. Las ideas de Shannon, sin pretenderlo, están de alguna manera en la estela de Leibniz, en la tradición que entiende la realidad desde la Lógica de la información.

  • Claude Shannon, Father of the Information Age [videograb.] University of California, San Diego, Television, 2002.
  • GOLOMB, S. W.; et. al. Claude Elwood Shannon (1916-2001) [texto pdf]. Notices of the AMS, 2002, 49(1):8-16

  • Zentralblatt MATH, la Historia

    13 julio 2008

    Si no me equivoco, Zentralblatt MATH es la última y única fuente de información bibliográfica superviviente de una época de la ciencia europea cuando, con Alemania a la cabeza, ostentaba la primacía en el mundo y sus repertorios bibliográficos resultaban esenciales para la investigación. Merece, pues, una evocación, un reconocimiento no exento de cierta melancolía. Me baso para ello en el artículo Berlin as a center for organizing mathematical reviewing, de Bernd Wegner, 1985, que Zentralblatt MATH recoge en su página dedicada a historia.

    Zentralblatt für Mathematik und ihre Grenzgrebiete empezó a publicarse como revista de reseñas en 1931, a cargo de Springer-Verlag, en Berlín. En buena medida apareció para superar y continuar la labor del Jahrbuch über die Fortschritte der Mathematik, que había nacido en 1869, también en Berlín, y desapareció con la Segunda Guerra Mundial. La actual base de datos Zentralblatt MATH incluye no sólo la serie histórica del Zentralblatt, sino también los contenidos del Jahrbuch.

    Durante varios años Zentralblatt estuvo dirigida por Otto Neugebauer, hasta que el ascenso del nazismo le obligó a escapar de Alemania, todo un símbolo sobre el devenir de la ciencia centroeuropea. En ese mismo contexto histórico, en los años 30, surgió en E.U.A. Mathematical Reviews (más conocido ahora como MathSciNet), el competidor de Zentralblatt que, con el tiempo, le hizo perder su hegemonía. 

    Terminada la II Guerra Mundial, con enormes dificultades, Zentralblatt continuó publicándose, al principio desde Berlín Este. Al agravarse la Guerra fría y hasta 1977 la responsabilidad del repertorio se repartió mitad y mitad entre instituciones del Este y del Oeste en lo que fue un peculiar arreglo resultado de la división de Berlín por el muro. Tan problemáticas circunstancias no le impidieron mantener un fuerte liderazgo internacional como instrumento de control de la literatura matemática, sin rival para la procedente del Este y centro de Europa.

    Desde 1978 se hizo cargo de Zentralblatt el Fachinformationszentrum (FIZ) de Karlsruhe, con el apoyo de la Academia de Ciencias de Heidelberg. Sin embargo, el equipo editorial siempre permaneció en Berlín. Se avanzó por el camino de la automatización y de la edición electrónica de Zentralblatt como base de datos en línea.

    Hoy día, Zentralblatt MATH reúne 2,7 millones de referencias de publicaciones de todo tipo y de todas las ramas de la matemática pura y aplicada, aparecidas desde 1869, e incluso anteriores en algunos casos, y publica unos 85.000 abstracts/reviews al año. En 2006 ha quedado también bajo los auspicios de la European Mathematical Society, configurándose como un producto con dimensión europea en el que colaboran instituciones de varios países.

    Las vicisitudes de Zentralblatt MATH lo convierten en un testigo bibliográfico y científico de la torturada historia del siglo XX, de la historia de Berlín, de Alemania y de toda Europa. Ahora, constituye asimismo un tímido exponente de una perspectiva de unidad continental también más bien tímida, y una especie de foco de resistencia ante el dominio estadounidense.


    Project Euclid, nuevo impulso

    26 abril 2008

    Project Euclid es un servicio de agregación y distribución online de publicaciones científicas pertenecientes al campo de las matemáticas puras y aplicadas y la estadística, que funciona desde 2003. Incluye contenidos de pequeños editores, generalmente instituciones o departamentos académicos. Funciona bajo los auspicios de algunas asociaciones científicas: AMS, SIAM, European Mathematical Society y American Statistical Association. Pero cuenta con mecenazgo privado y es gestionado por un operador de prestigio, la Cornell University Library, que también mantiene el repositorio de física arXiv.

    Actualmente, Project Euclid distribuye alrededor de 55 revistas electrónicas de unas 30 editoriales. De estas revistas, 11 títulos son de acceso por suscripción, 13 de acceso abierto y 30 de acceso parcialmente abierto. La cobertura temporal de las revistas presentes es muy variable, va desde los últimos años a varias, e incluso muchas, décadas, en algunos títulos. Hay dos revistas publicadas en España: Revista Matemática Iberoamericana y Publicacions Matemàtiques. En total, se habla de unos 90.000 artículos, un 75% de los cuales en acceso abierto. Además aparecen una serie de proceedings y tres series de monografías, con unos 60 volúmenes en total. Los procedimientos de suscripción son muy flexibles.

    En Project Euclid las facilidades de búsqueda de los documentos son bastante notables, incluyendo la recuperación por texto íntegro. Las referencias completas de los documentos ofrecen hipervínculos que enlazan con las correspondientes en las bases de datos de Mathematical Reviews (MathSciNet) y Zentralblatt Math. También presentan las referencias citadas en el documento, con enlaces asimismo a dichas bases de datos y a las fuentes de los textos completos (DOI, URL). Además, proporcionan los códigos de la clasificación AMS, palabras clave, etc. A su vez, los contenidos de Project Euclid  son accesibles desde MathSciNet, OAIster, Scirus, otros editores, etc. Admite conexión de referencias mediante CrossRef y recolección de metadatos OAI.

    Project Euclid es un sistema muy organizado y eficaz, una auténtica biblioteca de matemáticas, bien integrada en los circuitos de control de la literatura matemática internacional. Reúne de manera cooperativa a pequeños editores y revistas independientes, aumentando su proyección… Sin embargo, sus promotores no se conforman, creen que debe recibir un impulso mayor desde el punto de vista de su alcance público, de su difusión efectiva entre los matemáticos y científicos.

    En efecto, la noticia reciente es que Cornell University Library y Duke University Press han firmado un acuerdo para gestionar de manera conjunta Project Euclid. Mientras que la biblioteca continuará encargándose de la infraestructura tecnológica, del archivo y acceso a los contenidos, la editorial universitaria asume tareas de marketing, promoción comercial, gestión de suscripciones, etc., con el objetivo de extender la base de suscriptores y usuarios, de aumentar la visibilidad global de la plataforma.


    Chemistry y PhysMat Central

    5 noviembre 2007

    Diríase que el sistema editorial de BioMed Central (BMC) se consolida, es sostenible, dado que se extiende a otros espacios de la ciencia. Hace un año nació Chemistry Central, la sucursal de BMC para el campo de la química, y hace pocas semanas acaba de aparecer PhysMat Central, para la física y las matemáticas. Con ello, también, la revista electrónica abierta y comercial desborda el ámbito biomédico.

    Chemistry Central publica una revista electrónica de acceso abierto, Chemistry Central Journal (con un saldo modesto de 25 artículos en sus siete primeros meses de vida) y también facilita la consulta de los artículos de química publicados en varias revistas propias de BMC o editadas por BMC en colaboración con otros editores. No hay mucha tradición de acceso abierto en química, por lo que es un intento significativo, desde una buena plataforma de lanzamiento.

    PhysMat Central (PMC) ha empezado a publicar este mes de octubre dos revistas, PMC Physics A (altas energías, física nuclear, gravedad y cosmología) y PMC Physics B (materia condensada, física atómica, molecular y óptica), y anuncia el lanzamiento de PMC Physics C. La dinámica de trabajo de la física es muy diferente a la de la química y en este caso la iniciativa debe abrirse paso entre la muy consolidada combinación de eprints abiertos (arXiv, etc.) y revistas comerciales, con la idea también de atender a nuevas necesidades y planteamientos de publicación abierta surgidos en el CERN y en otros sectores. Desde PMC se promueve el depósito de los artículos en arXiv.

    Las explicaciones que los editores ofrecen de su modelo de negocio son sencillas y comprensibles: se financian con los APCs (Article Processing Charges) de los autores, básicamente mileuristas (más o menos a 1.000 € cada artículo). De esta manera, la comunicación científica se sufraga por el lado de la divulgación de los resultados, como la última fase y el coste final del proceso investigador, la acreditación o evaluación del conocimiento. O sea, se organiza como un mercado de autores, en lugar de como un mercado de lectores, lo que permite el acceso abierto para estos últimos, que no se cobre por la lectura. Claro que, en este caso, la sostenibilidad de la empresa editorial depende, reconocen los editores [pdf], de que el mercado de autores sea suficientemente amplio y no exageradamente selectivo, por así decirlo.

    Luego, como BMC ofrece acuerdos corporativos a los organismos y bibliotecas para que sufraguen colectivamente (al por mayor, con descuentos) la actividad publicadora de sus investigadores, las instituciones financian al editor convertidas en suscriptoras de autoría en vez de ser suscriptoras de lectura, como sucedía antes, en el modelo «lector paga».

    Creo que todo ello representa un pequeño paso más en la consolidación comercial de formas más rápidas e intensivas de propagación de aquel conocimiento que no es objeto inmediato de explotación industrial, o sea, de patente, licencia, etc.


    eFunda, para los ingenieros

    5 octubre 2007

    eFunda, con una «e» que inusitadamente no proviene de electronic, significa Engineering Fundamentals, y es un recurso de referencia en línea, una fuente de datos científico-técnicos para los ingenieros. Su uso está bastante extendido en los E.U.A., sobre todo en el campo de la ingeniería mecánica e industrial, de diseños y procesos, y en las propias industrias.

    efunda_blue.gif

    En sus propios términos, el objetivo de eFunda es proporcionar información fiable, rápida y concisa a los profesionales en ejercicio, para las necesidades y dudas del trabajo diario, acerca de cuestiones básicas: contenidos y datos muy variados que se pueden estudiar en las escuelas de ingeniería y que, por no estar constantemente sobre ellos, el ingeniero no los recuerda cuando los precisa.

    eFunda deja claro que no es un buscador, ni un catálogo de hipervínculos, sino una fuente de datos con contenidos sustantivos, una publicación en línea a la que se accede mediante suscripción, según diversas modalidades y tarifas (aunque deja consultar libremente durante un rato).

    eFunda incluye seis apartados principales de información: i) datos de materiales (elementos, aleaciones, polímeros, etc.); ii) técnicas de diseño muy usadas en ingeniería; iii) procesos y tatamientos industriales (mecanizados, térmicos, moldeados, etc.); iv) constantes, y unidades científicas y conversión de las mismas; v) fórmulas de uso frecuente por parte de los ingenieros; y vi) procedimientos matemáticos y calculadoras en línea para resolver problemas habituales, basadas en webMathematica.

    Además eFunda ofrece algunos servicios complementarios, como directorio de empresas y profesionales, búsqueda de empleo, noticias, foros, publicaciones gratuitas, etc.

    Intute otorga a eFunda una mención de Editor’s choice en la entrada principal del recurso, e incluye otras cuatro entradas sobre páginas o apartados específicos diferentes de esta fuente (materiales, matemáticas, etc.)


    TechXtra, un metabuscador

    15 May 2007

    TechXtra es un producto más de la excelente factoría Herriott-Watt University Library, que impulsó la Edimburgh Engineering Virtual Library (EEVL) hasta su integración en Intute hace tiempo. TechXtra es un metabuscador de uso gratuito que permite en la actualidad buscar información, simultáneamente y de forma muy sencilla, en unas 30 diferentes bases de datos y recursos disponibles en la red, del ámbito anglosajón (Reino Unido, Australia, EUA, etc.) Asegura incluir unos cuatro millones de documentos y funciona desde hace un año, más o menos.

    xtralogo.gif

    TechXtra está orientado básicamente a la Ingeniería, las Matemáticas y la Computación. Entre las fuentes de información más importantes que rastrea están: ArXiv, CiteSeer, NDLTD, el catálogo COPAC, el Intute Repository Search (50 repositorios del Reino Unido), las revistas de IoP, DOAJ, Project Euclid, etc. En algunas de las fuentes, no obstante, lo que se consulta es el segmento de las mismas que tiene que ver con los temas de TechXtra. En muchos casos los textos completos están disponibles gratuitamente y en otros, según la fuente de información de que se trate, son de pago.

    El tipo de documentos e información que abarcan los recursos en que TechXtra busca es también sumamente variado: libros, revistas, artículos, informes, tesis, materiales docentes, e-prints, páginas web, videos, etc. TechXtra también proporciona contenidos extra, como una serie de revistas y boletines comerciales, servicios de anuncios y noticias de la industria, ofertas de empleo, patentes y estándares a través de GlobalSpec, etc.

    La recuperación en TechXtra es simple, al estilo Google. Se puede restringir por tipo de documentos. Las búsquedas se ejecutan con rapidez, y los resultados se presentan de manera clara y cómoda, distribuidos según los diversos recursos en que se obtienen. Al final, remiten al contenido original en cada base de datos fuente. 

    TechXtra es una herramienta muy interesante para los campos que cubre, aunque en mi opinión agrega fuentes demasiado distintas por tipología, calidad y alcance como para competir con las bases de datos por separado, donde la recuperación es más precisa. Pero es una puerta común que conecta con los recursos, está en crecimiento y evolución, y resulta un servicio muy prometedor que conviene tener en cuenta para la internet profunda.

    Un comentario más amplio sobre TechXtra, titulado The long tail of information technology puede leerse en el Sci-Tech Library Newsletter de Stanford University.