OAIster supera los 10 millones

31 enero 2007

Hace pocos días OAIster ha superado los diez millones de registros, correspondientes a otros tantos documentos digitales conservados en 730 repositorios de cincuenta países. Su crecimiento es muy alto, dado que empezó a funcionar hace muy pocos años, en 2002.

logo-oaister.gif

OAIster se define a sí mismo como un catálogo colectivo de recursos digitales. Proporciona acceso a esos recursos recolectando sus metadatos de los repositorios en que se encuentran, mediante el sistema Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH), que facilita la interoperabilidad. Así, OAIster es un sitio central donde buscar toda esa documentación, de modo más preciso y exhaustivo que con los motores de búsqueda de internet.

Los recursos que abarca son absolutamente variados en formato (textos electrónicos, documentos digitalizados de fuentes impresas, archivos de sonido o imagen, numéricos, etc.), en su temática (documentación científica, histórica, literaria, etc.) y en su carácter (algunos revisados, algunos de acceso restringido, etc.) Los archivos indizados en OAIster son asimismo variopintos, e incluyen incluso revistas electrónicas convencionales, abiertas o de pago (como las de IoP). Quizá sea esta cierta indefinición uno de los puntos débiles de OAIster. Incluso le ha llevado a definir una complicada política de desarrollo de colecciones que lo separa algo de su vinculación esencial con el movimiento Open Access, como recolector de archivos abiertos.

Además de numerosos archivos institucionales, entre los más famosos archivos indizados en OAIster están: ArXiv, Biomed Central, CiteSeer, RePEc, CogPrints, CERN Document Server, SciELO, etc. Entre los 18 repositorios españoles representados cabe citar a Dialnet, TDR, EPrints Complutense, RECERCAT, etc.


GlobalSpec, todo en tecnología

28 enero 2007

GlobalSpec es un gran recurso de información tecnológica, una herramienta impresionante para buscar datos y documentación en internet. Creado en 1996, se trata de un buscador vertical, especializado en ingeniería e industria, que abarca una ingente cantidad de información de casi todos los sectores tecnológicos. Pone en contacto la oferta y la demanda de contenidos, productos y servicios para todo tipo de empresas y profesionales. Desde este punto de vista, es un lugar importante para el marketing, publicidad y posicionamiento empresariales. GlobalSpec tiene unos 3,4 millones de usuarios registrados; registrarse es gratuito pero necesario para consultas en profundidad.

globalspecsearchenginelogo.gif

GlobalSpec integra en una única plataforma varios componentes:

  • Una base de datos propia, SpecSearch, con 20.000 catálogos industriales que incluyen unos 2 millones de familias y más de 150 millones de especificaciones de productos.
  • Un motor de búsqueda, The engineering web, que indiza cientos de millones de páginas web de contenido tecnológico, abiertas y de la internet profunda, incluso de editores comerciales como Knovel, IEEE, MicroPatent, IHS, ASTM, etc. (información de referencia, patentes, normas, artículos…)
  • Un sistema de boletines informativos (newsletters) sobre novedades por segmentos industriales, con más de 50 series, que se pueden suscribir por correo electrónico.
  • Tools and links complementarios, de búsqueda de empleo, artículos técnicos, enlaces a contenidos científicos, fórmulas y teoremas, software, asociaciones, alertas sobre productos, etc.

GlobalSpec permite, pues, encontrar páginas web, informes, proveedores, productos, servicios, especificaciones técnicas, hojas de datos y propiedades de materiales, patentes, normas, artículos, manuales, revistas, tablas de cálculo, noticias, empleo, etc. Se puede buscar por características técnicas de los productos, dentro de los 150 millones de especificaciones. La información de proveedores y productos es básicamente norteamericana, con datos también de Canadá, Reino Unido, India y China (y con menos frecuencia de otros países). No sé qué hacen las empresas españolas que no corren a incorporarse a GlobalSpec.


La paradoja europea

27 enero 2007

Dentro del estilo de ese tipo de estudios que descubren desnudo al emperador, me ha gustado este artículo sobre la “así llamada” paradoja europea en materia de investigación e innovación. Consiste la supuesta paradoja europea en que los países de la Unión Europea (UE) desempeñan un papel de fuerte liderazgo en materia de producción científica, pero no son capaces de convertir esa fortaleza investigadora en creación material de riqueza. Es decir, su capacidad de innovación industrial no está al nivel de su capacidad científica. Los autores del artículo intentan demostrar con datos que no hay tal paradoja. Que en realidad Europa es débil en ambos aspectos: simplemente la base científica es precaria y la industria también. No es, pues, que haya un problema de conexión o de aplicación de la “mucha y buena ciencia” a la “industria que no sabe aprovecharse”, sino de precariedad en ambos polos.

Según el artículo, las políticas de I+D puestas en marcha con insistencia por la UE (redes de excelencia, interacción con los entornos locales, atención a las necesidades de los usuarios) son deudoras no sólo de una falsa paradoja, sino también de una visión mecanicista de la relación entre ciencia y tecnología, que concibe como un automatismo simple la compleja y aleatoria, pero fructífera, relación entre investigación, desarrollo e innovación.

Tras leer el artículo, a uno le entra la duda de si la política europea de I+D no será en cierta medida otro alambicado y burocrático instrumento proteccionista al estilo de la PAC, en el que países ricos usan los excedentes presupuestarios para engrasar sus propias maquinarias productivas, académicas y del bienestar, al rebufo de la economía del conocimiento y la globalización.

Abundando en el asunto, con el programa EuroIngenio, el gobierno español apoyará económicamente las propuestas y premiará el éxito en la participación en convocatorias del nuevo Programa Marco de la UE. Es cierto que los centros públicos de investigación españoles necesitan mejor infraestructura para moverse en la complicada red de la investigación europea, pero es que suena a «subvención al cuadrado», la verdad.


Acceso abierto y bibliotecarios

25 enero 2007

Durante siglos, las bibliotecas se han dedicado a conservar y difundir el conocimiento social registrado en forma de impresos (libros, revistas…) Cada biblioteca formaba unas colecciones propias, las protegía y facilitaba el acceso a las mismas a sus lectores, tal era su misión. Con la edición electrónica en internet, se viene creyendo que esa misión se va a mantener, mutatis mutandis: cada biblioteca adquiere derechos exclusivos sobre un cierto volumen de documentación publicada en internet, de pago, la integra en un conjunto coherente y la adapta y canaliza a su clientela mediante metainformación (catálogos…), servicios de búsqueda, asistencia, formación, etc. Unos contenidos propios caracterizarían a la biblioteca, sean fondos impresos o un segmento de internet.

Sin embargo, es probable que el acceso a los resultados de la investigación en internet sea cada vez más abierto (post: ¿Vamos al acceso abierto?), gracias a un cambio gradual en los modelos de negocio en que se basa la edición de la información científica. Si las publicaciones van estando en acceso abierto, cualquiera puede canalizarlas y cualquiera puede informarse sin pasar, en ningún sentido, por las bibliotecas. Al perder una parte fundamental de sus contenidos, se diluyen sus funciones, su histórica razón de ser. Parece que los bibliotecarios deberían estar en contra del acceso abierto, verlo como una amenaza.

Pero, sorprendentemente, en términos generales, los bibliotecarios suelen ser favorables al acceso abierto. Descartando que sean unos suicidas irresponsables, despreocupados de su mismo medio de vida, ¿a qué puede obedecer esta actitud? Creo que hay, al menos, tres motivos:

  1. Por deontología profesional, los bibliotecarios trabajan a favor de la más amplia y libre difusión y comunicación del conocimiento.
  2. Por identificación con sus clientelas, por simpatía, se sienten comprometidos a ayudar a los investigadores a comunicarse mediante sistemas más cómodos.
  3. Se proponen cambiar de funciones y dedicarse ellos mismos a publicar, abiertamente, la producción científica de las instituciones para las que trabajan, asociándose más al autor que al lector

De la abundante movilización bibliotecaria en pro del acceso abierto a la ciencia, cabe destacar en España el blog de Alicia López Medina, llamado precisamente Open access. Aunque a veces puede dar la impresión de un cuaderno de campaña militar, redactado bajo las urgencias del combate, es recomendable y valioso para seguir las novedades sobre el tema (o intervenir en la batalla, incluso).


Imprenta y ciencia: Eisenstein

23 enero 2007

Para entender el nacimiento de la llamada sociedad de la información me parece de gran ayuda la interpretación del invento de la imprenta, y de sus consecuencias, que realiza en sus estupendos libros Elizabeth Eisenstein. Con la vaga sensación de que, en el fondo, nada hay tan nuevo bajo el sol, lo que mejor y con mayor perspectiva ilumina la actual revolución en las tecnologías de la comunicación es comprender lo que pasó en la anterior.

Ignoro absolutamente cuál es la valoración y el puesto que merecen Eisenstein y sus teorías dentro de la historiografía académica. Pero para mí sus explicaciones minuciosas acerca de cómo la imprenta transformó el comportamiento de las élites ilustradas, renovó las técnicas del trabajo intelectual y creó una industria del conocimiento, son apasionantes. Además del origen del Renacimiento y la Reforma, gracias a Eisenstein he podido comprender, sobre todo, cómo en la base de la ciencia moderna está una tecnología de la comunicación, unos métodos de estudio, unas formas de compartir el conocimiento, y cuánto yerran las interpretaciones idealistas de la Revolución científica, que la atribuyen a la generación espontánea o a algún espíritu moderno.

Gracias a sus libros, también, se ve cómo la Modernidad, o la hegemonía de Europa surgen en cierto modo a partir de la industria tipográfica. Todo lo cual, por extensión, induce a pensar que la evolución de la humanidad podría ser resultado de las formas de comunicación, de las técnicas de transmitirse la información entre los homosapiens.


Homenaje a Boyle

21 enero 2007

Ahora que se conmemora el 346 aniversario de la publicación de su principal obra, The sceptical Chymist, y el 380 de su nacimiento, es oportuno recordar a Robert Boyle (1627-1691). Fue un ilustre y acaudalado caballero inglés entregado de manera liberal y enciclopédica a la filosofía natural, que cultivó en todas sus ramas. Alquimista como Newton y tantos otros padres de la ciencia, es considerado no obstante como el primer químico moderno, capaz de discernir entre las nieblas de la opinión y la tradición elementos esenciales de un conocimiento más seguro de las cosas, de la naturaleza de la materia en este caso. Su perspectiva es un modelo y, sobre todo, el título de su obra, El químico escéptico, no su menor logro, muy imitado, merece un homenaje.

the_sceptical_chymist.jpg


Fuentes para análisis de citas

19 enero 2007

El desarrollo de la Web ha traído consigo nuevas y diversas formas de publicar los resultados de la investigación, nuevas fuentes para evaluar las publicaciones mediante análisis de citas y nuevos métodos de cuantificar y objetivar esa valoración (índice h, etc.) Surgen, pues, competidores del Web of Science en el análisis y búsqueda de citas de publicaciones científicas, y aparece abundante bibliografía donde se evalúan y comparan los diferentes sistemas. Por ejemplo estos dos artículos:

Entre los sistemas de búsqueda de citas que estos autores revisan, muchos, naturalmente, son especializados, sectoriales. Son fuentes con diferentes prestaciones, pero destacarían las siguientes:

Lokman asegura que cada sistema proporciona resultados ligeramente diferentes, por lo que conviene usar múltiples instrumentos para un análisis exhaustivo. Pero, ciertamente, el WoS sigue siendo la fuente de referencia.


Tecnociencia, web de la cosa

17 enero 2007

Tecnociencia se define como el portal español de la ciencia y la tecnología. Lo publica la FECYT (Fundación Española para la Ciencia y la Tecnología), del Ministerio de Educación y Ciencia. Constituye un sistema de información para el sector español de I+D+I, y se dirige a todos los agentes del mismo, investigadores y empresas en especial, así como a la difusión social de la cultura científica.

Tecnociencia recoge mucha información, ciertamente, datos necesarios y contenidos útiles: documentos, legislación, convocatorias, directorio, revistas, noticias, agenda, proyectos, oferta tecnológica… Ignoro si está muy completa (me extraña que sólo salgan 9 referencias legislativas de política científica, y cosas así). Los materiales complementarios, como las entrevistas, el módulo «Ciencia y Tecnología en España: conózcalas», o los especiales y monográficos de divulgación, son estimables. Desde hace tiempo hay dos especiales interesantes, uno sobre información para la innovación y otro sobre vigilancia tecnológica.

Sin embargo, la presentación y usabilidad de Tecnociencia, me parecen bastante mejorables. Está lleno de carpetas, cajones, botones y clasificaciones… Por un lado canales temáticos, por otro secciones especializadas, por otro menús y formularios varios. Abundantes ventanas que se apilan y se apilan. Enormes listas exhaustivas con caracteres enanos. Sabemos que «la cosa» es compleja, pero podrían esforzarse en facilitar mejor el acceso, o restringir los contenidos más selectivamente. Además, yo una vez me inscribí para un boletín o alerta personal y aún estoy esperando, aprovecho para decirlo.

Luego está ahí arriba siempre la fotografía de la ministra, como supervisándolo todo permanentemente, que resulta un poco fuerte, inquietante: podrían variar, si no de ministra, por lo menos de foto. Por ejemplo, al subsecretario nadie lo conoce.


«Pangea», de V. L. Mora

16 enero 2007
  • Vicente Luis Mora. Pangea: internet, blogs y comunicación en un mundo nuevo. Sevilla: Fundación José Manuel Lara, 2006.

Pangea trata de las repercusiones de internet y las TIC en la sociedad, el individuo, la cultura, el derecho, la economía y la vida misma… Explora fenómenos como la blogosfera, la realidad virtual, el hackerismo, la privacidad, las formas culturales, la propiedad intelectual, la globalización, etc. Pangea, según Mora, es el nuevo continente reunificado, la aldea global virtual, una nueva realidad simulada y paralela a la realidad extensa, donde gobierna la velocidad, y que cae bajo la ley esencial de la tecnología: todo lo que puede ser hecho, será hecho.

Aunque los editores, con voluntad comercial, han puesto al libro como lema “Un manual de supervivencia en la selva digital”, en plan simpático, en realidad Pangea no es un manual práctico, sino más bien una crítica del mundo digital. No una diatriba despiadada y tecnófoba, sino un análisis ponderado y sereno, pero una crítica a fin de cuentas. O por decirlo mejor, un conjunto de críticas, una serie. Si algo se echa de menos es tal vez un más potente argumento central o hilo conductor del conjunto de las reflexiones, más allá del propio concepto de Pangea y de la idea de la simulación.

En general, estoy bastante de acuerdo con las críticas y reflexiones de Mora, me han gustado. Pero proceden más bien de una visión humanística y literaria de internet y de las TIC, que le lleva a resultar, para mí, en algunos apartados, algo especulativo. Es lo que sucede cuando analiza la realidad sobre la base de las imágenes de la realidad que transmiten artistas, escritores, poetas o filósofos, confundiéndose el discurso sobre las cosas con el discurso sobre los discursos acerca de las cosas. Creo que le falta al libro una comprensión más profunda y cercana de la ciencia y la tecnología (la ciencia está clamorosamente ausente), que están en el origen de lo que nos está pasando, para lograr una explicación más sistemática y radical de los fenómenos que aborda.


Contenidos y contenedores

15 enero 2007

De la abundante jerga que ha aparecido con la llamada sociedad de la información hay dos palabras que me resultan simpáticas, casi entrañables: contenidos y contenedores. Me encantan por lo que ingenuamente revelan como pareja, remitiéndose la una a la otra, definiéndose la una por la otra sin decir ninguna nada comprometido, nada concreto, nada incorrecto.

Contenidos se emplea más (yo la uso mucho). Contenidos es toda información (cualquier código, cualquier formato, cualquier señal) generada por seres humanos, en cuanto susceptible de compraventa, de comercio, de tráfico. Engloba desde las creaciones artísticas y científicas al parloteo audiovisual. Son memes, combinaciones de memes, en definitiva; pero aquélla parte de los memes que es mercancía de una industria que los replica y multiplica.

Contenedores es término algo más técnico, muy del gusto de empresarios del entretenimiento, aunque su origen y resonancias son más ¿prosaicas? Un contenedor es lo que recoge o agrupa, vehicula o empaqueta, contenidos (y dése la vuelta). Es un programa (de TV…), un formato, un sistema, un dispositivo, un canal…

La sociedad de la información, entre otras cosas, se caracteriza por el gran crecimiento y abundancia de los contenedores, llenos de contenidos, mayormente todo digital. Este mismo blog, sin ir más lejos, es un contenido en un contenedor.


INSPEC, otro monumento

14 enero 2007

Otro monumento histórico de la documentación científica es INSPEC, de la británica Institution of Electrical Engineers (IEE), ahora Institution of Engineering & Technology (IET). INSPEC (que significa Information Service in Physics, Electrotechnology and Control) es hoy una base de datos con ocho o diez millones de referencias. Pero lo más interesante es que su primera versión impresa, como Science Abstracts, empezó a publicarse en 1898. Por tanto, recoge gran parte de la ciencia e ingeniería contemporáneas: todo lo centrado en la Física y en la tecnología basada en la Física o relacionada con ella (electricidad, electrónica, comunicaciones, informática, etc.)

Impresiona pensar que cuando INSPEC nació reinaba la Física clásica de Newton, a la que se había agregado sólo veinticinco años antes el electromagnetismo de Maxwell. Se estaba investigando la radiactividad (Röntgen había descubierto los rayos X, etc.) y se acababa de descubrir el electrón (Thomson, 1897). Todavía tenía que llegar 1900 para que Planck inaugurara la mecánica cuántica, y sobre todo esperaba el 1905 de Einstein… Es decir, INSPEC nació con la nueva Física.

Con motivo del centenario de INSPEC en 1998 se elaboró un folleto, The History of Science Abstracts, que puede consultarse (en pdf o html) en la sección Centenary website de su página web. Es un interesante resumen de su historia, con fotografías y otros detalles, un breve testimonio de la historia de la documentación y de la historia de la ciencia. Resulta curioso, por ejemplo, que en 1898 se publicaran 1.500 abstracts y ahora cada año se agregan unos 300.000.

Me pregunto si una recopilación tan valiosa, detallada e impresionante de la bibliografía científica del siglo XX conseguirá sobrevivir muchos años a la googlelización de la información…


A la búsqueda de citas

12 enero 2007

El Web of Science (WoS) es un monumento de la documentación científica y se remonta a hace medio siglo. Uno de sus elementos peculiares es la búsqueda por referencia citada, Cited reference search, que ya se usaba en los índices de citas impresos de los años 60, donde pacientemente se rastreaba, entre montones de volúmenes y páginas, una escueta referencia en letra menuda para averiguar qué otros documentos la habían citado.

La esquemática, casi espartana, referencia citada de un trabajo (primer autor, abreviatura de la fuente, año, número y páginas), se concibió para ahorrar papel y cuando se contaba con tecnologías de la información menos potentes y flexibles. Lo peculiar no es sólo su esquematismo, su fuerte normalización, sino que se trata de un campo adicional más en los registros completos de los documentos citantes. Es un campo repetible tantas veces como citas contiene el documento principal. Y es un campo recuperable: o sea, que se puede buscar por referencia citada como se consultaría por autores o descriptores. En el WoS, ahora, se busca en un módulo aparte, lo que subraya la singularidad de este sistema.

Hoy día acostumbramos a navegar mediante hipervínculos entre información masiva. Los registros de los documentos en las bases de datos, en el propio WoS, muestran asociadas las referencias citadas, en un formato amplio, con enlace a sus propias descripciones íntegras, o a información externa, como el texto completo, etc. Una tupida red de enlaces recíprocos remite en la base de datos de unas a otras referencias y en diversas presentaciones. En WoS, si buscamos una referencia cualquiera podemos con un par de clicks averiguar todos los documentos que cita o los que la citan a ella. Dado un conjunto de referencias, todas las de un autor, por ejemplo, podemos pedir todas las que las citan, y además analizarlas, obtener gráficos, etc.

¿Qué aporta ahora de especial en WoS la Cited Reference Search? Dos cosas:

  • Permite buscar referencias citadas en documentos recogidos en la base de datos que corresponden a documentos externos, que no están a su vez descritos en la base de datos: artículos de revistas no vaciadas, libros, tesis, etc.
  • Permite buscar por aproximación citas erróneamente redactadas, muchas veces con datos de fecha o números alterados, pero que corresponden a documentos identificables.

Ambas cosas hacen que este sistema de búsqueda «antiguo» sea imprescindible para completar la información que buscamos. Pero, ¿qué problema serio tiene la Cited reference search?

  • La búsqueda por referencia citada de documentos que a su vez no están vaciados en la base de datos sólo se puede hacer por el primer autor del documento, único dato registrado.

Scopus, que no rivaliza con WoS en la cobertura temporal, pues sólo ofrece referencias citadas desde 1996, también permite la búsqueda por referencias, aunque no sea un elemento característico, y hay que usarla en su módulo de búsqueda avanzada. A pesar de estar casi oculta y ser más incómoda, es bastante versátil.

La diferencia, pues, está entre buscar una referencia completa de la base de datos y ver sus referencias citantes directamente mediante enlaces, o buscar por el campo específico de referencia citada, que incluye las no vaciadas en la base de datos y las redactadas con errores.