ARTÍCULOS

Análisis de la producción científica de la Universidad de Salamanca indexada en SCOPUS (2010-2015)

Analysis of the scientific production of the University of Salamanca indexed in SCOPUS (2010-2015)


Alejandro Medina-González

Departamento de Biblioteconomía y Documentación, Universidad de Salamanca, España / almedina@usal.es | https://orcid.org/0000-0001-8535-8674

Carlos Díaz-Redondo

Facultad de Traducción y Documentación, Universidad de Salamanca, España / charlierdiaz@usal.es | https://orcid.org/0000-0002-1391-3429

Blanca Rodríguez-Bravo

Área de Biblioteconomía y Documentación, Universidad de León, España / blanca.rodriguez@unileon.es | https://orcid.org/0000-0002-9476-7602

José Antonio Frías

Departamento de Biblioteconomía y Documentación, Universidad de Salamanca, España / frias@usal.es | https://orcid.org/0000-0002-5425-8950


Recepción: 27-11-2023. 

Aceptación: 23-05-2024.

DOI: https://doi.org/10.34096/ics.i50.13697



Resumen

El objetivo de este artículo es analizar la producción científica del personal docente e investigador de la Universidad de Salamanca durante el periodo 2010-2015. Sobre la base de dos conjuntos de datos que contienen esta producción y las referencias bibliográficas citadas en ella, se determinaron los siguientes indicadores: a) las áreas de conocimiento más productivas, b) los tipos documentales escogidos para divulgar la investigación; c) el tipo de acceso que presentan, y d) los tipos documentales empleados como referencias bibliográficas, su obsolescencia y su tipo de acceso. Se recurrió a una metodología cuantitativa, con un diseño transversal, empleando la estadística descriptiva para generar y analizar los resultados. Se concluye que las áreas de conocimiento más productivas fueron las Ciencias Físicas y las Ciencias de la Salud; y trabajando en colaboración, las Ciencias de la Salud con las Ciencias de la Vida. El tipo documental predominante es el artículo científico, seguido por las comunicaciones a congresos. La mayor parte de estas publicaciones están en acceso restringido. En las referencias bibliográficas, prima asimismo el artículo científico, seguido por los libros y los capítulos de libros. Estas referencias citadas tienen una vida media comprendida entre 6 y 9 años. Predomina el acceso cerrado y, entre las modalidades de acceso abierto, la vía verde.

Palabras clave: Acceso a la producción científica, Bibliometría, Tipos documentales, Scopus, Universidad de Salamanca

Abstract

This article aims to analyze the scientific production of the teaching and research staff of the University of Salamanca during the period 2010-2015. Based on two sets of data that contain this production and the bibliographic references cited in it, the following indicators were determined: a) the most productive areas of knowledge, b) the types of documents chosen to disseminate the research, c) the type of access that present; and d) the types of documents used as bibliographic references, their obsolescence, and their type of access. A quantitative methodology with a cross-sectional design was used, using descriptive statistics to generate and analyze the results. It is concluded that the most productive areas of knowledge were Physical Sciences and Health Sciences, and working in collaboration, Health Sciences with Life Sciences. The predominant document type is the scientific article, followed by conference communications. Most of these publications are in restricted access. The scientific article also takes precedence in bibliographic references, followed by books and book chapters. These cited references have a half-life between 6 and 9 years. Closed access predominates, and green open access predominates among the open access modalities.

Keywords: Scientific production access, Bibliometric analysis, Document types, Scopus, University of Salamanca




1. Introducción

Los estudios bibliométricos son una herramienta de gran utilidad para la medición de la calidad y productividad científica en tanto que, a través de criterios objetivos, proporcionan información cuantitativa que permite medir la evolución de la ciencia, identificar las fuentes fiables y los actores involucrados en ella, o las bases académicas para la evaluación de nuevos desarrollos (Moed, Bruin y Van Leeuwen, 1995). En las últimas décadas, la literatura especializada en análisis bibliométricos ha tenido un crecimiento exponencial como resultado de los avances acelerados en las tecnologías de la información y en el desarrollo y refinamiento de plataformas digitales de información científica como la Web of Science o Scopus (Hood y Wilson, 2003). Así, la práctica bibliométrica se ha utilizado para medir la actividad y productividad de todos los agentes involucrados en el progreso de la ciencia: países, muy especialmente revistas, grupos de investigación, centros de investigación, y, por supuesto, universidades.

Con respecto a este último agente, en España son relevantes, por ejemplo, la investigación de Villagrá Rubio (1992), que se ocupa de estudiar la producción científica en Ciencias Sociales publicada entre 1986-1988 por investigadores vinculados a universidades españolas, analizando, entre otras variables, la producción según su autoría o coautoría, su temática o subtemática, el área de conocimiento y la universidad productora, y su nivel de internacionalización. Destaca asimismo el trabajo de Campanario, Cabos e Hidalgo (1998) sobre la producción de la Universidad de Alcalá de Henares generada entre 1990-1992; el de Maz-Machado et al. (2010) sobre la producción de la Universidad de Málaga recogida en el Social Science Citation Index para el periodo 1998-2007, así como el de Alonso Arroyo, Pulgarín y Gil-Leiva (2006) relativo a la producción de la Universidad Politécnica de Valencia entre 1973 y 2001. En la Universidad de Salamanca, se cuenta con al menos dos antecedentes. Por un lado, el trabajo de Galbán Ferrús et al. (1985), que analizan un grueso de 1.720 publicaciones realizadas por investigadores vinculados a esta universidad, con 915 referencias bibliográficas aparejadas, que están recogidas en las principales bases de datos internacionales del momento para el periodo 1980-1983. Entre los aspectos analizados se encuentra la distribución de la producción por tipos documentales o por afiliación a facultades. Por otro lado, la investigación de Ferreras Fernández (2016), quien realiza un análisis cuantitativo de visibilidad, uso y citación de las tesis doctorales producidas por la Universidad de Salamanca, defendidas en el período comprendido entre 2006-2011 y disponibles en el repositorio institucional GREDOS, centrándose, entre otros aspectos, en el tipo de acceso o las prácticas de citación.

El análisis de citas es un procedimiento ampliamente utilizado desde los años 70 para demostrar el valor de las colecciones (Chambers y Healey, 1973). En este sentido, destaca por ejemplo el trabajo de Wilson y Tenopir (2008), quienes emplean una muestra de revistas científicas y las referencias citadas en ellas, combinando los datos obtenidos con los resultados de una encuesta sobre tendencias en la lectura, para evaluar las colecciones de la biblioteca de la University of New South Wales (Australia). Destaca igualmente el trabajo de Salisbury y Smith (2010), en el que utilizan los datos recogidos en la Web of Knowledge para identificar los hábitos de publicación y citación en la University of Arkansas (EE.UU.). Con frecuencia, estos estudios se han focalizado en el análisis de la producción vinculada a disciplinas particulares. No obstante, encontramos también análisis de las referencias citadas de disciplinas o instituciones concretas, como ponen de relieve Belter y Kaske (2016) en su estudio centrado en las Ciencias Atmosféricas y Oceánicas, y también análisis multidisciplinares, como el de Currie y Monroe-Gulick (2013) realizado en la University of Kansas (EE.UU.). Cabe mencionar igualmente la revisión de esta metodología realizada por Hoffmann y Doucette (2012), quienes, tras examinar 34 estudios de análisis de referencias publicados entre los años 2005 y 2010 para evaluar su transparencia y el rigor de sus metodologías, constatan que la mayoría de estas investigaciones no proporciona detalles suficientes de sus métodos y resultados como para permitir la comparación con otros trabajos o, incluso, su replicabilidad.

A pesar de que estudios como los mencionados se han convertido, especialmente en los últimos años, en una herramienta útil para evaluar el sistema de publicación científica, las limitaciones del análisis de citas son conocidas ampliamente: la extensión del contenido cubierto por las bases de datos de citas, la imposibilidad de conocer si los investigadores están citando un artículo haciendo de él una valoración positiva o negativa, y la inconsistencia de las prácticas de citación de los investigadores de diferentes disciplinas (Martin et al., 2016). Algunas de estas limitaciones han sido afrontadas recientemente. Así, por ejemplo, Yan, Chen y Li. (2020) tratan de establecer relaciones entre las citas, su condición positiva o negativa, y su impacto en la ciencia. Por otra parte, este tipo de análisis es muy complejo, exige mucho tiempo y hay mucha heterogeneidad de procedimientos para llevarlo a cabo, limitaciones que, frecuentemente, tornan difícil su replicación (White, 2019).

Uno de los aspectos más relevantes y susceptibles de evaluación a través de los estudios sobre la producción científica, es el tipo de acceso de las publicaciones. Basándose en los datos de la muestra utilizada por Laakso et al. (2011) sobre el porcentaje de artículos disponibles en Gold Open Access entre 2000 y 2009, Lewis (2012), anticipando que el Open Access (OA) era un movimiento inevitable, utilizó una extrapolación que mostraba que, en el año 2020, aproximadamente el 89,9 % de los artículos estarían en acceso abierto. Basándose exclusivamente en los datos de 2005-2009, Lewis utilizó otra curva para estimar que solamente el 43,2% de los artículos estarían en OA en 2020, pero que el 94,6 % alcanzaría ese estatus en 2025. En este sentido, Severin et al. (2018) ponen de manifiesto que el sistema de comunicación académica ha experimentado una transformación desde el acceso cerrado a la cada vez mayor aceptación del acceso abierto que ha superado desde el 2010 el 50 % del total de publicaciones. Constatan también la mayor aceptación de la vía dorada frente a la verde. Finalmente, una panorámica muy completa sobre la transformación provocada por el OA puede consultarse en Piwowar et al. (2019). Estos autores, que cuantifican la evolución del acceso abierto hasta el año 2015 empleando una muestra de 300.000 artículos, dejan constancia del paulatino incremento de las publicaciones en acceso abierto.

En el marco conceptual precedente, el objetivo final de nuestra investigación es constatar los cambios y las tendencias en los hábitos de publicación durante las dos últimas décadas, especialmente atendiendo al contexto inédito internacional marcado por la pandemia de la COVID-19 (Ruiz-Real, et al., 2020; Riccaboni y Verginer, 2022). De esta forma, nos planteamos comparar la producción científica generada por el personal docente e investigador de la Universidad de Salamanca, así como las referencias bibliográficas citadas en ella, en dos épocas, 2010-2015 y 2020-2025, de acuerdo con los datos extraídos de la base de datos Scopus. En este estudio se presenta el análisis del primer periodo, esto es, los años 2010-20151.

Si bien no resultó posible acceder a los datos exactos de este quinquenio en cuanto a número y porcentaje de docentes e investigadores vinculados a cada departamento o área de conocimiento, sí sabemos que, de acuerdo con la información facilitada por el Portal de Datos Abiertos de Castilla y León (Junta de Castilla y León, 2017), el volumen de Personal Docente e Investigador de la Universidad de Salamanca disminuyó ligeramente en estos cinco años. Así, mientras que en el año 2010 era de 2.414 trabajadores, en 2015 la cifra había descendido a 2.207. Se perdieron, en concreto, 207 docentes e investigadores que suponían el 8,57% de la plantilla.

2. Metodología

La investigación utiliza una metodología cuantitativa, con un diseño transversal que emplea la estadística descriptiva para generar y analizar los resultados. La muestra del estudio se extrajo, mediante un filtrado por la filiación institucional de los autores y la fecha de publicación, de un conjunto mayor de registros que suponía la producción científica generada entre 2010-2015 por docentes e investigadores de las universidades públicas de Castilla y León y Galicia (Burgos, León, Salamanca, Valladolid, La Coruña, Santiago y Vigo). Este conjunto se había descargado previamente desde Scopus en el marco del proyecto de investigación “Análisis del rendimiento de la inversión en revistas electrónicas a través de su impacto en la producción científica de las universidades. Los consorcios bibliotecarios” (MINECO/CSO2017-87956-R).

La muestra del estudio1 está constituida por 8.344 publicaciones, producidas entre los años 2010-2015, que tienen vinculadas un total de 308.150 referencias bibliográficas. Se aborda a través de las siguientes variables: (1) las áreas de conocimiento más productivas, en solitario y en colaboración; (2) los tipos documentales producidos con mayor frecuencia distribuidos por área de conocimiento; (3) la producción científica publicada en acceso abierto y en acceso restringido; (4) los tipos documentales empleados como referencias bibliográficas distribuidos por área de conocimiento; (5) la obsolescencia de las fuentes citadas en términos de vida media; y (6) el tipo de acceso de las referencias bibliográficas citadas.

Tanto los registros como las referencias se descargaron de forma masiva desde Scopus durante el primer semestre de 2022. Ambos datasets se volcaron en dos tablas de datos independientes: una para la producción científica de la Universidad de Salamanca tal como se extrajo de la base de datos y la otra para las referencias bibliográficas que emanan de esa producción. Para determinar la correspondencia entre una y otra, se generó un campo identificador que actúa como match, enlazando y relacionando ambas tablas.

Las áreas de conocimiento a las que se circunscriben las publicaciones estudiadas se corresponden con la clasificación predefinida por Scopus. Se han establecido así cuatro grandes áreas (Tabla 1): Ciencias de la Salud (Health Sciences), Ciencias de la Vida (Life Sciences), Ciencias Físicas (Physical Sciences) y Ciencias Sociales (Social Sciences) y un campo Multidisciplinar.

Tabla 1. Clasificación de las áreas de conocimiento en la base de datos Scopus (acrónimos entre paréntesis)


Los tipos documentales en que aparecía clasificada la producción científica son los que por defecto utiliza Scopus. Al procesar los datos, se observó que algunos de ellos no respondían a una tipología documental específica o no estaban vinculados con un área concreta de conocimiento En ambos casos, se decidió englobar estos documentos en una categoría etiquetada como “Unknown” (desconocido) debido a que su eliminación hubiera sesgado los resultados.

Para determinar el tipo documental de las referencias bibliográficas citadas se tomó como punto de partida el trabajo realizado en el mencionado proyecto “Análisis del rendimiento de la inversión en revistas electrónicas a través de su impacto en la producción científica de las universidades: los consorcios bibliotecarios” (MINECO/CSO2017-87956-R), en el que se llevó a cabo un arduo proceso de normalización sobre las referencias halladas en la producción de varias universidades de Castilla y León, entre ellas la Universidad de Salamanca, durante este periodo de tiempo (Rodríguez-Bravo, Fernández-Ramos y Travieso-Rodríguez, 2021; Fernández-Ramos, Travieso-Rodríguez y Rodríguez-Bravo, 2022; Fernández-Ramos, Rodríguez-Bravo y Diez-Diez, 2023). De ese modo, el punto de partida fue un grueso de referencias en las que el tipo documental se había distinguido en dos categorías: revistas (identificadas como “Journal”) y otros formatos (identificados con una ‘x’). El procesamiento y clasificación de estos últimos se efectuó a través de la revisión humana, empleando patrones de similitud basados en la existencia y posición de determinados elementos identificativos que formaban la referencia y que permitieron discernir un formato u otro. Así pues, se generó una clasificación de acuerdo con las tipologías que se presentan en la Tabla 2.

Tabla 2. Clasificación de las tipologías documentales identificadas en las referencias bibliográficas

Si bien la clasificación de la Tabla 2 no es exacta, es necesario señalar que la determinación del patrón de las referencias es una tarea compleja que ofrece resultados imprecisos. En función del estilo bibliográfico empleado o de la correcta descripción del recurso de información, la estructura de la referencia bibliográfica varía. La falta de normalización ha supuesto, como en cualquier estudio bibliométrico que trabaja con una cantidad tan extensa de referencias bibliográficas, un margen de error que ha de asumirse. Una vez identificados los tipos documentales, mediante el uso de aprendizaje automatizado no supervisado con el software RStudio, se crearon cadenas de textos para extraer el tipo documental de acuerdo con una determinada estructura en las referencias citadas.

Las Tablas 1 y 2 presentan además campos sobre la identificación del acceso a la publicación. En el caso de la producción científica, esta información quedó definida por defecto a partir del momento de la descarga de los registros desde la base de datos Scopus. No obstante, para determinar el acceso y el tipo de acceso de las referencias bibliográficas se optó por recurrir a Unpaywall, base de datos que recoge numeroso contenido en acceso abierto de más de 50.000 editores y repositorios. Así, las referencias bibliográficas se procesaron con el paquete Tidyverse de RStudio (versión 3.6.3). La identificación de patrones de strings, basados en la combinación de texto, números y signos de puntuación, permitió la extracción de los DOIs (siglas de Digital Object Identifier en inglés) de forma automatizada. Este procedimiento aseguraba un acierto aproximado del 97%, según los términos propuestos por Headly (2019). Una vez normalizada la lista de DOIs hallados tanto en la producción científica como en las referencias bibliográficas, se combinó el uso de RStudio con la API REST de Unpaywall (Jahn y Hobert, 2019) para recuperar los metadatos indexados por la Agencia Oficial de Registro de Identificadores de Objetos Digitales de la International DOI Foundation (Crossref).

Para la medición de la obsolescencia de las referencias bibliográficas se emplearon medidas de centralidad y dispersión aplicadas a los estudios bibliométricos. En este sentido, se aplicó la Ley de vida media o semiperiodo de Burton y Kebler (1960) con un enfoque sincrónico que “determina la edad media de las citas de un subconjunto de documentos publicados en un año determinado” (Gorbea-Portal y Atrián-Salazar, 2018: 336). El procesamiento, visualización y análisis de los resultados obtenidos se llevó a cabo con el software RStudio (versión 3.6.3).

3. Resultados

Tras el procesamiento de las 8.344 publicaciones que se corresponden con la producción científica de la Universidad de Salamanca entre 2010 y 2015, y las 308.150 referencias bibliográficas emanadas de esta producción, pueden extraerse los siguientes resultados.

3.1. Producción científica distribuida por áreas de conocimiento

La producción científica se ha explorado desde su singularidad y vinculación con una u otra área de conocimiento. En las Tablas 3a y 3b, puede observarse la frecuencia absoluta, la frecuencia relativa y la frecuencia relativa acumulada en cuanto a la contribución de la Universidad de Salamanca a cada área de conocimiento, incluyéndose además la colaboración entre áreas. Así, el área de conocimiento más productiva es, desde la singularidad, las Ciencias Físicas, que contribuyen con más de una quinta parte de la producción en general (22,68 %). Con menor porcentaje, pero dentro del bloque de mayores productores, se encuentran a continuación las Ciencias de la Salud (17,81 %). Les siguen las Ciencias Sociales (12,26 %), las Ciencias de la Vida (9,79 %) y, entre medias, se encuentra la categoría “Desconocido” (14,12 %), que como se ha explicado, comprende los documentos que no hicieron match con ninguna de las áreas en el entrecruzamiento realizado con las categorías de Scopus.

En cuanto a la colaboración científica entre áreas, destaca el primer bloque cuya frecuencia acumulada total es de 87,87 % y que lo integran las cuatro grandes áreas de conocimiento, Ciencias Físicas (22,68 %) como mayor productora, Ciencias de la Salud (17,81 %), Ciencias Sociales (12,26 %) y Ciencias de la Vida (9,79 %). Además, se encuentran los ítems vinculados a la categoría “Unknown area” (14,12 %) y las publicaciones realizadas en colaboración entre las Ciencias de la Salud y las Ciencias de la Vida (11,21%).

Un segundo bloque de medianos productores lo conforman las colaboraciones establecidas entre las áreas de conocimiento de las Ciencias de la Vida con las Ciencias Físicas (3,91 %), y las Ciencias Sociales con las Ciencias Físicas (2,8 %). Asimismo, aparecen en este grupo las Ciencias de la Vida contribuyendo con las Ciencias Físicas y las de la Salud (1,26 %), y las Ciencias de la Salud con las Ciencias Sociales (1,02 %). Finalmente, se encuentra la categoría Multidisciplinar (1,96 %), que agrupa las publicaciones de tipo multidisciplinar excluyéndose de las relaciones de afinidad entre áreas de conocimiento delineadas en este trabajo. Como pequeños o escasos productores están las restantes áreas de conocimiento con porcentajes casi nulos, todos inferiores al 0,5 % de forma individual.

3.2. Tipos documentales producidos distribuidos por área de conocimiento

Al observar los resultados obtenidos, parece que los avances constantes de la ciencia y la necesidad de publicar los resultados de investigación lo antes posible ha hecho del artículo de revista el tipo documental predominante debido al “corto” periodo de revisión, edición y comunicación que presenta frente a otros tipos documentales, como las monografías científicas.

Tabla 3a. Frecuencia relativa, frecuencia absoluta y frecuencia relativa acumulada de los tipos documentales por áreas de conocimiento individuales [Document Type (DT), Article (A), Article in press (AP), Book (B), Book chapter (BC), Conference Paper (CP), Editorial (E), Erratum (ER), Letter (L), Note (N), Review (R), Short Survey (S), Unknown Type (U), Frecuencia Relativa Acumulada (FRA) / Unknown Area (UA), Multidisciplinar (M), Health (H), Life (L), Physics (P), Social (S), Producción por áreas en combinación (CA)]


Como puede apreciarse en la Tabla 3a, la producción científica de la Universidad de Salamanca se publica mayoritariamente en forma de artículos (72,07 %). A estos les siguen las participaciones en congresos (12,16 %). En tercera instancia se encuentran las revisiones o artículos de revisión (5,71 %). En un bloque de porcentajes más cercanos en cuanto a su frecuencia y con menor significación están las cartas (2,51 %), los capítulos de libros (1,94 %), la tipología documental “desconocido” (1,74 %), los editoriales (1,73 %) y las notas (1,25 %). Finalmente sorprende la baja aportación de los investigadores a través de publicación de libros (0,14 %).

En cuanto a la distribución por áreas de conocimiento, existe una marcada correspondencia entre su productividad y la tipología documental. Así, en un análisis sobre la producción total, los artículos científicos son los más habituales en todas las ciencias, siendo notable la producción de artículos de las Ciencias Físicas (17,53 %), tanto en solitario como en contribución con otras ciencias como, por ejemplo, de acuerdo con la Tabla 3b, en combinación con las Ciencias Sociales (2,8 %) o las Ciencias de la Vida (3,46 %). Esta predominancia absoluta del artículo científico se corrobora atendiendo asimismo a los porcentajes marcados por este tipo documental cuando se analiza exclusivamente, ya no sobre el total, sino sobre los documentos producidos por cada área. En todos los casos, el artículo científico supera el 70 % de la producción.

De la misma forma, las participaciones en congresos las lideran las Ciencias Físicas (3,45 %) por detrás del “Unknown area” (8,02 %). Por su parte, las Ciencias de la Salud son las que más cartas al editor (1,87 %) y revisiones (1,44 %) publican. En el caso de estas últimas, las Ciencias Sociales (1,31 %) y las Ciencias de la Vida en conjunto con las Ciencias de la Salud (1,16%) tienen una pequeña pero visible presencia en este tipo de producción documental.

En todos los casos, se aprecia una baja presencia de libros y capítulos de libro, agrupándose en su mayoría dentro de “Unknown area” con 0,13 % y 1,86 % respectivamente. Las editoriales, erratas y notas resultan poco frecuentes en todas las áreas, al igual que las encuestas, que representan el 0,4 % del total de los documentos.

Tabla 3b. Frecuencia relativa, frecuencia absoluta y frecuencia relativa acumulada de los tipos documentales por áreas de conocimiento en combinación [Document Type (DT), Article (A), Article in press (AP), Book (B), Book chapter (BC), Conference Paper (CP), Editorial (E), Erratum (ER), Letter (L), Note (N), Review (R), Short Survey (S), Unknown Type (U), Frecuencia Relativa Acumulada (FRA) / Producción por áreas individuales (IA), Physics_Health (PH), Life_Health (LH), Life_Physics (LP), Life_Physics_Health (LPH), Life_Social (LS), Life_Social_Health (LSH), Life_Social_Physics (LSP), Life_Social_Physics_Health (LSPH), Social_Multidisciplinary (SM), Social_Health (SH), Social_Physics (SP), Social_Physics_Health (SPH)]


3.3. Producción científica en función del acceso

Como puede apreciarse en la Tabla 4, el acceso restringido domina la escena (82,5 %), frente al porcentaje considerablemente menor de publicaciones realizadas en acceso abierto (17, 5 %), que suponen menos de la quinta parte del total de publicaciones.

Tabla 4. Distribución de la producción científica en función del tipo de acceso (n=8.344)

El análisis temporal del tipo de acceso en las publicaciones de la Universidad de Salamanca entre los años 2010-2015 en Scopus muestra, sin embargo, indicios de cambio. Desde un enfoque basado en el acceso, como ya se ha visto, es mucho más lo que se publica en acceso restringido por pago que lo que se hace en abierto. Sin embargo, si se mide la frecuencia relativa con la que crecen las publicaciones de acuerdo con ambos tipos de acceso (Gráfico 1, figura B), se aprecia un incremento notorio en la tendencia de compartir los resultados de investigación en las fuentes disponibles en abierto en Scopus.

Gráfico 1. Número (figura A) y proporción (figura B) de distribución de la producción científica en función del tipo de acceso.

Así, desde el año 2010 ha habido un incremento paulatino de las publicaciones en abierto hasta el 2015 del 11,65 % y una media de crecimiento anual aproximado de 2,33 % con una desviación estándar de 1,01. Únicamente entre el año 2013 y 2014, el crecimiento fue por debajo de un punto porcentual, con un valor de 0,75 %. Mientras tanto, las publicaciones con acceso de restricción por pago han variado muy poco, con una media de crecimiento anual de 0,76 % y una desviación estándar de 0,97 %.

Entre los años 2014 y 2015 se produce, sin embargo, una relación inversa de crecimiento de la producción en abierto y con restricción. Según se aprecia en el Gráfico 1, figura A, para el primero de los casos hay un despegue relativamente importante, teniendo en cuenta que es poca la producción en abierto con respecto a la de restricción de las publicaciones (2,81 %) frente a un ligero decrecimiento (0,48 %) en cuanto al acceso restringido.

3.4. Referencias bibliográficas citadas en función de su tipología documental

El tipo documental de las fuentes referenciadas muestra que son los artículos de revistas (79 %), seguidos de referencias indefinidas (13,6 %) los de más alto porcentaje (Tabla 5).

Respecto a las referencias que no pudieron ser incluidas en un tipo documental (13,6 %), esta circunstancia obedece a las dudas generadas por la ambigüedad o la incompletitud de los datos. Algunas de estas referencias pueden ser URL (siglas de Uniform Resource Locators en inglés) de páginas web sin fecha, incompletas, caducadas o sin título. En todo caso, se trata de materiales que generan confusión en su descripción y errores de procesamiento, ya sea por los autores del documento que lo referencian o por el procesamiento propio de la automatización en el proceso de identificación y extracción del tipo de documento.

Tabla 5. Tipo documental del total de referencias bibliográficas (n = 308.150)

Los porcentajes de uso de referencias de tipos documentales que no son revistas se dividen en proporciones menores, resaltando la baja incidencia de citación de libros y capítulos de libros (4,18 %), así como de contribuciones a congresos (1,88 %).

El comportamiento en el consumo de tipo de documentos por las distintas áreas de conocimiento es similar al encontrado en los datos generales (Tablas 3a y 3b). Predomina la consulta de artículos de revistas para todas las áreas de conocimiento (Gráfico 2, figura A). Los porcentajes de uso de este tipo documental más altos lo tienen: Ciencias de la Vida (96,43 %), Ciencias de la Salud (90,90 %) y Ciencias Físicas (80,01 %). Las Ciencias Sociales se muestran atípicas (53,85 %) con relación a las anteriores, y presentan el porcentaje más alto de referencias sin identificar (Desconocido = 33,55 %). En la tercera parte de las referencias utilizadas por los investigadores de esta área de conocimiento ha sido imposible determinar de forma automatizada su tipo documental. La ausencia de datos se presenta como la principal causa para permitir la identificación de la fuente.

La nota interesante se encuentra en el elevado porcentaje de referencias cuyo tipo documental se desconoce en el área de las Ciencias Sociales (28 %). Cabría asumir que existen fuentes más complejas que dificultan su correcta identificación a los investigadores.

Los restantes tipos documentales tienen una utilización muy baja con relación a los artículos de revista como fuentes de información (Gráfico 2, figura B). Los libros y contribuciones a congresos destacan de entre las restantes referencias como fuentes de consulta para las Ciencias Físicas y las Sociales. Para las Ciencias de la Salud y de la Vida, los porcentajes de uso de fuentes alternativas a los artículos de revista ofrecen valores muy inferiores.

Con porcentajes por debajo del 2 % (Gráfico 2, figura B), las Ciencias Sociales consultan una mayor cantidad de otros recursos que las otras ciencias. Entre ellos los informes de otras investigaciones, las leyes y también tienen representación las tesis, aunque por detrás de las Ciencias Físicas.

Gráfico 2. Tipos documentales de las referencias bibliográficas por área de conocimiento

3.5. Obsolescencia de las referencias bibliográficas

En las referencias bibliográficas extraídas de la producción se encontraron un total de 11.850 ítems sin fecha declarada. En cuanto a la consulta de documentos antiguos, la máxima apunta a poco más de mil años (1006), según se aprecia en la Tabla 6. Si bien es probable que se consulten documentos históricos o fuentes primarias, como documentos de archivo, se consideró prudente no tomar en consideración estas edades, especialmente porque se trata de fuentes complejas de rastrear por el tipo de acceso debido a las características propias del material. El problema de contemplar valores extremos en la determinación de la obsolescencia de las fuentes es que distorsionan las medidas de centralidad y, como consecuencia, aumentan los valores medios de concentración de las edades de las referencias. Por esta razón, se discriminaron dichos valores, que representan el 1 % del total, para analizar el 99% restante, que aglutina los documentos que mostraban una edad comprendida de los 0 hasta los 64 años.

Tabla 6. Distribución de la obsolescencia de las referencias bibliográficas

Así pues, como puede apreciarse en el Gráfico 3, la vida media de las referencias empleadas por los investigadores de todas las áreas de conocimiento se sitúa entre 6 y 9 años, distribuidas de la siguiente forma: Ciencias de la Vida: 7, Ciencias Sociales: 9, Ciencias de la Salud: 6, y Ciencias Físicas 8. Esto significa que la mitad de las referencias empleadas en los trabajos de investigación tienen en general menos de una década de antigüedad, siendo las Ciencias de la Salud el área que consulta fuentes de información más recientes y las Ciencias Sociales el que consulta las más longevas.

Gráfico 3. Edad de las Referencias Bibliográficas distribuidas por área de conocimiento

3.6. Análisis de las referencias bibliográficas según acceso

A través de los DOI hallados en las referencias bibliográficas se identificaron un total de 37.037 referencias en la plataforma Unpaywall, constituyendo esta cifra el 12,02 % del total. Esto no significa que todas estas referencias bibliográficas estén en abierto, puesto que algunos de estos recursos permanecen cerrados durante un periodo de embargo, tal y como se aprecia en la Tabla 7, lo que provoca que disminuya la cantidad de documentos que se consultaron en abierto y que se encuentren disponibles en esta plataforma.El acceso restringido continúa dominando entre las fuentes citadas (35,84 %), seguido de las vías verde (24,20 %) y bronce (24,20 %).

Tabla 7. Referencias bibliográficas recuperadas en Unpaywall por tipo de acceso abierto

4. Discusión y conclusiones

De acuerdo con los resultados obtenidos en el procesamiento de la producción científica distribuida por áreas de conocimiento, las Ciencias Físicas y las Ciencias de la Vida tuvieron una productividad superior al resto de las áreas en el periodo 2010-2015. Por otro lado, las Ciencias de la Salud y las Ciencias Sociales se encuentran más homogéneas en este sentido. Si bien es cierto que podría exigirse más a estas dos últimas, especialmente teniendo en cuenta que la Universidad de Salamanca ha destacado tradicionalmente por el prestigio y la tradición vinculada con estas áreas de conocimiento, existen diferencias muy marcadas entre todas las ciencias relativas al momento y a la forma de presentar los resultados de investigación. Según expone Butler (2007), las prácticas de publicación difieren entre disciplinas e incluso entre subdisciplinas, planteando que las formas de medición de los resultados son más rápidas en las investigaciones cuantitativas o mixtas que en las cualitativas, por lo cual estas últimas contribuyen de forma negativa en la publicación a corto plazo.

Otro factor que afecta a las diferencias en la comunicación a corto plazo de los resultados de investigación apunta directamente a los tipos documentales más comunes en las distintas disciplinas de acuerdo con la naturaleza de sus investigaciones. Estudios realizados dentro y fuera de España coinciden en que la mayoría de las publicaciones producidas se concentran en artículos de revistas, capítulos de libros, libros y comunicaciones a congresos (Alonso Arroyo, Pulgarín y Gil-Leiva, 2006 y Laudel y Gläser, 2006). La Universidad de Salamanca concuerda en su comportamiento de producción científica en cuanto a los tipos documentales con estudios como el Alonso Arroyo, Pulgarín y Gil-Leiva (2006) donde el porcentaje de publicaciones en revistas supera el 80 % del total, como así ocurre en la muestra recogida de este estudio (94,4 %), al tiempo que la segunda tipología más relevante son las revisiones (6,48 %) desplazando a las comunicación en congresos (4,31 %) que según Galbán Ferrús et al. (1985) en su momento constituían la segunda tipología más publicada. Por otra parte, en lo que a las áreas de conocimiento atañe, es preciso destacar que las Ciencias Sociales presentan la cota más alta en cuanto a la relevancia de los congresos en los que participan sus investigadores atendiendo a las publicaciones de las memorias o actas de los mismos. Las Ciencias Físicas tienen un comportamiento similar. Esto parece indicar que los investigadores de la Universidad de Salamanca tienen una alta e importante presencia en estas dos áreas de conocimiento mostrándose como una fortaleza entre los años 2010-2015.

Con relación al acceso, en la Tabla 4, se comprueba que hasta 2015 el avance hacia un modelo de ciencia abierta ha sido lento, especialmente si se tiene en cuenta que el acceso abierto comenzó a difundirse como movimiento social en las ciencias a partir de principios de los años 2000. Dos estudios realizados por la Red de Bibliotecas Universitarias Españolas en los periodos 2014-2018 y 2016-2020 (REBIUN, 2019 y 2021, respectivamente) reflejan el desarrollo evolutivo de las publicaciones científicas de las universidades españolas. Los datos obtenidos en esta investigación concuerdan con el informe del periodo 2014-2018 en lo concerniente al grado de apertura. Existe una ligera tendencia hacia el aumento de la publicación en abierto por parte de las universidades españolas no quedando exenta la Universidad de Salamanca. Si seguimos el desarrollo progresivo del informe de REBIUN para el periodo 2016-2020, cabe esperar que la producción en acceso abierto continúe incrementándose. En este sentido, es esperable una contribución importante de la vía dorada, suponiendo un aumento en la proporcionalidad entre acceso abierto y restringido de casi el 50 %, lo que implica que la mitad de las publicaciones de la Universidad de Salamanca estén disponibles sin vías de pago. La mejora en este sentido podría alcanzar porcentajes de alrededor de un 32 % más de apertura de las publicaciones científicas para el quinquenio posterior al analizado en este estudio.

En cuanto al análisis de las referencias bibliográficas, la falta de normalización de las referencias y, en ocasiones, su inadecuada formulación, constituye una complicada barrera para la identificación de los tipos documentales y el tipo de acceso a las fuentes de información. El uso de identificadores digitales, como los DOI, permite una exploración más amplia de las referencias bibliográficas. No obstante, muchos recursos bibliográficos detectados en las citas no están digitalizados y este factor dificulta su acceso. El análisis sobre el uso de distintos tipos documentales en las referencias bibliográficas manifiesta que las fuentes de información por antonomasia son los artículos de revistas en todas las áreas de conocimiento. Razón por la cual y teniendo en cuenta la cantidad de referencias total de la producción científica (n = 308.150) se esperaba que se pudieran localizar más referencias en Unpaywall frente a las 37.037 encontradas.

En el procesamiento para identificar el año de publicación de las referencias bibliográficas se encontraron valores que generan inconsistencias para determinar la edad de las fuentes (por ejemplo, algunos datos anómalos se presentan en edades con una mínima fijada en un valor negativo) y que tuvieron que ser eliminados. Es preciso comentar que ello puede ser consecuencia de una mala práctica en la descripción de los recursos o de errores en el procesamiento de las referencias, algo sorprendente atendiendo a la exigencia de las editoriales durante los procesos de revisión y aceptación de propuestas de artículos. Además, en muchos casos, este problema se debe a la incompletitud de los datos en la descripción de la fuente recogida en la referencia bibliográfica. Finalmente, se constata que las distintas áreas de conocimiento tienen ritmos de actualización diferentes, las Ciencias de la Salud se presentan como las que más rápido actualizan sus resultados, seguidas por las Ciencias de la Vida, las Ciencias Físicas y por último las Ciencias Sociales.

Finalmente, en lo que respecta a las referencias bibliográficas según su acceso, en el inicio del estudio se esperaba una mayor cantidad de bibliografía citada que se encontrara en abierto para realizar análisis que condujeran a resultados más abarcadores. Sin embargo, se tuvo que descartar el estudio en profundidad de esta variable para evitar obtener resultados que sesguen la investigación.

De acuerdo con los resultados obtenidos, la accesibilidad que se ofrece a los recursos en abierto es todavía limitada como consecuencia de las contradicciones antagónicas del sistema de comunicación científica, cuyas políticas están marcadas por los grandes monopolios de la información. Entre las causas de este fenómeno se encuentra una deficiente configuración del sistema de evaluación de la ciencia, que demanda a los investigadores publicar en revistas de alto impacto, indexadas en las posiciones más altas de los rankings y que suelen tener una suscripción por pago. Por otro lado, el estudio expone que la Universidad de Salamanca comparte comportamientos de publicación en abierto similar a otras universidades donde se encuentra extendido el uso de los repositorios científicos dentro de la vía verde para la publicación de resultados.

Notas

1. Todos los datos utilizados y generados en esta investigación están disponibles para ser compartidos en el repositorio de acceso abierto Zenodo a través del siguiente enlace: https://zenodo.org/records/10156464

Referencias bibliográficas

Alonso Arroyo, Adolfo, Antonio Pulgarín e Isidoro Gil-Leiva. 2006. Análisis bibliométrico de la producción científica de la Universidad Politécnica de Valencia (1973-2001). En Revista Española de Documentación Científica. Vol. 29, no. 3, 345-363. <https://doi.org/10.3989/redc.2006.v29.i3.293>

Belter, Christopher W. y Neal K. Kaske. 2016. Using Bibliometrics to Demonstrate the Value of Library Journal Collections. En College & Research Libraries. Vol. 77, no. 4, 410-422. <https://doi.org/10.5860/crl.77.4.410>

Burton, R. E. y R. W. Kebler. 1960. The “half‐life” of some scientific and technical literatures. En American documentation. Vol. 11, no. 1, 18-22. <https://doi.org/10.1002/asi.5090110105>

Butler, Linda. 2007. Assessing university research: a plea for a balanced approach. En Science and public policy. Vol. 34, no. 8, 565-574. <https://doi.org/10.3152/030234207X254404>

Campanario, Juan Miguel, William Cabos y Miguel Ángel Hidalgo. 1998. El impacto de la producción científica de la Universidad de Alcalá de Henares. En Revista Española De Documentación Científica. Vol. 21, no. 4, 402-415. <https://doi.org/10.3989/redc.1998.v21.i4.361>

Chambers, George R. y James S. Healey. 1973. Journal citations in master’s Theses. One Measurement of a Journal Collection. En Journal of the American Society for Information Science. Vol. 24, no. 5, 397-401. <https://doi.org/10.1002/asi.4630240511>

Comisión Europea. 2014. HORIZON 2020 en breve. El Programa Marco de Investigación e Innovación de la UE. DDO: 10.2777/80075

Currie, Lea y Amalia Monroe-Gulick. 2013. What do our faculty use? An interdisciplinary citation analysis study. En The Journal of Academic Librarianship. Vol. 39, no. 6, 471-480. <https://doi.org/10.1016/j.acalib.2013.08.016>

Fernández-Ramos, Andrés, Críspulo Travieso-Rodríguez y Blanca Rodríguez-Bravo. 2022. Faculty Use of Subscribed Journals in a Spanish Library Consortium: Downloads and Citations in the Field of Psychology. En Serials Review. Vol. 48, no. 1-2, 121-136. <https://doi.org/10.1080/00987913.2022.2066966>

Fernández-Ramos, Andrés, Blanca Rodríguez-Bravo y Ángela Diez-Diez. 2023. Use of scientific journals in Spanish universities: analysis of the relationship between citations and downloads in two university library consortia. En Scientometrics. Vol. 128, 2489-2505. <https://doi.org/10.1007/s11192-023-04670-0>

Ferreras Fernández, Tránsito. 2016. Visibilidad e impacto de la literatura gris científica en repositorios institucionales de acceso abierto. Estudio de caso bibliométrico del repositorio Gredos de la Universidad de Salamanca. Salamanca: Universidad de Salamanca. Tesis de doctorado.

Galbán Ferrús, Carmen, Manuela Vázquez Valero, Rosa de la Viesca y Javier Lagüens. 1985. La producción científica de Salamanca 1980-1983. En Revista Española de Documentación Científica. Vol. 8, no. 4, 321-348.

Gorbea-Portal, Salvador y Magda Luz Atrián-Salazar. 2018. Medición de la obsolescencia de la información en revistas de salud pública de México. En Gaceta médica de México. Vol. 154, no. 3, 335-341. <https://www.anmm.org.mx/GMM/2018/n3/GMM_154_3_335-341.pdf> [Consulta: 11 noviembre 2023].

Headly, Charlie Joey. 2019. One weird regex matches 97% of DOI. Find youR way. <https://www.findingyourway.io/blog/2019/03/13/2019-03-13_extracting-doi-from-text/> [Consulta: 11 noviembre 2023].

Hood, William W. y Concepción S. Wilson. 2003. Informetric studies using databases: Opportunities and challenges. En Scientometrics. Vol. 5, no. 3, 587-608. <https://doi.org/10.1023/B:SCIE.0000006882.47115.c6>

Hoffmann, Kristin y Lise Doucette. 2012. A Review of citation Analysis Methodologies for Collection Management. En College & Research Libraries. Vol. 73, no. 4, 321-335. <https://doi.org/10.5860/crl-254>

Jahn, Najko y Anne Hobert. 2019. Open access evidence in Unpaywall. Scholarly Communication Analytics with R. <https://subugoe.github.io/scholcomm_analytics/posts/unpaywall_evidence/> [Consulta: 20 octubre 2023].

Junta de Castilla y León, Portal de Datos Abiertos de Castilla y León. 2017. Evolución del PDI y PAS en las Universidades Públicas. <https://datosabiertos.jcyl.es/web/jcyl/set/es/educacion/pdi-pas/1284771928013> [Consulta: 20 octubre 2023].

Laakso, Mikael, Patrik Welling, Helena Bukvova, Linus Nyman, Bo Christer Björk y Turid Hedlund. 2011. The development of Open Access Journal publishing from 1993 to 2009. En PLoS ONE. Vol. 6, no. 6, e20961. <https://doi.org/10.1371/journal.pone.0020961>

Laudel, Grit y Jochen Gläser. 2006. Tensions between evaluations and communication practices. En Journal of Higher Education Policy and Management. Vol. 28, no. 3, 289-295. <https://doi.org/10.1080/13600800600980130>

Lewis, David W. 2012. The Inevitability of Open Access. En College & Research Libraries. Vol. 73, no. 5, 501-502. <https://doi.org/10.5860/crl-299>

Martin, Virginia, Teddy Gray, Megan Kilb y Tessa Minchew. 2016. Analyzing Consortial “Big Deals” via a Cost-Per-Cited-Reference (CPCR) Metric. En Serials Review. Vol. 42, no. 4, 293-305. <https://doi.org/10.1080/00987913.2016.1248218>

Maz-Machado, Alexander, Manuel Torralbo-Rodríguez, Mónica Vallejo-Ruiz y Rafael Bracho-López. 2010. Análisis bibliométrico de la producción científica de la Universidad de Málaga en el Social Science Citation Index (1998-2007). En Revista Española de Documentación Científica. Vol. 33, no. 4, 582-599. <https://doi.org/10.3989/redc>

Moed, Henk F., Renger E. de Bruin y Thed N. Van Leeuwen. 1995. New bibliometric tools for the assessment of national research performance: Database description, overview of indicators and first applications. En Scientometrics. Vol. 33, no. 3, 381-422. <https://doi.org/10.1007/BF02017338>

Piwowar, Heather, Jason Priem, Vincent Larivière, Juan Pablo Alperin, Lisa Mattias, Bree Norlander, Ashley Farley, Jevin West y Stefanie Haustein. 2019. The state of OA: a large-scale analysis of the prevalence and impact of Open Access articles. En Scholarly Research and Information. Vol. 2, no. 4, 228-247. <https://doi.org/10.24108/2658-3143-2019-2-4-228-247>

REBIUN. Grupo de Acceso abierto. 2019. Medición del Acceso Abierto en las universidades españolas y el CSIC (2014-2018). En Estudios e informes Rebiun, línea 2. <https://repositoriorebiun.org/handle/20.500.11967/354>. [Consulta: 11 noviembre 2023].

REBIUN. Grupo de Acceso abierto. 2021. Medición del Acceso Abierto en las universidades españolas y el CSIC (2016-2020). En Estudios e informes Rebiun, línea 2. <https://repositoriorebiun.org/handle/20.500.11967/858>. [Consulta: 11 noviembre 2023].

Riccaboni, Massimo y Luca Verginer. 2022. The impact of the COVID-19 pandemic on scientific research in the life sciences. En PLoS ONE. Vol. 17, no. 2, e0263001. <https://doi.org/10.1371/journal.pone.0263001>

Rodríguez-Bravo, Blanca, Andrés Fernández-Ramos y Críspulo Travieso-Rodríguez. 2021. Relación entre descargas y citas de revistas científicas en el ámbito de la documentación: el caso de las universidades públicas de Castilla y León. En Revista Española de Documentación Científica. Vol. 44, no. 4, e307. <https://doi.org/10.3989/redc.2021.3.1806>

RStudio Team. 2023. RStudio: Integrated Development Environment for R. Boston, MA.: Posit. <http://www.rstudio.com/> [Consulta: 11 noviembre 2023].

Ruiz-Real, José Luis, Bruno José Nievas-Soriano y Juan Uribe-Toril. 2020. Has Covid-19 Gone Viral? An Overview of Research by Subject Area. En Health Education & Behavior. Vol. 47, no. 6, 861-869. <https://doi.org/doi:10.1177/1090198120958368>

Salisbury, Lutishoor, y Jeremy S. Smith. 2010. The use of Web of Knowledge to study publishing and citation use for local researchers at the campus level. En Collection Management.https://doi.org/10.1080/01462671003597959> Vol. 35, no. 2, 69-82. <

Severin, Anna, Matthias Egger, Martin Paul Eve y Daniel Hürlimann. 2018. Discipline-specific open access publishing practices and barriers to change: an evidence-based review. En F1000research. Vol. 7, no. 1925. <https://doi.org/10.12688/f1000research.17328.2>

Villagrá Rubio, Ángel. 1992. Scientific production of Spanish universities in the fields of social sciences and language. En Scientometrics. Vol. 24, no. 1, 3-19. <https://doi.org/10.1007/BF02026470>

White, Philip B. 2019. Using Data Mining for Citation Analysis. En College & Research Libraries. Vol. 80, no. 1, 76-93. <https://doi.org/10.5860/crl.80.1.76>

Wilson, Concepción. S. y Carol Tenopir. 2008. Local citation analysis, publishing, and reading patterns: using multiple methods to evaluate faculty use of an academic library’s research collection. En Journal of the American Society for Information Science and Technology. Vol. 59, no. 9, 1393-1408. <https://doi.org/10.1002/asi.20812>

Yan, Erjia, Zheng Chen y Kai Li. 2020. The relationship between journal citation impact and citation sentiment: A study of 32 million citances in PubMed Central. En Quantitative Science Studies. Vol. 1, no. 2, 664-674. <https://doi.org/10.1162/qss_a_00040>

Datos de Investigación

Medina González, Alejandro, Carlos Díaz-Redondo, Blanca Rodríguez-Bravo y José A.Frías. 2024. Análisis de la producción científica de la Universidad de Salamanca indexada en SCOPUS (2010-2015). Zenodo. <https://zenodo.org/records/10156464>