Etiquetado social y blog-scraping como alternativa para la actualización de vocabularios controlados: aplicación práctica a un tesauro de Biblioteconomía y Documentación

Gonzalo Mochón Bezares, Eva Méndez Rodríguez, Ángela Sorli Rojo

Resumen


El objetivo de este artículo es comparar las etiquetas en lenguaje libre, tomadas en nuestro caso de blogs especializados en ciencias de la información (information sciences), frente al lenguaje controlado no estructurado de las listas de palabras clave, con el fin de comprobar cuál de estos dos es una mejor fuente de nueva terminología para el Tesauro de Biblioteconomía y Documentación. Para ello, se extrajeron las etiquetas de autor de 127 blogs sobre biblioteconomía y documentación mediante técnicas de web scraping, y se compararon con los listados de descriptores e identificadores de la base de datos ISOC Biblioteconomía y Documentación (ISOC-BD). El análisis de las etiquetas de autor de blogs ha aportado 186 nuevos términos, mientras que los listados de la base de datos han proporcionado 130términos. Se concluye que las etiquetas en lenguaje libre pueden ser una mejor y más rápida vía de aporte de nueva terminología a los vocabularios controlados que los listados de lenguaje controlado no estructurado.

Palabras clave


Etiquetado social; Mantenimiento de tesauros; Blogs; Biblioteconomía y Documentación; Extracción terminológica

Texto completo:

PDF HTML

Referencias


Abadal, Ernest; A. Estivill; J. Franganillo; J. Gascón y J. M. Rodríguez Gairín. 2005. L’accés multilingüe per matèries a articles de revista. En La dimensión humana de la organización del conocimiento. Congreso del capítulo español de ISKO (5: 2005: Barcelona). Barcelona: Universidad de Barcelona. p. 33-50.

Alonso Soriano, Luis. 2013. Etiquetado social como fuente terminológica para el mantenimiento de vocabularios: Análisis aplicado al Tesauro de Biblioteconomía y Documentación del CINDOC. TFM presentado en el Máster Universitario en Bibliotecas y Servicios de Información Digital. Universidad Carlos III. MS. 70 p.

Araujo, Lourdes y J. R. Pérez-Agüera. 2006. Enriching thesauri with hierarchical relationships by pattern matching in dictionaries. En FinTAL: International Conference on Natural Language Processing. (5th: 2006: Turku). p. 268-279. [Consulta: 19 Junio 2017].

Arnold, Patrick y E. Rahm. 2014. Extracting Semantic Concept Relations from Wikipedia. En WIMS’14. Proceedings of the International Conference on Web Intelligence, Mining and Semantics. (4th: 2014: Thessaloniki). [Consulta: 19 Junio 2017].

Cording, Patrick Hagge. 2011. Algorithms for Web Scraping. Lyngby: Technical University of Denmark. [Consulta: 14 Junio 2017].

García-Silva, Andrés; O. Corcho; H. Alani y A. Gómez-Pérez. 2012. Review of the state of the art: Discovering and Associating Semantics to Tags in Folksonomies. En The Knowledge Engineering Review. Vol. 27, no. 1, 57-85. [Consulta: 19 Junio 2017].

International Standard Office (ISO). 1986. ISO 2788:1986. Guidelines for the establishment and development of monolingual thesauri. Ginebra: International Standard Office.

International Standard Office (ISO). 2011. ISO 25964-1:2011. Thesauri and interoperability with other vocabularies. Part 1: Thesauri for information retrieval. Ginebra: International Standard Office.

Limpens, Freddy; F. Gandon y M. Buffa. 2009. Linking Folksonomies and Ontologies for Supporting Knowledge Sharing: a State of the Art. [Consulta: 14 Junio 2017].

Masó-Marema, Gemma y M. Sebastià-Salat. 2013. The integration of folksonomies within a thesaurus in a social science Web portal: SIDBRINT. En Information research. Vol. 18, no. 3. [Consulta: 19 Junio 2017].

Mochón Bezares, Gonzalo y A. Sorli Rojo. 2002. Tesauro de biblioteconomía y documentación. Madrid: Consejo Superior de Investigaciones Científicas.

Rodríguez Yunta, Luis. 2009. Etiquetado libre frente a lenguajes documentales. Aportaciones en el ámbito de biblioteconomía y documentación. En Nuevas perspectivas para la difusión y organización del conocimiento. Congreso ISKO-España. (9: 2009: Valencia). Valencia: Universidad Politécnica. p. 832-845. [Consulta: 19 Junio 2017].

Vállez, María; R. Pedraja-Jiménez; L. Codina; S. Blanco y C. Rovira. 2015. Updating controlled vocabularies by analysing query logs. En Online Information Review. Vol. 39, no. 7, 870-884.

Vera Baceta, Miguel Ángel. 2013. Aproximación a la BIBLOGSFERA española: Composición, autoría, estructura, contenidos y definición. Trabajo académico presentado en la Universidad de Murcia. MS. 80 p. [Consulta: 19 Junio 2017].

Vera Baceta, Miguel Ángel. 2015. Biblogsfera: Comunidad de Blogs relacionados con la Biblioteconomía y la Documentación. [Consulta: 19 Junio 2017].

Wang, Jin. 2006. Automatic thesaurus development: Term extraction from title metadata. En Journal of the American Society for Information Society and Technology. Vol. 57, no. 7, 907-920.




DOI: http://dx.doi.org/10.34096%2Fics.i37.3652

Enlaces refback

  • No hay ningún enlace refback.


Licencia Creative Commons
Esta obra está bajo una Licencia Creative Commons Atribución-CompartirIgual 4.0 Internacional.

Información, cultura y sociedad | ISSN (impreso) 1514-8327 | ISSN (en línea) 1851-1740
Instituto de Investigaciones Bibliotecológicas - Filo:UBA
inibi@filo.uba.arics@filo.uba.ar | INIBI 


Bases e índices de datos internacionales
SCOPUS - SciELO Argentina - RedALyCAmeliCaDirectory of Open Access Journals (DOAJ) - Hispanic American Peridodicals Index (HAPI) - DIALNET - REDIB - INFOBILA - Library & Information Science Source (EBSCO) - Library, Information Science & Technology Abstracts (LISTA-EBSCO) - Library Literature Information Science Full text  H.W. Wilson (EBSCO) - Academic Search Ultimate (EBSCO) - Fuente Académica Premier (EBSCO) - Fuente Académica Plus (EBSCO) - Fuente Académica (EBSCO) - Informe Académico (Gale-Cengage) - Academic OneFile (Gale-Cengage) - Base de Publicaciones de FILO:UBA -

Directorios
Ulrich’s periodicals directory  - Directory of Open Access Journals (DOAJ)   - Latin-REV - Red Latinoamericana de Revistas Académicas en Ciencias Sociales y HumanidadesLatindex Catálogo (Categoría 1)

Repositorios
Repositorio Digital Institucional (RDI-UBA)  - E-LIS  

Plataformas de evaluación de revistas
ERIHplus - MIAR - Directory of Open Access Journals (DOAJ) - SciELO Argentina - RedALyC - Latindex Catálogo (Categoría 1)