Al unir los fundamentos teóricos de la minería de datos y textos, el descubrimiento de
conocimiento en bases de datos (BD) y la bioinformática con los conceptos
bibliométricos, se ha incursionado en el estudio de las bases de datos biológicas no
bibliográficas. La Bibliometría, como disciplina que asume como su materia prima a la
información, es una herramienta válida para estudiar el contenido de casi cualquier base
de datos. Esto es posible porque se apoya para los análisis en fórmulas matemáticas y
estadísticas (Algoritmos) que le permiten relacionar partes de un conjunto enorme de
datos y llegar a un nuevo conocimiento. A ello se le suma que bases de datos como el
GenBank, BD Structure y la BD Taxonomy (todas producidas por el National Center for
Biotechnology Information, NCBI). Estas BD están estructuradas por campos específicos
como palabras claves, autores de las proteínas, referencias a los artículos o los artículos
en Medline que la citan, etc. En este estudio se aplicaron los indicadores bibliométricos
en el análisis de las proteínas que componen el genoma del mycobacterium tuberculosis
específicamente las vinculadas a las proteínas de la membrana externa, se utilizaron los
indicadores de co-ocurrencia de palabras y los indicadores de frecuencia. Se vincularon
los resultados de las bases de datos entrezProteins a la base de datos bibliográfica
MedLine.