CiteSeer

CiteSeer fue un motor de búsqueda público y biblioteca digital de textos científicos y académicos, principalmente en el campo de la informática, que fue reemplazado por CiteSeer X. muchos lo consideran como el primer motor de búsqueda de textos académicos. Se hizo público en 1998 y tenía muchas funciones nuevas que en ese momento no estaban disponibles en los motores de búsqueda académicos, en relación con la indización, la investigación, las estadísticas y los vínculos entre diversos documentos y citas relacionadas. A menudo se considera el primer sistema automatizado de indexación de citas, predecesor de las herramientas de búsqueda académica como Google Scholar y Microsoft Academic Search. Los motores y archivos CiteSeer generalmente solo recopilan documentos de sitios web disponibles al público y no rastrean los sitios web de los editores. En consecuencia, los autores cuyos documentos están disponibles gratuitamente son más propensos a aparecer en el índice. El objetivo de CiteSeer era mejorar la difusión y el acceso a la literatura académica y científica. Al ser un servicio sin fines de lucro de libre uso para cualquier persona, ha sido considerado parte del movimiento a favor del libre acceso (acceso abierto) que está tratando de cambiar el mundo de las publicaciones académicas y científicas para promover un mayor acceso a la literatura científica. CiteSeer proporcionó a la iniciativa archivos abiertos metadatos gratuitos para todos los documentos indexados y vinculó los documentos indexados siempre que fue posible a otras fuentes de metadatos, como DBLP y el portal ACM. CiteSeer X, que ha recogido el legado de CiteSeer, continúa este trabajo y, con el fin de promover formatos digitales abiertos, comparte sus datos con otros investigadores a través de una licencia Creative Commons. El nombre CiteSeer se basa en un doble juego de palabras: por un lado suena como sightseer, es decir, un turista que mira las vistas; por otro lado cite seer es un investigador que mira los textos citados o incluso un "vidente" de las citas.

CiteSeer fue creado por los investigadores Lee Giles, Kurt Bollacker y Steve Lawrence en 1997 en el Instituto de investigación NEC (ahora NEC Labs) en Princeton, Nueva Jersey. El propósito de CiteSeer era tamizar activamente y recopilar documentos académicos y científicos en la red y utilizar la indexación Autónoma de citas para permitir consultas por cita o por documento, ordenándolas de acuerdo con el "impacto" de las citas en sí. Durante un tiempo, el sistema se llamó ResearchIndex. Después del NEC, en 2004 fue alojado en Internet como CiteSeer. IST en la Facultad de Ciencias de la información y Tecnología de la Universidad Estatal de Pensilvania, alcanzando un total de más de 700. 000 documentos. Versiones similares del motor de búsqueda fueron alojadas por otras universidades en los Estados Unidos y en el extranjero para permitir un acceso más amplio. Sin embargo, CiteSeer reveló una serie de limitaciones, tanto en términos de la precisión de los resultados de la investigación sobre los autores y sus documentos (inferior a la de otros sistemas como Google Scholar), como en términos de los altos costos de mantenimiento del sistema. Por estas razones, a partir de 2005 CiteSeer ya no se actualizó, volviéndose cada vez más limitado, hasta que en 2008 se instaló un nuevo sistema, CiteSeerX. CiteSeer x reemplazó a CiteSeer y todas las consultas realizadas anteriormente en CiteSeer fueron redirigidas a él. Al igual que su predecesor, CiteSeer X es también un motor de búsqueda público y una biblioteca digital, así como un repertorio de textos académicos y científicos dedicados principalmente a la informática. Publicado en 2008, es una evolución de CiteSeer y se basa en un nuevo "código abierto" o arquitectura de código abierto, SeerSuite, y nuevos algoritmos más potentes. Desarrollado por Isaac Council y C. Lee Giles en la Facultad de Ciencias de la información y Tecnología de la Universidad Estatal de Pensilvania, continúa persiguiendo los mismos objetivos CiteSeer para tamizar y recopilar documentos académicos y científicos en la red pública, proporcionando para indexarlos de acuerdo con las citas y clasificarlos en función del impacto de las citas en sí. Recientemente, se ha agregado una función de búsqueda de tablas. El proyecto fue financiado por la National Science Foundation, la NASA y Microsoft Research. CiteSeerX sigue siendo calificado como uno de los mejores repertorios del mundo e incluso ocupó el primer lugar en julio de 2010. Actualmente cuenta con más de 2 millones de documentos con casi 2 millones de autores exclusivos y 40 millones de citas. CiteSeerX también comparte software, datos, bases de datos y metadatos con otros investigadores, que actualmente utilizan Amazon S3 y rsync. Su nueva arquitectura modular de "código abierto" y software (disponible en SourceForge) están construidos sobre Apache Solr y otras herramientas Apache y de código abierto, lo que le permite actuar como un caso de prueba para nuevos algoritmos de recopilación de documentos, clasificación, indexación y extracción de información.

El modelo CiteSeer había sido adoptado para trabajos académicos con fines comerciales con SmealSearch y comercio electrónico con eBizSearch, pero los proyectos fueron abandonados por la desconexión de los patrocinadores. Otros sistemas de investigación y repertorio similares a Seer se han realizado para química (Chem X Seer) y Arqueología (ArchSeer), así como para la búsqueda de archivos de robots. txt (BotSeer). Todos estos sistemas se basan en la herramienta de código abierto seersuite, que utiliza el Lucene indexer.

Sitios

Buscador

Archivo digital

Base

Base de datos (revista)

Database: The Journal of Biological Databases and Curation (ISO 4 : Database) es una revista científica en inglés publicada por Oxford University Press, que pub...

Softonic

Softonic es un sitio web de origen español que recoge información y permite descargar software para diferentes sistemas operativos. La compañía fue fundada a pr...

Revistas de biología

Esta página se basa en el artículo de Wikipedia: Fuente, Autores, Licencia Creative Commons Reconocimiento-CompartirIgual.
This page is based on the Wikipedia article: Source, Authors, Creative Commons Attribution-ShareAlike License.
contactos
Política de privacidad , Descargos de responsabilidad