Bienavenidos


BIENVENIDOS, Este espacio está dirigido a todos aquellos profesionales de Sistemas de Información, Archivistas, Bibliotecólogos, Administradores de contenido y en general profesionales afines con recuperación de informacion, sistemas de recuperación de informacion, búsquedas y recuperación de información, metadatos y posicionamiento web.


sábado, 14 de mayo de 2011

Instalación de Google Desktop

Ubique el Google Desktop, elija la opción descarga de Google Desktop

De clic en la opción instalar Google Desktop
Al dar clic en la opción instalar Google Destkop aparece una nueva pantalla con un letrero que dice: “Gracias por descargar Google Destkop. La descarga se iniciara automáticamente si no es así "haz clic para comenzar"

Dar clic en comenzar, aparece un cuadro de dialogo con una advertencia de seguridad para descargar los archivos y pregunta ¿desea ejecutar o guardar este archivo? Dentro de las opciones que aparece esta, ejecutar, guardar o cancelar. Se escoge la opción guardar.

Al momento de escoger la opción guardar, abre una nueva ventana de guardar como (el archivo dentro del PC) escoge la opción donde desea guardarlo y da clic en guardar

Vaya a donde ubico su archivo,  de doble clic sobre el icono de Google Desktop, aparece un recuadro que pregunta ¿desea ejecutar este archivo? Escoja la opción ejecutar.
De inmediato aparece una ventana que indica que Google Desktop se está instalando

De inmediato aparece una nueva ventana de funciones de Google Desktop donde da la bienvenida y muestra las condiciones de servicio de Google. Escoge la opción acepto.
Después de dar aceptar aparece la misma ventana de funciones, en esta oportunidad muestra diferentes opciones de donde quiere que Google Desktop busque la información en el PC. Para este ejercicio se escoge Búsqueda por nombre de archivo (buscar archivos por nombre  y ejecutar aplicaciones). Y dar clic en finalizar
Para comprobar que Google Desktop ya está instalado en su equipo, oprima dos veces la tecla Ctrl y de inmediato aparece una barra de búsqueda de Google, la cual puede ocultar de la misma forma como lo activo.
Para configurar el tipo de búsqueda que se desea, de click derecho en el icono que aparece en la barra inferior de su equipo y de clic en opción es
Al dar clic sobre opciones, de inmediato abra una página de internet que muestra las preferencias que puede seleccionar sobre el Google Desktop. Se seleccionaron en los tipos de búsqueda; Archivos de textos y formatos, PDF, Archivos (ZIP)
En buscar ubicaciones se selecciono la opción Indexar carpetas de red de unidades adicionales. Todas las unidades fijas se indexan en forma predeterminada. De clic en Añadir la unidad o carpeta que desea incluir en la búsqueda. Al dar clic, despliega una ventana de buscar carpetas, escoge la (as) carpeta en que desea que Google Desktop haga la búsqueda y le aceptar
Después de haber seleccionado el archivo donde quiere hacer la búsqueda, escoge la opción guardar referencias ubicada en la parte superior de la página. Posteriormente aparece una anuncio Se han guardado tus opciones. Regresa a la página anterio

lunes, 2 de mayo de 2011

Metabuscador Puerto Rico

Loading

domingo, 1 de mayo de 2011

METADATA EXTRACTION TOOL

Metadata Extractión Tool es una de las posibilidades que se que se encuentra en el medio tecnológico para la gestión de archivos virtuales.
La herramienta de extracción de metadatos fue desarrollada por la Biblioteca Nacional de Nueva Zelanda[1] para la función de extraer metadatos (que cumplirán con la función de preservación) en una serie de formatos de archivo como documentos PDF, archivos de imágenes, archivos de sonido documentos de Microsoft Office, y muchos otros.


Los objetivos del software consisten en[2]
  • Extraer automáticamente metadatos para la preservación de archivos digitales
  • Dar salida de los metadatos en un formato estándar (XML) para su uso en actividades de conservación y de recuperación de información.


La función de recuperación de información a través de la web se da en especial cuando se consulta información en bibliotecas virtuales.

Esta herramienta de extracción de metadatos contiene una serie de adaptadores los cuales reconocen y extraen los metadatos desde los archivos donde se encuentran contenidos los documentos. Dentro de los formatos actualmente previstos esta:

  • Imágenes: BMP, GIF, JPEG y TIFF.
  • Documentos de Office: Microsoft Word (versión 2, 6), Word Perfect, Open Office (versión 1), MS Works, MS Excel, MS PowerPoint y PDF.
  • Audio y vídeo: WAV, MP3 (normal y con ID3Tags), BFW, FLAC.
  • Lenguajes de marcado: HTML y XML.
  • Archivos de Internet: ARC

Lo adaptadores analizan la fuente binaria de los diferentes formatos de archivo los cuales pasan por una prueba de concepto donde se analiza la estabilidad o variabilidad del código fuente, por ejemplo: el formato TIFF se mantiene en el tiempo, caso contrario de los formatos manejados por  Microsoft Word, que si han tenido diferentes ajustes por lo que su código fuente no es el mismo.

Lo anterior es verificado con el fin de medir la viabilidad de interpretación de los diferentes formatos que puede contener la unidad de información a través de una prueba de concepto (COP[3]) lo que determinara finalmente su utilidad en el momento de abrir y leer archivos. El COP ha encontrado viabilidad en los formatos  anteriormente mencionados.

Cuando no es posible reconocer algunos de los formatos, la herramienta  aplica un adaptador genérico el cual extrae los datos base sobre el formato (como el tamaño, nombre de archivo y fecha de creación).  Se utiliza también la función DataAdapter[4] que tiene como función actuar junto con Dataset y el origen donde se encuentra la información, para recuperar y almacenar  los datos.

A continuación el diagrama de su funcionamiento:



[5]Ilustración No. 1  Funcionamiento de la Herramienta

La aplicación abre todos los archivos como de sólo lectura, asegurando la integridad de los archivos originales. La herramienta lee la información de encabezado, por lo que el proceso de extracción es rápido.

REQUERIMIENTOS DEL SOFTWARE
Hardware

A nivel de procesador, memoria RAM, espacio en disco duro no hay limitaciones conocidas; no requiere un hardware con condiciones específicas de capacidad, puede afirmarse que es una herramienta que funcionaria en cualquier PC.

Software

La herramienta tiene tanto una interfaz de Microsoft Windows como una interfaz de línea de comandos de UNIX que permite trabajar para ser automatizado a través del procesamiento por lotes o procesados ​​de forma individual según las necesidades.  La herramienta de extracción de metadatos utiliza una combinación de Java y XML; puede ser utilizado a través de la interfaz gráfica de usuario, en la línea de comandos o incorporado a otros programas según sea necesario

La interfaz gráfica de usuario  está gestionada a través de JAVA Swing,  el cual es un tipo de programa que da otra posibilidad de interfaz[6].

LICENCIAMIENTO

Es de Desarrollo de Código Abierto y se distribuye como software libre bajo la Licencia Pública Apache (versión 2). 

Desarrollada inicialmente en 2003 y lanzado como software de código abierto en 2007, la versión actual se puede descargar desde la página de descarga de SourceForge o directamente desde la página de la Biblioteca Nacional de Nueva Zelanda.


Sin duda el uso de herramientas para la extracción de metadatos representa una utilidad importante puesto que no contar con datos estructurados genera obsolescencia en las fuentes que contiene información como por ejemplo en las Bibliotecas tanto para la consulta de sus contenidos físicos como electrónicos. Hoy en día la creación de servicios digitales y el alojamiento de información en estos medios hace que se centre la importancia en crear herramientas y estandarizar los términos que ayuden a recuperar la información y hacerla útil; los metadatos se orientan bajo el sentido de recuperación de información y como forma de preservación de la información digital.

Con esto, se considera de importancia relevante todo lo que gire en torno a la gestión de metadatos, puesto que la inmediatez lleva a generar medios para crearlos, hacerlos accesibles en el mundo digital pero poco se trata  la forma de preservarlos a largo plazo; con la ayuda de estándares y herramientas se logran resultados como el que ofrece la Biblioteca Nacional de Nueva Zelanda.

Sin duda la gestión constante de metadatos transforma y ajusta las herramientas a las necesidades del entorno donde son creados y continuaran en constante progreso puesto que el entorno digital conlleva a que la dinámica sea un constante cambio.


[1] National Library of New Zealand. Metadata Extraction Tool. [en línea] http://www.natlib.govt.nz/services/get-advice/digital-libraries/metadata-extraction-tool [consultado: 30/04/11].
[2] National Library of New Zealand. Metadata Extraction Tool Open source release information [en línea] http://meta-extractor.sourceforge.net/meta-extractor-info-sheet.pdf [consultado: 30/04/11].
[3] National Library of New Zealand. Metadata Extraction Tool Software Architecture, version 3.5. [en línea] http://meta-extractor.sourceforge.net/meta-extractor-software-architecture-v3.pdf . [consultado: 30/04/11]
[4] MSDN LIBRARY MICROSOFT. DataAdapter (Clase). [en línea] http://msdn.microsoft.com/es-es/library/system.data.common.dataadapter%28v=vs.80%29.aspx [consultado: 30/04/11]
[5] National Library of New Zealand. Metadata Extraction Tool Software Architecture. [en línea] http://meta-extractor.sourceforge.net/meta-extractor-software-architecture-v3.pdf [Consultado: 01/05/11]
[6] Ingeniería informática, Departamento de Informática, Universidad de valencia.  Prácticas de lenguajes de programación (Java). [en línea]  http://informatica.uv.es/iiguia/LP/laboratorio/P3/p3.pdf [consultado: 09/04/11]

sábado, 30 de abril de 2011

Google Docs

Es un procesador de texto en línea que permite crear, documentos en Word, ppt, Excel, su funcionamiento opera de la misma forma que una aplicación ofimática tradicional, por ello

Permite:
  • Crear y corregir documentos
  • Insertar imágenes, tablas, funciones matemáticas
  • Utilizar plantillas
  • Creación colaborativa de documentos con otros usuarios
  • Publicar documentos por internet
  • Ser ejecutado a través de un navegador web (Google Chrome, Safari 3 y 4, Internet Explorer 7 y 8, Firefox 3.0)[1]
 El requisito para acceder a Google Docs es ser usuario registrado. En este caso el medio de acceso es por la cuenta de correo de Gmail, registrando el nombre de usuario y contraseña.

Al ingresar al correo, se da clic sobre el link de Docs, por consiguiente: (1) de inmediato abre una nueva ventana y muestra la pantalla de inicio de Google Docs (2) la cual me permite ver mis documentos recientes y trabajar sobre ellos  y (3) crear nuevos, o subir documentos ya creados.

 
[1] Google Docs. Familiarización con Google Docs: Requisitos del sistema. [en línea], [consultado: 27/04/11]. Disponible en: http://docs.google.com/support/bin/answer.py?answer=37560 


Para crear un nuevo documento[2], se selecciona el menú nuevo (4) el cual despliega unas opciones; documentos (similar a Word), presentación (similar Power Point), Hoja de cálculo (similar Excel), Formulario, dibujo, colección y una opción de plantillas, donde hay una gama de variedad que permite escoger según necesidad.
Se accede a la pantalla de edición del tipo de documentos seleccionado mostrándolo en blanco (5).


Los documentos se van guardando automáticamente o se puede dar clic en guardar ahora (6). Google Docs permite revisar las diferentes modificaciones que cada colaborador le ha hecho a los documentos, así como también las versiones (el historial está agrupada por periodo de tiempo y por autor) que han producido del mismo. Aunque en algunos casos en las hojas de cálculo, cuando el documento es muy grande se eliminan algunas revisiones.


Para compartir con personas o colaboradores
Selecciona el documento a compartir, despliega la opción acciones, de donde se escoge compartir (hay varias opciones), nuevamente le despliega otra lista, para este caso se escoge la opción enviar correo electrónico a editores/lectores. Abre una venta que pide el correo con quien se va a compartir el documento, un asunto y un mensaje, después de haber llenado estos campos da clic en enviar.
De esta forma otras personas pueden hacer modificaciones paralelas del mismo documento, sin generar duplicidad documental o múltiples versiones de uno y otro documento.



[2]  YouTube. Curso de Google Docs. Aula Clic [en línea], [consultado: 27/04/11]. Disponible en: http://www.youtube.com/watch?v=6T3rcEjemRA&feature=player_embedded#at=74


viernes, 29 de abril de 2011

Memoria de clase Abril de 2011

En este espacio de clase se socializaron temas relacionados con los resultados evidenciados por el profesor en el desarrollo de la primera tutoría Análisis de Colecciones y se nos invitó a rescatar las mejores prácticas que cada grupo desarrollo en su ejercicio para compartirlas en el Moodle a fin de tener una herramienta práctica para comprender todo lo que implica el análisis de una colección en cualquier unidad de información.

Recuperación de información sobre imagenes o fotografias en Internet

El proceso que queremos describir a continuación surgió como resultado de un Mini estudio de Caso expuesto por nuestro profesor Laureano Felipe de la siguiente manera:

  • Quiero saber cómo hago para buscar en algún sitio de Internet y saber a qué lugar corresponde esta fotografía.
  • Deben documentar todo el proceso realizado para lograr esta hazaña.
Resultado de la Búsqueda:
Como resultado de la búsqueda se encontró que esta foto es una vista aérea de las montañas dentro de la Isla Reunión, departamento de ultramar de Francia, situado en el océano Indico al este de Madagascar y perteneciente a la Unión Europea.

Documentación del Mini-estudio de caso:
Lo primero que se hizo fue abrir una búsqueda en google y utilizar el término de búsqueda: search by image, lo que dio como primer resultado “TinEye is a reverse image search”  y se le dio clic allí:
 

En esta página se pide subir la imagen de búsqueda, lo cual se hizo descargando a Mis imágenes la foto indicada con el nombre Imagen 1 en este caso:

Tan pronto como se incluyó la imagen y se le dio enter inmediatamente se generó el siguiente pantallazo:

Esto nos indicó que existe la foto en www.inmagine.com, por lo cual utilizamos el link inferior al nombre de la foto para ver a donde nos llevaba:


En cuya parte inferior de la imagen anterior empiezan a reflejarse una serie de fotos de un lugar llamado Reunión, y sobre la treceava fila se encuentra la imagen de búsqueda del caso de estudio, tal como lo refleja la imagen a continuación:

Revisando su contenido nos detallamos que todas las 70 imágenes expuestas en esta muestra las encabezan con la palabra Reunión, y algunas palabras para describir el detalle del lugar en idioma inglés, de la cual nos llamó la atención la que decía: “Reunion, Salazie cirque”, término por el cual se efectuó la búsqueda en Internet:

 
Evidenciando de esta manera que corresponde a una Isla llamada Reunión, que es un destino turístico muy llamativo por sus paisajes y cascadas. 

Este nombre lo empleamos como término de búsqueda y me dirigió a Wikipedia donde pudimos obtener los datos básicos del lugar:

“La isla de la Reunión es un departamento de ultramar de Francia, situado en el océano Índico, al este de Madagascar, y perteneciente a la Unión Europea. Como el resto de departamentos de Ultramar, también es una región de Francia y forma parte de la República”, en el siguiente link:   

jueves, 31 de marzo de 2011

Buenas Prácticas en Análisis de Interfaces de Colección Académico

Análisis de interfaces

Teniendo en cuenta que dentro de la Colección Académico se encuentran diferentes tipos de formatos, a continuación mostraremos los diferentes procesos o interfaces utilizados para lograr convertirlos a .TXT.


Conversión de .PDF a .TXT

Para la conversión de los documentos tipo .PDF a formato .TXT fue necesario en primer lugar  utilizar un editor conocido como SomePDF.com, utilizando el siguiente enlace para descargue libre:    http://es.kioskea.net/download/descargar-1257-pdf-to-word-converter


Se descarga el editor y esto genera el siguiente pantallazo.


Se ubica la carpeta donde se encuentran los archivos .PDF utilizando el icono de carpeta de archivo y se seleccionaron:


Se da clic en el botón Star Convert, lo cual inicia la conversión y se genera el siguiente pantallazo hasta que todos los archivos son convertidos:

Generándose así los documentos .RTF, los cuales siguen el proceso de conversión de los documentos .DOC hasta llegar al .TXT.

Después de convertir a .RTF
Fue necesario revisar aquellos archivos que reflejaban imágenes y que la conversión no permitió traer los datos por ejemplo en el caso del archivo invi1_ip_una2010422 fue necesario tomar (copiar) el texto directamente sobre el .PDF y anexárselo sobre la imagen que mostraba el archivo .RTF para que al convertirlo a .TXT se reflejara el texto del documento.  A continuación se anexan los pantallazos:

La conversión de .PDF a .RTF se muestra de la siguiente manera y por supuesto al convertir a .TXT  nos muestra ningún carácter textual.

Al copiar el texto del .PDF sobre el .RTF se muestra así:

Y al efectuar la conversión a .TXT ahora sí, se reflejan los caracteres textuales del documento:


Algunos documentos .PDF como: E-DOC 11-12-2000, INFORM 09-10-1999, Integración de sistemas de gestión electrónica documental, Parámetros para la selección de un SGDE,  al ser resultado del escaneo de un documento al formato .PDF, no permite bajo ninguna circunstancia conversión a .TXT, ni deja siquiera copiar el contenido del formato de imagen.


Conversión de .DOC a .TXT

Escojo abrir el documento y le indico abrir con: Internet Explorer

Al abrirse Internet Explorer y saca la siguiente ventana se le dio abrir


Se abre Microsoft Word para guardar como otros formatos


En guardar como tipo se indica que Texto sin formato y guardar

Inmediatamente se abre la ventana de Conversión de archivos se le indica que es Otra configuración y se escoge Unicode para que genere la conversión a .TXT de manera universal


Se le da Aceptar y cerramos Microsoft Word y ya en la carpeta se puede visualiza el documento en .TXT

 Ya con la conversión a .TXT están listos para la indizar los archivos en la herramienta de corpus de texto llamada Tenka Text.