Bienavenidos


BIENVENIDOS, Este espacio está dirigido a todos aquellos profesionales de Sistemas de Información, Archivistas, Bibliotecólogos, Administradores de contenido y en general profesionales afines con recuperación de informacion, sistemas de recuperación de informacion, búsquedas y recuperación de información, metadatos y posicionamiento web.


jueves, 31 de marzo de 2011

Buenas Prácticas en Análisis de Interfaces de Colección Académico

Análisis de interfaces

Teniendo en cuenta que dentro de la Colección Académico se encuentran diferentes tipos de formatos, a continuación mostraremos los diferentes procesos o interfaces utilizados para lograr convertirlos a .TXT.


Conversión de .PDF a .TXT

Para la conversión de los documentos tipo .PDF a formato .TXT fue necesario en primer lugar  utilizar un editor conocido como SomePDF.com, utilizando el siguiente enlace para descargue libre:    http://es.kioskea.net/download/descargar-1257-pdf-to-word-converter


Se descarga el editor y esto genera el siguiente pantallazo.


Se ubica la carpeta donde se encuentran los archivos .PDF utilizando el icono de carpeta de archivo y se seleccionaron:


Se da clic en el botón Star Convert, lo cual inicia la conversión y se genera el siguiente pantallazo hasta que todos los archivos son convertidos:

Generándose así los documentos .RTF, los cuales siguen el proceso de conversión de los documentos .DOC hasta llegar al .TXT.

Después de convertir a .RTF
Fue necesario revisar aquellos archivos que reflejaban imágenes y que la conversión no permitió traer los datos por ejemplo en el caso del archivo invi1_ip_una2010422 fue necesario tomar (copiar) el texto directamente sobre el .PDF y anexárselo sobre la imagen que mostraba el archivo .RTF para que al convertirlo a .TXT se reflejara el texto del documento.  A continuación se anexan los pantallazos:

La conversión de .PDF a .RTF se muestra de la siguiente manera y por supuesto al convertir a .TXT  nos muestra ningún carácter textual.

Al copiar el texto del .PDF sobre el .RTF se muestra así:

Y al efectuar la conversión a .TXT ahora sí, se reflejan los caracteres textuales del documento:


Algunos documentos .PDF como: E-DOC 11-12-2000, INFORM 09-10-1999, Integración de sistemas de gestión electrónica documental, Parámetros para la selección de un SGDE,  al ser resultado del escaneo de un documento al formato .PDF, no permite bajo ninguna circunstancia conversión a .TXT, ni deja siquiera copiar el contenido del formato de imagen.


Conversión de .DOC a .TXT

Escojo abrir el documento y le indico abrir con: Internet Explorer

Al abrirse Internet Explorer y saca la siguiente ventana se le dio abrir


Se abre Microsoft Word para guardar como otros formatos


En guardar como tipo se indica que Texto sin formato y guardar

Inmediatamente se abre la ventana de Conversión de archivos se le indica que es Otra configuración y se escoge Unicode para que genere la conversión a .TXT de manera universal


Se le da Aceptar y cerramos Microsoft Word y ya en la carpeta se puede visualiza el documento en .TXT

 Ya con la conversión a .TXT están listos para la indizar los archivos en la herramienta de corpus de texto llamada Tenka Text.

viernes, 18 de marzo de 2011

Memoria de Clase Viernes 18 de marzo de 2011

En este espacio de clase se socializó como tema principal el concepto de búsqueda orientado al usuario final, se instaló y evidenció el manejo y las bondades de buscadores de escritorio como Google Desktop.

Como trabajo para la segunda tutoría debemos documentar la instalación de Google Desktop, al igual que cualquier otra de las multiples herramientas como éstas que se pueden encontrar, por lo cual el grupo escogió trabajar con Autonomy Corporation para la segunda entrega.

martes, 15 de marzo de 2011

Memoria de clase Lunes 14 de marzo de 2011

En este espacio de clase se socializaron temas relacionados con el posicionamiento de nuestros blogs en la web y se invitó a evitar Acciones como: utilizar la ecuación de búsqueda en el título, las palabras claves y los metadatos; adicionalmente faltas como el no citar o citar inadecuadamente textos, imágenes y videos utilizados en cada una de las entradas publicadas en el mismo.  Se enfatizó en que la producción y los contenidos de cada blog sean una creación propia de los involucrados en el proyecto.

sábado, 12 de marzo de 2011

Algo sobre los Sistemas de Recuperación de Información (SRI) actuales


En la actualidad el uso de herramientas como los SRI se hace mucho más necesario y evidente, debido al volumen tan monstruoso de información que podemos encontrar tanto a nivel físico como en la web; sin embargo, la comercialización de este tipo de productos hace que gastemos un valioso tiempo en determinar cuál de todas estas herramientas será mas útil para cumplir con nuestro propósito o necesidades de búsqueda y recuperación de información.
Es por eso que no debemos desconocer situaciones como las que plantea la tesis doctoral de Francisco Javier Martínez Méndez[1]: existe un hecho que no puede pasarse por alto y es la  actual competencia establecida entre los desarrolladores de los algoritmos que emplean  directorios, motores de búsqueda o metabuscadores de la red Internet, sistemas que compiten la manera en cómo facilitar al usuario un mayor número de documentos en el menor tiempo posible, sin tener en cuenta que, quizá el usuario prefiera que los resultados de entrega de información le sean evidentemente útiles para sus necesidades, aunque tenga que esperar unos minutos más para recibirla.
Todo lo anterior condiciona el reconocimiento de la relevancia y pertinencia de los resultados que arrojan los Sistemas de Recuperación de Información (SRI) y es prácticamente el usuario quien determina de acuerdo a sus necesidades de búsqueda específicas, cuál de los resultados es más útil o conveniente en un determinado momento, “por lo que los juicios de relevancia van a ser realizados por él, y son esos juicios de relevancia los que van propiciar que un SRI sea considerado bueno o malo”[2].

[1] UNIVERSIDAD DE MURCIA, Biblioteca Digital DIGITUM. Martínez Méndez, Francisco Javier. Recuperación de Información: Modelos, Sistemas y Evaluación. Ed. JMC Kiosko.  2004. p.58.  [En línea]. [Consultado: 10/03/2011]. Disponible en: http://digitum.um.es/xmlui/bitstream/10201/4316/1/libro-ri.PDF
[2] Ibíd., p. 61

jueves, 10 de marzo de 2011

La Universidad de la Salle, El Programa, el Posicionamiento y la Recuperación de Información

Panorámica de la sede chapinero de la Universidad de la Salle

La Universidad de la Salle se ha convertido en un canal estratégico de la información a nivel internacional, debido a que su enfoque investigativo se superpone a las barreras del tiempo orientándose a impulsar el programa de Sistemas de Información, Bibliotecología y Archivística, permitiéndole un posicionamiento en la Web con el fin de enmarcar en un nivel alto de importancia y de detalle el tema de la recuperación de la información.

No obstante, sus objetivos han sido claros, y aunque no es la única entidad educativa enfocada en la recuperación de la información, se destaca por su calidad en el tratamiento de un asunto tan controversial al plantear la unificación de criterios definidos y debidamente normalizados que permitan integrar la transparencia de la información y su adecuado manejo.

La Recuperación de Información en las Organizaciones

La información[1] es la que permite evidencia la existencia de una empresa, es su razón de ser y por lo tanto la razón lógica para que se creen, se mantengan y retroalimenten todas las formas de adecuar y conservarla reduciendo al mínimo el riesgo de su seguridad.

Es fundamental para la empresa no sólo garantizar la seguridad de los datos, sino también su disponibilidad, para ello, es necesario proveerse de hardware y software con características precisas y lógicas en concordancia con los procesos y las actividades que se manejan. Actualmente las empresas tienen a su disposición muchas opciones para proteger los datos: copias de seguridad, alojamientos alternativos, entre otros. 

Como las copias de seguridad experimentan sus propios problemas, se sugiere:

  • Limitar la cantidad de información para agilizar la consulta. 
  •  Tener el apoyo directo de un proveedor  con experiencia acreditada en servicio de recuperación de datos.
  •  Contar con la confianza de los principales fabricantes de equipos informáticos.
  • Asegurar la continuidad.

Informar, capacitar y orientar a los funcionarios, además de sensibilizarlos acerca de la protección de la información, es otra manera de reducir el riesgo teniendo en cuenta que por la diversidad de información y la importancia de la misma, cada funcionario le da un valor diferente y en mayoría de oportunidades deciden establecer criterios propios de organización y descripción de la información, permitiendo limitar o en caso extremo impedir el acceso.

Por ello es relevante la continuidad de los planes (estrategias) que de ser disciplinados y orientados al cumplimiento del objetivo principal (protección de información) evidencia el éxito y la permanente conquista al defender el patrimonio documental, evitando así ser objeto de manipulación y facilitar en momentos de crisis la recuperación de los datos.


[1] La flecha tú diario de ciencia y tecnología. La importancia de la recuperación de datos. [en línea], [consultado: 09/03/11]. Disponible en: http://www.laflecha.net/canales/seguridad/articulos/la-importancia-de-la-recuperacion-de-datos/

Acerca del Programa de Sistemas de Información, Bibliotecología y Archivística

El programa de sistemas de información de la Universidad de La Salle dio inicio en 1971, y desde entonces partiendo de las necesidades del mercado, los adelantos tecnológicos, las exigencias de la sociedad del conocimiento y demás circunstancias para estar a la altura de lo que se espera de sus profesionales, se han hecho necesarias varias reformas hasta llegar hoy día a lo que conocemos como programa de sistemas de información, bibliotecología y archivística; el cual tiene como objeto de estudio el Sistema formado por la interacción de cuatro elementos esenciales:

a) la información
b) el documento
c) el usuario 
d) la institución informativa documental

Concibe la información como resultado de la configuración del pensamiento, las ideas, los conceptos, los significados y los sentidos; considera al documento como la objetivación de la información bibliográfica y archivística en algún medio físico o simbólico; comprende al usuario como ser humano que tiene una necesidad de información que puede satisfacerse; y finalmente entiende a la institución informativa documental como un ente social que proporciona las condiciones para satisfacer las necesidades de información de los usuarios (Rendón, 2008: 72-73)[1]

Adicionalmente a través del proyecto educativo universitario Lasallista se brinda un enfoque integral del desarrollo profesional, buscando generar en sus estudiantes análisis y reflexión sobre su responsabilidad ante la comunidad, entidades y proyectos donde se espera su participación más que de orden privado, es la creación de proyectos de orden social y su ejecución, contribuyendo de esa manera a la democratización del conocimiento en todos los niveles de la sociedad y por tal razón el tema de la investigación es uno de las elementos que se busca fortalecer y promover entre sus estudiantes.

Para los estudiantes del programa de sistemas de información es evidente la responsabilidad que implica una buena preparación, y aunque la Universidad de La Salle brinda las herramientas necesarias, es suyo el deber de aprovecharlas y utilizarlas a fin de alcanzar y potenciar todas las competencias que se espera desarrollen sus estudiantes y que se verá reflejado en la práctica profesional.


[1] Rendón, 2008: 72-73, Citado por: VALLEJO S., Ruth Helena y MANCIPE F., Eduardo. El Programa de Sistemas de Información y Documentación de la Universidad de La Salle- Bogotá: diagnóstico de la docencia y estado de la investigación. En: GORBEA PORTAL, Salvador. Potencialidades de investigación y docencia iberoamericanas en Ciencias bibliotecológica y de la Información. Memoria. Primer Edición. UNAM, Centro Universitario de Investigaciones Bibliotecológicas, 2010. p. 109. ISBN: 978-607-02-0751-8

Los lenguajes documentales en las búsquedas y recuperación de información

Son una forma de recuperar información de manera más acertada y en especial de contenidos estructurados[1], puesto que es información conformada en su mayoría por palabras que ya han sido estructuradas o normalizadas por estándares internacionales como por ejemplo la Norma Técnica Colombiana 1476 y que desde lo práctico se ve reflejado en las Listas de Encabezamientos de Materias para Bibliotecas (LEMB) con el fin de evitar tener diversas formas en el uso de las palabras en general, lo que evita que los contenidos sean almacenados de forma incipiente, garantizando una recuperación acertada.
Al respecto, las palabras que ya han sido normalizadas o aceptadas (denominadas descriptores) bien se pueden encontrar condensadas en tesauros documentales como también pueden hacer parte de listas generalizadas de descriptores, siendo más recomendable aquellas listas convencionales por las que se guían las instituciones públicas y privadas, puesto que es más precisa su unificación, ejemplo de ello es el uso de las LEMB las cuales se convierten en medio confiable para la búsqueda y recuperación de información.   


[1] Proceso documental, del análisis a la recuperación, Lenguajes documentales. Documentación, Internet y Medios de Comunicación. [en línea]. [consultado: 27/02/11]. Disponible en: http://multidoc.rediris.es/publidocnet3/archivos/educacion/apuntes/docinfo/Tema%2016.pdf

miércoles, 9 de marzo de 2011

Novedades en navegación web: Google Chrome 10

No siendo un descubrimiento la navegación a través de Google Chrome, si es hoy una novedad la presentación que hace Google: la versión de navegación mejorada llamada Chrome 10[1] de la cual destaca bondades como la estabilidad y celeridad en la recuperación de la información, además de dar a sus usuarios la autonomía de modificar la interfaz de acuerdo a su gusto, además de mejorar las opciones de búsqueda a medida que se va realizando el ingreso de palabras en el campo de búsqueda, esto en lo que respecta de sus funciones principales.

Respecto de la seguridad de la información, no solo agrega el uso (para los usuarios) de caracteres de seguridad, sino que además de ello implementa la encriptación y protege contra páginas web que coloquen en riesgo la seguridad de los internautas.



[1]DINERO.COM. Google lanza nueva versión de su navegador, el Chrome 10. [en línea]. [consultado: 09/03/11]. Disponible en: http://www.dinero.com/negocios/google-lanza-nueva-version-su-navegador-chrome-10_85137.aspx

Un poco de lo que es nuestra academia: Universidad de La Salle Internacional

Más que conocer acerca de nuestra academia en Bogotá, es preciso destacar un poco lo que es la Universidad de la Salle a nivel Internacional. La figura institucional que representan los hermanos Lasallistas se llama Instituto de los Hermanos de las Escuelas Cristianas[1] que sin duda tienen como objetivo principal el ofrecer el servicio de la educación y hacer de éste derecho un servicio transversal a nivel internacional; en el mundo hacen presencia en más de 80 países: se encuentra en Asía, Europa y algunos países de África, México, Centroamérica y Suramérica.  

El grupo de profesores que imparten las clases está conformado tanto por hermanos lasallistas como por un selecto grupo de profesores laicos. La Universidad de la Salle en Colombia es reconocida no solo por impartir formación en el nivel profesional, sino también desde los niveles básicos de formación. Nuestra Universidad hace parte de la Asociación Internacional de Universidades Lasallistas[2].



[1] La Salle en el mundo. [en línea]. [consultado: 09/03/11]. Disponible en: http://unisalle.lasalle.edu.co/index.php/content/view/89/290/
[2] Asociación Internacional de Universidades Lasallistas. [en línea]. [consultado: 09/03/11]. Disponible en:   http://www.aiul.net/portal/index.php?page=news_World&lang=en

sábado, 5 de marzo de 2011

Reflexión sobre el II Seminario Internacional: Archivos y Ciudades Digitales

Tomando algunos de los elementos del II Seminario Internacional: Archivos y Ciudades Digitales, llevado a cabo del 23 al 25 de febrero en la Universidad de la Salle, se toma como punto de referencia la ponencia hecha por el Doctor Carlos Alberto Zapata, Profesor de dicha Universidad, en donde realiza apuntes importantes respecto de su Proyecto acerca de: La Gestión Documental en el Desarrollo de los proyectos de administración electrónica, en especial, en la parte de resumen de resultados.

Desde una observación quizá subjetiva, es preciso analizar que si dentro de un contexto de gestión documental hay fallas importantes por parte de las personas encargadas de las áreas de archivo y en general de la gestión de documentos e información, respecto de la conceptualización y más aún de los desarrollos tecnológicos que se llevan a nivel interno de las entidades bien sean estas públicas o privadas, ¿cómo puede ser exitoso un proceso de recuperación de información?. Esto a modo de reflexión.

A continuación compartimos la presentación que realizo el Dr. Zapata en el seminario.   

viernes, 4 de marzo de 2011

Ecuación de Búsqueda

El día de hoy el profesor nos ha sugerido como consejo y estrategia de posicionamiento del blog utilizar la siguiente ecuación, esto en razón a permitir posicionar y recuperar nuestro blog; ésta dinamica tiene como fin indicar que se pueden predeterminar ecuaciones basadas en lenguajes normalizados, que sin duda son formas para recuperar información.

“Recuperación de Información” AND “Programa de Sistemas de Información” AND “Universidad de La Salle” AND 2011 AND Colombia AND Google AND posicionamiento AND Grupo20

jueves, 3 de marzo de 2011

La infoxicación, una enfermedad

Este video es una clara muestra de saturación de información que los tiempos modernos con su desarrollo tecnológico trae, y destaca la relevancia de recuperar información con contenidos útiles.


 
 VERGARA, Elian Hector. Infoxicación[en línea] [consultado 03/03/11]. Disponible en: http://www.youtube.com/watch?v=0sUQwrMbLrA

miércoles, 2 de marzo de 2011

La infoxicación en la Recuperación de Información

Para dar inicio[1] a este planteamiento es indispensable saber ¿qué es infoxicación? esta palabra hace referencia a un exceso o sobrecarga de información, debido a la proliferación descontrolada que día a día los diferentes medios (páginas web, blogs, correos electrónicos, etc.) ofrecen. Esto se suma a la falta de cultura y análisis por parte de los usuarios al Recuperar la Información, haciendo incontrolable el manejo de la misma en la web. 
Es indispensable buscar herramientas que eviten, por desconocimiento, buscar información con resultados poco confiables que desvían el objetivo de la búsqueda.
Mediante el aprendizaje de técnicas y manejo de herramientas para recuperar la información, es que los usuarios van desarrollando habilidades y experticia en una recuperación útil para satisfacer sus necesidades.



[1] Cornella, Alfonso. Principio de la infoxicación del libro Más allá de Google. 2009

martes, 1 de marzo de 2011

Estructura de los documentos

Los documentos[1] de acuerdo  al contenido que en ellos existe, están determinados por la forma como el contenido se ha consignado en éste, es decir, pueden ser documentos que contengan texto de tipo digital, animados a través de video o audio.
De este modo, los documentos entran a ser afectados por una serie de determinantes como: estructura, reglas gramaticales, significado de las palabras, forma de presentación del documento (interfaz), etc. Es así como los documentos precisan de un orden, por lo que son denominados:
*       Estructurados: a modo de ejemplo, estos documentos son aquellos que hacen parte de las bases de datos en los que es preciso definir la información que deben representar de manera previa a su almacenamiento. Esta forma de estructuración no aplica para todos los documentos puesto que dicho documento se expone a que se dejen de lado datos que pueden llegar a ser relevantes.
*       Semiestructurados: son documentos a los que es posible agregar nuevos datos o marcas con el fin de hacer evidente las partes que lo componen; dichas marcas deben ser evidentemente diferentes al contenido del texto. Esta forma permite que los documentos sean flexibles y se les pueda modificar de ser pertinente.
*       No estructurados: en este caso los datos se identifican  como uno solo a través de la interfaz, no posee partes que lo dividan de alguna forma.


[1] Los documentos de texto y su estructura. Plataforma Virtual Universidad de la Salle