lunes, 9 de mayo de 2016

Actividad Tema 6: Business Inteligence

                En esta nueva entrada al blog hablaremos sobre Business Intelligence, ¿qué es? Y del papel que tiene en las empresas.

                La capacidad para tomar decisiones de negocio precisas y de forma rápida se ha convertido en una de las claves para que una empresa llegue al éxito. Business Intelligence es la habilidad para transformar los datos en información, y la información en conocimietno, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios.

                Aunque su diseño se adapta con mayor o menor medida para manejar los datos de la empresa, no permite obtener la información de los mismos, y mucho menos extrapolar el conocimiento almacenado en el día a día de las bases de datos.

                Las principales características que limitan estos sistemas son:

  • Gran rigidez a la hora de extraer datos.
  • Necesidad de conocimientos técnicos para la generación de nuevos informes o métricas.
  • Largos tiempos de respuesta.
  • Deterioro en el rendimiento del Sistema cuando la base de datos consultada, para generar informes o ratios de negocio, es la misma que la que soporta el operativo de la empresa.
  • Falta de integración debido a que muchas organizaciones disponen de múltiples sistemas de información y sus bases de datos no suelen estar integradas.
  • Datos erróneos, obsoletos o incompletos.
  • Problemas para adecuar la información al cargo del usuario.
  • Ausencia de información histórica.

                Para superar todas estas limitaciones surge el Business Intelligence apoyándose en un conjunto de herramientas tecnológicas que facilitan la extracción, la depuración, el análisis y el almacenamiento de los datos generados en una organización para su explotación directa (reporting, análisis OLAP, mineria de datos, etc.) o para su análisis y conversión en conocimiento como soporte a la toma de decisiones sobre el negocio.

                Por lo tanto, se puede definir al Business Intelligence como el conjunto de procesos tecnológicos que transforman datos en conocimiento para lograr una mayor competitividad, y por ello nos debemos preguntar qué soluciones aporta Business Intelligence a una empresa:

  • Rápida detención de desviaciones de presupuesto, stock, etc.
  • Identificación de las tendencias en las ventas de productos.
  • Ahorro de cientos de horas/hombre en generación y análisis de informes.
  • Aprovechamiento de los activos de información cómo ventaja competitiva.
  • Aprovechamiento de las oportunidades de negocio al gestionar información completa y actualizada.
  • Identificación de los Productos y Clientes más importantes  en cuanto a rentabilidad, facturación, etc.
  • Seguimiento eficiente de los objetivos planificados.
  • Disponibilidad de Cuadros comparativos de rendimiento de empleados, asociados y colaboradores.
  • Alineamineto del día a día con estrategias a futuro



domingo, 3 de abril de 2016

Actividad Tema 4: El sistema de búsqueda Google.




               Cuando realizamos una búsqueda en Google, en primer lugar debemos de saber que al realizar dicha búsqueda no se busca directamente en la Web, sino en el índice que Google hace en toda la Web. Este índice se crea a partir de programas de software que exploran un grupo de páginas web, no a todas ya que Google no tiene acceso a toda la Web. Estos programas software siguen los enlaces que contienen y exploran las páginas a las que dirigen, hasta examinar millones de páginas almacenadas en miles de máquinas.


                Sabiendo esto, cuando realizamos una búsqueda concreta, entre estas millones de páginas en las que Google examina, ¿cómo decide Google qué documentos me interesan? Pues mediante una serie de preguntas, en total son unas 200 preguntas, gran parte de ellas relacionadas sobre las palabras clave. Como por ejemplo, ¿cuántas veces aparecen las palabras clave en la página?¿Aparecen en el título, en la URL o juntas?¿Incluye sinónimos de esas palabras?¿El sitio Web al que pertenece es de alta calidad, de baja calidad o de spam?¿Qué clasificación PageRank tiene la página? Etc. Según la empresa Google es muy importante la calidad de información que muestra cada página, resultados útiles e imparciales, tampoco aceptan pagos por añadir un sitio al índice, actualizarlo más a menudo que otras páginas o mejorar su clasificación.


domingo, 13 de marzo de 2016

Actividad Tema 3: Sistema de almacenamiento actuales

                Para empezar este tema hablaremos primero de los almacenamientos actuales, los distintos tipos o dispositivos, tendencias y futuros. Una unidad de almacenamiento es un dispositivo capaz de leer y de escribir información con el propósito de almacenarla temporal o permanentemente, este almacenamiento consiste en dos procesos: 1º Escritura o registro de datos para que pueda utilizarse posteriormente y 2º la lectura de datos almacenados para poder transferirlos.
               
     TIPOS DE ALMACENAMIENTO

                 Podemos dividir las unidades de almacenamiento en dos grupos, los físicos y los de la nube.

                Los dispositivos físicos, a su vez, podemos dividirlos en dispositivos magnéticos, dispositivos ópticos y dispositivos de almacenamiento en estado sólido.

                Los dispositivos magnéticos son dispositivos que están cubiertos de datos con un material magnético sensible que reacciona a un campo magnético. El proceso de escritura de datos consiste en polarizar el material metálico con electricidad, al polarizar el metal se crea un imán, la orientación del campo magnético se puede utilizar para representar datos. Al proceso de dar las direcciones correctas al disco magnético se le conoce formato o inicialización, el disco duro integrado ya está formateado y cuenta con un software. Estos son:
·        
·         Unidad de cinta magnética.
·         Unidad de disco flexible, disquetera.
·         Unidad de disco duro.

·         
                Los dispositivos ópticos básicamente almacenan datos en una superficie reflectora de manera que pueda leerlos un rayo de luz láser. Las principales tecnologías ópticas de grabación son los siguientes:

·         Unidad de CD-ROM.
·         Unidad de CD-R/RW.
·         Unidad de DVD-ROM.
·         Unidad de DVD±R/RW.
·         Unidad de BD.

                Los dispositivos en estado sólido no son magnéticos ni ópticos sino que utilizan circuitos integrados para almacenar los daos. Son menos confiables por su fácil lectura y escrituras mucho más costosas que los magnéticos u ópticas, los usuarios los quieren por su portabilidad y velocidad. Estos podrían ser:
·                       ·     Unidad de memoria flash.
·                       ·     Unidad de tarjetas de memoria.


     BASE DE DATOS


                Para la definición de este concepto acudimos a varias fuentes de información: “Una base de datos se puede definir como un conjunto de información relacionada que se encuentra agrupada o estructurada”, www.maestrosdelweb.com“Una base de datos es una entidad en la cual se pueden almacenar datos de manera estructurada, con la menor redundancia posible”, es.ccm.net; Las bases de datos son recursos que recopilan todo tipo de información, para atender las necesidades de un amplio grupo de usuarios”, María Pinto Molina, catedrática de documentación, facultad de bibliotecomía y documentación, Universidad de Granada. De esto podemos deducir que es un sistema que almacena datos que están relacionados, en donde guardamos información integrada que podemos almacenar y recuperar. Una base de datos puede ser de diverso tipo, desde un pequeño fichero casero para ordenar libros y revistas por clasificación alfabética hasta una compleja base que contenga datos de índole gubernamental en un Estado u organismo internacional.
  
       COMPONENTES DE UNA BASE DE DATOS

·                                   ·     Hardware: constituido por dispositivo de almacenamiento como discos, tambores, cintas,                     etc.
·                                    ·    Software: que es el DBMS o Sistema Administrador de Base de Datos.
·                                    ·    Datos: los cuales están almacenados de acuerdo a la estructura externa y van a ser                                procesados para convertirse en información.


     BS ESTRUCURADA/BS NO ESTRUCTURADA

                Tras esta pequeña introducción de lo que es la BS, vamos a ver estos dos términos, que aparecen por la “gestión” de estos datos.


         BS ESTRUCURADA
                El contar con bases de datos eficientes es un componente vital de la infraestructura tecnológica de cualquier organización porque garantiza un excelente tiempo de respuesta a los usuarios y permite contar con un esquema de alta disponibilidad para las aplicaciones empresariales. Beneficios:

·          Al contar con bases de datos optimizadas, se minimiza el costo de caídas en el servicio y el impacto de la lentitud en los tiempos de respuesta. Al mismo tiempo, las aplicaciones son más eficientes y, como consecuencia, los usuarios se ven beneficiados al poder realizar mejor sus funciones.
·        La implementación de las mejores prácticas en la entrega de los servicios de administración y optimización de bases de datos garantiza el rendimiento óptimo de los recursos.
·         Se estructura una plataforma tecnológica que garantice la disponibilidad de los recursos y facilite las actividades relacionadas con el negocio para cumplir con las normativas internacionales de cumplimiento.
·         Los servicios de mantenimiento preventivo garantizan la optimización y la seguridad de la información residente en la Base de Datos, además de la disminución en los costos de Administración.
·      Los servicios que proporcionamos mantienen vigentes tanto el recurso humano como los componentes tecnológicos para garantizar el funcionamiento ininterrumpido y la total protección de la inversión.

         BS NO ESTRUCTURADA

                Las bases de datos no estructurados son repositorios en los que se consolida y ordena esta información, garantizando su integridad y poniéndola a la disposición de toda la organización, es decir, son aquellos datos no almacenados en una base de datos tradicional. La información no estructurada no puede ser almacenada en estructuras de datos relacionales predefinidas. Beneficios:


·          Los servicios de diseño, integración y continuidad de nuestra solución de Base de Datos no Estructurados, le permiten reducir el costo total de propiedad o TCO por medio de la creación de un repositorio centralizado.
·         Los servicios de administración y control de la información no estructurada, aunado al control de su disponibilidad y la administración de los cambios a la misma, le garantizan un esquema optimizado y seguro de la información contenida en la base de datos no estructurados, además de una reducción en los costos de administración.
·         Al construir una infraestructura que consolida la información y garantizar su disponibilidad, se incrementa la eficiencia y la productividad de los usuarios internos y externos.
·     Como parte de los servicios proporcionados, se ofrece la capacitación del recurso humano y el suministro de los componentes tecnológicos que garanticen el funcionamiento continuo e ininterrumpido de la solución en un escenario de alta disponibilidad y total protección a la inversión.
               
                Sin embargo hay un tratamiento de información no estructurada, que es el siguiente:

·        Crear una plataforma escalable (infraestructura y procesos).
·         Añadir información/estructura complementaria a los datos no estructurados.
·         Crear conjuntos reducidos de datos que sean representativos.
·         Desarrollo de algoritmos.
·     Procesos de depuración/limpiado de datos.


     BIG DATA

                Por último, cabe hablar sobre este concepto, Datos masivos, es un término que hace referencia a una cantidad de datos tal que supera la capacidad del software habitual para ser capturados, administrados y procesados en un tiempo razonable.


     BIBLIOGRAFÍA
·         http://www.maestrosdelweb.com/
·         http://www.dataprix.com/
·         http://www.ids-ac.com/
·         http://es.ccm.net/
·         http://www.mariapinto.es/

Actividad Tema 2: Representación de la información

(Se me olvidó subir al blog este ejercicio a su fecha, pero esta entregado a su fecha en el aula virtual. Perdón por el despiste.)

              El hecho de representar una información es poner de manera explícita dicha información para que la podamos entender, ya sea mediante palabras, figuras, imágenes, etc. Es decir codificar la información. En esta asignatura lo que nos debe importar es la representación de la información para que la entienda un ordenador.

               Computacionalmente la información se representa mediante un código binario de 0 y 1 siendo la mínima unidad de información el bit. Para representar las letras del alfabeto y otros símbolos, lo que es llamado como caracteres, se utiliza un conjunto de 8 bits, lo que es igual a un byte. Un byte igual a 8 bits, 1 Kbyte igual a 1.024 bytes, 1 Mbyte igual a 1.024 Kbytes,           1 Gbyte igual a 1.024 Mbytes y 1 Tbyte igual a 1.024 Gbyte. Esto sería la medida de almacenamiento de un ordenador. El principal problema radica en la utilización de un número de bits limitado para llevar a cabo estas representaciones. Por ello, los números deben mantenerse dentro de un rango y una precisión limitados y sólo es posible representar un número finito de caracteres.

                Además de este sistema binario, existen otros sistemas de para representar la información computacionalmente, como el sistema octal, que consiste en un sistema en base 8 que utiliza dígitos de 0 a 7. Los numero octales pueden construirse a partir de números binarios agrupando cada tres dígitos consecutivos de estos últimos, leyéndolos de derecha a izquierda, y obteniendo su valor decimal. Otro sistema es el hexadecimal, de base 16, utilizando los dígitos de 0 a F. El sistema de numeración base que es potencia exacta de 2 hace que la conversión a binario o viceversa sea bastante simple.

                A través de esta manera de de representar la información en un ordenador, podemos presentar textos, imágenes, audios y vídeos.
                Para la representación de textos tenemos que "traducir" toda la información suministrada a la computadora a ceros y unos es necesario establecer una correspondencia (codificación) entre 2 conjuntos, es decir necesitamos un código que asocie cada carácter un valor binario. Por lo que se utilizan el ASCII Y el EBCIDC, que son los dos códigos más habituales para la representación de caracteres. El código EBCDIC utiliza 8 bits para representar cada carácter, permite codificar hasta 256 símbolos distintos. Cada carácter codificado o byte, se divide normalmente en cuatro bits de zona (7, 6, 5 y 4), y cuatro bits numéricos (3, 2, 1 y 0).     El código ASCII es el Código Estándar Americano para el Intercambio de Información, el básico utiliza 7 bits y es el más usual, usualmente se incluye un octavo bit para detectar posibles errores de transmisión o grabación, lo que es llamado bit de paridad. Inconvenientes de estas codificaciones se presentan sobre todo con Internet.  Los símbolos codificados son insuficientes para representar los caracteres especiales que requieren numerosas aplicaciones. Los símbolos y códigos añadidos en las versiones ampliadas a 8 bits no están normalizados. ƒ Están basados en los caracteres latinos, existiendo otras culturas que utilizan otros símbolos muy distintos.
                Existen más códigos para la traducción de la información para textos, como el BCD de 6 bits, se utilizaba en las primeras computadoras que utilizaban códigos de 6 bits por lo que solo admitía 64 caracteres. Otra codificación utilizada es el Unicode es propuesto por un consorcio de empresas y entidades que trata de hacer posible escribir aplicaciones que sean capaces de procesar texto de muy diversas culturas, por lo cual este sería capaz de resolver los problemas que encontrábamos en los códigos anteriores.
               
               
                Con respecto a la representación de imágenes, básicamente existen 2 maneras de representarlas: un mapa de bits y mapa de vectores.
                Mapa de bits (Imágenes raster). Una imagen está compuesta por un número infinito de puntos y a cada uno de ellos se le pueden asociar atributos, su nivel de gris si es una imagen en blanco y negro o su color si es en color. Para codificar una imagen y almacenarla se han de tener en consideración dos factores: el número de puntos a tratar y el código de atributo asociado a cada punto. Y que es imposible almacenar y procesar los atributos de los infinitos puntos, los sistemas de captación consideran la imagen dividida en una fina retícula de celdas o elementos de imagen, conocidos como píxeles, y se le asigna a cada uno como atributo el nivel de gris medio en la celda o el color medio si la imagen es en color. La calidad de la imagen depende de la resolución y codificación del atributo, es decir, el número de bits. El formato más habitual de estas imágenes sería JEPG, PNG, GIF, TIFF, BMP… Este tipo de imágenes no pueden escalarse sin perder calidad.

                Mapa de vectores (Imágenes vectoriales). Este tipo de imágenes se basan en descomponer la imagen en una colección de objetos (líneas, polígonos, textos, etc.), cada uno de ellos con sus respectivos atributos o detalles (color, grosor, etc.) modelables a través de vectores y ecuaciones matemáticas que determinan tanto su posición en la imagen como su forma concreta. Estas sólo son adecuadas para gráficos de tipo geométrico, no imágenes reales, y una de las ventajas es que generan archivos que ocupan mucho menos espacio que los mapas de bits, y las imágenes son más fáciles de escalar a cualquier tamaño y de procesar. El formato más habitual para este tipo de imágenes es DXF, IGES, EPS, TRUTYPE, SVG…

                Para la grabación de una señal de audio en una computadora, se capta por medio de un micrófono que produce una señal analógica, La señal analógica se amplificada para encajarla dentro de dos valores límites, por ejemplo entre –5 voltios y +5 voltios, se muestrea y digitaliza por medio de un conversor A/D y estos valores obtenidos en la conversión se almacenan en posiciones consecutivas.

                Para el almacenamiento de estas muestras de audio obtenidas, se utilizan los siguientes formatos del  sonido digitalizado:

                - Audio digital en formato de onda o audio CD o WAV o AU. Buena calidad, sin                                embargo ocupa gran espacio.

                - MIDI. Permite gran flexibilidad y es ideal para compositores ya que soluciona el tema              del espacio. Sin embargo, para obtener una calidad aceptable, es necesario que la        tarjeta de sonido disponga de tabla de ondas o, en su defecto, de un sintetizador        virtual. Otra carencia importante es que no se puede añadir voces humanas, las voces                 no se pueden sintetizar tan fácilmente como el sonido de un instrumento.

                -MP3/MP4. Es al sonido lo que JPEG es imagen. Con este se consigue reducir el tamaño            original de los ficheros en unas 10 veces, a costa de sacrificar la calidad del sonido.

                Cabe destacar la forma de representar un video, que es muy similar a la del audio, donde los formatos más extendidos serían QuickTime y MPEG.


Referencias:
                - http://www.ceiscc.galeon.com/apuntes_arch/tema2.pdf

domingo, 14 de febrero de 2016

Actividad Tema 1: Información y documentación


                Este primer tema trata sobre los conceptos de la información y documentación, y la relación entre ambas.
 En un primer lugar hablamos de como se nos puede comunicar, obtener,  la información en el contexto de comunicación. En este punto encontramos varios problemas: una difícil asimilación de la información, se dice que si dedicas 24h en el estudio de un campo concreto tan sólo serías experto en un 3%; un fácil acceso a información, en la actualidad, debido a internet, tenemos un fácil acceso a todo tipo de información, pero no por ello tiene que ser una información de calidad, ya que cualquiera puede escribir en internet pudiendo proporcionar información “basura”; y por último la información restringida, redes ocultas, internet oscuro, también conocido, que es necesario un determinado tipo de acceso.
Las ciencias de la documentación: “... la documentación se ocupa de dirigir, canalizar, epistemológica, creativa y exhaustivamente la producción, distribución y consumo del conocimiento en todas sus formas...” Es decir, la documentación que me lleva a conocimiento debe de ser riguroso. Dentro de esto, observamos varias áreas:
-La informática: como se almacena la información, base de datos (BD), inteligencia     artificial (IA), etc.
-Teledocumentación: como accedemos a medios telemáticos que nos ofrecen  documentación.
-Bibliometría: aplicación de las matemáticas y métodos estadísticos para garantizar la calidad de la información.
-Terminología científica:es el conjunto de términos empleados en una especialización.
-Bibliografía: dirección (página web, libro, etc.) de donde he obtenido la información. También se puede obtener mediante la experiencia.
-Biblioteconomía: concede más importancia a las fuentes finales de la documentación.
-Ciencia cognitiva: es el estudio de los detalles del proceso humano mediante la experiencia, el aprendizaje, la inteligencia…
-Ciencias de la comunicación: medios audiovisuales, símbolos.

                En este siguiente apartado hablamos de la tipología de documentos, que se refiere al soporte físico en el que está constituido un documento. Puede ser en un soporte de papel, en un vídeo, CD, base de datos “on line”, etc. Y el este soporte dependerá de unos parámetros, volumen de documentos a tratar, naturaleza de los documentos periodo de validez, valor del documento, necesidad de actualización, frecuencia de consulta, coste de traspaso, almacenamiento y consulta, características técnicas del soporte, facilidad de uso del soporte con las nuevas tecnologías, tiempo y tipo de acceso.
                ¿Desaparecerá el papel con Internet?
                En un primer lugar, mientras observaba la conferencia, respondí positivamente, pero con la reflexión cambié de opinión, definitivamente el papel no desaparecerá. Aunque también es verdad que ha disminuido el uso con la aparición de elementos electrónicos. Yo personalmente, por ejemplo, lo que tenga que estudiar lo seguiré teniendo en formato de papel, ya para hacer alguna anotación o para subrayar etc. Y así también, yo estudiante de arquitectura, al realizar un proyecto no lo plasmo en un primer momento en el programa de dibujo del ordenador, sino dibujo croquis, ideas, a mano alzada. Con esto quiero decir que para algunas profesiones es imprescindible el uso de papel y lápiz.
               

                Por último, en este apartado hablaremos de la cadena documental y las fuentes de comunicación. La cadena documental la podríamos definir como el proceso para que la documentación cumpla sus objetivos. Bibliotecas que siguen el siguiente proceso, selección, análisis, búsqueda, y difusión. Y dentro de las fuentes de comunicación encontramos la literatura gris, que sería la información muy específica relacionada con el ámbito científico, y las bibliotecas depositarias, bibliotecas en las que se intenta que haya todo ejemplar de lo que va publicando.