martes, 27 de octubre de 2015

Resumen capítulo 7 del libro Sistemas de Información Gerencial

Capitulo 7 Telecomunicaciones, Internet y tecnología inalámbrica


LAS TELECOMUNICACIONES Y REDES EN EL MUNDO DE NEGOCIOS ACTUAL


TENDENCIAS DE REDES Y COMUNICACIÓN

En el pasado las empresas utilizaban dos tipos fundamentalmente distintos de redes: las redes telefónicas y las redes de computadora.
Gracias a la continua desregulación de las telecomunicaciones y a la innovación en la tecnología de la información, las redes telefónicas y computacionales están convergiendo en una sola red digital que utiliza estándares basados en Internet y equipo compartidos.

¿QUÉ ES UNA RED DE COMPUTADORAS?

En su forma más simple, una red consiste de dos o más computadoras conectadas entre sí.
Cada computadora en la red contiene un dispositivo de interfaz de red llamado tarjeta de interfaz de red (NIC). El medio de conexión para vincular componentes de red puede ser un cable telefónico, uno coaxial o una señal de radio, en el caso de las redes de teléfonos celulares y de área local inalámbricas (redes Wi-Fi).
El sistema operativo de red (NOS) enruta y administra las comunicaciones en la red y coordina los recursos de ésta. Una computadora servidor es una computadora en una red que realiza importantes funciones de red para computadoras cliente. La mayoría de las redes también contienen un switch o un hub que actúa como un punto de conexión entre las computadoras. Los hubs son dispositivos muy simples que conectan componentes de red. Un switch tiene mayor funcionalidad que un hub y puede tanto filtrar como reenviar datos a un destino especificado en la red.
¿Y qué hay si se desea comunicar con otra red, como Internet? Necesitaría un enrutador: un procesador de comunicaciones que se utiliza para enrutar paquetes de datos a través de distintas redes y asegurar que los datos enviados lleguen a la dirección correcta.

Redes en compañías grandes

La infraestructura de redes para una gran corporación consiste de una gran cantidad de estas pequeñas redes de área local vinculadas con otras redes de área local y con redes corporativas en toda la empresa. Varios servidores poderosos soportan un sitio Web corporativo, una intranet corporativa y tal vez una extranet.

TECNOLOGÍAS DE REDES DIGITALES CLAVE


Computación cliente/servidor

El servidor establece las reglas de comunicación para la red y provee a cada cliente una dirección, de modo que otros equipos puedan encontrarlos en la red.

Conmutación de paquetes

Es un método para dividir mensajes digitales en par- celas llamadas paquetes, y éstos se envían por distintas rutas de comunicación a medida que se vuelven disponibles, para después reensamblarlos una vez que llegan a sus destinos.

TCP/IP y conectividad

En una red típica de telecomunicaciones, diversos componentes de hardware y software necesitan trabajar en conjunto para transmitir información. Los distintos componentes en una red sólo se pueden comunicar si se adhieren a un conjunto común de reglas denominadas protocolos. Un protocolo es un conjunto de reglas y procedimientos que gobiernan la transmisión de información entre dos puntos en una red.
En la actualidad, las redes corporativas utilizan cada vez más un único estándar común a nivel mundial, conocido como Protocolo de Control de Transmisión/Protocolo de Internet (TCP/IP).

REDES DE COMUNICACIONES


COMPARACIÓN ENTRE SEÑALES DIGITALES Y ANALÓGICAS

Hay dos formas de comunicar un mensaje en una red: ya sea mediante una señal analógica o una digital. Una señal analógica se representa mediante una forma de onda continua que pasa por un medio o canal de comunicación y se ha utilizado para la comunicación por voz.
Una señal digital es una forma de onda binaria discreta, en vez de una forma de onda continua.
La palabra módem es abreviación de modulador-demodulador.

TIPOS DE REDES


Redes de área local

na red de área local (LAN) está diseñada para conectar computadoras personales y otros dispositivos digitales dentro de un radio de media milla o 500 metros.
Una red de igual a igual trata de la misma forma a todos los procesadores y se utiliza en primera instancia en las redes pequeñas con 10 o menos usuarios.
Algunas veces las LAN se describen en términos de la forma en que sus componentes se conectan entre sí, o su topología. Existen tres topologías importantes de LAN:
En una topología de estrella, todos los dispositivos en la red se conectan a un solo concentrador. En una red de estrella extendida, varias capas de concentradores se organizan en una jerarquía.
En una topología de bus, una estación transmite señales que viajan en ambas direcciones a lo largo de un solo segmento de transmisión. Todas las señales se difunden en ambas direcciones a toda la red. Todas las máquinas en la red reciben las mismas señales, y el software instalado en las computadoras cliente permite a cada cliente escuchar los mensajes dirigidos a él de manera específica. La topología de bus es la topología de Ethernet más común.
Una topología de anillo conecta a los componentes de la red en un lazo cerrado. Los mensajes pasan de una computadora a otra sólo en una dirección a través del lazo, y sólo una estación puede transmitir a la vez.

Redes metropolitanas y de área amplia

Las redes de área amplia (WAN) abarcan distancias geográficas amplias: regiones completas, estados, continentes o todo el globo terráqueo. La WAN más universal y poderosa es Internet. Las computadoras se conectan a una WAN por medio de redes públicas, como el sistema telefónico o los sistemas de cable privados, o por medio de líneas o satélites que se rentan. Una red de área metropolitana (MAN) abarca un área metropolitana, por lo general una ciudad y sus principales suburbios. Su alcance geográfico está entre una WAN y una LAN.

MEDIOS DE TRANSMISIÓN FÍSICOS


Cable trenzado

El cable trenzado consiste en tiras de cable de cobre trenzadas en pares y es uno de los tipos más antiguos de medio de transmisión.

Cable coaxial

El cable coaxial, similar al que se utiliza para la televisión por cable, consiste en cable de cobre con aislamiento grueso, el cual puede transmitir un mayor volumen de datos que el cable trenzado.

Fibra óptica y redes ópticas

El cable de fibra óptica consiste en tiras unidas de fibra de vidrio transparente, cada una del grosor de un cabello humano. Los datos se transforman en pulsos de luz, los cuales se envían a través del cable de fibra óptica mediante un dispositivo láser a velocidades que varían desde 500 kilobits hasta varios billones de bits por segundo en entornos experimentales.

Medios de transmisión inalámbricos

La transmisión inalámbrica se basa en las señales de radio de varias frecuencias. Hay tres tipos de redes inalámbricas que utilizan las computadoras: de microondas, celular y Wi-Fi. Los sistemas de microondas, tanto terrestres como celestiales, transmiten señales de radio de alta frecuencia a través de la atmósfera y se utilizan mucho para la comunicación punto a punto de alto volumen y larga distancia.
Los sistemas celulares también utilizan ondas de radio y una variedad de protocolos distintos para comunicarse con antenas de radio (torres) colocadas dentro de áreas geográficas adyacentes, conocidas como celdas.
Las redes inalámbricas están suplantando a las redes fijas tradicionales para muchas aplicaciones; además están creando nuevas aplicaciones, servicios y modelos de negocios.


Velocidad de transmisión

La cantidad total de información digital que se puede transmitir a través de cualquier medio de comunicación se mide en bits por segundo (bps). Se requiere un cambio de señal (o ciclo) para transmitir uno o varios bits; por lo tanto, la capacidad de transmisión de cada tipo de medio de telecomunicaciones es una función de su frecuencia. El número de ciclos por segundo que se pueden enviar a través del medio se mide en hertz: un hertz equivale a un ciclo por segundo.
El rango de frecuencias que se pueden acomodar en un canal de telecomunicaciones en particular se conoce como su ancho de banda. El ancho de banda es la diferencia entre las frecuencias más alta y más baja que se pueden acomodar en un solo canal. Cuanto más grande sea el rango de frecuencias, mayor será el ancho de banda y también la capacidad de transmisión del canal.

INTERNET GLOBAL


¿QUÉ ES INTERNET?

Internet se ha convertido en el sistema de comunicación público más extenso en el mundo, que en la actualidad compite con el sistema telefónico global en cuanto a alcance y rango. También es la implementación más grande en el mundo de la computación cliente/servidor y de las interredes, ya que vincula a millones de redes individuales en todo el mundo.
Un proveedor de servicios de Internet (ISP) es una organización comercial con una conexión permanente a Internet que vende conexiones temporales a suscriptores minoristas.
Las tecnologías de línea de suscriptor digital (DSL) operan a través de las líneas telefónicas existentes para transportar voz, datos y video a tasas de transmisión que varían desde 385 Kbps hasta llegar a 9 Mbps. Las conexiones de Internet por cable que ofrecen los distribuidores de televisión por cable utilizan líneas coaxiales de cable digital para ofrecer acceso a Internet de alta velocidad a los hogares y negocios.

DIRECCIONAMIENTO Y ARQUITECTURADE INTERNET

Internet se basa en la suite de protocolos de red TCP/IP que describimos en una sección anterior en este capitulo. A cada computadora en Internet se le asigna una dirección de Protocolo de Internet (IP) única, que en la actualidad es un número de 32 bits representado por cuatro cadenas de números, los cuales varían de 0 a 255 y se separan por puntos.

El sistema de nombres de dominio

Como seria sumamente difícil para los usuarios de Internet recordar cadenas de 12 números, el sistema de nombres de dominio (DNS) convierte los nombres de dominio en direcciones IP. El nombre de domino es el nombre en ingles o español que corresponde a la dirección IP numérica única de 32 bits para cada computadora conectada a Internet. Los servidores DNS mantienen una base de datos que contiene direcciones IP asociadas a sus correspondientes nombres de dominio. Para que una computadora tenga acceso a Internet, los usuarios sólo necesitan especificar su nombre de dominio.

Arquitectura y gobernanza de Internet

Nadie es “dueño” de Internet, por lo cual no tiene una administración formal. Sin embargo, las políticas de Internet a nivel mundial se establecen a través de varias organizaciones profesionales y organismos gubernamentales, como lo son; el Consejo de Arquitectura de Internet (IAB), que ayuda a definir la estructura general de Internet; la Corporación de Internet para la Asignación de Nombres y Números (ICANN), que asigna direcciones IP, y el Consorcio World Wide Web (W3C), encargado de establecer el lenguaje de marcado de hipertexto y otros estándares de programa- ción para Web.

SERVICIOS DE INTERNET Y HERRAMIENTAS DE COMUNICACIÓN

Internet se basa en tecnología cliente/servidor. Los individuos que utilizan Internet controlan lo que hacen por medio de aplicaciones cliente en sus computadoras, como el software de navegador Web.

Servicios de Internet

Una computadora cliente que se conecta a Internet tiene acceso a una variedad de servicios, como el correo electrónico, los grupos electrónicos de discusión, las salas de chat y la mensajería instantánea, Telnet, el protocolo de transferencia de archivos (FTP) y Web.
El correo electrónico permite intercambiar mensajes de una computadora a otra, con capacidades para dirigir mensajes a varios recipientes, reenviar mensajes y adjuntar documentos de texto o archivos multimedia a los mensajes.
La mensajería instantánea es un tipo de servicio de chat que permite a los participantes crear sus propios canales privados.

Voz sobre IP

Internet también se ha convertido en una plataforma popular para la transmisión de voz y las redes corporativas. La tecnología de Voz sobre IP (VoIP) transmite información de voz en forma digital mediante el uso de la conmutación de paquetes, con lo cual se evitan los costos que cobran las redes telefónicas locales y de larga distancia.

Comunicaciones unificadas

Las comunicaciones unificadas integran canales dispares para comunicaciones de voz, comunicaciones de datos, mensajería instantánea, correo electrónico y conferencias electrónicas en una sola experiencia, en donde los usuarios pueden alternar entre los distintos modos de comunicación sin ningún problema.

Redes privadas virtuales

Una red privada virtual (VPN) es una red privada segura y cifrada que se ha configurado dentro de una red pública para aprovechar la economía de escala y las facilidades administrativas de las grandes redes, como Internet.

WEB

Es un sistema con estándares aceptados de manera universal para almacenar, recuperar, dar formato y mostrar información mediante el uso de una arquitectura cliente/servidor.
Un sitio Web típico es una colección de páginas Web vinculadas a una página de inicio.

Hipertexto

Las páginas Web se basan en un Lenguaje de Marcado de Hipertexto (HTML) estándar, el cual da formato a los documentos e incorpora vínculos dinámicos a otros documentos e imágenes almacenadas en la misma computadora o en equipos remotos.
Protocolo de transferencia de hipertexto (http), es el estándar de comunicaciones que se utiliza para transferir páginas en Web.
En conjunto, a la dirección se le conoce como localizador uniforme de recursos (URL).

Servidores Web

Un servidor Web consiste en software para localizar y administrar páginas Web almacenadas. Localiza las páginas Web solicitadas por un usuario en la computadora en donde están almacenadas y las envía a la computadora del usuario.

Búsqueda de información en Web


Motores de búsqueda
Tratan de resolver el problema de encontrar información útil en Web casi al instante y, en definitiva, son la “aplicación asesina” de la era de Internet. Los motores de búsqueda actuales pueden filtrar archivos HTML, archivos de aplicaciones de Microsoft Office y archivos PDF, además de archivos de audio, video e imágenes.
Los motores de búsqueda se han convertido en importantes herramientas de compras al ofrecer lo que se conoce ahora como marketing de motores de búsqueda.
La optimización de motores de búsqueda (SEO) es el proceso de mejorar la calidad y el volumen del tráfico Web hacia un sitio Web, para lo cual se emplea una serie de técnicas que ayudan a un sitio Web a obtener una mayor clasificación con los principales motores de búsqueda cuando se colocan ciertas palabras y frases clave en el campo de búsqueda.
Los bots de compras usan software de agente inteligente para buscar en Internet la información sobre compras.

Web 2.0

Los sitios Web en la actualidad no sólo tienen contenido estático; también permiten a las personas colaborar y compartir información, además de crear nuevos servicios y contenido en línea. Estos servicios interactivos basados en Internet de segunda generación se conocen como Web 2.0.
Web 2.0 tiene cuatro características distintivas: interactividad, control del usuario en tiempo real, participación social (compartición) y contenido generado por el usuario.
Un blog, el término popular para un Weblog, es un sitio Web personal que por lo general contiene una serie de entradas cronológicas (de la más reciente a la más antigua) de su autor, además de vínculos a páginas Web relacionadas.
Si usted es un ávido lector de blogs, podría usar el servicio RSS para mantenerse actualizado con sus blogs favoritos sin tener que estar revisándolos de manera constante en búsqueda de actualizaciones. RSS, que significa resumen de sitios complejos o sindicación realmente simple, sindica el contenido de un sitio Web de modo que se pueda utilizar en otro entorno.
En contraste, los wikis son sitios Web colaborativos en donde los visitantes pueden agregar, eliminar o modificar contenido en el sitio, incluso las obras de autores anteriores. Wiki proviene de la palabra “rápido” en hawaiano.
Los sitios de redes sociales permiten a los usuarios crear comunidades de amigos y colegas profesionales.

Web 3.0: el servicio Web del futuro


Web 3.0 es la promesa de una Web futura en donde toda esta información digital y todos estos contactos se puedan entrelazar para formar una sola experiencia significativa.
Algunas veces a ésta se le conoce como Web semántica. La palabra “semántica” se refiere al significado. La mayoría del contenido de Web en la actualidad está diseñado para que los humanos lo lean y las computadoras lo desplieguen, no para que los pro- gramas de computadora lo analicen y manipulen. Los motores de búsqueda pueden descubrir cuándo aparece un término o palabra clave específico en un documento Web, pero en realidad no entienden su significado ni cómo se relaciona con el resto de la información en Web.

LA REVOLUCIÓN INALÁMBRICA


La comunicación inalámbrica ayuda a las empresas a permanecer con más facilidad en contacto con los clientes, proveedores y empleados, además de que provee arreglos más flexibles para organizar el trabajo. La tecnología inalámbrica también ha creado nuevos productos, servicios y canales de ventas.
Si requiere comunicación móvil y poder de cómputo o acceso remoto a sistemas corporativos, puede trabajar con una variedad de dispositivos inalámbricos, como teléfonos celulares, teléfonos inteligentes (smartphones) y computadoras personales con conexión inalámbrica.

SISTEMAS CELULARES

Las primeras generaciones de los sistemas celulares se diseñaron en primera instancia para la transmisión de voz y de datos limitados en forma de mensajes cortos. Ahora las compañías de comunicaciones inalámbricas ofrecen redes celulares más poderosas conocidas como redes de tercera generación o redes 3G.

a siguiente evolución en la comunicación inalámbrica, conocida como redes 4G, se basa por completo en la conmutación de paquetes y es capaz de alcanzar una velocidad de transmisión de 100 Mbps (que puede llegar a 1 Gbps bajo condiciones óptimas), con una calidad de primera y mucha seguridad. Los servicios de voz, datos y video de flujo continuo de alta calidad estarán disponibles para los usuarios en cualquier parte y a cualquier hora. Las tecnologías actuales previas a 4G son la evolución a largo plazo (LTE) y WiMax móvil.

REDES INALÁMBRICAS DE COMPUTADORAS Y ACCESO A INTERNET

Una variedad de tecnologías proveen acceso inalámbrico de alta velocidad a Internet para las PC y otros dispositivos portátiles inalámbricos, así como para los telé- fonos celulares.

Bluetooth

Bluetooth es el nombre popular para el estándar de redes inalámbricas 802.15, que es útil para crear pequeñas redes de área personal (PAN). Vincula hasta ocho dispositivos dentro de un área de 10 metros mediante el uso de comunicación basada en radio de baja energía, y puede transmitir hasta 722 Kbps en la banda de 2.4 GHz.

Wi-Fi y acceso inalámbrico a Internet

El conjunto de estándares 802.11 para redes LAN inalámbricas y acceso inalámbrico a Internet también se conoce como Wi-Fi.
En casi todas las comunicaciones Wi-Fi, los dispositivos inalámbricos se comunican con una LAN fija mediante el uso de puntos de acceso. Un punto de acceso es una caja que consiste en un receptor/transmisor de radio y antenas con vínculos a una red fija, un enrutador o un concentrador (hub).
Por lo general, los puntos activos consisten en uno o más puntos de acceso que proveen acceso inalámbrico a Internet en un lugar público. Algunos puntos activos son gratuitos o no requieren software adicional para usarse; otros tal vez requieran activación y el establecimiento de una cuenta de usuario, para lo cual se proporciona un número de tarjeta de crédito a través de Web.
No obstante, la tecnología Wi-Fi impone varios desafíos. Uno de ellos corresponde a las características de seguridad de Wi-Fi, que hacen a estas redes inalámbricas vulnerables a los intrusos.

WiMax

El IEEE desarrolló una nueva familia de estándares conocida como WiMax para lidiar con estos problemas. WiMax, que significa interoperabilidad mundial para acceso por microondas, es el término popular para el estándar 802.16 del IEEE. Tiene un rango de acceso inalámbrico de hasta 31 millas y una velocidad de transmisión de hasta 75 Mbps.
Las antenas WiMax son lo bastante poderosas como para transmitir conexiones a Internet de alta velocidad a las antenas en los techos de los hogares y las empresas a millas de distancia. Los teléfonos celulares y las computadoras laptop con capacidad para WiMax están empezando a aparecer en el mercado.

 

REDES DE SENSORES INALÁMBRICAS Y RFID


Identificación por radio frecuencia (RFID)

Los sistemas de identificación por radio frecuencia (RFID) ofrecen una tecnología poderosa para rastrear el movimiento de productos a través de la cadena de suministro. Los sistemas RFID usan diminutas etiquetas con microchips incrustados que contienen datos sobre un artículo y su ubicación para transmitir señales de radio a través de una distancia corta, a los lectores RFID. Después, los lectores RFID pasan los datos a través de una red a una computadora para su procesamiento. A diferencia de los códigos de barras, las etiquetas RFID no necesitan establecer contacto mediante una línea de visión para poder leerlas.

Redes de sensores inalámbricas

Las redes de sensores inalámbricas (WSN) son redes de dispositivos inalámbricos interconectados, los cuales están incrustados en el entorno físico para proveer mediciones de muchos puntos a lo largo de espacios grandes. Estos dispositivos tienen integrados el procesamiento, el almacenamiento, los sensores de radiofrecuencia y las antenas. Están enlazados en una red interconectada que enruta los datos que capturan hacia una computadora para su análisis.





lunes, 5 de octubre de 2015

Resumen capítulo 6 Sistemas de Información Gerencial

Capítulo 6

Fundamentos de inteligencia de negocios: bases de datos y administración de la información


ORGANIZACIÓN DE LOS DATOS EN UN ENTORNODE ARCHIVOS TRADICIONAL


TÉRMINOS Y CONCEPTOS DE ORGANIZACIÓNDE ARCHIVOS

Un sistema computacional organiza los datos en una jerarquía que empieza con bits y bytes, y progresa hasta llegar a los campos, registros, archivos y bases de datos. Un bit representa la unidad más pequeña de datos que una computadora puede manejar. Un grupo de bits, denominado byte, representa a un solo carácter. Un agrupamiento de caracteres se denomina campo. Un grupo de campos relacionados, representan un registro; un grupo de registros del mismo tipo se denomina archivo. Un grupo de archivos relacionados constituye una base de datos.

ROBLEMAS CON EL ENTORNO DE ARCHIVOS TRADICIONAL


Redundancia e inconsistencia de los datos

Es la presencia de datos duplicados en varios archivos, de modo que se almacenen los mismos datos en más de un lugar o ubicación. La redundancia ocurre cuando distintos grupos en una organización recolectan por separado la misma pieza de datos y la almacenan de manera independiente unos de otros. Desperdicia recursos de almacenamiento y también conduce a la inconsistencia de los datos, en donde el mismo atributo puede tener distintos valores.

Dependencia programa-datos

Se refiere al acoplamiento de los datos almacenados en archivos y los programas específicos requeridos para actualizar y dar mantenimiento a esos archivos, de tal forma que los cambios en los programas requieran cambios en los datos.

Falta de flexibilidad

Un sistema de archivos tradicional puede entregar informes programados de rutina después de cierto esfuerzo extenso de programación, pero no puede entregar informes ad hoc ni responder de manera oportuna a los requerimientos de información no anticipados.

Seguridad defectuosa

Como hay poco control o poca administración de los datos, el acceso a la información, así como su diseminación, pueden estar fuera de control. La gerencia tal vez no tenga forma de saber quién está accediendo a los datos de la organización, o incluso modificándolos.

Falta de compartición y disponibilidad de los datos

Como las piezas de información en los distintos archivos y las diferentes partes de la organización no se pueden relacionar entre sí, es casi imposible compartir o acceder a la información de una manera oportuna. La información no puede fluir con libertad entre áreas funcionales o partes de la organización distintas.

LA METODOLOGÍA DE LAS BASES DE DATOS PARA LA ADMINISTRACIÓN DE DATOS


La tecnología de las bases de datos resuelve muchos de los problemas de la organización de los archivos tradicionales. Una definición más rigurosa de una base de datos es la de una colección de datos organizados para dar servicio a muchas aplicaciones de manera eficiente, al centralizar los datos y controlar los que son redundantes.

SISTEMAS DE ADMINISTRACIÓN DE BASES DE DATOS (DBMS)


Es software que permite a una organización centralizar los datos, administrarlos en forma eficiente y proveer acceso a los datos almacenados mediante programas de aplicación. El DBMS actúa como una interfaz entre los programas de aplicación y los archivos de datos físicos.

Cómo resuelve un DBMS los problemas del entorno de archivos tradicionales

Un DBMS reduce la redundancia e inconsistencia de los datos al minimizar los archivos aislados en los que se repiten los mismos datos.
El DBMS desacopla los programas y los datos, con lo cual estos últimos se pueden independizar.
El DBMS permite a la organización administrar los datos, su uso y su seguridad en forma central.

DBMS relacional

Los DBMS contemporáneos utilizan distintos modelos de bases de datos para llevar el registro de las entidades, atributos y relaciones. El tipo más popular de sistemas DBMS en la actualidad para las PCs, así como para computadoras más grandes y mainframes, es el DBMS relacional. Las bases de datos relacionales representan los datos como tablas bidimensionales (llamadas relaciones), a las cuales se puede hacer referencia como si fueran archivos.

Operaciones de un DBMS relacional
Las tablas de bases de datos relacionales se pueden combinar con facilidad para ofrecer los datos requeridos por los usuarios, siempre y cuando dos tablas cualesquiera compartan un elemento de datos común.
En una base de datos relacional se utilizan tres operaciones básicas, para desarrollar conjuntos útiles de datos: seleccionar, unir y proyectar.

DBMS orientado a objetos

Almacena los datos y los procedimientos que actúan sobre esos datos como objetos que se pueden recuperar y compartir de manera automática.
Aunque las bases de datos orientadas a objetos pueden almacenar tipos más complejos de información que los DBMS relacionales, son lentos en comparación con los DBMS relacionales para procesar grandes números de transacciones. Ahora hay sistemas DBMS objeto-relacional híbridos, que ofrecen las capacidades de los sistemas DBMS tanto orientados a objetos como relacionales.

Bases de datos en la nube

Los proveedores de computación en la nube ofrecen servicios de administración de bases de datos, pero por lo general estos servicios tienen menos funcionalidad que sus contrapartes dentro de las premisas de la empresa. Por el momento, la base de clientes primordial para la administración de datos basados en la nube consiste en empresas iníciales enfocadas en Web o negocios desde pequeños hasta medianos que buscan capacidades de bases de datos a un menor precio que el de un DBMS relacional estándar.

CAPACIDADES DE LOS SISTEMAS DE ADMINISTRACIÓN DE BASES DE DATOS


Un DBMS incluye capacidades y herramientas para organizar, administrar y acceder a los datos en la base de datos. Las más importantes son: su lenguaje de definición de datos, el diccionario de datos y el lenguaje de manipulación de datos.
Los DBMS tienen una capacidad de definición de datos para especificar la estruc- tura del contenido de la base de datos. Podría usarse para crear tablas de bases de datos y definir las características de los campos en cada tabla. Esta información sobre la base de datos se puede documentar en un diccionario de datos, el cual es un archivo automatizado o manual que almacena las definiciones de los elementos de datos y sus características.

Consultas e informes

Un DBMS contiene herramientas para acceder a la información en las bases de datos y manipularla. La mayoría de los DBMS tienen un lenguaje especializado conocido como lenguaje de manipulación de datos el cual se utiliza para agregar, modificar, eliminar y recuperar los datos en la base. El lenguaje de manipulación de datos más prominente en la actualidad es el lenguaje de consulta estructurado, o SQL.

DISEÑO DE BASES DE DATOS

Para crear una base de datos hay que comprender las relaciones entre la información, el tipo de datos que se mantendrán en la base, cómo se utilizarán y la forma en que tendrá que cambiar la organización para administrarlos desde una perspectiva a nivel de toda la compañía. La base de datos requiere tanto un diseño conceptual como uno físico.

Diagramas de normalización y de entidad-relación

Para usar un modelo de base de datos relacional en forma efectiva, hay que optimi- zar los agrupamientos complejos de datos para minimizar los elementos de datos redundantes y las incómodas relaciones de varios a varios. El proceso de crear estruc- turas de datos pequeñas y estables pero a la vez flexibles y adaptivas a partir de grupos complejos de datos se denomina normalización.
Los sistemas de bases de datos relacionales tratan de cumplir reglas de integridad referencial para asegurar que las relaciones entre las tablas acopladas permanezcan consistentes.
Los diseñadores de bases de datos documentan su modelo de datos con un diagrama entidad-relación, el cual muestra la relación entre las entidades.

USO DE BASES DE DATOS PARA MEJORAR EL DESEMPEÑO DE NEGOCIOS Y LA TOMA DE DECISIONES


Las empresas utilizan sus bases de datos para llevar el registro de las transacciones básicas, como pagar a los proveedores, procesar pedidos, llevar el registro de los clientes y pagar a los empleados. Pero también se necesitan bases de datos para proveer información que ayude a la compañía a operar sus negocios con más eficiencia, y ayudar a los gerentes y empleados a tomar mejores decisiones.


ALMACENES DE DATOS

Un almacén de datos es una base de datos que almacena la información actual e histórica de interés potencial para los encargados de tomar decisiones en la compañía. Los datos se originan en muchos sistemas de transacciones operacionales básicos, como los sistemas de ventas, las cuentas de clientes, la manufactura, y pueden incluir datos de transacciones de sitios Web. El almacén de datos consolida y estandariza la información de distintas bases de datos operacionales, de modo que se pueda utilizar en toda la empresa para el análisis gerencial y la toma de decisiones.

Mercados de datos

Un mercado de datos es un subconjunto de un almacén de datos, en el cual se coloca una porción con alto grado de enfoque en los datos de la organización en una base de datos separada para una población específica de usuarios.

HERRAMIENTAS PARA LA INTELIGENCIA DE NEGOCIOS: ANÁLISIS DE DATOS MULTIDIMENSIONAL Y MINERÍA DE DATOS


Las herramientas de inteligencia de negocios permiten a los usuarios analizar datos para ver nuevos patrones, relaciones y perspectivas que son útiles para guiar la toma de decisiones.

Procesamiento analítico en línea (OLAP)

OLAP soporta el análisis de datos multidimensional, el cual permite a los usuarios ver los mismos datos de distintas formas mediante el uso de varias dimensiones. Cada aspecto de información representa una dimensión distinta.

Minería de datos

La minería de datos está más orientada al descubrimiento, ya que provee perspectivas hacia los datos corporativos que no se pueden obtener mediante OLAP, al encontrar patrones y relaciones ocultas en las bases de datos grandes e inferir reglas a partir de estos patrones y relaciones, para predecir el comportamiento a futuro. Los patrones y reglas se utilizan para guiar la toma de decisiones y pronosticar el efecto de esas decisiones. Los tipos de información que se pueden obtener de la minería de datos son:

• Las asociaciones son ocurrencias vinculadas a un solo evento.
• En las secuencias, los eventos se vinculan en el transcurso del tiempo.
• La clasificación reconoce los patrones que describen el grupo al que pertenece un elemento, para lo cual se examinan los elementos existentes que hayan sido clasificados y se infiere un conjunto de reglas.
• El agrupamiento funciona de una manera similar a la clasificación cuando aún no se han definido grupos.
• Aunque estas aplicaciones implican predicciones, el pronóstico utiliza las predicciones de una manera distinta. Se basa en una serie de valores existentes para pronosticar cuáles serán los otros valores.

El análisis predictivo utiliza las técnicas de minería de datos, los datos históricos y las suposiciones sobre las condiciones futuras para predecir los resultados de los eventos, como la probabilidad de que un cliente responda a una oferta o que compre un producto específico.

Minería de datos y minería Web

En la actualidad hay herramientas de minería de texto disponibles para ayudar a las empresas a analizar estos datos. Estas herramientas pueden extraer elementos clave de los conjuntos de datos ex- tensos no estructurados, descubrir patrones y relaciones, así como sintetizar la información.
El descubrimiento y análisis de los patrones útiles y la información pro- veniente de World Wide Web se denominan minería Web. Las empresas podrían recurrir a la minería Web para que les ayude a comprender el comportamiento de los clientes, evaluar la efectividad de un sitio Web específico o cuantificar el éxito de una campaña de marketing. La minería Web busca patrones en los datos a través de la minería de contenido, la minería de estructura y la minería de uso.

LAS BASES DE DATOS Y WEB

Hay varias ventajas en cuanto al uso de Web para acceder a las bases de datos internas de una organización. En primer lugar, el software de navegador Web es mucho más fácil de usar que las herramientas de consulta propietarias. En segundo lugar, la interfaz Web requiere pocos o ningún cambio en la base de datos interna. Es mucho menos costoso agregar una interfaz Web frente a un sistema heredado que rediseñar y reconstruir el sistema para mejorar el acceso de los usuarios.
El acceso a las bases de datos corporativas por medio de Web está creando nuevas eficiencias, oportunidades y modelos de negocios.

ADMINISTRACIÓN DE LOS RECURSOS DE DATOS


ESTABLECIMIENTO DE UNA POLÍTICA DE INFORMACIÓN


Una política de información es la que especifica las reglas de la organización para compartir, diseminar, adquirir, estandarizar, clasificar e inventariar la información. La política de información establece procedimientos y rendiciones de cuentas específicos, identifica qué usuarios y unidades organizacionales pueden compartir información, en dónde distribuirla y quién es responsable de actualizarla y mantenerla.
La administración de datos es responsable de las políticas y procedimientos específicos a través de los cuales se pueden administrar los datos como un recurso organizacional. Estas responsabilida- des abarcan el desarrollo de la política de información, la planificación de los datos, la supervisión del diseño lógico de la base de datos, y el desarrollo del diccionario de datos, así como el proceso de monitorear la forma en que los especialistas de sistemas de infor- mación y los grupos de usuarios finales utilizan los datos.

ASEGURAMIENTO DE LA CALIDAD DE LOS DATOS


Si una base de datos está diseñada en forma apropiada y hay estándares de datos esta- blecidos a nivel empresarial, los elementos de datos duplicados o inconsistentes deben reducirse al mínimo. Sin embargo, la mayoría de los problemas de calidad de los datos, como los nombres mal escritos, los números transpuestos y los códigos incorrectos o faltantes, se derivan de los errores durante la captura de los datos. La incidencia de dichos errores aumenta a medida que las compañías pasan sus negocios a Web y permi- ten que los clientes y proveedores introduzcan datos en sus sitios Web para actualizar de manera directa los sistemas internos.
Antes de implementar una nueva base de datos, las organizaciones necesitan identificar y corregir sus datos incorrectos y establecer mejores rutinas para editar los datos una vez que su base esté en operación. Con frecuencia, el análisis de la calidad de los datos empieza con una auditoría de calidad de los datos, la cual es una encuesta estructurada de la precisión y el nivel de su integridad en un sistema de información.
La limpieza de datos, conocida también en inglés como data scrubbing, consiste en actividades para detectar y corregir datos en una base que sean incorrectos, incompletos, que tengan un formato inapropiado o que sean redundantes. La limpieza de datos no sólo corrige los errores, sino que también impone la consistencia entre los distintos conjuntos de datos que se originan en sistemas de información separados.