Willkommen! - Bienvenido! - Welcome!

Bitácora digital de Información al cliente de Tux&Cía.
Bitácora Central: Tux & Cía.
Bitácora Técnica (multilingüe): TecniCambalandia
May the source be with you!

Sunday, March 28, 2010

Calidad de Sistemas y Datos

Data quality 
Data are of high quality "if they are fit for their intended uses in operations, decision making and planning" (J. M. Juran). Alternatively, the data are deemed of high quality if they correctly represent the real-world construct to which they refer. Furthermore, apart from these definitions, as data volume increases, the question of internal consistency within data becomes paramount, regardless of fitness for use for any external purpose, e.g. a person's age and birth date may conflict within different parts of a database. The first views can often be in disagreement, even about the same set of data used for the same purpose. This article discusses the concept as it related to business data processing, although of course other data have various quality issues as well.
Contents

List of system quality attributes


Integridad del mensaje

Por integridad del mensaje en computación se entiende que cuando se envíe un mensaje de una persona a otra o bien de una máquina a otra, este mensaje no sea modificado, sin que el destinatario pueda comprobarlo. La modificación se refiere tanto a una modificación explícita por alguien como a una modificación debido a un error (por ejemplo de transmisión).
En otras palabras se puede mantener la "Integridad del Mensaje" evitando que este pueda ser modificado por un tercero.
Típicamente esto se pude lograr utilizando funciones de sentido único o también llamadas funciones Hash, a las cuales se les da como dato de entrada el mensaje y devuelve un código Hash que en teoría es único para el mensaje enviado, de modo que la persona que envía el mensaje lo hace con su código Hash respectivo, la persona que los recibe utiliza la misma función Hash para comparar el código así obtenido con el código que recibe.
Existen varias implementaciones de estas funciones Hash; las más utilizadas son SHA1 y MD5 por ser de ejecución rápida, pero tienen mayor posibilidad de colisiones entre códigos generados para distintos mensajes que otras funciones que usan más bits para crear el hash de los mensajes.
Los códigos Hash de un CD de 650 Mb puede reducirse a unos cuantos Kbytes.
En combinación con llaves asimétricas es posible mantener la "Integridad del mensaje" y determinar su proveniencia.

Disponibilidad de Datos

El factor de disponibilidad de un equipo o sistema es una medida que nos indica cuanto tiempo está ese equipo o sistema operativo respecto de la duración total durante la que se hubiese deseado que funcionase. Típicamente se expresa con un porcentaje. No debe de ser confundida con la rapidez de respuesta. 
Ejemplo
  • Necesitamos que una máquina funcione 12 horas al día, pero ésta falla una hora cada día.
    Para repararla, se necesita además media hora adicional.
    Por lo tanto, su disponibilidad es de (12-1-0.5)h/12h *100% = 87.5 %.
Se pueden realizar estudios más rigurosos para tomar en cuenta el tiempo de llegada de los técnicos, el tiempo de diagnóstico, la logística de las piezas de recambio... etc.
Availability 
The most simple representation for availability is as a ratio of the expected value of the uptime of a system to the aggregate of the expected values of up and down time, or
A = \frac{E[\mathrm{Uptime}]}{E[\mathrm{Uptime}]+E[\mathrm{Downtime}]}
Example
If we are using equipment which has mean time between failure (MTBF) of 81.5 years and mean time to recovery (MDTR) of 1 hour:
MTBF in hours = 81.5*365*24=713940
Availability= MTBF/(MTBF+MDTR) = 713940/713941 =99.999859%
Unavailability = 0.000141%
Outage due to equipment in hours per year
U=0.01235 hours per year.
----------------------
Availability of the module is the percentage of time when system is operational. Availability of a hardware/software module can be obtained by the formula given below.
Availability calculation from MTBF and MTTR
Availability is typically specified in nines notation.
For example 3-nines availability corresponds to 99.9% availability.
A 5-nines availability corresponds to 99.999% availability. 
Percentage calculation
Availability is usually expressed as a percentage of uptime in a given year. The following table shows the downtime that will be allowed for a particular percentage of availability, presuming that the system is required to operate continuously. Service level agreements often refer to monthly downtime or availability in order to calculate service credits to match monthly billing cycles. The following table shows the translation from a given availability percentage to the corresponding amount of time a system would be unavailable per year, month, or week
Availability % Downtime per year Downtime per month* Downtime per week
90% 36.5 days 72 hours 16.8 hours
95% 18.25 days 36 hours 8.4 hours
98% 7.30 days 14.4 hours 3.36 hours
99% 3.65 days 7.20 hours 1.68 hours
99.5% 1.83 days 3.60 hours 50.4 minutes
99.8% 17.52 hours 86.23 minutes 20.16 minutes
99.9% ("three nines") 8.76 hours 43.2 minutes 10.1 minutes
99.95% 4.38 hours 21.56 minutes 5.04 minutes
99.99% ("four nines") 52.6 minutes 4.32 minutes 1.01 minutes
99.999% ("five nines") 5.26 minutes 25.9 seconds 6.05 seconds
99.9999% ("six nines") 31.5 seconds 2.59 seconds 0.605 seconds
* For monthly calculations, a 30-day month is used.
It should be noted that uptime and availability are not synonymous. A system can be up, but not available, as in the case of a network outage.
----------------------
The availability of a repairable system is defined as "the probability that the system is operating at a specified time t."  --Barlow and Proschan [1975]
The qualitative definition of availability is defined as "a measure of the degree of a system which is in the operable and committable state at the start of mission when the mission is called for at an unknown random point in time."  --Blanchard [1998] & MIL-STD-721
----------------------
High availability 
Reliability and Availability Basics 

Integridad de Datos

El término integridad de datos se refiere a la corrección y completitud de los datos en una base de datos
Cuando los contenidos se modifican con sentencias INSERT, DELETE o UPDATE, la integridad de los datos almacenados puede perderse de muchas maneras diferentes. Pueden añadirse datos no válidos a la base de datos, tales como un pedido que especifica un producto no existente.
Pueden modificarse datos existentes tomando un valor incorrecto, como por ejemplo si se reasigna un vendedor a una oficina no existente. Los cambios en la base de datos pueden perderse debido a un error del sistema o a un fallo en el suministro de energía. Los cambios pueden ser aplicados parcialmente, como por ejemplo si se añade un pedido de un producto sin ajustar la cantidad disponible para vender.
Una de las funciones importantes de un DBMS relacional es preservar la integridad de sus datos almacenados en la mayor medida posible. 
Tipos de restricciones de integridad
  • Datos Requeridos: establece que una columna tenga un valor no NULL. Se define efectuando la declaración de una columna es NOT NULL cuando la tabla que contiene las columnas se crea por primera vez, como parte de la sentencia CREATE TABLE.
  • Chequeo de Validez: cuando se crea una tabla cada columna tiene un tipo de datos y el DBMS asegura que solamente los datos del tipo especificado sean ingresados en la tabla.
  • Integridad de entidad: establece que la clave primaria de una tabla debe tener un valor único para cada fila de la tabla; si no, la base de datos perderá su integridad. Se especifica en la sentencia CREATE TABLE. El DBMS comprueba automáticamente la unicidad del valor de la clave primaria con cada sentencia INSERT Y UPDATE. Un intento de insertar o actualizar una fila con un valor de la clave primaria ya existente fallará.
  • Integridad referencial: asegura la integridad entre las claves ajenas y primarias (relaciones padre/hijo). Existen cuatro actualizaciones de la base de datos que pueden corromper la integridad referencial.

Confidencialidad

Confidencialidad es la propiedad de la información, por la que se garantiza que está accesible únicamente a personal autorizado a acceder a dicha información. La confidencialidad ha sido definido por la Organización Internacional de Estandarización (ISO) en la norma ISO-17799 como "garantizar que la información es accesible sólo para aquellos autorizados a tener acceso" y es una de las piedras angulares de la seguridad de la información. La confidencialidad es uno de los objetivos de diseño de muchos criptosistemas, hecha posible en la práctica gracias a las técnicas de criptografía moderna.
La confidencialidad también se refiere a un principio ético asociado con varias profesiones (por ejemplo, medicina, derecho, religión, psicología profesional, y el periodismo); en este caso, se habla de secreto profesional. En ética, y (en algunos lugares) en Derecho, concretamente en juicios y otras formas de resolución de conflictos legales, tales como la mediación, algunos tipos de comunicación entre una persona y uno de estos profesionales son "privilegiados" y no pueden ser discutidos o divulgados a terceros. En las jurisdicciones en que la ley prevé la confidencialidad, por lo general hay sanciones por su violación.
La confidencialidad de la información, impuesta en una adaptación del principio clásico militar "need-to-know", constituye la piedra angular de la seguridad de la información en corporaciones de hoy en día. La llamada "burbuja de confidencialidad" restringe los flujos de información, con consecuencias tanto positivas como negativas.
Confidencialidad en Informática
La confidencialidad se entiende en el ámbito de la seguridad informática, como la protección de datos y de información intercambiada entre un emisor y uno o más destinatarios frente a terceros. Esto debe hacerse independientemente de la seguridad del sistema de comunicación utilizado: de hecho, un asunto de gran interés es el problema de garantizar la confidencialidad de la comunicación utilizado cuando el sistema es inherentemente insegura (como Internet).
En un sistema que garantice la confidencialidad, un tercero que entra en posesión de la información intercambiada entre el remitente y el destinatario no es capaz de extraer cualquier contenido inteligible.
Para garantizarla se utilizan mecanismos de cifrado y de ocultación de la comunicación. Digitalmente se puede mantener la confidencialidad de un documento con el uso de llaves asimétricas. Los mecanismos de cifrado garantizan la confidencialidad durante el tiempo necesario para descifrar el mensaje. Por esta razón, es necesario determinar durante cuánto tiempo el mensaje debe seguir siendo confidencial. No existe ningún mecanismo de seguridad absolutamente seguro.

Sunday, March 21, 2010

What about my data?

Source
One of the major hurdles when converting from closed source software is compatibility. Companies which create their own closed source formats make it virtually impossible for anyone else to know how their formats work. Despite this, Linux is compatible with almost every data format in existence and there is generally a freely available program that will read your data. For example, Microsoft Office documents are supported in the OpenOffice.org suite and Adobe Photoshop files are supported in the Gimp.
 Linux supports and encourages the use of open source file formats. Currently the majority of documents are created by Microsoft Office, however these formats are closed source and proprietary. Using these formats puts you at the whim of Microsoft who can (and do) make their file formats incompatible with other applications, including older versions of Microsoft Office! Because these files are closed source, people are forced to purchase new versions of Microsoft Office. While some open source office suites can read and write Microsoft formats, the results are sometimes imperfect because we do not have the code to see how the formats work. Still Linux does a great job of working with Microsoft Office files and you will probably find you can use and swap them without issue. You can read more about this topic next in the section of this website, 'Other considerations'.
  As a result the free community has adopted a new International Organization for Standarization (ISO) approved XML based document standard (ISO26300) from OASIS called 'open document'. This standard is freely available for anyone to learn and implement (yes, even Microsoft) because it is open source. Due to pressure applied by various Governments switching to this new open format, Microsoft was forced to support this format in their next version of Office. We are not sure to what degree they will support it, however OpenOffice.org already does. Aside from the new open document formats, there are many other formats you can use that are freely usable; HTML, PDF, and even plain text.
As the ISO states, "Organizations and individuals that store their data in the open format avoid being locked in to a single software vendor, leaving them free to switch software if their current vendor goes out-of-business, raises its prices, changes its software, or alters its licensing terms"
Organisations all around the world, including the National Archives of Australia, are switching their documents to this new format to ensure unrestricted access to digital information now and in the future. We encourage users to switch from using closed and dangerous proprietary formats to open and freely available formats, which will be around forever.

Make The Move

makethemove.net Welcome!


Make The Move aims to present Linux and open source software as viable alternatives to the system on your computer.
These alternatives are both free (as in price) and free (as in freedom), and put you back in control of your system.
This site is designed to flow from the What is FOSS? section, however you may skip straight to any other.
Enjoy!

What is FOSS?
What is Linux?
Software you might already use
Why should I move to Linux?
What about my data?
Other considerations
Get started!