The Lempel-Ziv Complexity Measure.

23 abril, 2008 Horacio Castellini 3 comentarios

El análisis de la complejidad de Lempel-Ziv está basado en la transformación de la señal a analizar en una secuencia de símbolos. Esta secuencia S[i] se examina de izquierda a derecha. Un contador de complejidad c(n) se incrementa en una unidad cada vez que se encuentra una nueva subsecuencia de símbolos consecutivos. Dicha cuenta refleja la tasa de aparición de nuevos patrones a lo largo de la secuencia. c(n) es la medida de la complejidad de Lempel-Ziv de una señal. Tiene como cota superior a n/log_a(n) donde a es el numero de símbolos diferentes.

Dos son las formas usuales de codificación o de generación de secuencias.

Conversión Binaria: en este caso se define como valor umbral a la mediana (no el promedio) M. Entonces si el valor de la señal es mayor o igual a M se le asigna 1 un sino se le asigna un 0. En este caso a=2.
Conversión Ternaria: en este caso se usan tres valores, el máximo absoluto de la señal, Xmax; el mínimo absoluto Xmin; y la mediana M. Luego se definen dos umbrales, T1=M+abs(Xmax)/16 y T2=M-abs(Xmin)/16. Entonces si el valor de la señal es menor a T1 se le asina 0, si es mayor a T2 se le asigna 2, de otra forma se le asigna 1. En este caso a=3.

En la figura se puede apreciar el pseudo código del algoritmo de Lempel-Ziv modificado por Hongxuan et al.

Padre de la teoría del caos muere a los 90 años.

22 abril, 2008 Horacio Castellini

WASHINGTON (AP) – Edward Lorenz, el padre de la teoría del caos, murió en su casa de Cambridge, Massachusetts, el miércoles 17 del corriente a la edad de 90 años.

Lorentz fue profesor en el Instituto de Tecnología de Massachusetts, cuando introdujo el concepto científico que pequeños efectos llevar a grandes cambios, algo que se conoció como el «efecto mariposa». Explicó la forma en algo tan minúsculo como una mariposa batiendo sus alas en Brasil, cambia el ambiente en constante movimiento, de manera que más tarde podrían desencadenar tornados en Texas.

Su descubrimiento del «caos determinista» provocó «cambios en el punto de vista que tiene la humanidad sobre la naturaleza», dijo la comisión que adjudicó a Lorenz el Premio Kyoto 1991 para ciencias básicas.

Lorenz, estudiando meteorología de la atmósfera, introdujo la moderna teoría del caos en la década de 1960 a través de sus trabajos meticulosos, dijo Kevin Trenberth, un estudiante de Lorenz. Trenberth es ahora jefe de análisis del clima en el Centro Nacional de Investigaciones Atmosféricas.

Trust Metric (Métrica o medida de Confianza)

11 abril, 2008 Horacio Castellini

En la psicología y la sociología, una Trust Metric (Métrica de Confianza) es una medida sobre la confianza que se tiene de un miembro de un grupo por parte de otros que lo conocen. Las Trust Metric pueden ser abstraidas de manera tal que puedan ser implementadas en computadoras. Esto lo hace de interés para el estudio y ingeniería de comunidades virtuales, como Friendster y LiveJournal. El Ataque resistencia (Resistance Attack) es una propiedad importante de las métricas de confianza que reflejan su capacidad de no ser demasiado influenciadas por los agentes que tratan de manipular la confianza y participan de mala fe (es decir, que tienen como objetivo la presunción de abuso de confianza).
Las primeras formas de Trust Metric en fueron usadas en sistemas de comercio electrónico como eBay ‘s la cual es una puntuación por votos cliente-vendedor. Slashdot introdujo su concepto de karma, obtenidos de las actividades para promover la eficacia del grupo, este enfoque es muy influyente en comunidades virtuales para evaluar la confianza entre miembros.
El recurso de desarrollo para software libre Advogato se basa en un nuevo enfoque de los ataques resistentes utilizando la Trust Metric Raph Levien. Levien observó que el algoritmo PageRank (usado por Google) puede ser entendido como una Trust Metric con ataque resistente.
En la figura se muestra un algoritmo de Trust Metric y su aplicación práctica, supongamos que en mi red de infuencia están Alicia (métrica de confianza=0,85) y Beto (metrica de confianza = 0,7). Y desearía saber de antemano poder hacer un negocio con Cacho (que no lo conosco), ahora bien Cacho está en la red de confianza de Alicia (0,1) y Beto (0,95). Entonces una métrica de confianza sería

MC=max{0,85*0,1;0,7*0,95}=0,665

y una métrica de desconfianza sería

MD=1-min{0,85*0,1;0,7*0,95}=0, 915

Como MD > MC puedo tomar la decisión de no hacer negocios con él. Por supesto puedo extender la decisión al terreno de la lógica difusa compensatoria (ver post anteriores) pero ese no es el tema de este post.

Reputation system y Sybil attack

8 abril, 2008 Horacio Castellini

Un Sistema de Reputación es un tipo de algoritmo de filtrado colaborativo que trata de determinar las calificaciones de un conjunto de entidades, en vista de una colección de opiniones que esas entidades tienen unos de otros. Es decir, esto es similar a un sistema de recomendación, pero con el fin de recomendar las entidades entre sí.
Los sistemas de reputación son útiles en las grandes comunidades on line en que unos usuarios tienen con frecuencia la oportunidad de interactuar con otros usuarios con los que no tienen experiencia previa o en comunidades en las que el contenido generado por el usuario es remitido públicamente para ser compartido, por ejemplo, YouTube o Sonico. En estos casos es útil tener una calificación asignada por otros de de un usuario desconocido para tomar la decisión de interactuar o no con él.
Un sistemas de reputación puede estar acompañado de un sistema de incentivos para premiar la buena conducta y castigar la mala conducta. Por ejemplo, a los usuarios con alta reputación se les pueden conceder privilegios especiales, mientras que los usuarios con poca o desconocida reputación tienen privilegios limitados.
Un simple sistema de reputación, empleados por MercadoLibre.com, es un registro calificación (ya sea positivo, negativo o neutro) posterior a que cada par de usuarios realiza una transacción. Es decir, luego de efectuar una transacción cada usuario califica a su interlocutor tanto como cleinte, como vendedor.
Algoritmos más sofisticados permiten evaluar la reputación de entidades. Uno de tales algoritmos es PageRank, esta es una marca registrada y patentada por Google el 9 de enero de 1999 que ampara una familia de algoritmos utilizados para asignar de forma numérica la relevancia de los documentos (o páginas web) indexados por un motor de búsqueda. PageRank ha tomado su modelo del Science Citation Index (SCI) elaborado por Eugene Garfield para el Instituto de información cientifica (ISI) en los Estados Unidos durante la década del 50. El Science Citation Index pretende resolver la asignación objetiva de méritos cientificos suponiendo que los investigadores cuyo factor de impacto (número de publicaciones y/o referencias bibliográficas en otros trabajos cientificos) es más alto colaboran en mayor medida con el desarrollo de su área de investigación. El índice de citación es un elemento determinante para seleccionar que investigadores reciben becas y recursos de investigación. Y han generado un lamentable atraso en los criterios de investigación, pues lo que importa es producir publicaciones y no el conocimiento humano.
Un Ataque Sybil o de Personalidades Múltiples es aquel en la que un atacante subvierte la reputación del sistema mediante la creación de un gran número de entidades seudónimas, y utilizarlos para obtener una influencia desproporcionadamente grande. Cuando en un sistema de reputación este aportaciones de las entidades que no tienen una cadena de confianza vincular y trata a todos las Entidades de la misma manera es fuertemente vulnerable a este tipo de ataque. Es el nombre de este ataque se asocia al libro Sybil, donde se estudio el caso de una mujer con trastorno de personalidad múltiple.

El Conocimiento desde el punto de vista de la información.

7 abril, 2008 Horacio Castellini

El conocimiento es más que un conjunto de datos, verdades o de información almacenada a través de la experiencia o del aprendizaje (a posteriori), o a través de introspección (a priori). El conocimiento, en su sentido más amplio, es una apreciación de la posesión de múltiples datos interrelacionados que por sí solos poseen menor valor cualitativo. Significa, en definitiva, la posesión de un modelo de la realidad en la mente.
Según Platón, el conocimiento se caracteriza por ser necesariamente verosimil (episteme). De otro modo, la mera creencia y opinión (ignorante de la realidad de las cosas) quedan relegadas al ámbito de lo probable y lo aparente. Y en efecto, esta vinculación entre conocimiento, verdad y necesidad forma parte de toda pretensión de conocimiento filosófico en el pensamiento occidental. En las ciencias de la información, se acostumbra a definir a un conjunto progresivamente integrado por los datos, e información. Así, se define al conocimiento como el conjunto organizado de datos e información destinados a resolver un determinado problema. Es decir una visión algorítmica del conocimiento. Para alcanzarlo se aplica un método de múltiples vías para llegar obtener el conocimiento: método empírico, método histórico, método lógico, analogía, etc.
En general, para que una creencia constituya conocimiento científico no basta con que sea válida y consistente desde la lógica, pues ello no implica su verosimilitud. Así por ejemplo, téngase un sistema lógico deductivo consistente y válido. Niéguese la totalidad de las premisas del sistema, y se obtendrá un sistema igualmente consistente y válido, sólo que contradictorio al sistema previo. De tal manera, validez no garantiza verosimilitud. Para que una teoría deba ser considerada como verosimil, deben existir, desde el punto de vista de la ciencia, pruebas que la apoyen.
El conocimiento puede ser teórico o práctico. El conocimiento teórico puede ser científico (por causas. Así todas las «logías». Por ejemplo Geología) o vulgar (las «grafías» o meras descripciones. Por ejemplo: Geografía). El conocimiento científico a su vez se divide en científico en sentido estricto (por las causas inmediatas), filosófico (por las causas segundas). El conocimiento práctico se divide en arte y técnica, atendiendo a su belleza, sistemática etc. La técnica requiere tanto destrezas manuales como intelectuales, frecuentemente el uso de herramientas y siempre de conocimientos muy variados. La técnica no es privativa del hombre, pues también se manifiesta en la actividad de otros animales y responde a su necesidad de supervivencia. En los animales las técnicas son características de cada especie. En el ser humano, la técnica surge de su necesidad de modificar el medio y se caracteriza por ser transmisible.

Tipos de conocimiento:

El conocimiento a posteriori es derivado de los sentidos. La verdad o falsedad de este conocimiento puede verificarse mediante la experiencia de los sentidos.
El conocimiento a priori es aquel que es necesariamente verosimil y universal, incluso antes de ir al mundo de la experiencia, ya que no depende de la experiencia sino de construcciones mentales. Su fundamento son las condiciones trascendentales, puras, que no sólo no dependen y son anteriores a la experiencia sino que son las condiciones que hacen posible la objetividad de la experiencia.

Foro de Ciencia Cruda

Archivo por meses: abril 2008

The Lempel-Ziv Complexity Measure.

Padre de la teoría del caos muere a los 90 años.

Trust Metric (Métrica o medida de Confianza)

Reputation system y Sybil attack

El Conocimiento desde el punto de vista de la información.

La piedra en el zapato de la física Argentina. "Nullius addictus iurare in verba magistri"