Juan Chamero

Metodología Darwin

  • Aumentar el tamaño de la letra
  • Tamaño de letra predeterminado
  • Reducir el tamaño de la letra

Breadcrumbs

Home La Web Semántica
La web semántica

La Web Semántica - Darwin 1

Correo electrónico Imprimir PDF

La Web Semántica

Develada por la Metodología Darwin

Por Juan Chamero, Esta dirección electrónica esta protegida contra spambots. Es necesario activar Javascript para visualizarla , Buenos Aires – Madrid – Dallas, 25 de mayo 2010

 

Darwin 1: La Web Conceptual: Conceptos versus palabras y “keywords”


 El Huevo de Colón en Sevilla

 

Nota del Editor: Se propone la creación, en Facebook y en otras redes, de un Grupo a denominarse “La Web Semántica” o “Hacia un Nuevo Modelo de Sociedad”. Su fundamento es la Metodología Darwin que permite reconocer y recuperar conceptos de grandes reservorios de datos en red. La Web es un modelo cibernético de nuestra sociedad a la cual la gente se suma en forma espontanea y abierta subyaciendo en ella su “inteligencia”, su ordenamiento intrínseco en base a lo que se dice y se muestra. La Web, en los análisis que haremos en este grupo, se muestra como un gigantesco océano de palabras y de imágenes, a la larga, de “ideogramas” conceptuales íntimamente relacionados entre sí y que en cada momento muestran una estructura guía dominante. Darwin permite “ver” esa estructura y su evolución en el tiempo y en el espacio.

 

 

LA WEB

Mensaje: La Web es un laboratorio espontáneo y autónomo de nuevas formas de sociedad y un súper medio de información masiva con leyes propias.

Este grupo será dedicado a discutir el alcance de la Web dentro de la Sociedad de la Información.  La Web, un sub espacio de Internet, es  hasta ahora el único medio de comunicación masiva que permite una total interactividad humana hasta ahora discriminada en dos submundos en continua interacción:  el Mundo de la Gente, personas como usted y yo que a través de nuestras computadoras nos conectamos con la red , y el Mundo del Orden Establecido (ver “orden” y sus formas según la RAE), un término relativo para designar al mundo de los “Sitios Web”. Se presupone que en  este segundo mundo está almacenado el conocimiento humano  así como sus creencias, rasgos culturales, códigos, principios y leyes considerados validos y vigentes en un determinado momento.

Por primera vez está almacenado en forma accesible el conocimiento en sus formas más diversas desde lo genial a lo trivial y a  la tontería, desde el  conocimiento científico a falacias, supuestas verdades y mentiras manifiestas.  En este mundo, cada documento o “pagina Web” está públicamente abierta a la mirada de la gente y es opcionalmente interactiva, permitiendo a la gente interactuar con su contenido, sumándose al mismo, aplaudiéndolo o rechazándolo. A diferencia con el mundo de las comunicaciones orales todo queda o puede quedar registrado en páginas que pueden o podrían incorporarse al Mundo del Orden Establecido. Esta realidad está de hecho actuando como agente catalítico de una profunda transformación social.

Hasta no hace mucho el modelo comunicacional entre los “voceros” del Orden Establecido y la gente era a través de los medios convencionales: radio, periódicos, cine, TV, que solo permitían ver y escuchar. Con la Web y particularmente con el advenimiento de los sitios con arquitecturas Web 2.0 y Web 3.0 las comunicaciones entre los voceros de los intereses y la gente tienden cada vez más a ser entre la gente:

Cada uno puede actuar en cualquiera de los dos mundos, como vocero o formando parte de la gente. Datos e inteligencia fluyen libremente en ambos sentidos y no ya entre un medio y SU público sino entre todos, instituciones, organizaciones, redes, personas físicas y jurídicas. En última instancia, el hombre y sus organizaciones actúan indistintamente como emisores y/o receptores de información.

En este estadio evolutivo de aparente confusión de roles la Web se nos presenta como muy poco estructurada semánticamente: con Sitios Web solo indexados por las palabras de sus contenidos y no por las temáticas de los mismos. Por otra parte, la gente, ya no se limita a escuchar y ver sino que quiere registrar sus “verdades” en el Mundo del Orden Establecido para modificarlo. Este fenómeno evolutivo, de naturaleza explosiva, se ha manifestado en los últimos tres a cuatro años con la proliferación de las Redes Sociales. Entender esto es de fundamental importancia.

Estándares Web no  aptos para la gente: Por el contrario, los desarrollos tecnológicos recientes han estado orientados a interpretar a un modelo de Orden Establecido (poder) versus la gente fundamentado en que la gente está dispuesta a ver y escuchar lo que se le comunica en forma relativamente bien ordenada. Al ser tan distinta la realidad de los últimos tres años esos desarrollos poco sirven para interpretarla. En ésta línea los desarrollos liderados por el Consorcio W3C de estándares Web están orientados a fortalecer la autoridad del Orden Establecido creando lenguajes y protocolos especialmente aptos para ser manejados por seres humanos cada vez mas “ordenados” (no la gente sino los operadores y funcionarios de ese orden)  sin tratar de comprender la diversidad humana así como la situación real entre esos dos mundos que a la larga se refundirán en uno solo: el mundo de la gente.

En efecto, los autores de los contenidos de los Sitios Web son personas como usted y yo, cada vez más complejos y libres, y que cada vez nos mostramos como menos estructurados. La metodología Darwin que pasaremos a describir permite develar las estructuras conceptuales que subyacen en estos dos mundos TAL_COMO_SE_MUESTRAN ( el “AS_IT_IS” en inglés) en su natural diversidad y complejidad. .

 

¿LA WEB SE HA DESCONTROLADO?

La Clave para comprenderla y prever su evolución

 

Mensaje: La Web muestra un salto cualitativo y cuantitativo en las comunicaciones humanas de tal magnitud que se nos presenta como caótica y desordenada en la medida que no abramos nuestras mentes  para ver más y mejor su inteligencia oculta. El huevo de Colón para distinguirla.

¿Es la Web tan compleja e impredecible como aparenta o hemos dejado de ver claro deslumbrados por tanta tecnología?. Ante una supuesta complejidad excesiva del lenguaje-comportamiento  humano en lugar de estudiarlo en profundidad aprovechando el gigantesco “reality show” que nos ofrece la Web, creamos más tecnología para abajarnos reduciéndonos a simples autómatas.  El ser humano es una maravillosa entidad  creadora de conceptos y esos conceptos están en La Web TAL_COMO_SE_MUESTRA. Luego, un primer paso para conocer lo que pasa por nuestras mentes es poder develar de la Web esos conceptos bajo la forma de un “mapa conceptual” o “tesauro”.  Desde este espacio plantearemos como hacerlo y desde ya adelantamos que no es complejo, pero el descubrirlo implica otro “huevo de Colón”.

El huevo de Colon, o la “proeza” de poner un huevo de pie, es algo simple y sencillo una vez entendido. A veces el “Colon de turno” es un sabio, otras un iluminado, otras un tesonero buscador, pero siempre es alguien que “ve más y mejor” y se manifiesta ansioso de comunicar su visión y sobre todo de concretarla. Por analogía traemos a colación los casos de Galileo, Marconi y Einstein.

Galileo Galilei fue un hombre insigne del Renacimiento, matemático, físico, astrónomo y filosofo inventor entre otras cosas del “telescopio” justamente un aparato para ver más y mejor las maravillas del universo.

Guglielmo Marconi fue un ingeniero italiano ganador del Premio Nobel de Física del año 1909 considerado el padre de la radio y de las telecomunicaciones, paternidad discutida y compartida con otras personas (por ejemplo con el austro húngaro Nikola Tesla). Citamos la radio pues la emplearemos como analogía de lo que ocurre en el Ciberespacio y particularmente en el espacio Web.

Albert Einstein  físico, matemático y gran pensador, considerado el científico más importante del Siglo XX  publica en el año 1905, a los 25 años de edad, su Teoría de la Relatividad Especial, un ensayo que demuestra que ya a esa altura de su vida veía más y mejor que sus precursores, Newton incluido.  Muy posiblemente los impresionantes logros que siguieron a ese primer ensayo sean corolarios de esa primera visión. Einstein como físico reflexiona sobre el tiempo y el espacio  y ve lo que otros no habían visto hasta ese momento, al menos con su claridad conceptual que resume en el análisis estricto del siguiente interrogante: ¿Cuando puede un observador afirmar que algo ha ocurrido?.

¿QUÉ ES DARWIN?

Mensaje: La Web es un inmenso Océano donde residen conceptos y Darwin es una metodología que permite construir herramientas para reconocer y recuperar conceptos.

Darwin es un acrónimo en inglés por Distributed Agents to Retrieve the Web Intelligence, Agentes Distribuidos para Recuperar (ver) la Inteligencia Web, es decir, se trata de agentes o robots (ver “Software agents” o  agentes de software y particularmente “intelligent agents”, por agentes inteligentes” en Wikipedia) creados y entrenados para detectar la inteligencia que aparece dispersa en el espacio Web. A la luz de esta definición Darwin aparece como una metodología y herramienta para ver más y mejor en la Web.

Ahora deberíamos preguntarnos: ¿qué hay en la Web?. Básicamente un inmenso “Océano” virtual de “páginas Web” que son esencialmente documentos humanos.  En cuanto  a su volumen se estima que tienen hoy cabida y acceso habilitado en ese espacio unos 20.000 millones de documentos, número que acrece a un ritmo del orden del 10% anual. Darwin se fundamenta en una serie de “Conjeturas Darwin” acerca de cómo están estructurados esos documentos, a la larga, un modelo acerca de cómo documentamos los humanos. Con todas las reservas del caso, pues se ha hecho abuso del término dentro de Internet, podríamos decir que este conjunto de conjeturas constituye una Ontología de Documentación del Conocimiento.

Un primer análisis nos muestra que estos documentos están redactados en base a palabras (más símbolos, signos de puntuación, e imágenes y objetos multimedia de todo tipo intercalados aquí y allá) pertenecientes a una o varias lenguas y ya en un mayor grado de detalle podemos percatarnos de que algunas palabras o encadenamientos precisos de ellas constituyen algo que percibimos e intuimos como “conceptos” y que diferenciamos de las palabras, acotaciones, términos comunes y de las tan mentadas “keywords” o “palabras clave”. Un concepto es pues algo que tiene para nosotros un significado especial dentro de un determinado contexto y que el o los autores del documento han querido transmitir.

Darwin es una metodología para descubrir conceptos mediante agentes y que como tal nos permite incrementar en millones de veces nuestra capacidad de percepción de conceptos. Para ello deberemos primero entender el mecanismo mediante el cual percibimos conceptos.

 

 

¿CUANTOS CONCEPTOS EXISTEN?

Mensaje: Sin conceptos solo seriamos animales parlantes. Somos entes vivos capaces de crear conceptos cada vez más elaborados. ¿Podemos cuantificar nuestro universo actual de conceptos?.

 

Supongamos (1) que en promedio existan para cada documento  50 conceptos que dependerán de la temática central del mismo. Aceptemos además que ésta temática central es en sí un concepto, el que es tratado técnica y literariamente en base a esos otros 50 conceptos. Ahora bien, si pudiéramos recuperar todos los documentos que tratan esa misma temática  en una determinada lengua (por ejemplo 50.000) podríamos comprobar si la mayoría de ellos (probabilísticamente hablando) comparte un núcleo de digamos 40 conceptos. Si así fuera, la “Conceptualización de la Web”, algo que a primera vista podría aparecer como un operativo prácticamente imposible no lo seria tanto pues siendo el universo de posibles temas de tamaño finito, comprendido entre 250.000 a 350.000 (2), digamos 300.000, estaríamos hablando de un “espacio semántico” capaz de alojar alrededor de 12 millones de conceptos, un universo fácilmente operable con las actuales tecnologías y herramientas  computacionales.

Nota 1: Esto ha sido comprobado para tres mapas conceptuales experimentales, Computación, Arte y Seguridad, analizando mediante agentes más de 200 millones de páginas Web;

Nota 2: Existen al respecto varios trabajos que estiman de 150 a 200 disciplinas del conocimiento y cada una de ellas discriminada jerárquicamente en forma de árbol lógico de 500 a 8000 nodos (o subtemas). Por todo ello suponemos que 300.000 sería un límite superior para la amplitud del espectro temático;

 

CONCEPTOS: SUS CICLOS DE VIDA

Mensaje: Los conceptos podrían ser imaginados como paquetes de ondas hertzianas y como tales ser “sintonizados” como las radioemisoras y canales de TV. Planteada una idea Darwin permite descubrir adonde está mejor tratada en la Web. Se adjunta un ejemplo,  

Podemos concebir al concepto como una idea acabada de algo existente y que en cada lengua tiene un nombre. He aquí gran parte de la clave que nos conducirá al núcleo de la Metodología Darwin. Y vamos a poner un caso reciente de aplicación de dicha metodología. Dentro de la industria editorial y de las publicaciones ha comenzado a calar hondo una sensación de crisis terminal de los periódicos editados bajo forma de papel. Esta idea seguramente viene bullendo en las mentes de decenas de miles de personas relacionadas a esta importante actividad económica pero todavía no tiene un nombre que goce de consenso universal.  Los invitamos a jugar con los buscadores intentando localizar la zona semántica de acción del fenómeno en el espacio Web. Nosotros lo hicimos con un agente Darwin “boy scout” (3) que nos sugirió como “nombre modal”:

“newspapers are dying”(4)

 

 

Nota 3: El agente puede ser inicialmente un humano que está experimentando la eficacia de la metodología como paso previo a la programación específica del agente.

Nota 4: newspapers are dying en ingles podría interpretarse en español por ¿están los diarios (o periódicos) muriendo?.  Nuestra experiencia como analistas semánticos nos recomienda no traducir los mapas conceptuales pues a una misma idea pueden estar asociados nombres muy distintos de los surgidos por traducción directa, por razones no solo idiomáticas sino culturales y de uso. Es decir, si quisiéramos buscar la zona temática de influencia de esta idea en español deberíamos hacer una nueva exploración, posiblemente con agentes distintos. 

Ficha de la búsqueda

a) Ejemplo de sugerencias al agente “boy scout” al que previamente se lo ha creado y entrenado para detectar nombres para la temática en estudio: es algo de naturaleza efímera, circunstancial, que puede ser presentado tanto en forma afirmativa cuanto interrogativa y que posiblemente no posea una trayectoria semántica establecida (ver al respecto “semantic paths” en la Ontología Darwin);

b) Buscador elegido: Google;

c) Día, hora y lugar de la búsqueda (algo a tener muy en cuenta dado el reordenamiento que hacen continuamente los motores de búsquedas en sus bases de datos): jueves 20 de mayo a las 16 horas de Buenos Aire. Los números a la derecha de cada nombre alternativo cantidad de referencias Google;

are newspapers dying?: 233.000

newspapers out of business: 27.400

newspapers are dying: 16.800

newspapers bankruptcy: 7.600

newspapers crisis: 1.690

newspapers collapse: 1.960

newspapers ending: 1.500

 

En este ejemplo un humano se decidió por el tercer nombre de la idea por considerar que la primera si bien apuntaba mayoritariamente al tema lo era en términos de duda metódica a la que muchos autores se suman en momentos de crisis. La segunda fue descartada por ser un término demasiado genérico que involucra a quedar fuera del negocio por múltiples causas y hasta cierto punto independientemente  de las crisis.

 

¿CONCEPTOS ASIMILABLES A ONDAS HERTZIANAS?

Mensaje: Todo en una especie de chip virtual con capacidad para sintonizar 12 millones de conceptos

Y aquí surge la supuesta analogía imaginada entre la radio y el espacio Web. En efecto, la partícula semántica “newspapers are dying  obra como una onda que puede ser sintonizada por una especie de dial semántico. En sus cercanías semánticas – es decir otros nombres alternativos que supuestamente apuntarían al mismo concepto- vamos a encontrar vía los buscadores menos y más pobres referencias como ocurriría por ejemplo  en un dial de radio en las cercanías de la emisora XF34. Estas partículas podrían ser asimiladas a ondas hertzianas  que nacen dentro de la mente humana, evolucionan y finalmente mueren después de vidas efímeras o de larga duración –las noticias como ejemplo de las primeras y los conceptos filosóficos, morales y religiosos como ejemplos de las segundas-  Un Mapa Conceptual de la Web se hace entonces perfectamente posible y puede ser imaginado como un mapa sintonizable mediante una especie de dial de aproximadamente 12 millones de posiciones, dial que evolucionará a lo largo del tiempo.

En apretada síntesis, Darwin, acoplado a un buscador o a un pool de ellos, permite crear lo que Tim Berners-Lee, el creador de la Web, consideraba una utopía: la Web Semántica estructurada en base a un Tesauro Web, que es en esencia Un Mapa Conceptual de la Web –que tendría aproximadamente 12 millones de conceptos por lengua-. 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Última actualización el Jueves 17 de Junio de 2010 03:13  

Imágenes Polls

Poll Darwin

Darwin puede ser usado para
 

Newsflash

Poll Semántico I

La Semántica es la
 

Poll Semántico II

La Web Semántica es una
 

Poll Semántico III

El Conocimiento Humano es:
 

Poll Semántico IV

El Tesauro Web es
 

Usuarios Online

Tenemos 29 invitados conectado

Breadcrumbs

Home La Web Semántica