Juan Chamero

Metodología Darwin

  • Aumentar el tamaño de la letra
  • Tamaño de letra predeterminado
  • Reducir el tamaño de la letra

Breadcrumbs

Home Cómo develar Conceptos

Cómo develar Conceptos

Correo electrónico Imprimir PDF

La Web Semántica

Develada por la Metodología Darwin

Por Juan Chamero, Esta dirección electrónica esta protegida contra spambots. Es necesario activar Javascript para visualizarla , Buenos Aires – Madrid – Dallas, 25 de mayo 2010

 

Darwin 6: Cómo develar Conceptos

 

How to unveil concepts

Cómo develar conceptos

 

En los gráficos que siguen trataremos de mostrar cómo es posible extraer conceptos de documentos de cualquier tipo. Para un mayor detalle lo invitamos a ver una presentación introductoria del proceso   de extracción de conceptos en Flash bajo la Ontología Darwin presentado por la firma de I+D  Intag, Intelligent Agents Internet Corp de Estados Unidos. El documento ejemplo trata de la diabetes y es uno de los aproximadamente 84 millones de documentos que tratan en mayor o menor grado dicho tema según Google al 2 de Junio del año 2010. Supongamos además que mediante algún procedimiento lógico que permita filtrar páginas Web supuestamente de escaso valor de contenido llegamos a identificar solo 10.000 documentos con “autoridad” supuestamente eficiente para tratarlo.  Supongamos ahora que repartimos esos 10.000 documentos entre 1000 personas con buen conocimiento del inglés y deseablemente con formación universitaria a los que se los instruye previamente para “marcar” palabras o cadenas de palabras que a su buen saber y entender sean potencialmente conceptos, algo que les llame la atención y/o que perciban como “diferentes” de palabras y términos comunes o que simplemente no conozcan pero que suponen tienen que ver con el tema aparentemente central: diabetes.

 

Opcionalmente podría darse una muy breve explicación de lo que es la diabetes.  Nosotros, como Darwin Team, hemos hecho una experiencia similar en el año 2001, es decir hace ya casi 10 años. Unos 100 estudiantes de carreras afines a computación y sistemas analizaron en esta primera experiencia semántica unos 8.000 documentos de aplicaciones de software a razón de 80 documentos cada uno en promedio. Con una probabilidad cercana al 95% los estudiantes identificaron en ellos un “cluster” de términos “no comunes” y que luego de ser evaluados por expertos informáticos acordaron eran potencialmente conceptos. Ese fue el principio de nuestra metodología Darwin. A partir de ese momento nos concentramos en crear e instruir a agentes para que hicieran la tarea encomendada a los alumnos. 

 

Documento original

 

 



Documento “Yang”

Al que un agente Darwin le ha extraído las “partículas semánticas” que aparentemente cumplen la función de palabras, términos y expresiones comunes. 


 


Documento Yin

De palabras y términos supuestamente comunes

 



Se muestra lo que queda en el cedazo Darwin luego de eliminar del cuerpo textual del documento los supuestos conceptos potenciales. Complementariamente, un algoritmo analiza la supuesta trivialidad de los términos descartados presentando un listado de “dudas” al humano que investiga.

 

 

 

 

 

 

 

 

 

 

Imágenes Polls

Poll Darwin

Darwin puede ser usado para
 

Newsflash

Poll Semántico I

La Semántica es la
 

Poll Semántico II

La Web Semántica es una
 

Poll Semántico III

El Conocimiento Humano es:
 

Poll Semántico IV

El Tesauro Web es
 

Usuarios Online

Tenemos 58 invitados conectado

Breadcrumbs

Home Cómo develar Conceptos