Juan Chamero

Metodología Darwin

  • Aumentar el tamaño de la letra
  • Tamaño de letra predeterminado
  • Reducir el tamaño de la letra

Breadcrumbs

Home SSSE, Súper Buscadores Semánticos (II)

SSSE, Súper Buscadores Semánticos (II)

Correo electrónico Imprimir PDF

La Web Semántica

Develada por la Metodología Darwin

Por Juan Chamero, Esta dirección electrónica esta protegida contra spambots. Es necesario activar Javascript para visualizarla , Buenos Aires – Madrid – Dallas, 25 de mayo 2010

 

Darwin 8: SSSE, Súper Buscadores Semánticos de un solo clic (II)

 

Mediante la Metodología Darwin se pueden construir “SSSE Semantic Super Search Engines” o “Súper Buscadores Semánticos” guiados por un Tesauro Web en el que el Conocimiento Humano disperso en la Web  se muestra organizado en hasta 13 niveles jerárquicos abarcando una 200 disciplinas del quehacer humano, algunas clásicas tales como matemáticas, medicina, filosofía, historia y otras muy recientes tales como biotecnología, nanotecnología, y juegos. Estos buscadores, que mantienen siempre actualizado sus tesauros, están preparados para brindar respuestas coherentes a cualquier interrogante en una solo clic, vale decir en una consulta (en la jerga Darwin “YGWYN IOOC ,ó You Get What You Need In Only One Click, “UOLQN EUSC, Usted Obtiene lo que Necesita en Un Solo Clic”. No obstante, ello requiere que el usuario siga las sugerencias del “Wizard”o programa inteligente que lo guiará como si fuera el “Súper Bibliotecario” de una súper BV, Biblioteca Virtual alojada en la Web.

En todo momento el usuario puede optar por buscar por su cuenta por infinidad de razones, por ejemplo para proteger su privacidad o simplemente porque sabe a ciencia cierta que lo que busca puede encontrarse por un encadenamiento de palabras o de símbolos o de códigos que solo existen en determinados documentos. 

 

Diálogo Usuario - Wizard

Los SSSE se diseñan para brindar información válida en un solo clic a condición que el usuario acepte ser semánticamente guiado. De pruebas realizadas con dos prototipos Darwin, uno para Computación y otro para Arte, se ha comprobado que con probabilidad superior al 90% se encuentra lo que se busca en un solo clic y hasta el 99% en dos clics, siendo el segundo de ajuste semántico. Supongamos que usted quiere saber TODO lo relacionado con “abracadabra”. El problema es que ese “TODO” lo tiene solo usted en su mente y en una de esas no bien definido. La palabra abracadabra tiene hoy en Google 3.200.000 entradas y si usted ha hecho la pregunta desde un sitio de habla hispana Google es lo suficientemente listo para discriminar e informarle que de esas 3.200.000 entradas 271.000 están en idioma español. Aún así un SSSE Darwin le informará que efectivamente existen 3.200.000 entradas pero le señalará que según su Tesauro esa palabra es usualmente empleada como concepto, sola o asociada a otras, en más de 10 disciplinas del conocimiento humano  y dentro de ellas en 120 temas y si usted lo desea le presentará un listado con esa información para que usted oriente su búsqueda a fin de integrar su TODO.

Opcionalmente el Wizard Darwin podrá mostrarle párrafos y “keywords” relacionadas en los cuales aparece esa palabra. El análisis previo a su primer clic es a su elección.

Nota: La palabra abracadabra es empleada en programas de radio y TV, en sitios de entretenimiento, juegos, películas, religiones, creencias, software, magia, esoterismo, ONGs, servicios de comida, sistemas de control automático, etc.   

En resumen con los SSSE Darwin usted podrá buscar por “tema” o siguiendo su intuición y experiencia en navegación Web. Estamos convencidos de que a la larga se impondrán los buscadores temáticos pues además de ser muchísimo más eficientes que los buscadores convencionales en los que generalmente se busca por “guessing” o adivinanza, el usuario podrá además de encontrar rápidamente lo que necesita aprender en forma ordenada.

 

Ejemplos

Veamos ahora dos ejemplos preparados para seminarios taller sobre SSSE dados en Estados Unidos, México, Argentina y España durante los años 2005/2007. Se proponía a un grupo de jóvenes estudiantes universitarios buscar en ingles por “disk” y “car” (disco y coche respectivamente).

Ya en esos momentos “disk” Google mostraba 167.000.000 referencias y “car” 400.000.000 lo cual nos indicaba que esas palabras estaban más cerca de ser “palabras comunes” (recuérdese que en la Ontología Darwin se consideran solo dos tipos de partículas semánticas: palabras y expresiones comunes y keywords, los cuales (keywords) dentro de contextos específicos definen conceptos). ¿Que es lo que haría un Wizard Darwin ante esas preguntas?. Respuesta: Le aparecería (en este ejemplo en inglés) la siguiente ventana:

Warning: Your selected word (disk) is considered a Common Word forming part of as much as [25,567] keywords!. Begins a secure search guided by Darwin

 

1. Computing [1250]

2. Multimedia [1017

3. Music [986]

4. Medicine [750]

5. Physics [654]

6. Geometry [501]

7. Cosmology [327]

8. Science Fiction [220]

9. Games [201]

10. Sports [154]

…………………..

 

 

 

Véase que el Wizard previene al usuario diciéndole que según su Tesauro, la palabra disk figura asociada a 25.567 keywords y por lo tanto le sugiere que se deje guiar semánticamente por Darwin. Le muestra 10 Temas Top que emplean esa palabra, por ejemplo le dice que en Computación aparecen 1250 keywords que tienen en su cuerpo de texto (de dos, tres o más palabras) a la palabra disk. Y le presenta (a derecha) un menú de opciones, a saber:

1. Seleccionar una disciplina (tema o subtema según el caso), presentar muestras de keywords que emplean disk en su cuerpo;

2. No deseo ser guiado;

3. Cambio de instancia;

 

Si el usuario deseara ver muestras de keywords se le presentaría la siguiente ventana con una muestra ponderada  y clickeable en dos opciones: Global y en Detalle:

 

 

 

 

Keywords ó [popularity] [Discipline] [level]

Special Cases

001

Disk Recorder ó [845,000] [Multimedia] [2]

Second Top: Too General level [2]

002

Unit disk ó [160,000] [Mathematics] [4]

 

003

Multimedia disk ó [58,000] [Multimedia] [5]

 

004

Green disk ó [19,300] [Environmental Science] [3]

 

005

Herniated disk ó [168,000] [Medicine] [5]

 

006

Vertebral disk ó [863] [Medicine] [5]

 

007

Optic disk ó [125,000] [Physics]

 

008

Cervical disk ó [36,800] [Medicine] [4]

 

009

Military flash disk ó [3] [Defense] [7]

Rare and too specific [7]

010

Fight disk ó [765] [Games] [6]

 

011

Disk Encryption ó [489,000] [Computing] [5]

 

012

Disk Partition ó [518,000] [Computing] [4]

 

013

Disk Harrows ó [9,900] [Agriculture] [5]

 

014

Disk Space ó [19,800,000] [Computing] [2]

First Top: Too General level [2]

015

Hyperbolic disk ó [372] [Mathematics] [5]

 

016

Disk packing algorithm ó [141] [Mathematics] [6] AND [Games] [5]

Multiple keyword existence

017

Disk sorting algorithm ó [156] [Computing] [6]

 

018

Disk Ring ó [752] [Astronomy] [6] AND [Games] [Leisure}

 

019

Diamond disk ó [12,300] [Engineering] [5]

 

020

Disk ring composites ó [4] [Medicine] [6]

 

021

Beta pictoris disk astronomy ó [1] [Astronomy] [6]

Rare, specific [6], large size keyword

022

Compact disk ó [1,990,000] [Computing] [4]

 

023

Phaistos disk ó [18,300] [Archaeology] [5]

 

024

Disk ufo ó [297] [Science Fiction] [1]

 

025

Solar disk ó [221,000] [Astronomy] [1]

 

026

Disk to disk ó [660,000] [Computing] [4]

Chosen keyword to try First Query!

027

Laser disc ó [178,000] [Multimedia] [4]

 

028

Flying disk ó [62,100] [Games] [5] AND [Science Fiction} [3]

 

029

Gold disk ó [67,400] [Multimedia] [3]

 

030

Disk Topology ó [381] [Computing] [6]

 

031

Secchi disk ó [90,000] [Environmental Science] [6]

 

032

Floppy disk ó [5,330,000] [Computing] [2]

 

033

Brakes discs ó 9361,000] [Automobile] [4] AND [Engineering] [4]

 

034

Disk Geometry ó [144,000] [Computing] [5]

 

035

exchange disk ó geometry [130] [Computing] [6]

 

036

lumbar disk geometry ó [23] [Medicine] [6]

 

037

thick disk stellar ó [173] [Astronomy] [6]

 

038

disk and wind interaction ó [84] [Astronomy] [7]

Rare, very specific [7], large size k

039

accretion disk ó [355,000] [Physics] [4] AND [Astronomy] [4]

 

040

disk/c jockeys ó [245,000] [1,890,000] [Music] [3] AND [Entertainment] [4]

Accepted Synonym 

041

data disk package ó [1,990] [Computing] [3]

 

042

video disk ó [380,000] [Multimedia] [2]

 

043

disk track ó [17,000] [Computing] [5]

 

044

disk sector ó [66,700] [Computing] [4]

 

045

acute disk rupture ó [4] [Medicine] [6]

 

046

disk shaped object ó [12,200] [Science Fiction] [4]

 

047

zip disk ó [1,560,000] [Computing] [4]

Close to die concept

048

Spinning disk encapsulation ó [7] [Chemistry] [6]

 

049

Cortically anchored disk design implants ó [30] [Dentistry] [5]

Rare, largest keyword

050

Boot disk design ó [82] [Computing] [6]

 

051

Accretion disk physics ó [226] [Physics] [5]

 

052

Frisbee disk ó [976] [Entertainment] [6]

 

053

Airy disk ó [37,300] [Physics] [6] AND [Astronomy] [6]

 

054

Circumstellar disk physics ó [8] [Astronomy] [6]

 

055

Large Jade Buddha disk ó [50] {Antiques] [5] AND {Religions] [5]

 

056

Yellow amber disk ó [5] [Religions] [6]

 

 

En base a ésta información el usuario podría decidir hacer su primer clic o indagar más para mejorar su “guess”, por ejemplo sobre “disk to disk” destacado en color esmeralda o por el contrario iniciar una búsqueda sistemática dentro de “computing”, averiguar más sobre el significado de “disk to disk” o explorar en la vecindad semántica de la zona cognitiva preseleccionada.

A continuación se esquematiza cómo Darwin realiza la exploración de la “vecindad semántica” de disk to disk:

 

It depicts how Darwin semantically inspects the selected neighborhood

 within the same level (Collaterals), Up Stream and Down Stream

 

En la figura se muestra un detalle  de la vecindad del “cepto” (disk to disk es un “cepto” que llega a ser un CONcepto si se lo considera contenido dentro del CONtexto conceptual seleccionado,, por ejemplo Computación) . Dada la estructura arbórea de Computación, un agente Darwin explora la vecindad semántica del nodo disk to disk, en el nivel inmediatamente superior (upstream), en el nivel inmediatamente inferior (downstream) y en nodos al mismo nivel jerárquico (collaterals). 

 

 

Otros Conceptos Darwin

 

Más adelante, en artículos derivados de ésta serie básica, profundizaremos sobre la estructura del Wizard Darwin y sus algoritmos principales, la identificación de “Autoridades Temáticas” y las temáticas de “Documentos Autoridad”, la identificación de las temáticas derivadas de una temática dada, la construcción de “Semillas Semánticas”, la creación de “Semantic Fingerprints” o “Huellas Digitales Semánticas” de documentos y temas, etc.  

 

 

 

Muestra de posibles conceptos sugeridos por el Wizard

 

Disk Recorder; Unit disk; Multimedia disk; Green disk; Herniated disk; Vertebral disk; Optic disk; Cervical disk;; Military flash disk; Fight disk; Disk Encryption; Disk Partition; Disk Harrows; Disk Space; Hyperbolic disk; Disk packing algorithm; Disk sorting algorithm; Disk Ring; Diamond disk; Disk ring composites; Beta pictoris disk; astronomy; Compact disk; Phaistos disk; Disk ufo; Solar disk; Disk to disk; Laser disc; Flying disk; Gold disk; Disk Topology; Secchi disk; Floppy disk; Brakes discs; Disk Geometry; exchange disk geometry; lumbar disk; thick disk stellar; disk and wind interaction; accretion disk; disc jockeys; data disk package; video disk; disk track; disk sector; acute disk rupture; disk shaped object; zip disk; Spinning disk encapsulation; Cortically anchored disk design implants; Boot disk design; Accretion disk physics; Frisbee disk; Airy disk; Circumstellar disk physics; Large Jade Buddha disk; Buddha yellow amber disk; ……………………

Última actualización el Jueves 22 de Julio de 2010 00:55  

Imágenes Polls

Poll Darwin

Darwin puede ser usado para
 

Newsflash

Poll Semántico I

La Semántica es la
 

Poll Semántico II

La Web Semántica es una
 

Poll Semántico III

El Conocimiento Humano es:
 

Poll Semántico IV

El Tesauro Web es
 

Usuarios Online

Tenemos 10 invitados conectado

Breadcrumbs

Home SSSE, Súper Buscadores Semánticos (II)