Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Problème de requête avec des relations sur des arguments pouvant être plusieurs types d'entités #20

Open
EstelleChaix opened this issue Apr 9, 2018 · 0 comments

Comments

@EstelleChaix
Copy link
Collaborator

En Français car déjà difficile à expliquer (alors en anglais)
Problème retrouvé sur microbe et seedev :

  • Sur Microbe :
    Deux relations étaient possibles en ayant comme argument "commensal" pouvant être à la fois "habitat" et "phénotype".
    "Bacteria exhibits commensal" ne donnait pas de réponse, alors qu'il y en avait dans le texte (et que l'on pouvait voir en allant chercher plus haut)
    Le problème a été "résoulu" par une pirouette sur l'ontologie, et enlevant "commensal" de Habitat.

  • Sur SeeDev , je vais un peu plus détailler le problème rencontré.

Pour permettre une interrogation "large" de FlagDB, j'ai fabriqué une entité "GeneOrProtein" , permettant d'interroger toutes les relations trouvées entre Gene et/ou Protein par une relation "universelle" ~loc (on passera sur le choix du nom.)

Du coup, dans mes textes, je tague des entités comme [Protein] , que je retaggue par dessus par [GeneOrProtein]
Le problème réside dans l'interrogation de ces relations là :

Quand je fais par exemple :
AT2G32950 interact AT3G20770
Je retrouve bien le lien entre les deux.

image

AT2G32950 ~loc AT3G20770 , j'ai une erreur no result

image

Mais, quand je cherche les relations "~loc" qui existent , en faisant des restrictions dessus, j'arrive à trouver cette relation là : {geneandprotein}* ~loc {geneandprotein}* AT3G20770 AT2G32950 , voir le deuxième hit, et la relation surlignée en violet

image

L'hypothèse c'est qu'il y a un choix qui est fait à un moment donné sur les entités qui peuvent être annotés par plusieurs types d'entités lors de la requête, et que ce choix impacte donc sur les résultats proposés.

En résumé : sur microbio :
la requête ""Bacteria exhibits commensal" ne pouvait aboutir, car l'entité "commensal" pouvait être taggé par "Habitat" et "Phénotype", et était tagguée/choisie comme "habitat", et que la relation "Exhibits" n'accepte que des Phénotypes de l'autre côté.

De la même façon, ici pour SeeDev :
Les deux protéines sont taggées par [Protein] et [GeneOrPortein] , et il est choisi [Protein] arbitrairement, ce qui fait qu'un requête de type ~loc ne peut aboutir car les arguments de part et d'autre ne sont pas [GeneOrPortein].

Je ne sais pas si ce choix est fait sur la requête, ou sur le texte "doublement annoté"

Là où cela pose plus problème c'est que j'étais en train de "découper" les relations génériques "Interact" en plusieurs types de relations (Binds, Regulation...)

  • Si c'est sur la query, est-ce que l'on pourra requêter un "Binds" et un "Interact" si les entités cibles en requête peuvent être tantôt un gène, tantôt une proteine (puisque normalisé sur le locus ou nom via l'expender.) , par exemple AT2G32950 interact AT3G20770 versus AT2G32950 ~loc AT3G20770
  • Si le problème est sur le texte doublement annoté, il faudrait quand même conserver une relation "Générique" (par exemple, [GeneOrPortein] ~loc [GeneOrPortein]) permettant de toutes les requêter quand même, et je n'ai pas l'impression que cela sera possible dans l'état actuel.

J'espère que c'est par trop brouillon comme présentation du problème.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants