Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[SEARCH] Improvement of the search engine #914

Open
Souterweb opened this issue Jun 20, 2022 · 1 comment
Open

[SEARCH] Improvement of the search engine #914

Souterweb opened this issue Jun 20, 2022 · 1 comment
Labels
Type: Bug Something isn't working as expected

Comments

@Souterweb
Copy link

Souterweb commented Jun 20, 2022

English below

Plusieurs soucis rendent le moteur de recherche imprécis :

Résultats trop larges

  • La prise en compte des chaînes de caractères n'est pas assez sélective. Ainsi, quand on saisit le département "Lot", on ramène les entrées du Lot mais aussi celles du Lot-et-Garonne, comme si on avait saisi "Lot*"(où l’astérisque remplace tout caractère en suivant). Idem pour "Loire" qui ramène les entrées de la Loire mais aussi celles de la Haute-Loire et de le Loire-Atlantique. Il fait alors se livrer à des calculs manuels pour isoler chaque département.

Signes diacritiques trop sélectifs (accents et autres)

  • Quand on saisit le département "Rhone" ou "RHONE", sans accent circonflexe, on ne trouve aucune entrée. De même pour la région "Ile-de-France" ou "ILE-DE-FRANCE". Or, les signes diacritiques (accents et autres signes additifs) sont assez souvent ignorés dans la typographie ordinaire, surtout en majuscule.

Impossiblité de chercher par pays

  • Pour l’instant il n'y a pas de recherche possible sur les codes administratifs. La possibilité de rechercher par code ISO des divisions administratives (codes stables et dépourvus de signes diacritiques) aiderait beaucoup la précision.

EN Version 🇬🇧

Several issues make the search engine inaccurate:

  • The consideration of strings is not selective enough. Thus, when you enter the department "Lot", it brings back entries for the Lot but also for the Lot-et-Garonne, as if you had entered "Lot*" (where the asterisk replaces any following character). The same goes for "Loire" which brings back the entries for the Loire but also for the Haute-Loire and the Loire-Atlantique. It is then necessary to make manual calculations to isolate each department.

  • The diacritical marks are too selective. Thus, when one enters the department "Rhone" or "RHONE", without circumflex, one finds no entry. Similarly for the region "Ile-de-France" or "ILE-DE-FRANCE". Now, diacritical marks (accents and other additive signs) are quite often ignored in ordinary typography, especially in capital letters.

  • For the moment there is no search possible on administrative codes. The possibility to search by ISO code of administrative divisions (stable codes without diacritical marks) would help a lot the accuracy.

@Souterweb Souterweb added the Type: Bug Something isn't working as expected label Jun 20, 2022
@Souterweb Souterweb changed the title Amélioration du moteur de recherche / Improvement of the search engine Amélioration du moteur de recherche / IMPROVEMENT OF THE SEARCH ENGINE Jun 20, 2022
@Clm-Roig
Copy link
Member

Point 1

Je pourrais avoir un exemple svp ? Normalement dans la recherche avancée, les chaînes de caractères saisies sont interprétées de manière "strictes".

Point 2

Cf commentaire précédent, on est très stricts sur tous les caractères ils me semblent. Mais effectivement, il faudrait ne pas l'être sur les signes diacritiques, je suis d'accord.

Point 3

Concernant les pays, une issue est ouverte pour en discuter plus précisément là-bas : #588

On utilise le native_name pour la recherche par pays sur les cavités (España, Italia, France) ce qui mène effectivement à de grandes difficultés (exemple avec la Russie dont le nom natif est Россия)...

@Clm-Roig Clm-Roig changed the title Amélioration du moteur de recherche / IMPROVEMENT OF THE SEARCH ENGINE [SEARCH] Improvement of the search engine Dec 31, 2022
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Type: Bug Something isn't working as expected
Projects
None yet
Development

No branches or pull requests

2 participants