Code source wiki de Requête en langage naturel
Modifié par jhurst le 2024/04/02 14:26
Masquer les derniers auteurs
author | version | line-number | content |
---|---|---|---|
![]() |
1.1 | 1 | {{ddtoc/}} |
2 | |||
3 | = Prérequis = | ||
4 | |||
5 | * Des cubes dans vos portefeuilles récemment rafraîchis | ||
6 | |||
7 | = Création de flux via des requêtes en langage naturel = | ||
8 | |||
9 | Digdash offre la possibilité de créer des graphiques en quelques clics via des requêtes en langage naturel. | ||
10 | |||
11 | * Via l’éditeur de tableau de bord | ||
12 | |||
13 | |[[image:text_query_fr_html_a7f915e890b18ac9.png||queryString="width=258&height=183" height="183" width="258"]] | ||
14 | |**Éditeur de tableaux de bord** > **Création de nouveaux graphiques** > E**n langage naturel** | ||
15 | |[[image:text_query_fr_html_a8320d7a08f37973.png||queryString="width=284&height=189" height="189" width="284"]] | ||
16 | |Dans la fenêtre qui apparaît, vous pouvez saisir votre requête dans la barre de recherche | ||
17 | |[[image:text_query_fr_html_40713eb3535f7aa4.png||queryString="width=323&height=211" height="211" width="323"]] | ||
18 | |Choisir un graphe dans la liste de résultats présentée (nous allons choisir le premier résultat) | ||
19 | |[[image:text_query_fr_html_54d00d5426e9da23.png||queryString="width=333&height=165" height="165" width="333"]] | ||
20 | |Et enregistrer dans le portefeuille courant le graphe choisi. | ||
21 | |[[image:text_query_fr_html_a2e6123cb377f8d5.png||queryString="width=303&height=199" height="199" width="303"]] | ||
22 | |Donner un nom à votre flux à créer | ||
23 | |[[image:text_query_fr_html_ec2aa8b478645502.png||queryString="width=355&height=198" height="198" width="355"]] | ||
24 | |Le nouveau flux sera rajouté à votre éditeur de tableau de bord et vous trouverez bien le flux fraîchement créé dans la liste des flux | ||
25 | |||
26 | * Via le tableau de bord | ||
27 | |||
28 | Il est également possible de rajouter dans votre tableau de bord final un élément « Requête sur les données » pour pouvoir produire des flux à la volée. | ||
29 | |||
30 | |[[image:text_query_fr_html_593b9623abdb5a4a.png||queryString="width=233&height=455" height="455" width="233"]] | ||
31 | |**Éditeur de tableaux de bord **> **Contenu statique** > **Éléments** > **Requête sur les données** | ||
32 | |[[image:text_query_fr_html_22fbbc87dea1438d.png||queryString="width=325&height=249" height="249" width="325"]] | ||
33 | |Ajouter l’élément sur votre éditeur de tableau de bord | ||
34 | |[[image:text_query_fr_html_24adf3840e398ced.png||queryString="width=300&height=175" height="175" width="300"]] | ||
35 | |((( | ||
36 | Il se peut lors de vos requêtes que vous filtriez sur les membres d’une dimension ou d’une mesure. | ||
37 | |||
38 | Il est donc conseillé de se munir de l’élément « Éléments filtrés » sur le tableau de bord pour les supprimer pour les prochaines requêtes. | ||
39 | |||
40 | **Éditeur de tableaux de bord** > **Contenu statique** > **Éléments** > **Éléments filtrés** | ||
41 | ))) | ||
42 | |[[image:text_query_fr_html_274f0444542aba9f.png||queryString="width=325&height=127" height="127" width="325"]] | ||
43 | |Vous retrouverez ensuite ces éléments du côté de votre tableau de bord | ||
44 | |||
45 | {{{ | ||
46 | }}} | ||
47 | |||
48 | = Formation d’une requête en langage naturel = | ||
49 | |||
50 | Digdash vous permet de créer des graphes à partir de modèles de données en langage naturel. | ||
51 | |||
52 | Digdash se repose principalement sur des mots-clés pour vous proposer les graphiques les plus pertinents ainsi que sur les noms des colonnes de vos modèles de données. | ||
53 | |||
54 | Une requête sera ainsi basiquement formée de noms de mesures de votre modèle et/ou de noms de dimensions, suivi ou pas de noms de graphiques et/ou d’opérations de tri. | ||
55 | |||
56 | Nous verrons dans la suite de ce document à quel point le choix des termes d’une requête est important. | ||
57 | |||
58 | = Résultats d’une requête = | ||
59 | |||
60 | [[image:text_query_fr_html_dee11487843abaf5.png||queryString="width=550&height=124" height="124" width="550"]] | ||
61 | |||
62 | |||
63 | //__Capture : Présentation des résultats d’une requête en langage naturel__// | ||
64 | |||
65 | |||
66 | Les résultats d’une requête vous proposent une liste de graphes classés par pertinence avec un score associé. Plus ce score est grand, plus le graphe associé est considéré comme pertinent. Aussi, le nom du cube associé est mentionné ainsi qu’une description du graphe. | ||
67 | |||
68 | Nous verrons dans la suite de ce document quels sont les critères qui influent sur le calcul du score d’un résultat de requête. | ||
69 | |||
70 | = Choix des graphiques = | ||
71 | |||
72 | Pour une requête donnée, il vous sera proposé une liste de résultats de différents graphes, dépendants du contenu de la requête. | ||
73 | |||
74 | Il est toutefois possible d’exiger un type de graphe en particulier, dans la mesure où cela reste cohérent (la requête « Coût de communication en courbe » n’est pas cohérente). | ||
75 | |||
76 | Le nombre de membres dans les résultats d’une requête a également une incidence. En effet, dans le cas d’une requête cohérente mais avec un nombre de résultats trop important, il vous sera proposé un graphe adapté au nombre de résultats à afficher. | ||
77 | |||
78 | Voici les mots-clés à utiliser pour le choix des graphes : | ||
79 | |||
80 | |**Nom des graphiques**|**Mots-clés** | ||
81 | |Diagramme en secteurs|« secteur » | ||
82 | « camembert » | ||
83 | « ratio » | ||
84 | |Jauge|« jauge » | ||
85 | |Barre de progression|« barre de progression » | ||
86 | |Barres d’énergie|((( | ||
87 | « energie » | ||
88 | |||
89 | « consommation » | ||
90 | ))) | ||
91 | |Indicateur flèche|« fleche » | ||
92 | |Diagramme en colonnes|((( | ||
93 | « colonne » | ||
94 | |||
95 | « histogramme » | ||
96 | ))) | ||
97 | |Diagramme en barres|« barre » | ||
98 | |Carte|« carte » | ||
99 | |Diagramme scatter|((( | ||
100 | « dispersion » | ||
101 | |||
102 | « correlation » | ||
103 | ))) | ||
104 | |Diagramme à bulles|« bulle » | ||
105 | |Diagramme en ligne|((( | ||
106 | « ligne » | ||
107 | |||
108 | « courbe » | ||
109 | ))) | ||
110 | |Diagramme de surfaces|((( | ||
111 | « zone » | ||
112 | |||
113 | « surface » | ||
114 | ))) | ||
115 | |Diagramme radar|« radar » | ||
116 | |Tableau|((( | ||
117 | « tableau » | ||
118 | |||
119 | « Table » | ||
120 | ))) | ||
121 | |Indicateur|« indicateur » | ||
122 | |Tableau croisé|« tableau croisé » | ||
123 | |Tableau OLAP|((( | ||
124 | « OLAP » | ||
125 | |||
126 | « tableau OLAP » | ||
127 | ))) | ||
128 | |Texte|« texte » | ||
129 | |||
130 | //__Tableau des mots-clés pour le choix d’un graphe__// | ||
131 | |||
132 | = Tri = | ||
133 | |||
134 | Il vous est possible d’effectuer des opérations de tri dans vos requêtes via les mots-clés suivants : | ||
135 | |||
136 | |**Tri**|**Mots-clés**|**Exemples de requêtes** | ||
137 | |Croissant|((( | ||
138 | « trie » (croissant) | ||
139 | |||
140 | « triee » (croissant) | ||
141 | |||
142 | « ordonne » (croissant) | ||
143 | |||
144 | « ordonnee » (croissant) | ||
145 | |||
146 | « tri » (croissant) | ||
147 | |||
148 | « ordre » (croissant) | ||
149 | |||
150 | « croissant » | ||
151 | )))|((( | ||
152 | « Coûts par région en France en 2006 triés par coût en tableau » | ||
153 | |||
154 | « Coûts par région en France en 2006 triés en tableau » | ||
155 | |||
156 | « Coûts par région en France en 2006 croissants en tableau » | ||
157 | |||
158 | « Coûts par région en France en 2006 triés croissants en tableau » | ||
159 | ))) | ||
160 | |Décroissant|((( | ||
161 | « trie » (décroissant) | ||
162 | |||
163 | « triee » (décroissant) | ||
164 | |||
165 | « ordonne » (décroissant) | ||
166 | |||
167 | « ordonnee » (décroissant) | ||
168 | |||
169 | « tri » (décroissant) | ||
170 | |||
171 | « ordre » (décroissant) | ||
172 | |||
173 | « décroissant » | ||
174 | )))|((( | ||
175 | « Coûts par région en France en 2006 triés décroissant par coût en tableau » | ||
176 | |||
177 | « Coûts par région en France en 2006 décroissants en tableau » | ||
178 | |||
179 | « Coûts par région en 2006 triés en décroissant en tableau » | ||
180 | ))) | ||
181 | |||
182 | //__Tableau des mots-clés pour le tri__// | ||
183 | |||
184 | |||
185 | = Tendance d’une mesure = | ||
186 | |||
187 | Une mesure a une tendance. Elle peut être stable (tendance par défaut), croissante ou décroissante : | ||
188 | |||
189 | {{{ | ||
190 | }}} | ||
191 | |||
192 | |**Tendance**|**Signification** | ||
193 | |STABLE|Tendance par défaut : Le plus grand est le meilleur | ||
194 | |CROISSANTE|((( | ||
195 | Le plus grand est le meilleur | ||
196 | |||
197 | //Exemple : pour une marge// | ||
198 | ))) | ||
199 | |DÉCROISSANTE|((( | ||
200 | Le plus petit est le meilleur | ||
201 | |||
202 | //Exemple : pour un coût// | ||
203 | ))) | ||
204 | |||
205 | __//Tableau des tendances possibles pour une mesure//__ | ||
206 | |||
207 | |||
208 | |||
209 | Vous pouvez éditer la tendance d’une mesure via le Studio Digdash, dans la configuration avancée d’une source de données, dans les propriétés de la mesure. | ||
210 | |||
211 | |||
212 | //__Définition d’une tendance pour une mesure dans le Studio Digdash__// | ||
213 | |||
214 | |||
215 | * Impact de la tendance sur le tri | ||
216 | |||
217 | La tendance a un impact sur le tri. En effet, si le type de tri (croissant ou décroissant) n’est pas explicitement mentionné, celui-ci se basera sur la tendance de la mesure sur laquelle le tri s’effectue. On obtiendra par conséquent un tri décroissant sur une mesure de tendance stable ou croissante et un tri croissant dans le cas d’une mesure de tendance décroissante. | ||
218 | |||
219 | |||
220 | |||
221 | |**Tendance**|**Exemples de requêtes**|**Tri obtenu** | ||
222 | |STABLE|((( | ||
223 | « CA par région trié » | ||
224 | |||
225 | CA est une mesure à tendance stable | ||
226 | )))|//Le tri de la mesure CA sur la dimension région sera décroissant// | ||
227 | |CROISSANTE|((( | ||
228 | « Marge par région triée » | ||
229 | |||
230 | Marge est une mesure à tendance croissante | ||
231 | )))|//Le tri de la mesure Marge sur la dimension région sera décroissant// | ||
232 | |DÉCROISSANTE|((( | ||
233 | « Coût par région trié » | ||
234 | |||
235 | Coût est une mesure à tendance décroissante | ||
236 | )))|//Le tri de la mesure Coût sur la dimension région sera croissant// | ||
237 | |||
238 | //__Tableau d’exemples de l’impact de la tendance d’une mesure sur le tri__// | ||
239 | |||
240 | {{{ | ||
241 | }}} | ||
242 | |||
243 | = Le(s) pire(s) / le(s) meilleur(s) = | ||
244 | |||
245 | Il est possible de connaître les X meilleurs/pires membres des résultats de votre requête en utilisant les mots-clés suivants : | ||
246 | |||
247 | |**Cas**|**Mots-clés**|**Exemple** | ||
248 | |Les X meilleurs|((( | ||
249 | « Top » | ||
250 | |||
251 | « meilleur » | ||
252 | |||
253 | « plus grand » | ||
254 | |||
255 | « plus important » | ||
256 | )))|((( | ||
257 | Le meilleur coût en France | ||
258 | |||
259 | Les 5 meilleures marges en 2016 | ||
260 | |||
261 | Les 2 plus grands CA en Europe | ||
262 | |||
263 | Top 3 des coûts en France en 2016 | ||
264 | ))) | ||
265 | |Les X pires|((( | ||
266 | « Pire » | ||
267 | |||
268 | « moins bon » | ||
269 | |||
270 | « plus mauvais » | ||
271 | |||
272 | « plus petit » | ||
273 | )))|((( | ||
274 | Le pire coût en France | ||
275 | |||
276 | Les 5 pires marges en 2016 | ||
277 | |||
278 | Les 2 plus mauvais CA en Europe | ||
279 | ))) | ||
280 | |||
281 | //__Tableau des mots-clés pour le meilleur et pour le pire__// | ||
282 | |||
283 | |||
284 | = Méthodes d’agrégation = | ||
285 | |||
286 | Vous avez la possibilité de définir une fonction d’agrégation pour les mesures de votre requête en spécifiant les mots-clés suivants : | ||
287 | |||
288 | |**Agrégation**|**Mots-clés**|**Exemples de requêtes** | ||
289 | |Somme|« somme »|« Somme du coût de communication » | ||
290 | |Moyenne|« moyenne »|« Moyenne du coût de communication » | ||
291 | |Minimum|« min »|« Min du coût de communication » | ||
292 | |Maximum|« max »|« Max du coût de communication » | ||
293 | |||
294 | //__Tableau des mots-clés pour les méthodes d’agrégation__// | ||
295 | |||
296 | |||
297 | = Objectifs = | ||
298 | |||
299 | Il est possible d’appliquer des objectifs sur des mesures en mentionnant dans la requête le mot-clé suivant : | ||
300 | |||
301 | |||
302 | |**Mots-clés** | ||
303 | |« objectif » | ||
304 | |||
305 | __//Tableau des mots-clés pour les objectifs//__ | ||
306 | |||
307 | |||
308 | Vous pouvez également mentionner directement le nom des objectifs que vous voulez appliquer | ||
309 | |||
310 | |||
311 | |**Exemple** | ||
312 | |Soit un modèle de données avec les colonnes suivantes((( | ||
313 | |**Dimensions**|**Mesures** | ||
314 | |Date|Qualité de communication | ||
315 | |Type de ligne|Coût de communication (avec objectif « Obj ») | ||
316 | ))) | ||
317 | |((( | ||
318 | Exemple 1 : « Coût de communication en jauge avec objectif » | ||
319 | |||
320 | * Tous les objectifs de toutes les mesures sont appliqués (un seul objectif par mesure). | ||
321 | |||
322 | Exemple 2 : « Coût de communication en jauge avec Obj » | ||
323 | |||
324 | * L’objectif « Obj » est appliqué sur la mesure associée « Coût de communication ». | ||
325 | ))) | ||
326 | |||
327 | __//Tableau présentant des exemples d’utilisation des objectifs dans une requête//__ | ||
328 | |||
329 | |||
330 | = Utilisation des synonymes = | ||
331 | |||
332 | La recherche en langage naturel prend en charge les synonymes des termes de vos requêtes. | ||
333 | |||
334 | == Création des dictionnaires des synonymes == | ||
335 | |||
336 | Pour utiliser des termes synonymes dans vos requêtes, vous devez dans un premier temps importer un dictionnaire des synonymes dans Digdash. | ||
337 | |||
338 | Consulter la documentation « [[synonyms_dictionary>>doc:Digdash.user_guide.information_flow.synonyms_dictionary.WebHome]] » pour importer un dictionnaire des synonymes dans Digdash. | ||
339 | |||
340 | == Activation des dictionnaires des synonymes == | ||
341 | |||
342 | Vous devez ensuite vous assurer que l’utilisation des dictionnaires des synonymes est bien activée pour la fonctionnalité « Requête en langage naturel » dans la configuration serveur. | ||
343 | \\[[image:index-configuration.png]] | ||
344 | |||
345 | |||
346 | [[image:configuration-serversettings.png]] | ||
347 | |||
348 | Arrivé sur la page de la configuration des serveurs, Dans le menu à gauche > **Paramètres supplémentaires... >> **> sous-menu « **Dictionnaires des synonymes **» > Case **Utiliser les dictionnaires des synonymes pour les requêtes en langage naturel** | ||
349 | |||
350 | [[image:serversettings-synonymsDictionary.png]] | ||
351 | //__Capture : Activation de l’utilisation des dictionnaires des synonymes pour les requêtes en langage naturel__// | ||
352 | |||
353 | == Exemple d’utilisation == | ||
354 | |||
355 | |**Exemple** | ||
356 | |Soit un modèle de données avec les colonnes suivantes((( | ||
357 | |**Dimensions**|**Mesures** | ||
358 | |Date|Qualité de communication | ||
359 | |Type de ligne|Coût de communication | ||
360 | ))) | ||
361 | |((( | ||
362 | Dans ce cas, la requête | ||
363 | |||
364 | « Prix de communication par genre de ligne » | ||
365 | |||
366 | est équivalente à la requête | ||
367 | |||
368 | « Coût de communication par type de ligne » | ||
369 | |||
370 | (« prix » est un synonyme de « coût » et « genre » est synonyme de « type »). | ||
371 | |||
372 | (% class="box infomessage" %) | ||
373 | ((( | ||
374 | __**NB**__ : Ceci n’est valable que si votre dictionnaire des synonymes contient ces synonymes. | ||
375 | ))) | ||
376 | ))) | ||
377 | |||
378 | //__Tableau présentant un exemple d’utilisation de termes synonymes dans une requête__// | ||
379 | |||
380 | = Score des résultats d’une requête = | ||
381 | |||
382 | Les résultats des requêtes sont triés selon leur pertinence et les meilleurs peuvent atteindre le score de 5. | ||
383 | |||
384 | Le score pour un résultat d’une requête sera plus ou moins bon selon plusieurs raisons. | ||
385 | |||
386 | * Importance des termes de la requête | ||
387 | |||
388 | En effet, un résultat d’une requête sera mieux noté si la requête contient dans ses termes les noms exacts des colonnes de vos modèles de données. | ||
389 | |||
390 | Une requête sera donc considérée comme moins bonne si elle contient dans ses termes des noms partiels de vos colonnes, ou alors des synonymes des noms des colonnes de votre modèle de données. | ||
391 | |||
392 | |(% colspan="3" %)**Exemple** | ||
393 | |(% colspan="3" %)Soit un modèle de données avec les colonnes suivantes((( | ||
394 | |**Dimensions**|**Mesures** | ||
395 | |Date|Qualité de communication | ||
396 | |Type de ligne|Coût de communication | ||
397 | ))) | ||
398 | |((( | ||
399 | **Requête 1 :** | ||
400 | |||
401 | **Avec des noms exactes** | ||
402 | )))|((( | ||
403 | **Requête 2 :** | ||
404 | |||
405 | **Avec des noms partiels** | ||
406 | )))|((( | ||
407 | **Requête 3 :** | ||
408 | |||
409 | **Avec des synonymes** | ||
410 | ))) | ||
411 | |« Coût de communication par type de ligne »|« Coût par type »|« Prix par genre de ligne » | ||
412 | |Avec seulement des termes exacts dans cette requête, les résultats peuvent être bien notés.|Avec des termes partiaux dans cette requête, les résultats peuvent être moins bien notés.|((( | ||
413 | « prix » est synonyme de « coût », « genre de ligne » est synonyme de « type de ligne ». | ||
414 | |||
415 | Cette requête est différente de la requête d’origine, les notes seront basses. | ||
416 | ))) | ||
417 | |Score* : 5/5|Score* : 3/5|Score* : 2/5 | ||
418 | |(% colspan="3" %)* les scores présentés n’ont qu’un but démonstratif dans ce document | ||
419 | |||
420 | //__Tableau pour un exemple présentant l’importance des termes d’une requête__// | ||
421 | |||
422 | * Importance du type de graphique proposé | ||
423 | |||
424 | La liste des résultats d’une requête propose des graphes plus ou moins pertinents quant à ce qui est attendu. Compte tenu de la nature des termes de la requête, certains graphes seront moins bien classés que certains, d’où un score moins élevé pour ces derniers. |