La création de la source de données est des plus simples et revient à cliquer avec le bouton droit de la souris sur le dossier Sources de données (Data Sources) dans BIDS et à sélectionner Nouvelle source de données (New Data Source). L’Assistant Source de données (New Data Source Wizard)
Sources de données

vous guide tout au long du processus de sélection d’un serveur, d’une méthode d’authentification et d’une base de données.
Dans mon cas, j’ai choisi SRS01 comme serveur et WinBig en tant que base de données contenant la table lottery_load préremplie avec l’historique des tirages. Vues de source de données. Cette étape nécessite un peu plus de travail, principalement du fait que le simple choix de la table ne suffit pas pour l’analyse. J’avais besoin d’une requête personnalisée capable de fournir non seulement les numéros de loterie tirés, mais aussi des valeurs utilisables comme entrées pour l’auto-apprentissage des modèles d’exploration de données suivants.
Par exemple, prenons une hypothèse : vous essayez de prédire le type de produit qu’un client achètera sur la base de certains critères collectés auprès dudit client. La connaissance de la situation de ce dernier (par ex., revenu, statut martial, région de résidence) constitue un composant clé pour déterminer ses décisions d’achat potentielles. Toutes ces données associées sont entrées dans le modèle d’exploration de données pour les éléments prédictibles, notamment la probabilité que le client achètera tel ou tel article. Ce type d’analyse importe peu ici, vu la nature aléatoire d’une loterie, mais le fait de fournir ce type de données associées au modèle peut révéler des modèles cachés.
Dans le cas d’une prédiction pour la loterie, la date du tirage, en plus des numéros tirés, constitue une information pouvant constituer une entrée précieuse pour les modèles de prédiction. Je peux créer une vue de source de données basée sur une ou plusieurs tables source, comme dans le cas de la table lottery_load, mais je peux aussi recourir à une requête nommée au lieu d’une table, afin d’obtenir plus de souplesse dans mon schéma : l’utilisation d’une requête nommée me permet de relier les tables sousjacentes en une seule entité, puis de filtrer les colonnes employées et les données sur la base de ces critères.
Le moyen le plus facile de créer une vue de source de données basée sur une requête nommée consiste à cliquer avec le bouton droit de la souris sur le dossier Vues de source de données (Data Source Views) dans l’Explorateur de solutions et à sélectionner Nouvelle vue de source de données (New Data Source View) pour lancer l’assistant. J’ai alors sélectionné la table de la source de données WinBig que j’ai créée à l’étape précédente, puis j’ai parcouru l’assistant en sélectionnant la table lottery_load et en cliquant sur Terminer (Finish) pour créer la vue de source de données nommée WinBig.dsv.
Toutefois, j’ai ensuite la possibilité de cliquer avec le bouton droit de la souris sur l’en-tête de la table et de sélectionner Remplacer la table (Replace Table), puis Par la nouvelle requête nommée (With New Named Query). Les requêtes nommées permettent de définir plus facilement de nouvelles colonnes qui ne figurent pas dans la table de base. Avec une requête nommée, j’ai ajouté plusieurs nouveaux champs à utiliser comme éléments d’entrée afin d’aider les algorithmes du modèle d’exploration de données à prédire les numéros de loterie.
Les champs ajoutés à la table de base sont tous dérivés du champ DrawDate. Le fait de connaître le jour de la semaine, par exemple, peut révéler des tendances importantes dans la requête résultante. Le mois et l’année du tirage pourraient être tout aussi importants. La connaissance de la phase de la lune, des horaires des marées, des prévisions météorologiques locales et de la pression barométrique pourrait être tout aussi raisonnable dans cet exercice, mais nous devons travailler avec les données disponibles.
Le listing 1 présente la requête nommée qui va piloter les modèles d’exploration de données. Notez, à cet égard, les nouvelles colonnes dérivées du champ DrawDate. Le champ WeekPart peut se révéler important pendant l’auto-apprentissage des modèles car il y a deux tirages par semaine, le mercredi et le samedi, soit les quatrième et septième jours de la semaine pour la fonction WeekPart.
Téléchargez cette ressource

État des lieux de la réponse à incident de cybersécurité
Les experts de Palo Alto Networks, Unit 42 et Forrester Research livrent dans ce webinaire exclusif leurs éclairages et stratégies en matière de réponses aux incidents. Bénéficiez d'un panorama complet du paysage actuel de la réponse aux incidents et de sa relation avec la continuité de l'activité, des défis auxquels font face les entreprises et des tendances majeures qui modèlent ce domaine. Un état des lieux précieux pour les décideurs et professionnels IT.
Les articles les plus consultés
- Et si les clients n’avaient plus le choix ?
- Afficher les icônes cachées dans la barre de notification
- Activer la mise en veille prolongée dans Windows 10
- Cybersécurité Active Directory et les attaques de nouvelle génération
- N° 2 : Il faut supporter des langues multiples dans SharePoint Portal Server
Les plus consultés sur iTPro.fr
- Cybersécurité : l’IA générative rebat les cartes du cybercrime
- Le World Cyber Ranking, 1er classement mondial de la cybersécurité des entreprises
- Comment le Quarter Plan permet d’aligner IT et Métiers pour délivrer
- Explosion des attaques d’ingénierie sociale en 2025
- SI sous pression : 3 signes que vos flux sont mal orientés
