Répondre à la discussion
Affichage des résultats 1 à 8 sur 8

Data mining




  1. #1
    mathsloveer

    Exclamation Data mining

    Bonjour à tous,

    Je recherche un site dans lequel je peux télécharger des données de volume supérieur à 1Go. Je suis intéressé aux données transactionnelles des clients d'une entreprise. Plus précisément je veux une sorte de base de données contenant deux tableaux le premier contient les données de clients, et le deuxième contenant leurs transactions.

    Cordialement.

    -----


  2. Publicité
  3. #2
    minushabens

    Re : Data mining

    Tu imagines que ces données sont publiques?

    sinon pour ce qui est de télécharger beaucoup de données, en génétique on le fait couramment. Le mois dernier j'ai récupéré 6To de séquences sur le site ncbi. Pour de tels volumes on ne peut pas utiliser des protocoles comme ftp, tftp. Il faut commencer par installer un logiciel spécialisé qui gère les paquets de données et est capable de reprendre le travail sur plusieurs jours même quand les ordis aux deux bouts ont été réinitialisés.

  4. #3
    mathsloveer

    Re : Data mining

    Merci! J'ai pensé trouver des données anciennes mais apparemment je dois changer de sujet, merci pour vos informations.

    Cordialement!


  5. #4
    Ikhar84

    Re : Data mining

    Je suis toujours surpris par la naïveté (limite poétique) de certaines demandes...

    1. En france, la collecte et la cession (entre autres) des données (personnelles) est strictement encadrée.
    2. La base de données client d'une société est l'un de ses actifs les plus jalousement protégé...
    3. La liste des transactions pose des problèmes supplémentaires de confidentialité et de securité ...

    Autant demander à une entreprise de ceder tous ses clients et les details de leur achats, ce qui permettra non seulement de les démarchers, mais en plus de leur proposer de véritables publicités ciblées ...
    (Voir le scandale Facebook / Cambridge Analytica en ce moment, par exemple...).
    J'ai glissé Chef !

  6. #5
    pm42

    Re : Data mining

    Ceci dit, ce genre de données existe en anonymisé et parfois "randomisé". Mais dans le cas présent, je ne sais pas si on peut en trouver une dans le domaine public en effet.

  7. A voir en vidéo sur Futura
  8. #6
    mathsloveer

    Re : Data mining

    Ce que je demande c'est des ressources pour des buts purement pédagogiques. C'est pas nécessaire que ça soit le vrai truc mais des données large suffisamment pour que je puisse y appliquer des algorithmes de data mining. Mais apparemment il y en a pas.
    Cordialement.

  9. #7
    Ikhar84

    Re : Data mining

    Si c'est juste une question de taille de base pour s'entrainer à faire de gris (edit gros) traitements, il y a les bases de l'etat, sur differents domaines, comme la base des adresses (qui est publique), depuis l'ouverture des données publiques (open data), il y a de quoi faire en data mining... sans risquer la prison... ou que la CNIL ne débarque...

    Edit: lapsus révelateur...
    Ou la base des medicaments
    Dernière modification par Ikhar84 ; 15/04/2018 à 18h56. Motif: Fôtes de frappe...
    J'ai glissé Chef !

  10. Publicité
  11. #8
    pm42

    Re : Data mining

    Oui, on peut en trouver pas mal :

    https://www.kdnuggets.com/datasets/index.html
    https://piktochart.com/blog/8-useful...-dig-for-data/

    Une recherche sur "data mining database download" ramène cela et plein d'autres.

Discussions similaires

  1. data mining - p-value et lambda wilks
    Par osishame dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 04/06/2008, 11h17
  2. Data Mining
    Par livre dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 23/01/2008, 19h04
  3. Besoin d'aide sur R - Data Mining
    Par bstevy dans le forum Logiciel - Software - Open Source
    Réponses: 0
    Dernier message: 22/11/2007, 00h17
  4. Data mining -Analyses multivariées
    Par pendemovis dans le forum Mathématiques du supérieur
    Réponses: 0
    Dernier message: 08/05/2007, 20h29