Pardonnez mon français, s'il vous plaît répondre à la question. Si vous aviez vu des questions grammaticales, s'il vous plaît demander.
Je suis étudiant dans une université locale comme un étudiant de doctorat. Mon domaine d'étude est les sciences de données. Et je veux utiliser l'apprentissage automatique pour résoudre les problèmes de CRM. Il ouvrira de nombreuses possibilités pour la recherche actuelle.
Je vais utiliser les machines à vecteurs de support (SVM), je serai nourrissais entrées non-linéaires du système, avec personnalisé Kernels, qui sera réalisée avec l'aide de RBFs. Le problème est, je ne peux avoir 10000 points de données, qui donnent naissance à nombre de restrictions. Afin d'obtenir de bons résultats, 10000 ne sont que du bruit. Vous devez prendre le plus ajusté (qui déforme les sorties), puis quelques entrées sont besoin de régularisation et validation.To faire empirer les choses, je dois utiliser les entrées non-linéaires. Kernel et RBFs sont également ont allouer de troncature (entrées en raison de 5 chiffres titulaire). Donc, 10k est un seuil: -
Les questions:
- Quelle est la meilleure solution?
- Comment obtenir plus d'entrées?
- Atteindre Généralisation et performance en utilisant Régularisation et validation?
- Comment optimiser les résultats?
Seulement 46,9843% des résultats corrects est mauvais. Et je dois atteindre 75% de précision par mois prochain.
Je travaille avec helpmil NGo. En ce moment, je suis affecté d'une organisation de protection militaire, cette ONG fournit de l'aide à veterans.I suis affecté à un site Web qui contient des informations que je dois utiliser militarybases.I avoir les données de chaque jour, qui racontent personnes ont visité chacune des pages du site (en temps réel, ce sont les vraies personnes qui recherchent des informations) .I ont leur emplacement, le temps et le nombre de pages et les commentaires de ces visiteurs. Ensuite, je dois obtenir des résultats (avec la plupart des 10000 entrées).
exemple Dummy avec des valeurs:
Supposons une personne Alice visitez la page http://militarybases.co/directory/na...cksonville-fl/ au moment HH: MM: SS (heure en heure: minute: secondes), après le temps T, il a quitté le site et l'heure exacte était HH + X: MM + Y: SS + Z (qui est compréhensible).
Cette personne, a visité K1, ..., pages Kk. Et L1, L2, ...., Ll commentaires gauche. Lorsque, vous entrées ces valeurs dans l'algorithme, il fournira la sortie, il sera comparable à P1, P2, ...., Pn (probabilités). Lorsque les indices montrent le type d'intérêt comme intéressé par la résidence différente, il aime les militaires, etc etc Où 1 est l'intérêt maximal et 0 est le minimum.
Je mal échoué et ne peut pas obtenir de bons résultats. Mais maintenant, je suis en fonction de votre sortie.
-----