Scraper Français
-
Cool jai hate de tester.
-
@Screech, les scrappe en FR m'intéresse aussi, je suis prêt à t'aidé si tu le souhaite, pour créer une API pour un scan auto depuis recalbox (comme actuellement mais en FR)... Je n'ai jamais fait ça, mais j'ai des connaissances en html/css/php/sql et je bosse sur un projet similaire pour gérer ma vidéothèque.
-
@Yohann Le Bellec Merci pour la proposition. Je suis loin de pouvoir faire un scan auto depuis la recalbox. Je me contente de faire ce que je sais faire c'est a dire utiliser un petit langage de dev sous windows qui s'appel AUTOIT. Mais ça devrait déjà permettre de faire de beau XML Quand j'aurais quelque chose de suffisamment avancé, je publierais les sources sur le github Si ça peut te permettre de faire quelque chose directement sur la recalbox pourquoi pas. Je pourrais peut être t'aider ^^ (P.S. : tu es Breton ? Je suis sur la région de Rennes )
-
Un projet très intéressant en tout cas. Je l'ai pas mal suivi dernièrement, espérons que cela avance. Il est vrai qu'un scraping en Francais serait un réel plus pour recalbox. (bien que pas indispensable à mon sens )
-
De mon coté je complète la base de donnée, je suis actuellement sur la snes et je peut vous dire que j'en ai rempli une tartine (meme les jeux de majhong !) Pour ce systeme nous somme a plus de 75% de descriptions Française ! ça avance plutôt pas mal mais on a vraiment besoin d'aide pour étoffé la base de donnée. Il me tarde vraiment de voir ce que ça peu donner sur Recalbox !
-
J'ai commencé le boulot, j'ai récupéré tout les jeux disponibles pour les plateformes gérer par recalbox (presque 11 000 jeux...) depuis la base de données de thegamedb.net. Il Faut maintenant du monde pour traduire ou trouvé les infos en FR pour tout ça... Donc si il y a des volontaire, je ne suis pas contre ! Une fois tout traduit, il suffit de créer l'API à la même façon que je thegamedb.net et de paramétré ça dans recalbox (faut que je regarde comment ça se passe dans recalbox d'ailleurs). @Screech, Oui je suis breton, je suis sur le secteur de guingam ;).
-
@Yohann l'idée n'est pas de traduire "QUE" pour recalbox mais d'alimenter screenscraper pour que tous le monde en profite facilement. De mon coté je me suis penché sur la game gear ^^ et du coup, ça commence à se remplir ^^ mais doucement, je fais ça tranquil depuis mon taf ^^
-
Je sais bien que ce n'est pas QUE pour recalbox, mais commencé par là fait déjà pas mal de boulot... Comme je l'ai dit, je suis déjà à plus de 10 000 jeux, une fois ça fait, on continuera pour les autres plateforme existante. Mais bon comme je l'ai dit, seul c'est presque impossible, je n'ai pas le temps pour tout faire.
-
Yohann je comprend pas vraiment t'as demarche.. on a une base de donnée prete a etre rempli et déja bien garnie et justement il nous manque du monde pour participer... Pourquoi ne pas faire les chose ensemble ?
-
Je veux bien participer, là je cherche à créer (en gros) une version FR de thegameDB, où les gens peuvent ajouté/édite le jeux présent. Avec ceci une API avec la quelle on pourrai couplé sur nos recalbox... J'ai un serveur teamspeak ou skype, on pourrai essayé de se réunir de savoir ce qu'on peu faire et comment ?
-
@Yohann En fait ce que tu veux faire, c'est... Screenscraper ^^ Es tu passé sur : http://www.screenscraper.fr/index.php ? Parce qu'il s'agit exactement de ça. Une grosse base de données, comme thegamedb, mais en français. Ou tous le monde peut participer pour alimenter la base de donnée en FR. Une API existe déjà sur ce site (il faut demander un ID de dev sur le forum et je travail actuellement sur un scraper pour créer des fichiers XML pour la recalbox avec le contenu de cette BDD en FR) Donc un conseil ne réinvente pas l'eau chaude ce que tu cherches à faire existe déjà, il faut "juste" la compléter pour être le plus exhaustive possible
-
Effectivement, je ne connaissais pas le site, moins de taff, je ne suis pas contre, je ne suis pas SM ^^.
-
OK je comprend mieux, je pensait que tu avait déjà fait un tour sur ScreenSraper ^^ Tout le monde est bienvenue pour compléter la base de donnée, n'hésitez pas a participer car nous avons besoin d'aide !
-
Tadaaaa !!! Et voici la première version Alpha 0.0.0.2 ^^ <del datetime="2016-02-23T16:56:19+00:00">Universal_XML_Scraper (Alpha 0.0.0.2)</del> Donc :
- Interface Multilangue - English / French
- Configuration pas trop compliqué pour les profils de base (juste des chemins à configurer)
- 3 profils fonctionnel (Screenscraper vers recalboxV3, vers recalboxV4, vers emulationstation)
- Possibilité limité pour le moment de création de profil
- scan du répertoire des roms avec substitution des chemins dans le fichier xml
- download des images avec substitution des chemins dans le fichier xml
- création du fichier xml final
To do à cours terme :
- possibilité de redimensionner les images
- ajouter thegamedb dans les bdds (pour les anglophones qui utilise la recalbox)
- ajouter d'autre système genre hyperspin
- refaire mon système d’édition de fichier xml avec du scrape "à l'unité" (rechercher un jeu par son nom par exemple lorsqu'il n'a pas été trouvé via son CRC/MD5/SHA1)
Petit Tuto pour créer un profil : Ajouter le nom du profil dans la partie [PROFILS_SCRAPER] exemple : $PROFILS_SCRAPER_4 = 'ScreenScraper-superfrontend' Créer une section du même nom exemple : [ScreenScraper-superfrontend] Dans cette section, on ajoute les images (si on veut ^^) dans une taille de 150x100 1 pour la source et 1 pour la cible exemple : $IMAGE_SOURCE= 'Screenscraper.jpg' $IMAGE_CIBLE = 'superfrontend.jpg' Ensuite, un élément par tag XML. On commence par le root avec le nom du root cible en premier, un pipe, le mot root, un pipe le nom du root source, un pipe et enfin le mot root exemple : $ELEMENT_1 = 'gameList|root|Data|root' on continue avec le child dans le même format avec le mot child à la place de root exemple : $ELEMENT_2 = 'game|child|jeu|child' Et enfin on ajoute chaque élément avec des tags particuliers : value -> on reprend directement la valeur attr: -> on prend un attribut et on précise après le ":" de quelle élément est l’attribut (exemple : id|attr:game va créer un attribut id à l’élément game) variable -> pour le moment seul 2 variables sont prises en compte : la variable %RomPath% (qui va reprendre le chemin de la rom avec substitution) et une valeur sans % (qui écrira directement cette valeur. Pratique pour les valeurs fixes) path: -> Il s'agit d'un chemin pour un élément à télécharger, exemple, les images. (En indiquant path:image, le soft va downloader l'image dans le répertoire indiqué dans la config et va mettre le chemin avec substitution du fichier téléchargé) Detail important : dans le cas ou il y a plusieurs éléments dans la sources, seul le 1er est pris dans le cas ou vous voudriez pouvoir mettre plusieurs valeurs, vous pouvez doublez un élément, s'il n'y avait rien dans le 1er il essayera le 2eme. Exemple : $ELEMENT_9 = 'desc|value|synopsis/synopsis_fr|value' $ELEMENT_10 = 'desc|value|synopsis/synopsis_us|value' S'il n'y a pas de synopsis_fr à mettre dans le champs desc, il va prendre le synopsys_us à la place Exemple de profil : [code] [ScreenScraper-Recalbox v4] $IMAGE_SOURCE = 'Screenscraper.jpg' $IMAGE_CIBLE = 'RecalboxV4.jpg' $ELEMENT_1 = 'gameList|root|Data|root' $ELEMENT_2 = 'game|child|jeu|child' $ELEMENT_3 = 'id|attr:game|id|value' $ELEMENT_4 = 'source|attr:game|ScreenScraper|variable' $ELEMENT_5 = 'path|value|%RomPath%|variable' $ELEMENT_6 = 'emulator|value' $ELEMENT_7 = 'core|value' $ELEMENT_8 = 'name|value|nom|value' $ELEMENT_9 = 'desc|value|synopsis/synopsis_fr|value' $ELEMENT_10 = 'desc|value|synopsis/synopsis_us|value' $ELEMENT_11 = 'image|value|medias/media_screenshot|path:image' $ELEMENT_12 = 'image|value|medias/media_box2d_fr|path:image' $ELEMENT_13 = 'image|value|medias/media_box2d_us|path:image' $ELEMENT_14 = 'thumbnail|value' $ELEMENT_15 = 'rating|value|note|value' $ELEMENT_16 = 'releasedate|value|dates/france|value' $ELEMENT_17 = 'releasedate|value|dates/europe|value' $ELEMENT_18 = 'releasedate|value|dates/usa|value' $ELEMENT_19 = 'releasedate|value|dates/japon|value' $ELEMENT_20 = 'developer|value|developpeur|value' $ELEMENT_21 = 'publisher|value|editeur|value' $ELEMENT_22 = 'genre|value|genres/genre|value' $ELEMENT_23 = 'players|value|joueurs|value' $ELEMENT_24 = 'favorite|value' $ELEMENT_25 = 'region|value' $ELEMENT_26 = 'romtype|value' $ELEMENT_27 = 'hidden|value' $ELEMENT_28 = 'playcount|value' $ELEMENT_29 = 'lastplayed|value' [/code] Voila je vous laisse faire des tests si vous voulez n'hesitez pas à revenir vers moi pour tous bug ou demande d'amélioration (sachant que je travail sur la to do list ^^)
-
Salut, Une petite question, cette application, traduirait les gamelist en francais ? Je vais essayer de suite ^^ Luckiest
-
Hello, elle ne traduit pas réellement les gamelist en FR. Elle scrape vos roms avec les infos provenant de la Bdd ScreenScraper qui est en FR (encore en cours d’alimentation, n’hésitez d’ailleurs pas à y participer ) Donc en gros, elle scan le rep des Roms et génère un fichier gamelist.xml avec les descriptions en FR (pour celle existante, sinon c'est en anglais si elle ne trouve pas de Desc en FR) et télécharge un screenshot lié à la Rom (si tu as bien configuré les chemins et chemins de substitution ).
-
Bien joué @Screech, beau boulot! Je vais tester ça sous une VM quand j'aurais un peu de temps. J'ai une question à te demander, actuellement si j'ai bien suivi, le scraper télécharge un screenshot du jeu. Serait il possible d'avoir le choix entre un screenshot et une cover du jeu ?
-
Oui c'est tout à fait possible, il suffit d'editer le fichier config.ini pour modifier les profils. Pour ce que tu veux, dans le profil [screenscraper-recalbox V4] Tu peux modifier les lignes suivantes : $ELEMENT_11 = 'image|value|medias/media_screenshot|path:image' $ELEMENT_12 = 'image|value|medias/media_box2d_fr|path:image' $ELEMENT_13 = 'image|value|medias/media_box2d_us|path:image' La ces lignes veulent dire : download l'image medias/media_screenshot si pas présente download l'image medias/media_box2d_fr si pas présente download l'image medias/media_box2d_us Si tu veux la liste complete des images downloadable, tu peux aller ici : http://www.screenscraper.fr/webapi.php?alpha=0&numpage=0 et regarder la section jeuInfos.php
-
<del datetime="2016-02-23T16:56:44+00:00">Version 0.0.0.4</del> Correction sur les chemin de substitution qui collait systématiquement un \ et linux aime pas ça donc attention à bien utiliser des / pour indiquer ou se trouve vos roms et vos images. Sinon je viens de faire mes premier tests directement sur la recalbox Verdict : CA MARCHE !!! ^^ Un petit conseil pour la recalbox : créez un répertoire "images" directement dans le répertoires ou se trouve vos roms pour y télécharger vos images. Stockez aussi votre fichier gamelist.xml directement dans le répertoire de vos roms. Du coup dans les paths vous pouvez mettre (par exemple pour la nes sur une V4) : $PathRom =\RECALBOX\User data\roms\nes\ $PathRomSub =./ $PathNew =\RECALBOX\User data\roms\nes\gamelist.xml $PathImage =\RECALBOX\User data\roms\nes\images\ $PathImageSub =./images/ Pensez bien à quitter emulationstation avant de faire le scrape et faire un reboot après
-
Bonjour Screech et tous ^^ Bon donc après plusieurs tentatives, il recupere bien la liste, calcul les HASH, aucun message d'erreur, génére un nouveau fichier gamelist en renommant l'ancien en old mais le nouveau est vide ... <?xml version="1.0" encoding="UTF-8"?> <gameList/> Mes gamelist et images sont dans le répertoire roms et sur un clé USB. Ma config : $PathRom =G:\recalbox\roms\fba\ $PathRomSub =.\ $PathNew =G:\recalbox\roms\fba\gamelist.xml $PathImage =G:\recalbox\roms\fba\downloaded_images\ $PathImageSub =.\downloaded_images\ $No_Profil =1 $user_lang =040c Mauvaise config ?