13 May 2016, 11:39

"Concernant le reset du fichier à chaque scrap, c’est dans ma todo list de faire un fonction “append” qui ne ferait que “compléter” un fichier avec les manquants. La problématique vient justement des gros fichiers. Exemple, tu rajoutes 10 roms à un fichier XML qui en contient 2000, il faut tout pa**er pour voir si la rom existe déjà ou pas… Du coup c’est une usine à gaz hyper lente… Il faut que je revois la metodo…" Lis le fichier XML existant au début, extrait une simple liste de chaine des fichiers de roms déjà scrappés que tu gardes dans un coin (ça te fera une liste de 1000 éléments max) et quand tu fais la réconciliation tu compares ton nom de fichier à réconcilier par rapport à cette liste plutôt que par rapport au fichier. Sinon pour la génération du scrappe en règle générale, si c'est la taille du fichier qui prend du temps tu peux générer des bouts de fichiers, tous les 200 fichiers scrappés par exemple, tu passe à un autre fichier xml ou texte temporaire, à la fin tu combines tous tes fichiers temporaires en un seul. (tu peux même le faire en copiant/collant le contenu texte du fichier plutôt que de le considérer comme du xml à cette étape)