资源描述:
《Strategies & Tools for Parallel Machine Learning in Python》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Strategies&ToolsforParallelMachineLearninginPythonParisDataGeeksMeetup-Feb.2013vendredi8février13TheStoryscikit-learnTheCloudstackoverflow&kagglevendredi8février13vendredi8février13PartsoftheEcosystem♥♥♥SingleMachinewithMultipleCoresmultiprocessing♥♥♥Multipl
2、eMachineswithMultipleCoresvendredi8février13TheProblemBigCPU(Supercomputers-MPI)SimulatingstufffrommodelsBigData(Googlescale-MapReduce)Countingstuffinlogs/IndexingtheWebMachineLearning?oftensomewhereinthemiddlevendredi8février13vendredi8février13CrossValida
3、tionInputDataLabelstoPredictvendredi8février13CrossValidationABCABCvendredi8février13CrossValidationABCABCSubsetofthedatausedHeld-outtotrainthemodeltestsetforevaluationvendredi8février13CrossValidationABCABCACBACBBCABCAvendredi8février13ModelSelectiontheHyp
4、erparametershellparam_1in[1,10,100]param_2in[1e3,1e4,1e5]FindthebestcombinationofparametersthatmaximizestheCrossValidatedScorevendredi8février13GridSearchparam_1(1,1e3)(10,1e3)(100,1e3)param_2(1,1e4)(10,1e4)(100,1e4)(1,1e5)(10,1e5)(100,1e5)vendredi8février1
5、3(1,1e3)(10,1e3)(100,1e3)(1,1e4)(10,1e4)(100,1e4)(1,1e5)(10,1e5)(100,1e5)vendredi8février13GridSearch:QualitativeResultsvendredi8février13GridSearch:CrossValidatedScoresvendredi8février13ParallelMLUseCases•ModelAssessmentwithCrossValidation•ModelSelectionwi
6、thGridSearch•BaggingModels:RandomForests•In-LoopAveragedModelsvendredi8février13EmbarrassinglyParallelMLUseCases•ModelAssessmentwithCrossValidation•ModelSelectionwithGridSearch•BaggingModels:RandomForests•In-LoopAveragedModelsvendredi8février13Inter-Process
7、Comm.UseCases•ModelAssessmentwithCrossValidation•ModelSelectionwithGridSearch•BaggingModels:RandomForests•In-LoopAveragedModelsvendredi8février13EnoughMLtheory!Letsgoshopping^Wparallelcomputing!vendredi8février13SingleMachinewithMultipleCores♥♥♥♥vendredi8fé
8、vrier13multiprocessing>>>frommultiprocessingimportPool>>>p=Pool(4)>>>p.map(type,[1,2.,'3'])[int,float,str]>>>r=p.map_async(type,[1,2.,'3'])>>>r.get()[int,float,str]vendredi8février13multiprocessing•Par