模型pipeline及pmml文件

模型部署:sklearn模型保存为pmml文件

(注意:包sklearn2pmml中自带PMMLPipeline工具,所以不需要使用包sklearn中的Pipeline方法。)

环境: win7_64, anaconda3.6.

安装包,sklearn_pandas 用于特征工程的pipeline化,sklearn2pmml 用于模型pipeline化和生成pmml文件,pypmml 用于读取pmml文件;xgboost,LightGBM为常用模型包。

pip下载包
pip download sklearn_pandas -d "d:\a"
pip download sklearn2pmml -d "d:\a"
pip download pypmml -d "d:\a"
pip download xgboost -d "d:\a"
pip download LightGBM -d "d:\a"

pip离线安装包
pip install --no-index --find-links="d:\a" sklearn_pandas
pip install --no-index --find-links="d:\a" sklearn2pmml
pip install --no-index --find-links="d:\a" xgboost
pip install --no-index --find-links="d:\a" LightGBM


参看:
python模型转PMML

python 读取pmml文件 计算auc

使用PMML部署机器学习模型 【此文中方法不是很可取】

pipeline优点及入门案例:

原文地址:https://www.cnblogs.com/andylhc/p/14046316.html