FLYAI

https://www.flyai.com/d/FacialAge

FLYAI 竞赛说明

参加项目竞赛必须实现 model.py 中的predict_all方法，系统才能给出最终分数。

样例代码说明

`app.yaml`

是项目的配置文件，项目目录下必须存在这个文件，是项目运行的依赖。

`processor.py`

样例代码中已做简单实现，可供查考。

处理数据的输入输出文件，把通过csv文件返回的数据，处理成能让程序识别、训练的矩阵。

可以自己定义输入输出的方法名，在app.yaml中声明即可。

    def input_x(self, image_path):
        '''
        参数为csv中作为输入x的一条数据，该方法会被dataset.next_train_batch()
        和dataset.next_validation_batch()多次调用。可在该方法中做数据增强
        该方法字段与app.yaml中的input:->columns:对应
        '''
        pass

    def output_x(self, image_path):
         '''
        参数为csv中作为输入x的一条数据，该方法会被dataset.next_train_batch()
        和dataset.next_validation_batch()多次调用。
        该方法字段与app.yaml中的input:->columns:对应
        '''
        pass

    def input_y(self, label):
        '''
        参数为csv中作为输入y的一条数据，该方法会被dataset.next_train_batch()
        和dataset.next_validation_batch()多次调用。
        该方法字段与app.yaml中的output:->columns:对应
        '''
        pass

    def output_y(self, data):
        '''
        输出的结果，会被dataset.to_categorys(data)调用
        :param data: 预测返回的数据
        :return: 返回预测的标签
        '''
        pass

`main.py`

样例代码中已做简单实现，可供查考。

程序入口，编写算法，训练模型的文件。在该文件中实现自己的算法。

通过dataset.py中的next_batch方法获取训练和测试数据。
'''
Flyai库中的提供的数据处理方法
传入整个数据训练多少轮，每批次批大小
'''
dataset = Dataset(epochs=args.EPOCHS, batch=args.BATCH)
#获取训练数据
x_train, y_train = dataset.next_train_batch()
#获取验证数据
x_val, y_val = dataset.next_validation_batch()
通过model.py中的save_model方法保存模型
# 模型操作辅助类
model = Model(dataset)
model.save_model(YOU_NET)
如果使用PyTorch框架，需要在net.py文件中实现网络。其它用法同上。

`model.py`

样例代码中已做简单实现，可供查考。

训练好模型之后可以继承flyai.model.base包中的base重写下面三个方法实现模型的保存、验证和使用。

   def predict(self, **data):
        '''
        使用模型
        :param data: 模型的输入的一个或多个参数
        :return:
        '''
        pass

    def predict_all(self, datas):
        '''
        （必须实现的方法）评估模型，对训练的好的模型进行打分
        :param datas: 验证集上的随机数据，类型为list
        :return outputs: 返回调用模型评估之后的list数据
        '''
        pass

    def save_model(self, network, path=MODEL_PATH, name=MODEL_NAME, overwrite=False):
        '''
        保存模型
        :param network: 训练模型的网络
        :param path: 要保存模型的路径
        :param name: 要保存模型的名字
        :param overwrite: 是否覆盖当前模型
        :return:
        '''
        self.check(path, overwrite)

`predict.py`

样例代码中已做简单实现，可供查考。

对训练完成的模型使用和预测。

`path.py`

可以设置数据文件、模型文件的存放路径。

`dataset.py`

该文件在FlyAI开源库的flyai.dataset包中，通过next_train_batch()和next_validation_batch()方法获得x_train y_train x_val y_val数据。

FlyAI开源库可以通过pip3 install -i https://pypi.flyai.com/simple flyai 安装。

FlyaI终端命令

windows用户

客户端模式：

1. 下载项目并解压

2.进入到项目目录下，双击执行flyai.exe程序

第一次使用需要使用微信扫码登录

杀毒软件可能会误报，点击信任该程序即可

3.本地开发调试

运行flyai.exe程序，点击"本地调试"按钮，输入循环次数和数据量，点击运行即可调用main.py

如果使用本地IDE开发，需要执行安装“flyai”依赖并导入项目，运行main.py

4.下载本地测试数据

运行flyai.exe程序，点击"下载数据"按钮，程序会下载100条调试数据

4.提交训练到GPU

运行flyai.exe程序，点击"提交到GPU"按钮，输入循环次数和数据量，点击运行即可提交到GPU训练。

返回sucess状态，代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

命令行模式：

1. 下载项目并解压

2. 打开运行，输入cmd，打开终端

Win+R 输入cmd

3. 使用终端进入到项目的根目录下

首先进入到项目对应的磁盘中，然后执行

cd path oproject

Windows用户使用 flyai.exe

4. 本地开发调试

执行下列命令本地安装环境并调试（第一次使用需要使用微信扫码登录）

flyai.exe test

执行test命令，会自动下载100条测试数据到项目下

安装项目所需依赖，并运行 main.py

如果使用本地IDE开发，可以自行安装 requirements.txt 中的依赖，运行 main.py 即可

5.提交训练到GPU

项目中如有新的引用，需加入到 requirements.txt 文件中

在终端下执行

flyai.exe train

返回sucess状态，代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

完整训练设置执行代码示例：

flyai.exe train -b=32 -e=10

通过执行训练命令，整个数据集循环10次，每次训练读取的数据量为 32 。

Mac和Linux用户

1. 下载项目并解压

2. 使用终端进入到项目的根目录下

cd /path/to/project

Mac和Linux用户使用 ./flyai 脚本文件

3. 初始化环境并登录

授权flyai脚本

chmod +x ./flyai

4. 本地开发调试

执行下列命令本地安装环境并调试（第一次使用需要使用微信扫码登录）

./flyai test 注意：命令前面不要加sudo

执行test命令，会自动下载100条测试数据到项目下

安装项目所需依赖，并运行 main.py

如果使用本地IDE开发，可以自行安装 requirements.txt 中的依赖，运行 main.py 即可

5.提交训练到GPU

项目中如有新的引用，需加入到 requirements.txt 文件中

在终端下执行

./flyai train 注意：命令前面不要加sudo

返回sucess状态，代表提交离线训练成功

训练结束会以微信和邮件的形式发送结果通知

完整训练设置执行代码示例：

./flyai train -b=32 -e=10

通过执行训练命令，整个数据集循环10次，每次训练读取的数据量为 32 。

案例：https://github.com/PengzhongSun/BirdClassification_FlyAI