bert源码的文件、参数理解

$ tree .
.
|-- bert_cloud_tpu.md
|-- classifier_data_lib.py # 分类数据方法库
|-- common_flags.py # 通用命令行参数
|-- create_finetuning_data.py # 生成tfrecord格式的微调数据(依赖classifier_data_lib.py)
|-- create_pretraining_data.py # 生成预训练数据(只有重新预训练整个模型时才使用,本次不用)
|-- custom_metrics.py # 自定义文件,用于计算自定义metrics
|-- do_pred_data.py # 自定义文件,用于生成预测数据
|-- do_predict.py # 自定义文件,用于模型训练完成后执行预测
|-- export_tfhub.py
|-- export_tfhub_test.py
|-- __init__.py
|-- input_pipeline.py # 用于加载tfrecord格式的训练数据
|-- model_saving_utils.py # 用于模型保存
|-- README.md
|-- run_classifier.py # finetune分类主程序
|-- run_pretraining.py # 预训练主程序(本次不用)
|-- run_squad.py # squad主程序(本次不用)
|-- squad_lib.py
|-- squad_lib_sp.py
|-- tf1_checkpoint_converter_lib.py
|-- tf2_albert_encoder_checkpoint_converter.py
|-- tf2_encoder_checkpoint_converter.py
|-- tokenization.py # 分词器
|-- tokenization_test.py
`-- utils.py #自定义文件,用于绘制自定义metrics图表

0 directories, 25 files

和官网的目录文件多一点,参考https://www.cnblogs.com/zhongmiaozhimen/p/12228839.html

1

ModuleNotFoundError: No module named 'bert.tokenization'
!pip install bert-tensorflow
 

2补充几个关于在colab上面运行bert的网站,还有一些keras-bert的

https://www.cnblogs.com/zhongmiaozhimen/p/12228839.html

https://blog.csdn.net/liguo_yao/article/details/103365343

https://blog.csdn.net/asialee_bird/article/details/102747435?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-14&utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-14

https://blog.csdn.net/earofreceiver/article/details/105017268

https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/93145748?depth_1-utm_source=distribute.pc_relevant_right.none-task-blog-BlogCommendFromBaidu-3&utm_source=distribute.pc_relevant_right.none-task-blog-BlogCommendFromBaidu-3

https://github.com/bojone/bert_in_keras

3

4

5

原文地址:https://www.cnblogs.com/xingnie/p/12781442.html