python把数据分为训练部分和测试部分的简单实现

根据《Data Science from Scratch》一书的说法,machine learning:creating or using models that are learned from data

为避免模型overfitting or underfitting,一种简单的方法是把现有的数据分两部分,一部分用来训练得到模型,剩下的用来检查模型好不好。

把数据分成两部分

#-------------------------------------------
import random

def split_data(data,prob):
    """split data into fractions [prob,1-prob]"""
    results = [],[]
    for row in data:
        results[0 if random.random()<prob else 1].append(row)
    return results
    
#---------------------------------------------
原文地址:https://www.cnblogs.com/zhanchao/p/5717541.html