登录
首页 >  Golang >  Go问答

使用已训练的二进制文件在 golearn 中的操作

来源:stackoverflow

时间:2024-03-18 13:30:30 258浏览 收藏

在机器学习中,训练好的模型可以保存为二进制文件,以便以后使用。使用经过训练的二进制文件进行预测涉及加载文件,设置模型并使用新数据进行预测。通过加载经过训练的二进制文件,我们可以对未知数据进行预测,从而评估模型的性能并进行推理。本文将指导您使用 GoLearn 库加载和使用经过训练的二进制文件,并提供一个代码示例,说明如何使用新数据进行预测。

问题内容

我在 csv 中有这个训练数据:

roomtype, haswater
bathroom, true
living_room, false
storage, false
kitchen, true
...

使用 golearn 训练数据。决策树(不确定决策树是否正确?)

func traindata() {
...
    //do a training-test split
    traindata, testdata := base.instancestraintestsplit(rawdata, 0.50)
    tree := trees.newid3decisiontree(0.6)
...
    tree.save('decissiontree.h')
}

所以我已将结果保存到这个二进制文件中。

我希望能够使用房间有水或没有水的概率的标签(房间类型)来查询我的文件。

func HasWater(roomType: string):float64 {
    tree := trees.NewID3DecisionTree(0.6)
    tree.Load("model.h");
   // What next??
}

我在 golearn 中没有找到任何实际如何使用经过训练的二进制文件的示例。我想我应该加载该文件。但然后呢?

很抱歉问一个基本问题。对于 ml(和 go)来说是全新的。


解决方案


您有一个 training.csv,用于训练和测试您的模型是否按预期工作。一旦您的模型按预期工作,您就将其保存以供以后使用。

training.csv

roomtype, haswater
bathroom, true
living_room, false
storage, false
kitchen, true
...
// reading training.csv file
testdata, err := base.parsecsvtoinstances("training.csv", false)
if err != nil {
    panic(err)
}
// spliting train and test data
traindata, testdata := base.instancestraintestsplit(testdata, 0.50)
// used the traindata for training model
...
// testing if model is working as expected
predictions, err := tree.predict(testdata)
...
// saved model for later work
tree.save('decissiontree.h')

现在模型已经过训练并按预期工作。我们需要测试模型是否适用于不同于训练和测试数据的未知数据 您可以加载之前保存的经过训练的二进制文件并使用它来测试未知数据以进行预测

unknown.csv

roomtype, haswater
ocean, true
truck, false
car, false
lake, true
...
tree := &decisiontreenode{}
err := tree.load("model.h");

unknowntestdata, err := base.parsecsvtoinstances("unknown.csv", false)
if err != nil {
  panic(err)
}

predictions, err := tree.predict(unknowntestdata)
  • 自行创建数据并传递给模型进行预测的示例
// Create a new, empty DenseInstances
newInst := base.NewDenseInstances()

// Create some Attributes 
attrs := make([]base.Attribute, 2)
attrs[0] = new(base.CategoricalAttribute)
attrs[0].SetName("0")
attrs[1] = new(base.CategoricalAttribute)
attrs[1].SetName("1")

// Add the attributes
newSpecs := make([]base.AttributeSpec, len(attrs))
newSpecs[0] = newInst.AddAttribute(attrs[0])
newSpecs[1] = newInst.AddAttribute(attrs[1])

newInst.Extend(4)

newInst.Set(newSpecs[0], 0, newSpecs[0].GetAttribute().GetSysValFromString(strings.TrimSpace("RoomType")))
newInst.Set(newSpecs[1], 0, newSpecs[1].GetAttribute().GetSysValFromString(strings.TrimSpace("HasWater")))

newInst.Set(newSpecs[0], 1, newSpecs[0].GetAttribute().GetSysValFromString(strings.TrimSpace("ocean")))
newInst.Set(newSpecs[1], 1, newSpecs[1].GetAttribute().GetSysValFromString(strings.TrimSpace("true")))
newInst.Set(newSpecs[0], 2, newSpecs[0].GetAttribute().GetSysValFromString(strings.TrimSpace("truck")))
newInst.Set(newSpecs[1], 2, newSpecs[1].GetAttribute().GetSysValFromString(strings.TrimSpace("false")))
newInst.Set(newSpecs[0], 3, newSpecs[0].GetAttribute().GetSysValFromString(strings.TrimSpace("lake")))
newInst.Set(newSpecs[1], 3, newSpecs[1].GetAttribute().GetSysValFromString(strings.TrimSpace("true")))

predictions, err := tree.Predict(newInst)

这里我只使用了 categoricalattribute 但 golearn 中还有更多可用的属性类型,例如 floatattributebinaryattribute

注意: unkwown.csv 包含训练或测试数据中未包含的数据,可用于检查模型在未知数据上的执行情况。

今天带大家了解了的相关知识,希望对你有所帮助;关于Golang的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>