总共有一个文件,针对每一个用户对项目的评价,按照8:2的比例对项目分出训练集和测试集。分出来的格式还是这样的3列。
数据格式是
user_id item_id rating_value
1 101 5
1 102 3
1 10 3
1 103 5
1 104 2
1 105 5
1 106 5
1 107 5
1 108 5
1 109 3
1 110 4
1 111 5
1 112 4
1 113 5
1 11 4
1 114 5
1 115 5
1 116 5
1 117 5
……
“按照8:2的比例对项目分出训练集和测试集”:从数据源中随机抽取80%的数据作为“训练集”,其余的是“测试集”
import random这个思路很好,色子不是只有6面么?我想用8:2的比例,按照4:1的设置,具体怎么做呢?
追答用随机数啊 小于.8分到训练 大于.8分到检验。 最后统计一下实际的划分比例
是否存在一个问题,它必须多行解决而不能单行解决?
追问已经解决了,谢谢。
追答//tieba.baidu.com/i/sys/jump?un=yiyuezhuo" onclick="Stats.sendRequest('fr=tb0_forum&st_mod=pb&st_value=atlink');" onmouseover="showattip(this)" onmouseout="hideattip(this)" username="yiyuezhuo" target="_blank" class="at">@yiyuezhuo :习惯单行解决某些问题,
这个思路很好,色子不是只有6面么?我想用8:2的比例,按照4:1的设置,具体怎么做呢?
追答用随机数啊 小于.8分到训练 大于.8分到检验。 最后统计一下实际的划分比例
是否存在一个问题,它必须多行解决而不能单行解决?
追问已经解决了,谢谢。
追答//tieba.baidu.com/i/sys/jump?un=yiyuezhuo" onclick="Stats.sendRequest('fr=tb0_forum&st_mod=pb&st_value=atlink');" onmouseover="showattip(this)" onmouseout="hideattip(this)" username="yiyuezhuo" target="_blank" class="at">@yiyuezhuo :习惯单行解决某些问题,