社区
脚本语言
帖子详情
python按比例随机分割生成新文本文件
jin70908469
2016-09-12 09:33:25
小弟有一个4000行2000列的数据
想按一定比例P将其随机分成包含4000*P行的训练集,剩下的4000*(1-P)行成为测试集,输出这两个文本文件
求大神指点一下代码
...全文
775
1
打赏
收藏
python按比例随机分割生成新文本文件
小弟有一个4000行2000列的数据 想按一定比例P将其随机分成包含4000*P行的训练集,剩下的4000*(1-P)行成为测试集,输出这两个文本文件 求大神指点一下代码
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
xSeeker~
2016-09-13
打赏
举报
回复
数据的格式是怎么样的?随机的获取数据应该不难
(简单的编写方案)编写一个程序,
生成
一个10*10的
随机
矩阵并保存为文件(空格分隔行向量、换行
分割
列向量),再写程序将刚才保存的矩阵文件另存为CSV格式,用Excel或文本编辑器查看结果
这个程序是我参考了网上的一些方案自己总结了比较简单的方法,代码如下: from numpy import random import numpy as np array = random.randint(1,20,size=(10,10)) print(array) np.savetxt('E:\\test.csv',array,fmt='%d',delimiter=' ') 输出的结果如下: 有个缺点就是输出的csv文件没对齐,如下: 用到的numpy函数需要自己下载,网站在这里https://www.lfd.uci.edu/~gohlke/
python
libs/#numpy wind
易化的
Python
-易语言
使用易语言 设计
Python
窗口组件 易友专属,毕竟易语言组件操作功能齐全也方便 可参考老版本介绍:https://bbs.125.la/forum.php?mod=viewthreadtid=14463987 2.191103 版本更
新
: 1.增加组件,组合框,超级列表框代码
生成
2.增加功能,支持
生成
TTK组件代码(易语言内的windows通用组件库6.0版) 3.功能增加,增加
新
事件绑定 鼠标左键单击用法: 打开源码,在启动窗口直接设计窗口组件,已支持 标签,组合框,编辑框,按钮,单选框,多选框,超级列表框 组件的创建跟事件绑定及部分属性代码
生成
,需要其他属性的可以根据源码自行添加或评论留言。窗口设计完后按F5调试程序,窗口出现的时候代码也就自动
生成
好了,直接去
Python
里粘贴即可调试
Python
模块EP.py 已封装200+常用命令 函数命名跟各种操作已尽量仿照精易模块 ,用起来还是熟悉的味道。 模块内已有函数(模块内需要安装的第三方库都已备注) 已有命令 返回返回调试输出到文本到整数到数值对象到文本到元组到列表到字典到字节到字节数组序列_是否都为真序列_是否有真字节数组_清空字节数组_顺序反转取数据类型取数据长度集合文本_取出现次数文本_是否指定文本结尾文本_是否指定文本开头文本_TAB转空格文本_寻找文本文本_倒找文本文本_寻找文本index文本_倒找文本index文本_是否全十进制数字U文本_是否全数字字母文本_是否全数字文本_是否全数字U文本_是否全空格文本_是否标题化文本_是否全小写文本_是否全大写文本_是否全字母文本_标题化文本_首字母转大写文本_到小写文本_到大写文本_大小写字符到小写文本_大小写翻转文本_拼接文本_居中文本_左对齐文本_右对齐文本_右对齐0文本_删左边全部空格文本_删右边全部空格文本_删首尾指定字符文本_三元
分割
_左文本_三元
分割
_右文本_子文本替换文本_
分割
文本文本_换行
分割
文本_
生成
翻译表文本_转换字符文本_按键名转键值文本_键值转按键名文本_取出中间文本文本_取文本左边文本_取文本右边文本_取左边文本_取右边文本_取字符长度文本_取
随机
IP文本_取
随机
邮箱文本_取
随机
手机号文本_取
随机
字母文本_取
随机
数字文本_取
随机
字符文本_取
随机
姓氏文本_取
随机
汉字文本_取
随机
范围数字文本_到时间_datetime文本_取中间_批量文本_拼音转换数值_求次方数值_四舍五入数值_取绝对值数值_取上入整数数值_取下入整数数值_取最大数数值_取最小数字典_取值并删除字典_取指定键值字典_清空字典_拷贝字典_
生成
字典_转列表字典_取全部键字典_取全部值字典_取出并删除最后键值字典_取值添加列表_转字典列表_加入成员列表_插入成员列表_取出现次数列表_加入
新
列表列表_查找成员位置列表_取值并删除列表_删除指定值列表_倒序排列列表_大小排序时间_取指定格式时间时间_亚马逊操作时间时间_取启动时间时间_取现行时间time时间_取日期时间_取某年某月日历时间_取某年日历时间_是否为闰年时间_指定范围闰年总数时间_取某月天数时间_取某月一号星期几时间_取某天星期几时间_取现行时间datetime时间_取
随机
时间戳时间_格式化时间_文本转datetime时间时间_datetime时间转文本时间_增减datetime时间_取上月最后一天时间_取时间间隔时间_时间转时间戳时间_时间戳转时间时间_取现行时间戳队列_创建队列队列_加入成员队列_取出成员队列_取队列成员数队列_清空队列队列_是否为空队列_是否已满正则_匹配编码_编码编码_解码编码_UTF8编码编码_UTF8解码编码_GBK编码编码_GBK解码编码_URL编码编码_URL解码编码_ANSI到USC2编码_USC2到ANSI编码_BASE64编码编码_BASE64解码加密_MD5加密_SHA加密_SHA3加密_HmacSHA256加密_CRC32JS_调试JS_加载JS_运行GZIP_压缩GZIP_解压文件_取运行目录文件_更改当前工作目录文件_更改当前进程目录文件_遍历指定路径文件文件_遍历指定路径所有子目录文件_创建单层目录文件_创建多层目录文件_删除文件文件_删除文件2文件_删除单层空目录文件_删除多层空目录文件_获取访问修改时间文件_设置访问修改时间文件_重命名文件_修改权限文件_是否为绝对路径文件_是否为目录文件_是否为文件文件_是否存在文件_取文件大小文件_取最近访问时间文件_取创建时间文件_取修改时间文件_取文件目录文件_取路径文件名文件_文件扩展名
分割
文件_目录文件名
分割
文件_创建文件文件_检测权限文件_写入文件文件_读取文件文件_读取某行数据_排列数据_组合数据_排列组合进制_十到二进制_十到八进制_十到十六进制_二到十进制_八到十
python
划分数据集文件(txt标签文件按
比例
随机
切分)
python
划分数据集文件(txt标签文件按
比例
随机
切分) import os import random class SplitFiles(): """按行
分割
文件""" def __init__(self, file_name): """初始化要
分割
的源文件名和
分割
后的文件行数""" self.file_name = file_name def get_random(self): """
生成
随机
数组,
随机
划分 (0,1900
python
生成
指定个数的
随机
文本文件
(Hadoop word count 例子)
直接上代码(此处
生成
2个,每个文件
生成
20个
随机
单词,以空格
分割
) from random_words import RandomWords as r for i in range(2): a = open("d:\\hi{}.txt".format(i), 'w') w=[] for i in range(20): word = r().random_word() w.append(word) z = ' '.join(w) a.wr
python
按行
分割
文件:
python
划分数据集文件(txt标签文件按
比例
随机
切分)
import os import random class SplitFiles(): """按行
分割
文件""" def __init__(self, file_name): """初始化要
分割
的源文件名和
分割
后的文件行数""" self.file_name = file_name def get_random(self): """
生成
随机
数组,
随机
划分 (0,190001)txt标签行数, 7600测试集标签行数"""
脚本语言
37,720
社区成员
34,239
社区内容
发帖
与我相关
我的任务
脚本语言
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
复制链接
扫一扫
分享
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
试试用AI创作助手写篇文章吧
+ 用AI写文章