tushare 下载股票行情数据，复权处理100万行需要10分钟，请教如何优化。

hhxadhy 2019-02-12 03:50:14

本人菜鸟一只，上代码，大佬给看看。

我每天下载最新未复权行情，自己做复权处理，复权公式：复权价=收盘价*当日复权因子/最新复权因子。
下图是我本地存储的数据。adj_factor是因子列。

我复权处理，就是用for循环，用df1 = df.ix[code] 来保存一只股票全部代码，用i存储最新日期的因子，再用 df1['factor'] = df1['adj_factor']/i，就可以得到股票复权的系数。后面直接系列相乘，这个简单。关键是这个for循环里，1百多万行耗时8分。

网上看了很多优化的文章，才知道自己这个最愚蠢。可是按文章里说的iterrow，apply，矢量化等等，我这个很难套进去。除了我的办法之外，怎么更快速得到复权的这个系数？？？？？？？？？？？

...全文

384 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

jeky_zhang2013 2019-02-16

打赏
举报

回复

考虑下多线程处理。

解压后运行demo即可获取固定编码的股票日线数据，其中引用的函数ma、kdj、macd、rsi等计算代码位于indexes文件夹。demosession1只是添加了for循环用于获取所有沪深数据，获取数据值为前复权数据，和常规股票软件显示结果一致。

tushare股票前复权数据获取及实现均线、kdj、macd等计算解压后运行demo

此为sqlite版复权因子数据，一支股票一个表，注意这是复权因子，有其它数据时，用对应股票的复权因子，可以计算出对应的不复权、前复权和后复权等价格其它请查看此文章，正常一个月一更新，请保持关注！ https://blog.csdn.net/sohoqq/article/details/132534214 股票历史数据全市场5000多支股票上市以来至今30年的数据下载、读取、处理和保存方法演示，包含不复权、前复权、后复权，复权因子等各数据，文章中有各版本数据的读取、处理和保存的的演示

此为三个版本复权因子数据，注意这是复权因子，有其它数据时，用对应股票的复权因子，可以计算出对应的不复权、前复权和后复权等价格其它数据请查看此文章，正常一个月一更新，请保持关注！ https://blog.csdn.net/sohoqq/article/details/132534214 复权因子数据不大，打包成一个发布了，没用的就删掉股票历史数据全市场5000多支股票上市以来至今30年的数据下载、读取、处理和保存方法演示，包含不复权、前复权、后复权，复权因子等各数据，文章中有各版本数据的读取、处理和保存的的演示

此为csv版复权因子数据，一支股票一个文件，注意这是复权因子，有其它数据时，用对应股票的复权因子，可以计算出对应的不复权、前复权和后复权等价格其它请查看此文章，正常一个月一更新，请保持关注！ https://blog.csdn.net/sohoqq/article/details/132534214 股票历史数据全市场5000多支股票上市以来至今30年的数据下载、读取、处理和保存方法演示，包含不复权、前复权、后复权，复权因子等各数据，文章中有各版本数据的读取、处理和保存的的演示

37,743

社区成员

34,212

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

试试用AI创作助手写篇文章吧

+ 用AI写文章